O uso da rede neural convolucional como extrator de características aplicado ao problema de identificação de escritores

Righetto, Guilherme

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/6031

Título:	O uso da rede neural convolucional como extrator de características aplicado ao problema de identificação de escritores
Autor(es):	Righetto, Guilherme
Orientador(es):	Gonçalves, Diego Bertolini
Palavras-chave:	Redes neurais (Computação) Escrita - Identificação Escrita Neural networks (Computer science) Writing - Identification Writing
Data do documento:	22-Nov-2016
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Campo Mourao
Citação:	RIGHETTO, Guilherme. O uso da rede neural convolucional como extrator de características aplicado ao problema de identificação de escritores. 2016. 49 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2016.
Resumo:	Contexto: No contexto da identificação de escritores, frequentemente pesquisadores propõem diferentes métodos para a extração, processamento das características e classificação. Podemos dividir a identificação de escritores em dois grandes grupos. O primeiro extraí características locais referentes a escrita, como espaçamento, vales, laços, angulações, dentre outras. O segundo representa a escrita através de descritores de textura, que extraem características globais. As bases de documentos manuscritos normalmente possuem um único estilo de escrita. Entretanto atualmente o conteúdo de cada amostra do mesmo escritor produz documentos em línguas diferentes, como, português, árabe, inglês, alemão, dentre outras. Ao considerar mais de um estilo de escrita para o problema de identificação de escritores, a tarefa torna-se ainda mais difícil, pois é necessário construir um sistema de identificação independente do alfabeto utilizado. A fim de solucionar o problema de identificação de escritores que produzem documentos em línguas diferentes, foram utilizados diversas técnicas como citado anteriormente. Uma delas é utilizar uma rede neural convolucional (CNN) como extrator de características e classificador, na qual, também foi utilizada neste trabalho, além da abordagem de dissimilaridade, que transforma um problema n-classes em binário. Objetivo: O principal objetivo deste trabalho é avaliar o desempenho propiciado através das características extraídas pela rede neural convolucional (CNN) no processo de identificação off-line de escritores. Para isso utilizaremos as bases de dados BFL, CVL e QUWI. Método: O método proposto neste trabalho cumpriu as seguintes etapas: Realizou um pré-processamento nos documentos manuscritos utilizando uma abordagem de geração de textura. Posteriormente a textura foi dividida em blocos de tamanho igual a 128 × 128. Na etapa seguinte com uso do classificador CNN / extrator universal de características foi utilizado dois recursos providos pela CNN, sendo a classificação de cada bloco de entrada. Portanto, o processo tradicional do classificador CNN e também o uso da CNN como um extrator de características. Em seguida, o cálculo da dissimilaridade sobre os vetores de características extraídos a partir de cada bloco. Na etapa seguinte foi utilizado o classificador SVM para classificar os blocos de textura. Por fim, foi realizado a combinação das predições geradas de cada bloco, pelo SVM e pela CNN, a fim de obter uma decisão final sobre quem escreveu determinado documento. Resultados: Os principais resultados obtidos foram utilizando a abordagem de dissimilaridade no vetor de características extraído pela rede neural convolucional, sendo eles 98,26% (BFL), 97,91% (CVL) e 86,96% (QUWI). Conclusões: Concluímos neste trabalho, que a abordagem de dissimilariadde se mantém robusta em relação a identificação de escritores de documentos manuscritos de diferentes línguas. Além disso, observou-se que as características extraídas pela CNN obteve bons resultados nos casos em que a língua escrita seguia um alfabeto similar.
Abstract:	Context: In the context of the writer identification, researchers often propose different methods for extraction, processing of features and classification. In which we can divide the writer identification in two groups. The first one extracted local features related to writing, like as spacing, concavity, angulations, among others. The second represents writing through texture descriptors, which extract global features. Bases of handwritten documents usually have a unique writing style. However, currently the content of each sample of the same writer produces documents in different languages, such as Portuguese, Arabic, English, German, among others. When considering more than one writing style for the problem of identifying writers, the task becomes even more difficult as it is necessary to construct an identification system independent of the alphabet used. In order to solve the problem of writer identification who produce documents in different languages, several techniques were used as mentioned above. One of them is to use a convolutional neural network (CNN) as a feature extractor and classifier, in which it was also used in this work, in addition to the dissimilarity approach, which turns a n-classes problem into binary. Objective: The main objective of this work is to evaluate the performance provided by the features extracted by the convolutional neural network (CNN) in the process of the off-line writer identification. For this we will use the databases BFL, CVL and QUWI. Method: The method proposed in this work fulfilled the following steps: Preprocessed manuscript documents using a texture generation approach. Subsequently the texture was divided into blocks of different sizes. In the next step using the CNN classifier / universal features extractor, two CNN resources were used, the classification of each input block, that is, the traditional CNN classifier process and also the use of CNN as a features extractor. Then, dissimilarity feature vectors are computed by feature vectors extracted from each block. In the next step, the SVM classifier was used to classify the texture blocks. Finally, a combination of the predictions generated from each block was made by the SVM and CNN in order to obtain a final decision on who wrote a particular document. Results: The main results were obtained using the dissimilarity approach in the feature vector extracted by the convolutional neural network, 98.26% (BFL), 97.91% (CVL) and 86.96% (QUWI). Conclusions: We conclude in this work that the dissimilarity approach remains robust in relation to the writer identification of handwritten documents of different languages. In addition, it was observed that the features extracted by CNN obtained good results in cases where the written language followed a similar alphabet.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/6031
Aparece nas coleções:	CM - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CM_COCIC_2016_2_02.pdf		2,14 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas