Recuperação da trajetória online de caracteres latinos utilizando deep learning

Lin, Yu Han

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5230

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Lin, Yu Han	-
dc.date.accessioned	2020-10-15T16:35:05Z	-
dc.date.available	2020-10-15T16:35:05Z	-
dc.date.issued	2020-08-25	-
dc.identifier.citation	LIN, Yu Han. Recuperação da trajetória online de caracteres latinos utilizando deep learning. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/5230	-
dc.description.abstract	Studies on the recovery of trajectories manuscript have gained space in the field of offline handwriting recognition research. The reason is in the use of online recognition resources, creating techniques to simulate the writing of the handwritten word and inserting the simulated coordinates of the pixels in systems that recognize words online. The principle of these techniques is to find an orderly pattern similar to that made by a person during writing; this process is known as handwriting trajectory recovery (HTR). Several works have presented the use of graphs to perform the HTR, skeletonizing the characters and tracing the correct path of the graph, which this graph representing the skeleton of the character. However, recent studies characterize the use of deep learning artificial neural networks to realize the HTR. The great advantage of using deep learning networks is to take their generalization capacity to achieve better accuracy rates in the recovery of handwriting trajectories. Although these works present promising results, their results are difficult to compare with each other, since they use different evaluation metrics. Based on these factors, this work aims to present a proposal to perform the HTR of Latin characters of the IRONOFF dataset through the use of deep learning networks, in addition, present a new evaluation model called SWO (Segmentation-sliding Window-Ordering) to evaluate the sequence of coordinates predicted by the deep learning networks. Compared with the existing metrics in the literature, the SWO evaluation proved to be more effective in both quantitatively and qualitatively aspect, being able to verify whether the sequence of the strokes and the geometric shape of the character were recovered. This work also identifies that the variation in the number of coordinate points per character (𝑝/𝑐) affects the performance of deep learning networks for the problem of HTR, evidencing an approach to improve the evaluation rates. The experiments are conducted from the transformation of information online into offline. This data goes through the normalization and data augmentation process. Five network configurations are implemented and undergo the training, validation and testing process. The best results are achieved with a 95.31% accuracy rate in predicting the trajectory of single-stroke character and 92.93% accuracy in predicting the trajectory of multi-strokes character, thus presenting good results for the HTR problem.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Manuscritos	pt_BR
dc.subject	Escrita - Identificação	pt_BR
dc.subject	Conjunto de caracteres (Processamento de dados)	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Manuscripts	pt_BR
dc.subject	Writing - Identification	pt_BR
dc.subject	Character sets (Data processing)	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.title	Recuperação da trajetória online de caracteres latinos utilizando deep learning	pt_BR
dc.title.alternative	Online latin characters trajectory recovery using deep learning	pt_BR
dc.type	masterThesis	pt_BR
dc.description.resumo	Estudos sobre a recuperação de trajetória de manuscritos ganharam espaço na área da pesquisa de reconhecimento de textos manuscritos offline. O motivo está no uso de recursos de reconhecimento online, criando técnicas para simular a escrita da palavra manuscrita e inserindo as coordenadas simuladas dos pixels em sistemas que reconhecem palavras de modo online. O princípio dessas técnicas é encontrar um traçado ordenado de modo similar àquele feito por uma pessoa durante a escrita; esse processo é conhecido como recuperação da trajetória de manuscritos (handwriting trajectory recovery - HTR). Vários trabalhos apresentaram o uso de grafos para realizar a HTR, esqueletizando os caracteres e traçando o caminho correto do grafo, sendo este grafo o esqueleto do caractere. Entretanto, estudos recentes caracterizam o uso das redes neurais artificiais de aprendizagem profunda (deep learning) para realizar a HTR. A vantagem de se utilizar as redes de deep learning é usufruir da sua capacidade de generalização para atingir taxas de acertos melhores na recuperação dessas trajetórias. Apesar destes trabalhos apresentarem resultados promissores, seus resultados são dificilmente comparados entre si, uma vez que utilizam métricas de avaliação diferentes uma das outras. Baseado nesses fatores, o presente trabalho tem como objetivo apresentar uma proposta para realizar a HTR de caracteres latinos do dataset IRONOFF através do uso de redes deep learning, além de apresentar um novo modelo de avaliação chamada de SWO (Segmentation-sliding Window-Ordering), para avaliar a sequência de coordenadas preditas pelas redes de deep learning. Comparada com as métricas existentes na literatura, a avaliação SWO mostrou-se ser mais eficaz tanto quantitativamente, quanto qualitativamente, sendo capaz de verificar se a sequência dos traços e o formato geométrico do caractere foram recuperados. Este trabalho também identifica que a variação na quantidade de pontos de coordenadas por caractere (𝑝/𝑐) afeta no desempenho das redes de deep learning para o problema da HTR, evidenciando uma abordagem para melhorar as taxas de avaliação. Os experimentos são conduzidos a partir da transformação da informação online em offline. Esses dados passam pelo processo de normalização e data augmentation. Cinco configurações de redes são implementadas e passam pelo processo de treinamento, validação e testes. Alcança-se como melhores resultados as taxa de 95, 31% de acurácia na predição de trajetória de caracteres single-stroke e 92, 93% de acurácia na predição de trajetória de caracteres multi-strokes, apresentando dessa maneira bons resultados para o problema de HTR.	pt_BR
dc.degree.local	Ponta Grossa	pt_BR
dc.publisher.local	Ponta Grossa	pt_BR
dc.creator.ID	https://orcid.org/0000-0001-7294-9328	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/8481854548619029	pt_BR
dc.contributor.advisor1	Morais, Erikson Freitas de	-
dc.contributor.advisor1ID	https://orcid.org/0000-0002-0845-7457	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/1716165820460791	pt_BR
dc.contributor.advisor-co1	Aires, Simone Bello Kaminski	-
dc.contributor.advisor-co1ID	https://orcid.org/0000-0003-3346-2693	pt_BR
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/4283126175158861	pt_BR
dc.contributor.referee1	Britto Jr., Alceu de Souza	-
dc.contributor.referee1ID	https://orcid.org/0000-0002-3064-3563	pt_BR
dc.contributor.referee1Lattes	http://lattes.cnpq.br/4251936710939364	pt_BR
dc.contributor.referee2	Freitas, Cinthia Obladen de Almendra	-
dc.contributor.referee2ID	https://orcid.org/0000-0002-7015-094X	pt_BR
dc.contributor.referee2Lattes	http://lattes.cnpq.br/1058846722790485	pt_BR
dc.contributor.referee3	Morais, Erikson Freitas de	-
dc.contributor.referee3ID	https://orcid.org/0000-0002-0845-7457	pt_BR
dc.contributor.referee3Lattes	http://lattes.cnpq.br/1716165820460791	pt_BR
dc.contributor.referee4	Borges, Helyane Bronoski	-
dc.contributor.referee4ID	https://orcid.org/0000-0002-9153-3819	pt_BR
dc.contributor.referee4Lattes	http://lattes.cnpq.br/8340106221427112	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.subject.capes	Engenharia/Tecnologia/Gestão	pt_BR
Aparece nas coleções:	PG - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
recuperacaotrajetoriacaracteresdeeplearning.pdf		17,62 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas