Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5230
Registro completo de metadados
Campo DCValorIdioma
dc.creatorLin, Yu Han-
dc.date.accessioned2020-10-15T16:35:05Z-
dc.date.available2020-10-15T16:35:05Z-
dc.date.issued2020-08-25-
dc.identifier.citationLIN, Yu Han. Recuperação da trajetória online de caracteres latinos utilizando deep learning. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/5230-
dc.description.abstractStudies on the recovery of trajectories manuscript have gained space in the field of offline handwriting recognition research. The reason is in the use of online recognition resources, creating techniques to simulate the writing of the handwritten word and inserting the simulated coordinates of the pixels in systems that recognize words online. The principle of these techniques is to find an orderly pattern similar to that made by a person during writing; this process is known as handwriting trajectory recovery (HTR). Several works have presented the use of graphs to perform the HTR, skeletonizing the characters and tracing the correct path of the graph, which this graph representing the skeleton of the character. However, recent studies characterize the use of deep learning artificial neural networks to realize the HTR. The great advantage of using deep learning networks is to take their generalization capacity to achieve better accuracy rates in the recovery of handwriting trajectories. Although these works present promising results, their results are difficult to compare with each other, since they use different evaluation metrics. Based on these factors, this work aims to present a proposal to perform the HTR of Latin characters of the IRONOFF dataset through the use of deep learning networks, in addition, present a new evaluation model called SWO (Segmentation-sliding Window-Ordering) to evaluate the sequence of coordinates predicted by the deep learning networks. Compared with the existing metrics in the literature, the SWO evaluation proved to be more effective in both quantitatively and qualitatively aspect, being able to verify whether the sequence of the strokes and the geometric shape of the character were recovered. This work also identifies that the variation in the number of coordinate points per character (𝑝/𝑐) affects the performance of deep learning networks for the problem of HTR, evidencing an approach to improve the evaluation rates. The experiments are conducted from the transformation of information online into offline. This data goes through the normalization and data augmentation process. Five network configurations are implemented and undergo the training, validation and testing process. The best results are achieved with a 95.31% accuracy rate in predicting the trajectory of single-stroke character and 92.93% accuracy in predicting the trajectory of multi-strokes character, thus presenting good results for the HTR problem.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectManuscritospt_BR
dc.subjectEscrita - Identificaçãopt_BR
dc.subjectConjunto de caracteres (Processamento de dados)pt_BR
dc.subjectRedes neurais (Computação)pt_BR
dc.subjectManuscriptspt_BR
dc.subjectWriting - Identificationpt_BR
dc.subjectCharacter sets (Data processing)pt_BR
dc.subjectNeural networks (Computer science)pt_BR
dc.titleRecuperação da trajetória online de caracteres latinos utilizando deep learningpt_BR
dc.title.alternativeOnline latin characters trajectory recovery using deep learningpt_BR
dc.typemasterThesispt_BR
dc.description.resumoEstudos sobre a recuperação de trajetória de manuscritos ganharam espaço na área da pesquisa de reconhecimento de textos manuscritos offline. O motivo está no uso de recursos de reconhecimento online, criando técnicas para simular a escrita da palavra manuscrita e inserindo as coordenadas simuladas dos pixels em sistemas que reconhecem palavras de modo online. O princípio dessas técnicas é encontrar um traçado ordenado de modo similar àquele feito por uma pessoa durante a escrita; esse processo é conhecido como recuperação da trajetória de manuscritos (handwriting trajectory recovery - HTR). Vários trabalhos apresentaram o uso de grafos para realizar a HTR, esqueletizando os caracteres e traçando o caminho correto do grafo, sendo este grafo o esqueleto do caractere. Entretanto, estudos recentes caracterizam o uso das redes neurais artificiais de aprendizagem profunda (deep learning) para realizar a HTR. A vantagem de se utilizar as redes de deep learning é usufruir da sua capacidade de generalização para atingir taxas de acertos melhores na recuperação dessas trajetórias. Apesar destes trabalhos apresentarem resultados promissores, seus resultados são dificilmente comparados entre si, uma vez que utilizam métricas de avaliação diferentes uma das outras. Baseado nesses fatores, o presente trabalho tem como objetivo apresentar uma proposta para realizar a HTR de caracteres latinos do dataset IRONOFF através do uso de redes deep learning, além de apresentar um novo modelo de avaliação chamada de SWO (Segmentation-sliding Window-Ordering), para avaliar a sequência de coordenadas preditas pelas redes de deep learning. Comparada com as métricas existentes na literatura, a avaliação SWO mostrou-se ser mais eficaz tanto quantitativamente, quanto qualitativamente, sendo capaz de verificar se a sequência dos traços e o formato geométrico do caractere foram recuperados. Este trabalho também identifica que a variação na quantidade de pontos de coordenadas por caractere (𝑝/𝑐) afeta no desempenho das redes de deep learning para o problema da HTR, evidenciando uma abordagem para melhorar as taxas de avaliação. Os experimentos são conduzidos a partir da transformação da informação online em offline. Esses dados passam pelo processo de normalização e data augmentation. Cinco configurações de redes são implementadas e passam pelo processo de treinamento, validação e testes. Alcança-se como melhores resultados as taxa de 95, 31% de acurácia na predição de trajetória de caracteres single-stroke e 92, 93% de acurácia na predição de trajetória de caracteres multi-strokes, apresentando dessa maneira bons resultados para o problema de HTR.pt_BR
dc.degree.localPonta Grossapt_BR
dc.publisher.localPonta Grossapt_BR
dc.creator.IDhttps://orcid.org/0000-0001-7294-9328pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/8481854548619029pt_BR
dc.contributor.advisor1Morais, Erikson Freitas de-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-0845-7457pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1716165820460791pt_BR
dc.contributor.advisor-co1Aires, Simone Bello Kaminski-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0003-3346-2693pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4283126175158861pt_BR
dc.contributor.referee1Britto Jr., Alceu de Souza-
dc.contributor.referee1IDhttps://orcid.org/0000-0002-3064-3563pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4251936710939364pt_BR
dc.contributor.referee2Freitas, Cinthia Obladen de Almendra-
dc.contributor.referee2IDhttps://orcid.org/0000-0002-7015-094Xpt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/1058846722790485pt_BR
dc.contributor.referee3Morais, Erikson Freitas de-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-0845-7457pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1716165820460791pt_BR
dc.contributor.referee4Borges, Helyane Bronoski-
dc.contributor.referee4IDhttps://orcid.org/0000-0002-9153-3819pt_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/8340106221427112pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.subject.capesEngenharia/Tecnologia/Gestãopt_BR
Aparece nas coleções:PG - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
recuperacaotrajetoriacaracteresdeeplearning.pdf17,62 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.