Sistema de automatização de animação Lip Sync por algoritmo de alinhamento forçado

Nishimura, Fernando Itiro

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/38817

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Nishimura, Fernando Itiro	-
dc.date.accessioned	2025-11-03T21:48:56Z	-
dc.date.available	2025-11-03T21:48:56Z	-
dc.date.issued	2024-11-04	-
dc.identifier.citation	NISHIMURA, Fernando Itiro. Sistema de automatização de animação Lip Sync por algoritmo de alinhamento forçado. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Eletrônica) - Universidade Tecnológica Federal do Paraná, Curitiba, 2024.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/38817	-
dc.description.abstract	This paper presents the development of a plug-in program for the Autodesk MAYA animation editor, with the aim of automating 3D lip sync animations in English and Japanese. The automation was performed using machine learning methods applied to phoneme recognition by forced alignment and speech emotion recognition by neural networks, using as input audio files, their transcriptions and sets of predefined viseme animations. For the acoustic models in English, pre-trained models made available by the Montreal Forced Alignment (MFA) API were used. However, due to alignment problems in the existing pre-trained model for Japanese, it was necessary to train a new model, adapted to the kana syllabic system. This approach simplified the Japanese phonetic dictionary, mitigating errors caused by the flexibility and wide lexical variety of the language. The tool developed aims to reduce the workload of animators, given that manually creating this type of animation is often considered repetitive and time-consuming. In addition, the proposed method improves the quality of animations by giving greater naturalness to lip movements, in contrast to more simplified approaches that only use time-domain analysis of sound waves. The technology presented has applications in several areas, such as cartoon animation, electronic games, computer graphics and any media that requires synchronized lip animations from audio files.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	pt_BR
dc.subject	Algorítmos computacionais	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Fonética	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Língua japonesa	pt_BR
dc.subject	Sistemas de processamento da fala	pt_BR
dc.subject	Computer algorithms	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Phonetics	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Japanese language	pt_BR
dc.subject	Speech processing systems	pt_BR
dc.title	Sistema de automatização de animação Lip Sync por algoritmo de alinhamento forçado	pt_BR
dc.title.alternative	Lip Sync animation automation system by forced alignment algorithm	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	Este trabalho apresenta o desenvolvimento de um programa no formato de plug-in para o editor de animações Autodesk MAYA, com o objetivo de automatizar animações 3D de sincronização labial (lip sync) em inglês e japonês. A automação foi realizada por meio de métodos de aprendizado de máquina (machine learning) aplicados ao reconhecimento de fonemas por alinhamento fonético e emoções na fala por redes neurais, utilizando como entrada arquivos de áudio, suas transcrições e conjuntos de animações pré-definidas de visemas. Para os modelos acústicos em inglês, foram utilizados modelos pré-treinados disponibilizados pela API Montreal Forced Alignment (MFA). No entanto, devido a problemas de alinhamento no modelo pré-treinado existente para o japonês, foi necessário treinar um novo modelo, adaptado ao sistema silábico kana. Essa abordagem simplificou o dicionário fonemático japonês, mitigando erros causados pela flexibilidade e pela ampla variedade lexical da língua. A ferramenta desenvolvida visa reduzir a carga de trabalho dos animadores, dado que a criação manual desse tipo de animação é frequentemente considerada repetitiva e demorada. Além disso, o método proposto melhora a qualidade das animações ao conferir maior naturalidade aos movimentos labiais, em contraste com abordagens mais simplificadas que utilizam apenas análises no domínio do tempo das ondas sonoras. A tecnologia apresentada possui aplicações em diversas áreas, como animação de desenhos animados, jogos eletrônicos, computação gráfica e qualquer mídia que exija animações labiais sincronizadas a partir de arquivos de áudio.	pt_BR
dc.degree.local	Curitiba	pt_BR
dc.publisher.local	Curitiba	pt_BR
dc.contributor.advisor1	Lopes, Heitor Silvério	-
dc.contributor.referee1	Lopes, Heitor Silvério	-
dc.contributor.referee2	Borba, Gustavo Benvenutti	-
dc.contributor.referee3	Nassu, Bogdan Tomoyuki	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Engenharia Eletrônica	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA	pt_BR
Aparece nas coleções:	CT - Engenharia Eletrônica

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
sistemaautomatizacaoanimacao.pdf		3,56 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons