Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/37697
Registro completo de metadados
Campo DCValorIdioma
dc.creatorResende, Gustavo Silva-
dc.date.accessioned2025-08-01T19:13:20Z-
dc.date.available2025-08-01T19:13:20Z-
dc.date.issued2022-12-14-
dc.identifier.citationRESENDE, Gustavo Silva. Leitura labial em vídeos com a utilização de aprendizado profundo. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/37697-
dc.description.abstractIn recent years, the evolution and popularization of machine learning techniques have allowed sophisticated automated lip reading algorithms to be proposed. To accompany such algorithms, datasets composed of images prepared for this purpose were created, which may contain images related to letters, digits, words or phrases spoken by one or more speakers. Thus, the present work shows the construction of a dataset composed of images related to words being spoken by a single speaker. In addition, deep learning models based on convolutional neural networks was also used to perform automated lip reading on this dataset reaching up to 90.28% accuracy.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rightsAttribution-NonCommercial-ShareAlike 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.subjectSurdos - Meios de comunicaçãopt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectAprendizado profundopt_BR
dc.subjectRedes Neurais (Computação)pt_BR
dc.subjectDeaf - Means of communicationpt_BR
dc.subjectMachine learningpt_BR
dc.subjectDeep learning (Machine learning)pt_BR
dc.subjectNeural networks (Computer science)pt_BR
dc.titleLeitura labial em vídeos com a utilização de aprendizado profundopt_BR
dc.typebachelorThesispt_BR
dc.description.resumoNos últimos anos a evolução e popularização das técnicas de aprendizado de máquina permitiram com que algoritmos sofisticados de leitura labial automatizada fossem propostos. Para acompanhar tais algoritmos, datasets compostos por imagens preparadas para este fim foram criados, podendo conter imagens relacionadas a letras, dígitos, palavras ou frases ditas por um ou mais falantes. Com isso, o presente trabalho apresenta a construção de um dataset composto por imagens relacionadas a palavras sendo ditas por um único falante. Além disso, também foram utilizados modelos de aprendizado profundo baseados em redes neurais convolucionais para realizar leitura labial automatizada sobre esse dataset atingindo até 90,28% de acurácia.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.contributor.advisor1Oliveira, Claiton de-
dc.contributor.referee1Oliveira, Claiton de-
dc.contributor.referee2Corrêa, Cléber Gimenez-
dc.contributor.referee3Sanches, Silvio Ricardo Rodrigues-
dc.publisher.countryBrasilpt_BR
dc.publisher.programEngenharia da Computaçãopt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
Aparece nas coleções:CP - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
leituralabialaprendizadoprofundo.pdf986,34 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons