Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/37697
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Resende, Gustavo Silva | - |
dc.date.accessioned | 2025-08-01T19:13:20Z | - |
dc.date.available | 2025-08-01T19:13:20Z | - |
dc.date.issued | 2022-12-14 | - |
dc.identifier.citation | RESENDE, Gustavo Silva. Leitura labial em vídeos com a utilização de aprendizado profundo. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. | pt_BR |
dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/37697 | - |
dc.description.abstract | In recent years, the evolution and popularization of machine learning techniques have allowed sophisticated automated lip reading algorithms to be proposed. To accompany such algorithms, datasets composed of images prepared for this purpose were created, which may contain images related to letters, digits, words or phrases spoken by one or more speakers. Thus, the present work shows the construction of a dataset composed of images related to words being spoken by a single speaker. In addition, deep learning models based on convolutional neural networks was also used to perform automated lip reading on this dataset reaching up to 90.28% accuracy. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
dc.rights | openAccess | pt_BR |
dc.rights | Attribution-NonCommercial-ShareAlike 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | * |
dc.subject | Surdos - Meios de comunicação | pt_BR |
dc.subject | Aprendizado do computador | pt_BR |
dc.subject | Aprendizado profundo | pt_BR |
dc.subject | Redes Neurais (Computação) | pt_BR |
dc.subject | Deaf - Means of communication | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject | Deep learning (Machine learning) | pt_BR |
dc.subject | Neural networks (Computer science) | pt_BR |
dc.title | Leitura labial em vídeos com a utilização de aprendizado profundo | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.description.resumo | Nos últimos anos a evolução e popularização das técnicas de aprendizado de máquina permitiram com que algoritmos sofisticados de leitura labial automatizada fossem propostos. Para acompanhar tais algoritmos, datasets compostos por imagens preparadas para este fim foram criados, podendo conter imagens relacionadas a letras, dígitos, palavras ou frases ditas por um ou mais falantes. Com isso, o presente trabalho apresenta a construção de um dataset composto por imagens relacionadas a palavras sendo ditas por um único falante. Além disso, também foram utilizados modelos de aprendizado profundo baseados em redes neurais convolucionais para realizar leitura labial automatizada sobre esse dataset atingindo até 90,28% de acurácia. | pt_BR |
dc.degree.local | Cornélio Procópio | pt_BR |
dc.publisher.local | Cornelio Procopio | pt_BR |
dc.contributor.advisor1 | Oliveira, Claiton de | - |
dc.contributor.referee1 | Oliveira, Claiton de | - |
dc.contributor.referee2 | Corrêa, Cléber Gimenez | - |
dc.contributor.referee3 | Sanches, Silvio Ricardo Rodrigues | - |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.program | Engenharia da Computação | pt_BR |
dc.publisher.initials | UTFPR | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
Aparece nas coleções: | CP - Engenharia da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
leituralabialaprendizadoprofundo.pdf | 986,34 kB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons