Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30188
Registro completo de metadados
Campo DCValorIdioma
dc.creatorYamamura, Cezar Fumio-
dc.date.accessioned2022-11-28T13:13:02Z-
dc.date.available2022-11-28T13:13:02Z-
dc.date.issued2021-11-17-
dc.identifier.citationYAMAMURA, Cezar Fumio. Conversão de fala sussurrada para fala normal usando modelos neurais. 2021. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/30188-
dc.description.abstractWhispering is a common and secondary speech mechanism for communicating, however, in some cases, it can also be the main form to communicate, such as cases of people with pathologies of the larynx or who have suffered some type of damage to the vocal folds. Differences in characteristics between normal voice and whispered discussions have raised in speech recognition area, due to the difficulty of converting whispered to normal speech. This work presents the study of the characteristics of normal and whispered speech, and the implementation of the whispered to normal voice conversion system using multilayer perceptron networks and generative adversarial networks. The database used came from the partnership with Faculdade de Porto, which are vowel signs used in European Portuguese. To validate the study, three metrics were analyzed: Mel-Cepstrum Distortion, square root of the mean error of log(F0) and accuracy of the vowel classifier.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectDistúrbios da falapt_BR
dc.subjectRedes Neurais (Computação)pt_BR
dc.subjectComunicaçãopt_BR
dc.subjectSpeech disorderspt_BR
dc.subjectNeural networks (Computer science)pt_BR
dc.subjectCommunicationpt_BR
dc.titleConversão de fala sussurrada para fala normal usando modelos neuraispt_BR
dc.typemasterThesispt_BR
dc.description.resumoO sussurro é um mecanismo de fala comum e secundário para se comunicar, porém, em alguns casos, pode ser a principal forma de diálogo, como nos casos de pessoas com patologias da laringe ou que sofreram algum tipo de dano nas pregas vocais. As diferenças de características entre a voz normal e a sussurrada têm levantado discussões na área de reconhecimento de fala, pela dificuldade de realizar a conversão de fala sussurrada para fala vozeada. Este trabalho apresenta o estudo das características da fala normal e sussurrada, e a implementação do sistema de conversão de voz normal para sussurrada utilizando redes perceptron multicamadas e redes generativas adversárias. Os dados utilizados foram provenientes pela parceria com Faculdade de Porto, que são sinais de vogais usados no português europeu. Para a validação do estudo, foram analisado três métricas: Mel-Cepstrum Distortion, raiz quadrada do erro médio do log(F0) e acurácia do classificador de vogais.pt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.creator.IDhttps://orcid.org/ 0000-0002-4085-070Xpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/8471372431195427pt_BR
dc.contributor.advisor1Scalassara, Paulo Rogerio-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5016119298122922pt_BR
dc.contributor.referee1Agulhari, Cristiano Marcos-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4935395556663775pt_BR
dc.contributor.referee2Spatti, Danilo Hernane-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7371885828178292pt_BR
dc.contributor.referee3Scalassara, Paulo Rogerio-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/5016119298122922pt_BR
dc.contributor.referee4Barbon Junior, Sylvio-
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétricapt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
dc.subject.capesEngenharia Elétricapt_BR
Aparece nas coleções:CP - Programa de Pós-Graduação em Engenharia Elétrica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
whisperedspeechneuralmodels.pdf4,45 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.