Conversão de fala sussurrada para fala normal usando modelos neurais

Yamamura, Cezar Fumio

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30188

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Yamamura, Cezar Fumio	-
dc.date.accessioned	2022-11-28T13:13:02Z	-
dc.date.available	2022-11-28T13:13:02Z	-
dc.date.issued	2021-11-17	-
dc.identifier.citation	YAMAMURA, Cezar Fumio. Conversão de fala sussurrada para fala normal usando modelos neurais. 2021. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/30188	-
dc.description.abstract	Whispering is a common and secondary speech mechanism for communicating, however, in some cases, it can also be the main form to communicate, such as cases of people with pathologies of the larynx or who have suffered some type of damage to the vocal folds. Differences in characteristics between normal voice and whispered discussions have raised in speech recognition area, due to the difficulty of converting whispered to normal speech. This work presents the study of the characteristics of normal and whispered speech, and the implementation of the whispered to normal voice conversion system using multilayer perceptron networks and generative adversarial networks. The database used came from the partnership with Faculdade de Porto, which are vowel signs used in European Portuguese. To validate the study, three metrics were analyzed: Mel-Cepstrum Distortion, square root of the mean error of log(F0) and accuracy of the vowel classifier.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Distúrbios da fala	pt_BR
dc.subject	Redes Neurais (Computação)	pt_BR
dc.subject	Comunicação	pt_BR
dc.subject	Speech disorders	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Communication	pt_BR
dc.title	Conversão de fala sussurrada para fala normal usando modelos neurais	pt_BR
dc.type	masterThesis	pt_BR
dc.description.resumo	O sussurro é um mecanismo de fala comum e secundário para se comunicar, porém, em alguns casos, pode ser a principal forma de diálogo, como nos casos de pessoas com patologias da laringe ou que sofreram algum tipo de dano nas pregas vocais. As diferenças de características entre a voz normal e a sussurrada têm levantado discussões na área de reconhecimento de fala, pela dificuldade de realizar a conversão de fala sussurrada para fala vozeada. Este trabalho apresenta o estudo das características da fala normal e sussurrada, e a implementação do sistema de conversão de voz normal para sussurrada utilizando redes perceptron multicamadas e redes generativas adversárias. Os dados utilizados foram provenientes pela parceria com Faculdade de Porto, que são sinais de vogais usados no português europeu. Para a validação do estudo, foram analisado três métricas: Mel-Cepstrum Distortion, raiz quadrada do erro médio do log(F0) e acurácia do classificador de vogais.	pt_BR
dc.degree.local	Cornélio Procópio	pt_BR
dc.publisher.local	Cornelio Procopio	pt_BR
dc.creator.ID	https://orcid.org/ 0000-0002-4085-070X	pt_BR
dc.creator.Lattes	http://lattes.cnpq.br/8471372431195427	pt_BR
dc.contributor.advisor1	Scalassara, Paulo Rogerio	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/5016119298122922	pt_BR
dc.contributor.referee1	Agulhari, Cristiano Marcos	-
dc.contributor.referee1Lattes	http://lattes.cnpq.br/4935395556663775	pt_BR
dc.contributor.referee2	Spatti, Danilo Hernane	-
dc.contributor.referee2Lattes	http://lattes.cnpq.br/7371885828178292	pt_BR
dc.contributor.referee3	Scalassara, Paulo Rogerio	-
dc.contributor.referee3Lattes	http://lattes.cnpq.br/5016119298122922	pt_BR
dc.contributor.referee4	Barbon Junior, Sylvio	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA	pt_BR
dc.subject.capes	Engenharia Elétrica	pt_BR
Aparece nas coleções:	CP - Programa de Pós-Graduação em Engenharia Elétrica

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
whisperedspeechneuralmodels.pdf		4,45 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas