Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/38936
Registro completo de metadados
Campo DCValorIdioma
dc.creatorYamamura, Cezar Fumio-
dc.date.accessioned2025-11-18T20:42:35Z-
dc.date.available2025-11-18T20:42:35Z-
dc.date.issued2025-10-22-
dc.identifier.citationYAMAMURA, Cezar Fumio. Análise de modelos de conversão de fala sussurrada para normal em língua portuguesa. 2025. Tese (Doutorado em Engenharia Elétrica - Uel/Utpfr) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/38936-
dc.description.abstractWhispered speech is a common and secondary mechanism of communication. However, individuals with aphonia, such as laryngectomized patients, rely on whispered speech as their primary means of expression. Due to the significant differences between whispered and normal speech, speech recognition and conversion systems face major challenges in achieving accurate transformation between them. This doctoral thesis addresses, discusses, and proposes solutions across three main fronts: i) An evaluation of four voice conversion models without prior training on whispered speech, assessed through the Multiple Stimuli with Hidden Reference and Anchor (MUSHRA) perceptual speech test for whisper-to-normal conversion. The k-nearest neighbors voice conversion model (KNN-VC) outperformed the others in both objective and subjective metrics; ii) The construction of a Brazilian Portuguese whispered speech database, duly approved by the Research Ethics Committee, aiming to address the scarcity of data in this linguistic modality and expand opportunities for scientific experimentation; iii) Enhancements to the KNN-VC model from different perspectives, including: experiments with alternative feature extraction models; transfer learning using the low-rank adaptation (LoRA) algorithm; mapping of parallel whispered and normal speech data with KNN (pKNN-VC), and with MLP (MLP-VC). Finally, the thesis highlights the contributions derived from each study and discusses opportunities and directions for future research.pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectBanco de dadospt_BR
dc.subjectProgramas de aprendizadopt_BR
dc.subjectFalapt_BR
dc.subjectDatabasespt_BR
dc.subjectApprenticeship programspt_BR
dc.subjectSpeechpt_BR
dc.titleAnálise de modelos de conversão de fala sussurrada para normal emlíngua portuguesapt_BR
dc.title.alternativeAnalysis of voice conversion models for whisper-to-normal portuguese speechpt_BR
dc.typedoctoralThesispt_BR
dc.description.resumoO sussurro é um mecanismo de fala comum e secundário para a comunicação. Entretanto, indivíduos com afonia, como os laringectomizados, utilizam a fala sussurrada como principal meio de expressão. Devido às diferenças significativas entre a fala sussurrada e a fala normal, os sistemas de reconhecimento e conversão de fala enfrentam grandes desafios para realizar essa transformação de forma precisa. Esta tese de doutorado aborda, discute e propõe soluções em três frentes principais: i) Avaliação de quatro modelos de conversão de voz sem treinamento prévio com fala sussurrada, utilizando o teste perceptual de fala MUSHRA (Multiple Stimuli with Hidden Reference and Anchor) para analisar a conversão de sussurro para fala normal. O modelo de conversão de voz por k-vizinhos mais próximos (KNN-VC) se destacou em métricas objetivas e subjetivas; ii) Construção de um banco de dados de fala sussurrada em português brasileiro, devidamente aprovado pelo Comitê de Ética em Pesquisa, com o objetivo de suprir a escassez de dados nessa modalidade linguística e ampliar as possibilidades de experimentação científica; iii) Aprimoramento do modelo KNN-VC em diferentes perspectivas, incluindo: estudo com modelos alternativos de extração de características; aprendizado por transferência utilizando o algoritmo de adaptação de baixo nível (LoRA); mapeamento de dados paralelos de voz sussurrada e normal com KNN (pKNN-VC), e com MLP (MLP-VC). Por fim, são destacadas as contribuições obtidas em cada estudo, bem como discussões sobre oportunidades e direções para futuros trabalhospt_BR
dc.degree.localCornélio Procópiopt_BR
dc.publisher.localCornelio Procopiopt_BR
dc.creator.IDhttps://orcid.org/0000-0002-4085-070Xpt_BR
dc.creator.Latteshttps://lattes.cnpq.br/8471372431195427pt_BR
dc.contributor.advisor1Scalassara, Paulo Rogerio-
dc.contributor.advisor1Latteshttps://lattes.cnpq.br/5016119298122922pt_BR
dc.contributor.referee1Agulhari, Cristiano Marcos-
dc.contributor.referee1Latteshttps://lattes.cnpq.br/4935395556663775pt_BR
dc.contributor.referee2Spatti, Danilo Hernane-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-4613-4509pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7371885828178292pt_BR
dc.contributor.referee3Santos, Herman Lucas dos-
dc.contributor.referee3Latteshttps://lattes.cnpq.br/5862841460156282pt_BR
dc.contributor.referee4Marinello Filho, Jose Carlos-
dc.contributor.referee4Latteshttps://lattes.cnpq.br/0539500854426508pt_BR
dc.contributor.referee5Scalassara, Paulo Rogerio-
dc.contributor.referee5Latteshttps://lattes.cnpq.br/5016119298122922pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica - Uel/Utpfrpt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.subject.capesEngenharia Elétricapt_BR
Aparece nas coleções:CP - Programa de Pós-Graduação em Engenharia Elétrica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
conversaofalasussurradaportugues.pdf12,94 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.