Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/27418
Título: Classificação de disfonias utilizando redes neurais artificiais e transformadas Wavelet Packet
Autor(es): Lima, Aron Alexandre Martins
Orientador(es): Dajer, María Eugenia
Palavras-chave: Redes Neurais Artificiais
Transformadas integrais
Reconhecimento automático da voz
Neural networks (Computer science)
Integral transforms
Automatic speech recognition
Data do documento: 23-Nov-2018
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: LIMA, Aron Alexandre Martins. Classificação de disfonias utilizando redes neurais artificiais e transformadas Wavelet Packet. 2018. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.
Resumo: Grande parte das patologias laríngeas causam alterações no padrão vibratório das pregas vocais. Essas alterações produzem mudanças na qualidade vocal e podem tornar-se um problema significativo, principalmente para quem faz uso ocupacional e profissional da voz. Os métodos de avaliação de voz são em geral invasivos, possuem alto custo de implementação e causam desconforto ao paciente. Por outro lado os métodos não invasivos não possuem boa resolução e robustez, já que nestes métodos o sinal de voz é analisado como um sinal periódico, sem considerar que quanto mais patológica a voz, mais aperiódico será o sinal. As Redes Neurais Artificiais do tipo Perceptron Multicamadas, junto às Transformadas Wavelets Packet, vêm sendo amplamente aplicadas no reconhecimento de padrões de sinais biológicos, apresentando boa acurácia, com altos índices de confiabilidade. Por tais motivos, este trabalho aplica às Redes Neurais Artificiais e Transformadas Wavelets Packet para análise de sinais vocais que ajudem na classificação de disfonias funcionais e orgânicas, bem como vozes saudáveis. Dessa forma obteve-se acurácia na classificação de 100% para saudáveis, 99,55% para disfonias orgânicas e 93,47% para disfonias funcionais, com 98% de confiabilidade.
Abstract: Most laryngeal pathologies cause deviations in the vibratory pattern of the vocal folds. These deviations produce changes in vocal quality and can become a significant problem, especially for occupational and professional voice users. Voice assessment methods are generally invasive, have a high implementation cost and cause discomfort to the patient. On the other hand, noninvasive methods do not have good resolution and robustness, since they assume voice as a periodic signal, without considering that the more pathological the voice, the more aperiodic is the signal. Artificial Neural Networks as Multilayer Perceptron have been widely applied in the recognition of nonlinear biological signal patterns, presenting good accuracy, with high reliability. For these reasons, this work proposes the application of Artificial Neural Networks and Wavelet Packet Transform for voice signal analysis and for classification of functional and organic dysphonias, as well as healthy voices. In this way, 100% classification accuracy was obtained for healthy, 99.55% for organic dysphonia and 93.47% for functional dysphonia, with 98% reliability.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/27418
Aparece nas coleções:CP - Engenharia de Controle e Automação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CP_COEAU_2018_2_01.pdf2,86 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.