Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/27418
Título: | Classificação de disfonias utilizando redes neurais artificiais e transformadas Wavelet Packet |
Autor(es): | Lima, Aron Alexandre Martins |
Orientador(es): | Dajer, María Eugenia |
Palavras-chave: | Redes Neurais Artificiais Transformadas integrais Reconhecimento automático da voz Neural networks (Computer science) Integral transforms Automatic speech recognition |
Data do documento: | 23-Nov-2018 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Cornelio Procopio |
Citação: | LIMA, Aron Alexandre Martins. Classificação de disfonias utilizando redes neurais artificiais e transformadas Wavelet Packet. 2018. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018. |
Resumo: | Grande parte das patologias laríngeas causam alterações no padrão vibratório das pregas vocais. Essas alterações produzem mudanças na qualidade vocal e podem tornar-se um problema significativo, principalmente para quem faz uso ocupacional e profissional da voz. Os métodos de avaliação de voz são em geral invasivos, possuem alto custo de implementação e causam desconforto ao paciente. Por outro lado os métodos não invasivos não possuem boa resolução e robustez, já que nestes métodos o sinal de voz é analisado como um sinal periódico, sem considerar que quanto mais patológica a voz, mais aperiódico será o sinal. As Redes Neurais Artificiais do tipo Perceptron Multicamadas, junto às Transformadas Wavelets Packet, vêm sendo amplamente aplicadas no reconhecimento de padrões de sinais biológicos, apresentando boa acurácia, com altos índices de confiabilidade. Por tais motivos, este trabalho aplica às Redes Neurais Artificiais e Transformadas Wavelets Packet para análise de sinais vocais que ajudem na classificação de disfonias funcionais e orgânicas, bem como vozes saudáveis. Dessa forma obteve-se acurácia na classificação de 100% para saudáveis, 99,55% para disfonias orgânicas e 93,47% para disfonias funcionais, com 98% de confiabilidade. |
Abstract: | Most laryngeal pathologies cause deviations in the vibratory pattern of the vocal folds. These deviations produce changes in vocal quality and can become a significant problem, especially for occupational and professional voice users. Voice assessment methods are generally invasive, have a high implementation cost and cause discomfort to the patient. On the other hand, noninvasive methods do not have good resolution and robustness, since they assume voice as a periodic signal, without considering that the more pathological the voice, the more aperiodic is the signal. Artificial Neural Networks as Multilayer Perceptron have been widely applied in the recognition of nonlinear biological signal patterns, presenting good accuracy, with high reliability. For these reasons, this work proposes the application of Artificial Neural Networks and Wavelet Packet Transform for voice signal analysis and for classification of functional and organic dysphonias, as well as healthy voices. In this way, 100% classification accuracy was obtained for healthy, 99.55% for organic dysphonia and 93.47% for functional dysphonia, with 98% reliability. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/27418 |
Aparece nas coleções: | CP - Engenharia de Controle e Automação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CP_COEAU_2018_2_01.pdf | 2,86 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.