Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/36450
Título: Detecção de nódulos nas pregas vocais através da proeminência do pico cepstral de vogal sustentada
Autor(es): Tokuhara, Larissa Ayumi
Orientador(es): Dajer, María Eugenia
Palavras-chave: Distúrbios da voz - Tratamento
Distúrbios da fala
Sistemas de processamento da fala
Voice disorders - Treatment
Speech disorders
Speech processing systems
Data do documento: 9-Dez-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: TOKUHARA, Larissa Ayumi. Detecção de nódulos nas pregas vocais através da proeminência do pico cepstral de vogal sustentada. 2021. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Eletrônica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2021.
Resumo: Este trabalho tem como objetivo detectar nódulos nas pregas vocais através da proeminência do pico cepstral (CPP) e do pico cepstral suavizado (CPPS) de vogal sustentada. O cepstro de potência foi calculado na escala decibel, como na literatura, e para efeitos de comparação também na escala linear. Foram consideradas 10 estatísticas de 8 configurações de CPP e 12 de CPPS para 35 voluntários foram consideradas. Para avaliar a capacidade discriminante das estatísticas descritivas, o teste de Kruskal Wallis foi realizado. A moda do CPP calculado na escala decibel com tempo de janelamento T = 20 ms apresentou a melhor capacidade discriminante, alcançando um valor-p de 4,22e-06. A classificação das estatísticas foi realizada através de uma Máquina de Vetores de Suporte (SVM) com validação cruzada do tipo leave- one-out e considerando três diferentes tipos de kernels: linear, polinominal e gaussiano. A melhor acurácia obtida foi de 0,97 para combinações estatísticas média/quinto percentil/assimetria e mediana/quinto percentil/assimetria do CPP calculado na escala decibel com tempo de janelamento T = 20 ms. De maneira geral, os resultados indicam que a combinação de estatísticas relacionadas à localização da distribuição com estatísticas que caracterizam o formato da distribuição são promissoras para a classificação. Apesar da literatura afirmar a eficiência do CPPS para distinguir vozes saudáveis de patológicas, neste trabalho o CPP apresentou uma melhor capacidade discriminante no Teste de Kruskal Wallis e melhores valores de acurácia na classificação.
Abstract: This work aims to detect nodules in the vocal folds through the prominence of the cepstral peak (CPP) and the prominence of the smoothed cepstral peak (CPPS) of a sustained vowel. As in the literature, the power cepstr was calculated on the decibel scale and, for comparison purposes, this work calculated the cepstr on the linear scale. 10 descriptive statistics from 8 CPP and 12 CPPS configurations for 35 volunteers were considered. To assess the discriminant capacity of descriptive statistics, the Kruskal Wallis test was performed. The CPP mode calculated on the decibel scale with windowing time T = 20ms showed the best discriminant capacity, reaching a p-value of 4.22e-06. The classification of statistics was performed using a leave- one-out cross-validated SVM and considering three different types of kernels: linear, polynomial and Gaussian. The best accuracy obtained was 0.97 for statistical combinations mean/fifth percentile/asymmetry and median/fifth percentile/asymmetry of the CPP calculated on the decibel scale with windowing time T = 20ms. Overall, the results indicate that the combination of statistics related to the location of the distribution with statistics that characterize the shape of the distribution are promising for classification. Although the literature affirms the efficiency of the CPPS to distinguish healthy from pathological voices, in this work the CPP presented a better discriminating ability in the Kruskal Wallis Test and better accuracy values in the classification.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/36450
Aparece nas coleções:CP - Engenharia Eletrônica

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
deteccaonodulospregasvocais.pdf1,59 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons