Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/27256
Título: | Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais |
Autor(es): | Pavoni, Higor Eduardo |
Orientador(es): | Dajer, María Eugenia |
Palavras-chave: | Classificação Redes Neurais Artificiais Transformadas integrais Classification Neural networks (Computer science) Integral transforms |
Data do documento: | 22-Jun-2017 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Cornelio Procopio |
Citação: | PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017. |
Resumo: | Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%. |
Abstract: | This work proposes an aid method for speech professionals, in clinical, scientific and pedagogical environments, since the classification of vocal samples into subjective parameters is extremely important for the diagnosis of pathologies and much used in the daily life of these professionals. Using previously recorded samples, the patient's voice is analyzed by means of acoustic parameters - energy and logarithmic entropy - extracted from the third level coefficients of the Wavelet Packet Transform. Subsequently these samples are classified by a set of artificial neural networks in roughness, breathiness or strain, all subjective parameters of the voice.In order to obtain a higher rate of accuracy, the study proposes the use of six artificial neural networks, each one specialized in the identification of one of the subjective parameters, also divided into female and male.The experimental results demonstrate that the proposed methodology can adequately generalize speech samples with a mean percentage of correctness of 96.33%. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/27256 |
Aparece nas coleções: | CP - Engenharia Elétrica |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CP_COELT_2017_1_13.pdf | 2,35 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.