Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais

Pavoni, Higor Eduardo

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/27256

Título:	Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais
Autor(es):	Pavoni, Higor Eduardo
Orientador(es):	Dajer, María Eugenia
Palavras-chave:	Classificação Redes Neurais Artificiais Transformadas integrais Classification Neural networks (Computer science) Integral transforms
Data do documento:	22-Jun-2017
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Cornelio Procopio
Citação:	PAVONI, Higor Eduardo. Classificação de sinais vocais em parâmetros não acústicos utilizando redes neurais artificiais. 2017. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) – Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2017.
Resumo:	Este trabalho propõe um método de auxílio para profissionais da voz, em âmbitos clínico, científico e pedagógico, uma vez que a classificação de amostras vocais em parâmetros subjetivos é de extrema importância para diagnosticar patologias e muito utilizada no cotidiano destes profissionais. Utilizando-se amostras previamente gravadas, a voz do paciente é analisada computacionalmente por meio de parâmetros acústicos – energia e entropia logarítmica – extraídos dos coeficientes do terceiro nível da Transformada Wavelet Packet. Posteriormente estas amostras são classificadas por um conjunto de redes neurais artificiais em rugosidade, soprosidade ou tensão, que são parâmetros subjetivos da voz. Para obtenção de maior taxa de acerto, o trabalho propõe a utilização de seis redes neurais artificiais, sendo cada uma especialista na identificação de um dos parâmetros subjetivos, divididos também em feminino e masculino. Os resultados experimentais demonstram que a metodologia proposta pode generalizar adequadamente amostras de voz com percentual médio de acerto de 96,33%.
Abstract:	This work proposes an aid method for speech professionals, in clinical, scientific and pedagogical environments, since the classification of vocal samples into subjective parameters is extremely important for the diagnosis of pathologies and much used in the daily life of these professionals. Using previously recorded samples, the patient's voice is analyzed by means of acoustic parameters - energy and logarithmic entropy - extracted from the third level coefficients of the Wavelet Packet Transform. Subsequently these samples are classified by a set of artificial neural networks in roughness, breathiness or strain, all subjective parameters of the voice.In order to obtain a higher rate of accuracy, the study proposes the use of six artificial neural networks, each one specialized in the identification of one of the subjective parameters, also divided into female and male.The experimental results demonstrate that the proposed methodology can adequately generalize speech samples with a mean percentage of correctness of 96.33%.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/27256
Aparece nas coleções:	CP - Engenharia Elétrica

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CP_COELT_2017_1_13.pdf		2,35 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas