Reconhecimento automático de palavras

Ishizaki, Mauricio Yoiti

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/7154

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Ishizaki, Mauricio Yoiti
dc.date.accessioned	2020-11-10T17:54:58Z	-
dc.date.available	2020-11-10T17:54:58Z	-
dc.date.issued	2018-06-19
dc.identifier.citation	ISHIZAKI, Mauricio Yoiti. Reconhecimento automático de palavras. 2018. 43 f. Trabalho de Conclusão de curso (Graduação em Engenharia de Controle e Automação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2018.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/7154	-
dc.description.abstract	Automatic word recognition is the translation of human speech into text, which has proved useful in man - computer communication. For this reason, several researches were developed in this area and consequently applications, such as virtual assistants, have arisen to make life easier for people. However, people who suffer from any dysphonia (hoarseness) can’t fully enjoy these applications, due to the distortions in their voice. This paper proposes the use of Convolutional Neural Networks (CNNs) to make the recognition of spoken words with this type of distortion. A database of 20 words with 28 samples was used, all voices were from different dysphonic people. Several topology were created for CNN, varying some hyperparameters of the network. All topologies were training and testing. For the test set, the topology with the highest accuracy obtained a result of 82,50%.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Sistemas de reconhecimento de padrões	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Processamento de palavras	pt_BR
dc.subject	Pattern recognition systems	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Word processing	pt_BR
dc.title	Reconhecimento automático de palavras	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	Reconhecimento automático de palavras é a tradução da fala humana para texto, o qual se mostrou útil na comunicação homem - computador. Por este motivo, várias pesquisas foram feitas nesta área e consequentemente aplicações, como assistentes virtuais, surgiram para facilitar a vida das pessoas. No entanto, pessoas que sofrem com alguma disfonia (rouquidão) não conseguem desfrutar totalmente destas aplicações, devido às distorções da voz. Este trabalho propõe a utilização de Redes Neurais Convolucionais (CNNs) para fazer o reconhecimento de palavras faladas com esse tipo de distorção. Utilizou-se uma base de dados de 20 palavras com 28 amostras, sendo todas as vozes de diferentes pessoas disfônicas. Foram criadas diversas topologias para a CNN, variando alguns hiperparâmetros da rede. Foi feito o treinamento e teste de cada uma dela. Para o conjunto de teste, a topologia com maior acurácia obteve um resultado de 82,50%.	pt_BR
dc.degree.local	Cornélio Procópio	pt_BR
dc.publisher.local	Cornelio Procopio	pt_BR
dc.contributor.advisor1	Dajer, María Eugenia
dc.contributor.advisor-co1	Spatti, Danilo Hernane
dc.contributor.referee1	Dajer, María Eugenia
dc.contributor.referee2	Spatti, Danilo Hernane
dc.contributor.referee3	Agulhari, Cristiano Marcos
dc.contributor.referee4	Goedtel, Alessandro
dc.publisher.country	Brasil	pt_BR
dc.publisher.program	Engenharia de Controle e Automação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	Engenharias	pt_BR
Aparece nas coleções:	CP - Engenharia de Controle e Automação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CP_COEAU_2018_1_09.pdf		1,07 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas