Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/27301
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Santos, Carla Maria Martins dos | - |
dc.date.accessioned | 2022-02-22T23:36:35Z | - |
dc.date.available | 2022-02-22T23:36:35Z | - |
dc.date.issued | 2014-11-26 | - |
dc.identifier.citation | SANTOS, Carla Maria Martins dos. Desenvolvimento de um sistema de reconhecimento de fala usando modelos ocultos de Markov. 2014. Trabalho de Conclusão de Curso (Bacharelado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2014. | pt_BR |
dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/27301 | - |
dc.description.abstract | In this study, we present the development of a speech recognition system in Matlab software that can recognize words spoken by different speakers. The method proposed is based on three stages: signal pre-processing, Markov chains and pattern recognition. However, the whole system consists of five main blocks: signal acquisition, preprocessing, parameter extraction, Hidden Markov Model and signal recognition of interest, it may evolve towards classification of speech/speaker and control some device/system of interest. In speech recognition systems, HMM is capable of modeling the variability of the speech signal, based on a stochastic process which may carry the recognition of isolated words or continuous, with small or large vocabularies. The patterns used were the Mel-Frequency Cepstral Coefficients using mel cepstral coefficients to represent characteristics of the speech signal. Derived from the Fast Fourier Transform and the analysis by means of a filter bank in mel scale, the MFCC are used to train the HMM and recognition validation. For greater robustness the system, samples were collected from different users, forming a database of more complete data for training and validation of the HMM. In analyzing the results, the application of HMM for training and validation of the system had a mean accuracy level of 92% in recognition of utterances of interest, when trained with only one speaker, and success rate of 98% when trained with all the speakers used in validation, which shows that the system is capable of speaker-independent recognition. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
dc.rights | openAccess | pt_BR |
dc.subject | Reconhecimento automático da voz | pt_BR |
dc.subject | Markov, Processos de | pt_BR |
dc.subject | Percepção de padrões | pt_BR |
dc.subject | Automatic speech recognition | pt_BR |
dc.subject | Markov processes | pt_BR |
dc.subject | Pattern perception | pt_BR |
dc.title | Desenvolvimento de um sistema de reconhecimento de fala usando modelos ocultos de Markov | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.description.resumo | Neste trabalho, apresenta-se o desenvolvimento de um sistema de reconhecimento de fala no software Matlab capaz de reconhecer palavras pronunciadas de forma isolada por diferentes locutores. O método utilizado baseia-se em três etapas: pré-processamento dos sinais, modelagem por cadeias de Markov e reconhecimento de padrões. Porém, o sistema como um todo é formado por cinco blocos principais: aquisição do sinal, pré-processamento, extração dos parâmetros, Modelo Oculto de Markov (HMM) e reconhecimento do sinal de interesse, podendo evoluir para classificação da elocução/locutor e acionamento de algum dispositivo/sistema de interesse. Nos sistemas de reconhecimento de fala, os HMM são capazes de modelar as variabilidades do sinal de voz, baseando-se em um processo estocástico que pode realizar o reconhecimento de palavras isoladas ou contínuas, com vocabulários pequenos ou grandes. Os padrões usados foram os Mel-Frequency Cepstral Coefficients (MFCC) que utilizam coeficientes cepstrais de frequência mel para representar as características do sinal de voz. Derivados da Transformada Rápida de Fourier e da análise por meio de um banco de filtros na escala Mel, os MFCC são utilizados para treinar o HMM e validar o reconhecimento. Diante disso, para maior robustez do sistema foram coletadas amostras de diferentes usuários, formando-se um banco de dados mais completo para o treinamento e validação do HMM. Na análise dos resultados, a aplicação de HMM para treinamento e validação do sistema apresentou índice médio de acerto de 92% no reconhecimento da elocução de interesse, quando treinado com apenas um locutor e, índice de acerto de 98% quando treinado com todos os locutores usados na validação, o que demonstra que o sistema é capaz de realizar o reconhecimento independente do locutor. | pt_BR |
dc.degree.local | Cornélio Procópio | pt_BR |
dc.publisher.local | Cornelio Procopio | pt_BR |
dc.contributor.advisor1 | Scalassara, Paulo Rogério | - |
dc.contributor.referee1 | Scalassara, Paulo Rogério | - |
dc.contributor.referee2 | Endo, Wagner | - |
dc.contributor.referee3 | Durand, Fábio Renan | - |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.program | Engenharia Elétrica | pt_BR |
dc.publisher.initials | UTFPR | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | pt_BR |
Aparece nas coleções: | CP - Engenharia Elétrica |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
CP_COELT_2014_2_04.pdf | 1,31 MB | Adobe PDF | ![]() Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.