Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32128
Título: Ciência de dados aplicada à aquisição da língua oral
Título(s) alternativo(s): Data science applied to oral language acquisition
Autor(es): Araújo, Vera Lúcia Vasilévski dos Santos
Orientador(es): Costa, Agnaldo da
Palavras-chave: Mineração de dados (Computação)
Gramática comparada e geral - Fonologia
Aquisição de linguagem
Data mining
Grammar, Comparative and general - Phonology
Language acquisition
Data do documento: 19-Jun-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Santa Helena
Citação: ARAÚJO, Vera Lúcia Vasilévski dos Santos. Ciência de dados aplicada à aquisição da língua oral. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2023.
Resumo: O objetivo deste trabalho é auxiliar na compreensão do processo de aquisição da linguagem verbal oral, a partir da exploração de uma base de dados de fala, utilizando princípios, técnicas e ferramentas da Ciência de Dados. Um banco de dados linguísticos, composto por resultados de testes de produção oral aplicados a crianças de 3 a 7 anos, foi preparado e submetido a técnicas de Data Warehouse, ferramentas de Business Intelligence e mineração de dados. Foram aplicados K-Means, Apriori e Naïve Bayes. Dentre os resultados obtidos, destaca que:1) a variação sociolinguística marcante da região pesquisada está sendo menos realizada pelas novas gerações; 2) por volta dos 5 anos, há uma fase de transição em que ocorrem discrepâncias relevantes na aquisição do sistema fonológico pela criança; 3) no início da alfabetização persistem casos de crianças que não pronunciam todos os sons do português; foram dados os primeiros passos na direção de um modelo que relacione características determinantes da maturação fonoarticulatória. Conclui que, apesar de algumas dificuldades, é possível processar dados linguísticos de forma satisfatória na modelagem de data warehouse, nas ferramentas de BI e em algoritmos de mineração de dados.
Abstract: The goal of this work is to help in the understanding of the acquisition of oral verbal language process, from the exploration of a speech database, using principles, techniques and tools of Data Science. A linguistic database, composed of results of oral production tests applied to children from 3 to 7 years old, was prepared and subjected to Data Warehouse techniques, Business Intelligence tools and data mining. K-Means, Apriori and Naïve Bayes were applied. Among the results obtained, it is worth mentioning that: the marked sociolinguistic variation of the researched region is being less performed by the new generations; around the age of 5, there is a transition phase in which important discrepancies occur in the child's acquisition of the phonological system; at the beginning of literacy, there are cases of children who do not pronounce all the sounds of Portuguese; the first steps were taken towards a model that relates determinant characteristics of honoarticulatory maturation. It concludes that, despite some difficulties, it is possible to process linguistic data satisfactorily in data warehouse modeling, in BI tools and in data mining algorithms.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32128
Aparece nas coleções:SH - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
cienciadadoslinguaoral.pdf1,54 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons