Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31507
Título: Classificação de textos escolares com aprendizado de máquina e lógica Fuzzy
Título(s) alternativo(s): Classification of school texts with machine learning and Fuzzy logic
Autor(es): Dressler, Nelson Jacob
Orientador(es): Mantovani, Rafael Gomes
Palavras-chave: Aprendizado do computador
Processamento de linguagem natural (Computação)
Lingüística - Processamento de dados
Machine learning
Natural language processing (Computer science)
Computational linguistics
Data do documento: 26-Mai-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Dois Vizinhos
Citação: DRESSLER, Nelson Jacob. Classificação de textos escolares com aprendizado de máquina e lógica Fuzzy. 2022. Monografia (Especialização em Ciência de Dados) - Universidade Tecnológica Federal do Paraná, Dois Vizinhos, 2022.
Resumo: Nos dias atuais, em meio ao processo de ensino-aprendizagem, é muito comum alunos buscarem informações acerca das disciplinas com propósitos de complementação de estudos ou para a execução de trabalhos escolares. Para isso, é possível utilizar motores de busca na Internet, porém nem sempre os textos possuem a complexidade compatível com o grau de escolaridade do aluno. Uma solução para tal propósito e a filtragem automática de textos, onde são criados modelos computacionais para classificação textual de acordo com seus contextos. Muitos estudos têm apresentado soluções baseadas em técnicas de Aprendizado de Máquina ou Lógica Fuzzy, porém não existe um comparativo, nem um estudo analisando a possibilidade da combinação de ambos os métodos. Este trabalho explora este cenário, implementando duas soluções: uma baseada apenas em algoritmos tradicionais de aprendizado de máquina, e outra combinando a execução de uma Árvore de Decisão com a automatização de um sistema de Lógica Fuzzy. Em ambas soluções são aplicadas técnicas de Processamento de Linguagem Natural, a fim de selecionar características dos conteúdos textuais e introduzi-los no pipeline de classificação. Experimentos foram conduzidos e os resultados obtidos sugerem que, para o cenário explorado, os algoritmos de Aprendizado de Máquina possuem resultado superior, com acurácia balanceada por classes em torno de 0.89 nos dados de teste. Além disso, o uso de modelos de Árvore de Decisão para a criação das regras de um Sistema Fuzzy pôde adicionar mais interoperabilidade e compreensão à classificação de textos escolares, porém com uma acurácia balanceada de aproximadamente 0.5, ainda superior a todos os baselines escolhidos para o experimento deste trabalho.
Abstract: Nowadays, during the teaching-learning process, it is prevalent for students to seek information about the subjects to complement studies or execute school work. For this, it is possible to use search engines on the Internet, but the texts do not always have the complexity compatible with the student’s level of education. A solution for this purpose is the automatic filtering of texts, where computational models are created for textual classification according to their contexts. Many studies have presented solutions based on Machine Learning or Fuzzy Logic techniques, but there is no comparison nor an analysis considering the possibility of combining both methods. This work explores this scenario, implementing two solutions: one based only on traditional machine learning algorithms and another combining the execution of a Decision Tree with the automation of a Fuzzy Logic system. In both solutions, Natural Language Processing techniques are applied in order to select characteristics of the textual contents and introduce them into the classification pipeline. Experiments were conducted and the results obtained suggest that, for the scenario explored, the Machine Learning algorithms have a superior result, with class-balanced accuracy of around 0.89 in the test data. Furthermore, the use of Decision Tree models to create the rules of a Fuzzy System could add more interpretability and understanding to the classification of school texts, but with a balanced accuracy of approximately 0.5, still superior to all the baselines chosen for the experiment of this work.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/31507
Aparece nas coleções:DV - Ciência de Dados

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
classificacaotextosaprendizadodemaquina.pdf13,32 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons