Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/37398
Título: | Predição de evasão estudantil usando aprendizado de máquina |
Título(s) alternativo(s): | Student dropout prediction using machine learning |
Autor(es): | Parra, Pedro Mian |
Orientador(es): | Mantovani, Rafael Gomes |
Palavras-chave: | Evasão universitária Aprendizado do computador Estudantes universitários College dropouts Machine learning College students |
Data do documento: | 19-Dez-2024 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Apucarana |
Citação: | PARRA, Pedro Mian. Predição de evasão estudantil usando aprendizado de máquina. 2024. Trabalho de Conclusão de Curso (Engenharia de Computação) – Universidade Tecnológica Federal do Paraná, Apucarana, 2024. |
Resumo: | Nos últimos anos, a evasão no Ensino Superior tem se intensificado, gerando impactos negativos tanto para os estudantes quanto para as instituições, especialmente no setor público, que sofre perdas financeiras significativas. Diversos fatores contribuem para esse fenômeno, como dificuldades de aprendizado, estrutura inadequada dos cursos e a falta de recursos financeiros. O presente estudo propõe utilizar algoritmos de Aprendizado de Máquina (AM) para prever e identificar padrões comportamentais de estudantes com risco de evasão. Para isso, foram realizados experimentos com dados extraídos do sistema acadêmico da Universidade Tecnológica Federal do Paraná (UTFPR), campus Dois Vizinhos. Os dados foram devidamente anonimizados e pré-processados, para que informações sensíveis não fossem acessadas pelos modelos preditivos. Foram realizados experimentos com diferentes tarefas preditivas explorando toda a completude dos registros extraídos do sistema da universidade. Explorou-se também quatro algoritmos "interpretáveis", que retornam regras das estruturas que permitem os gestores entenderem as predições e tomarem decisões de gestão. Os resultados experimentais mostraram que o melhor algoritmo avaliado foi o Random Forest, com melhor valor médio de F1-Score em todos os experimentos, e atingindo o valor máximo de 0,99 considerando o dataset com apenas os últimos registros dos alunos no sistema acadêmico, na classificação binária entre alunos “Regulares vs Desistentes” com limiares de atributos constantes de 0,05 e correlacionados de 0,8. Embora os resultados sejam promissores, eles ainda carecem da inclusão de variáveis socioeconômicas, o que limita a capacidade do sistema em compreender plenamente as causas da evasão. |
Abstract: | In recent years, dropout rates in Higher Education have intensified, causing negative impacts on students and institutions, particularly in the public sector, which suffers significant financial losses. Various factors contribute to this phenomenon, such as learning difficulties, inadequate course structures, and a lack of financial resources. This study proposes using Machine Learning (ML) algorithms to predict and identify behavioral patterns of students at risk of dropping out. For this purpose, experiments were conducted using data extracted from the academic system of the Federal Technological University of Paraná (UTFPR), Dois Vizinhos campus. The data were properly anonymized and pre-processed to ensure that sensitive information could not be accessed by the predictive models. Experiments were conducted with different predictive tasks, exploring the completeness of the records extracted from the university’s system. Additionally, four "interpretable" algorithms were explored, which provide rules or structures that allow managers to understand predictions and make informed management decisions. The experimental results showed that the best-performing algorithm was Random Forest, achieving the highest average F1-Score across all experiments, with a maximum value of 0.99. This result was obtained using the dataset containing only the latest student records from the academic system, considering a binary classification between “Regular vs. Dropout“ students, with attribute thresholds of 0.05 for constants and 0.8 for correlations. Although the results are promising, they still lack the inclusion of socioeconomic variables, which limits the system’s ability to understand the causes of dropout fully |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/37398 |
Aparece nas coleções: | AP - Engenharia de Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
evasaoaprendizadodemaquina.pdf | 1,24 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons