Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30729
Título: Predição do desempenho no ENADE dos discentes de computação
Título(s) alternativo(s): Performance prediction in ENADE of computing students
Autor(es): Capelari, Luis Otávio Oliveira
Orientador(es): Schwerz, André Luís
Palavras-chave: Aprendizado do computador
Mineração de dados (Computação)
Estudantes universitários
Machine learning
Data mining
College students
Data do documento: 15-Jun-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: CAPELARI, Luis Otávio Oliveira. Predição do desempenho no ENADE dos discentes de computação. 2022. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2022.
Resumo: A avaliação da educação superior é importante para garantir sua qualidade, além de ser do interesse de discentes, docentes, governos e da sociedade. O Sistema Nacional de Avaliação da Educação Superior (SINAES) é uma rede de avaliação educacional com vários métodos de avaliação, sendo um deles o Exame Nacional de Desempenho de Estudantes (ENADE), que é organizado pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). O ENADE avalia os alunos de cursos de graduação que estão no último ano do curso ou completaram no mínimo 80% da carga horaria do curso. Esse exame possui um ciclo avaliativo de três anos, avaliando um conjunto de cursos diferentes em cada um desses anos, sendo os cursos da área de computação avaliados no Ano II. O resultado das avaliações e dos questionários complementares são disponibilizados como dados abertos pelo INEP, servindo como fonte rica para análises e a descoberta de novos conhecimentos. Embora os dados estejam disponíveis, ainda são restritas as pesquisas cientificas que exploram suas relações e evoluções, principalmente, no que diz respeito a identificação de fatores que auxiliam a tomada de decisão dos gestores das Instituições de Ensino Superior. Tendo isso em mente, o objetivo do presente trabalho é utilizar o método de Descoberta de Conhecimento em Base de Dados junto a técnicas de classificação para predizer o desempenho dos discentes de computação participantes do ENADE a partir de fatores socioeconômicos, buscando descobrir qual o melhor modelo de classificação e qual o melhor ponto de corte para gerar classes do desempenho dos participantes. Nesse trabalho foram avaliados cinco modelos de classificação: Árvore de Decisão, K-vizinhos mais próximos, Máquina de Vetores de Suporte, Floresta Aleatória e Regressão Logística; além de serem testadas cinco formas de classificar os participantes de acordo com o desempenho. Como resultado, foi descoberto que a melhor combinação para a classificação de desempenho dos participantes é a utilização do modelo Máquina de Vetores de Suporte adotando a mediana como forma de separar as classes de participantes. O resultado obtido contribui no entendimento de como os dados do ENADE podem ser utilizados para predizer o desempenho dos participantes, na definição de modelos de Aprendizado de Máquina adequados para esse contexto, além da descoberta de como a forma de divisão de desempenho dos participantes impacta no desempenho dos modelos de classificação e de qual delas é a mais indicada.
Abstract: The evaluation of higher education is important to ensure its quality, in addition to being of interest to students, teachers, governments and society. The National Higher Education Assessment System (SINAES) is an educational assessment network with several assessment methods, one of which is the National Student Performance Examination (ENADE), which is organized by the National Institute for Educational Studies and Research Anísio Teixeira (INEP). ENADE evaluates undergraduate course students who are in the final year of the course or who have completed at least 80% of the course workload. This exam has an evaluation cycle of three years, evaluating a set of different courses in each of these years, with courses in the computing area being evaluated in Year II. The results of assessments and complementary questionnaires are made available as open data by INEP, serving as a rich source for analysis and the discovery of new knowledge. Although the data are available, scientific research that explores their relationships and evolutions is still restricted, especially with regard to the identification of factors that help decision-making by managers of Higher Education Institutions. With this in mind, the objective of the present work is to use the Discovery of Knowledge in Database method together with classification techniques to predict the performance of computing students participating in ENADE based on socioeconomic factors, seeking to discover the best model. of classification and what is the best cut-off point to generate classes of the participants’ performance. In this work, five classification models were evaluated: Decision Tree, K-nearest neighbors, Support Vector Machine, Random Forest and Logistic Regression; in addition to testing five ways of classifying participants according to performance. As a result, it was found that the best combination for classifying participants’ performance is to use the Support Vector Machine model, adopting the median as a way of separating the classes of participants. The result obtained contributes to the understanding of how ENADE data can be used to predict the performance of participants, in the definition of Machine Learning models suitable for this context, in addition to the discovery of how the way participants’ performance is divided impacts the performance of classification models and which one is the most suitable.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/30729
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
predicaodesempenhoenadediscentes.pdf3,8 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons