Aplicação de aprendizagem por reforço em um jogo educacional para educação ambiental

Araujo, Matheus Mitsrael Gomes de

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39030

Título:	Aplicação de aprendizagem por reforço em um jogo educacional para educação ambiental
Título(s) alternativo(s):	Application of reinforcement learning in a educational game for environmental education
Autor(es):	Araujo, Matheus Mitsrael Gomes de
Orientador(es):	Borges, Helyane Bronoski
Palavras-chave:	Jogos educativos Reciclagem profissional Agentes inteligentes (Software) Educação ambiental Educational games Occupational retraining Intelligent agents (Computer software) Environmental education
Data do documento:	28-Nov-2025
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Ponta Grossa
Citação:	ARAUJO, Matheus Mitsrael Gomes de. Aplicação de aprendizagem por reforço em um jogo educacional para educação ambiental. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2025.
Resumo:	Considerando a crescente relevância dos jogos educacionais como ferramentas pedagógicas e a lacuna existente na aplicação de técnicas de Inteligência Artificial para personalizar a experiência de aprendizagem, este trabalho justifica-se ao propor uma abordagem adaptativa voltada à conscientização ambiental. O objetivo é apresentar o desenvolvimento do jogo Recycle Learning, voltado ao ensino do descarte correto de resíduos recicláveis, que se destaca pela implementação de agentes inteligentes (personagens não jogáveis) cujo comportamento é diretamente moldado pelas ações do jogador. O jogo foi desenvolvido na plataforma Godot 4 e incorpora uma mecânica na qual os descartes realizados pelo jogador, corretos ou incorretos, passam a definir a política de recompensas utilizada no processo de aprendizagem dos demais agentes. Para fundamentar a escolha do algoritmo de aprendizagem por reforço mais adequado a esse cenário dinâmico, conduziu-se uma análise comparativa em um ambiente de simulação desenvolvido em Python. Nesse ambiente, os algoritmos Q-Learning (off-policy) e SARSA (on-policy) foram avaliados em cenários com regras de descarte que mudavam periodicamente, simulando a variabilidade decorrente do comportamento do jogador. Os resultados evidenciaram que o Q-Learning obteve um desempenho superior, alcançando maior taxa de sucesso e maior estabilidade (expressa por menor variação na Tabela Q) quando comparado ao SARSA, especialmente em configurações com parâmetros de aprendizado mais elevados. Conclui-se, portanto, que a abordagem off-policy do QLearning é mais robusta e adequada para o contexto proposto, caracterizado por um ambiente de aprendizagem instável e diretamente influenciado pelo jogador. Como trabalhos futuros, pretende-se a aplicar o jogo em contexto escolar com estudantes com deficiência intelectual e do ensino fundamental I. Este resumo de TCC foi elaborado a partir do artigo “Recycle Learning: um Jogo Educacional com Agentes Inteligentes para a Conscientização Ambiental”, publicado nos anais do SBGames - XXIV Simpósio Brasileiro de Jogos e Entretenimento Digital 2025.
Abstract:	Considering the growing relevance of educational games as pedagogical tools and the existing gap in the application of Artificial Intelligence techniques to personalize the learning experience, this work is justified by proposing an adaptive approach focused on environmental awareness. The objective is to present the development of the Recycle Learning game, which aims to teach the correct disposal of recyclable waste. This game stands out for its implementation of intelligent agents (non-playable characters) whose behavior is directly shaped by the player's actions. The game was developed on the Godot 4 platform and incorporates a mechanic in which the player's disposals, correct or incorrect, define the reward policy used in the learning process of the other agents. To justify the choice of the most suitable reinforcement learning algorithm for this dynamic scenario, a comparative analysis was conducted in a simulation environment developed in Python. In this environment, the Q-Learning (offpolicy) and SARSA (on-policy) algorithms were evaluated in scenarios with periodically changing disposal rules, simulating the variability resulting from the player's behavior. The results showed that Q-Learning performed better, achieving a higher success rate and greater stability (as indicated by less variation in the Q Table) compared to SARSA, especially in configurations with higher learning parameters. Therefore, it is concluded that the off-policy approach of Q-Learning is more robust and suitable for the proposed context, characterized by an unstable learning environment directly influenced by the player. Future work aims to apply the game in a school setting with students who have intellectual disabilities and in elementary school (grades 1-5). This undergraduate thesis summary was based on the article "Recycle Learning: An Educational Game with Intelligent Agents for Environmental Awareness," published in the proceedings of SBGames - XXIV Brazilian Symposium on Games and Digital Entertainment 2025.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/39030
Aparece nas coleções:	PG - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
agentesinteligentejogoeducacional_RESUMO.pdf		115,61 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas