Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido

Acuña, Daniel Grimm; Luz, Henrique Santos da; Klein, Lucas Jurgen

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/8198

Título:	Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
Título(s) alternativo(s):	Reinforcement learning algorithms applicability study on an inverted pendulum
Autor(es):	Acuña, Daniel Grimm Luz, Henrique Santos da Klein, Lucas Jurgen
Orientador(es):	Assef, Amauri Amorin
Palavras-chave:	Algoritmos Controle automático Kalman, Filtragem de Markov, Processos de Aprendizado por reforço Algorithms Automatic control Kalman filtering Markov processes Reinforcement learning
Data do documento:	9-Jul-2019
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019.
Resumo:	Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros.
Abstract:	This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/8198
Aparece nas coleções:	CT - Engenharia de Controle e Automação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_COEAU_2019_1_01.pdf		6,34 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas