Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/8198
Título: Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido
Título(s) alternativo(s): Reinforcement learning algorithms applicability study on an inverted pendulum
Autor(es): Acuña, Daniel Grimm
Luz, Henrique Santos da
Klein, Lucas Jurgen
Orientador(es): Assef, Amauri Amorin
Palavras-chave: Algoritmos
Controle automático
Kalman, Filtragem de
Markov, Processos de
Aprendizado por reforço
Algorithms
Automatic control
Kalman filtering
Markov processes
Reinforcement learning
Data do documento: 9-Jul-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: ACUÑA, Daniel Grimm; LUZ, Henrique Santos da; KLEIN, Lucas Jurgen. Estudo da aplicabilidade de algoritmos de aprendizado por reforço em um pêndulo invertido. 2019. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2019.
Resumo: Este trabalho aborda uma pesquisa exploratória sobre a aplicabilidade de algoritmos de aprendizado por reforço (APR) em um sistema de pêndulo invertido, sendo este um problema clássico de um sistema instável em malha aberta. A pesquisa realizada abordou o estudo e aplicação de algoritmos especificos: Q-Learning e Deep-Q-Network. O trabalho apresenta desde a pesquisa teórica dos algoritmos até a implementação em software dos mesmos. Em uma segunda etapa, desenvolveu-se um protótipo físico do sistema de pêndulo, no qual se empregou o uso de filtros estocásticos para a melhora na qualidade de leitura dos sensores, deixando em aberto a possibilidade de continuidade do desenvolvimento do protótipo em trabalhos futuros.
Abstract: This work addresses an exploratory research on the applicability of reinforcement learning algorithms (RLA) in an inverted pendulum system, a classic problem of an unstable open loop system. The research carried out, addressed the study and application of some specific algorithms such as Q-Learning and Deep-Q-Networks. The work presents a theoretical research of the algorithms until the software implementation of the same ones. In a second step, a physical prototype of the pendulum system was built, in which stochastic filters were used in order to enhance the sensor reading quality, leaving open a possibility of continuity of the development for future works.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/8198
Aparece nas coleções:CT - Engenharia de Controle e Automação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CT_COEAU_2019_1_01.pdf6,34 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.