Comparação de desempenho do algoritmo Deep Q-Learning em ambientes simulados com estados contínuos

Colombo, Gabriel

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/29123

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Colombo, Gabriel	-
dc.date.accessioned	2022-07-28T13:09:49Z	-
dc.date.available	2022-07-28T13:09:49Z	-
dc.date.issued	2022-06-24	-
dc.identifier.citation	COLOMBO, Gabriel. Comparação de desempenho do algoritmo Deep Q-Learning em ambientes simulados com estados contínuos. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2022.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/29123	-
dc.description.abstract	Reinforcement learning emerged in the 1980s and is one of three main areas of machine learning, the other two being supervised and unsupervised learning. Reinforcement problems have unique characteristics, such as the exchange of information between the agent and the environment in which it is inserted. In addition, all reinforcement learning problems are based on objectives and make use of rewards as stimulus for learning. Another particularity of reinforcement learning is that it does not need prior information about the environment, as it is possible to collect data from interactions, using trial and error techniques. Although it emerged in the 1980s, reinforcement learning has recently gained popularity with the advancement of neural networks and the emergence of deep neural networks, since the fact that they can find function approximations has made it possible to solve problems with infinite states, which are more similar to problems in the real world. A major ambition of reinforcement learning is to create an algorithm that can be generalized and adapted to various environments. In this sense, this work aims to evaluate the Deep Q-Learning algorithm on 5 continuous state environments and to analyze both its performance and its adaptation capacity for different environments.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.rights.uri	https://creativecommons.org/licenses/by-sa/4.0/	pt_BR
dc.subject	Aprendizado de máquinas	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Redes neurais (Computação)	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.subject	Artificial intelligence	pt_BR
dc.subject	Neural networks (Computer science)	pt_BR
dc.title	Comparação de desempenho do algoritmo Deep Q-Learning em ambientes simulados com estados contínuos	pt_BR
dc.title.alternative	Comparison of performance of the Deep Q-Learning algorithm in simulated environments with continuous states	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	A aprendizagem por reforço surgiu na década de 80 e compõe uma das três grandes áreas de aprendizagem de máquinas, sendo as outras duas a aprendizagem supervisionada e a não supervisionada. Os problemas de reforço possuem características peculiares, como a troca de informação que ocorre entre o agente e o ambiente em que ele está inserido, além disso, todos os problemas de aprendizagem por reforço são focados em objetivos e utilizam recompensas como estímulos para a aprendizagem. Outra particularidade da aprendizagem por reforço é que ela não precisa de informações prévias sobre o ambiente, pois é possível coletar os dados a partir das interações, utilizando técnicas de tentativa e erro. Apesar de ter surgido na década de 80, a aprendizagem por reforço voltou a ganhar popularidade recentemente com o avanço das redes neurais e o surgimento das redes neurais profundas, pois o fato de elas conseguirem encontrar aproximações de funções, tornou possível solucionar problemas com infinitos estados, que são mais semelhantes aos problemas existentes no mundo real. Uma grande ambição da aprendizagem por reforço é criar um algoritmo que possa ser generalizado e consiga se adaptar a diversos ambientes. Nesse sentido, esse trabalho tem o objetivo de avaliar o algoritmo Deep Q-Learning em 5 ambientes com estados contínuos e analisar tanto o seu desempenho quanto sua capacidade de adaptação para diferentes ambientes.	pt_BR
dc.degree.local	Pato Branco	pt_BR
dc.publisher.local	Pato Branco	pt_BR
dc.contributor.advisor1	Casanova, Dalcimar	-
dc.contributor.referee1	Casanova, Dalcimar	-
dc.contributor.referee2	Favarim, Fábio	-
dc.contributor.referee3	Barbosa, Marco Antonio de Castro	-
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Departamento Acadêmico de Informática	pt_BR
dc.publisher.program	Engenharia de Computação	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
Aparece nas coleções:	PB - Engenharia de Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
aprendizagemreforcotreinamentoagente.pdf		3,3 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons