Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas

Souza, João Ewerton Duarte de

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/26544

Título:	Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas
Autor(es):	Souza, João Ewerton Duarte de
Orientador(es):	Naves, Thiago França
Palavras-chave:	Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science)
Data do documento:	23-Ago-2021
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Santa Helena
Citação:	SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021.
Resumo:	Modelos baseados em Aprendizado Profundo ganharam notoriedade em diversas áreas, principalmente em Visão Computacional. Entretanto, devido à sua extensa literatura e o grande número de a serem ajustados, tornou-se um desafio para aqueles que desejam desenvolver soluções utilizando essa abordagem. Assim, o objetivo deste trabalho é sintetizar, revisar e apresentar os principais conceitos, configurações e aplicações que integram Aprendizado Profundo e Visão Computacional, através de experimentos e exploração de suas configurações, métodos e análises. São exploradas famílias de arquiteturas de Rede Neurais Convolucionais, Redes Auto codificadoras e Máquinas de Boltzmann Restritas como apoio para o pré treinamento, utilizando as bases de dados de imagens MNIST e CIFAR-10.Observou-se a eficiência dos modelos convolucionais na tarefa de classificação da base MNIST e redução do desempenho destes quando utilizadas as mesmas configurações na CIFAR-10. A Autocodificadora obteve valores de erros de reconstrução satisfatórios e um bom desempenho em conjunto com a Mobile Net na tarefa de classificação. As configurações exploradas podem ser utilizadas para auxiliar na construção de soluções em tarefas de Visão Computacional, e este trabalho pode ser utilizado como um guia para aqueles que pretendem conhecer ou aprofundar seus conhecimentos em Aprendizado Profundo aplicado à Visão Computacional.
Abstract:	Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/26544
Aparece nas coleções:	SH - Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
SH_COCIC_2021_1_2.pdf	.	7,84 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas