Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/26544
Título: | Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas |
Autor(es): | Souza, João Ewerton Duarte de |
Orientador(es): | Naves, Thiago França |
Palavras-chave: | Visão por computador Arquitetura de computador Redes neurais (Computação) Computer vision Computer architecture Neural networks (Computer science) |
Data do documento: | 23-Ago-2021 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Santa Helena |
Citação: | SOUZA, João Ewerton Duarte de. Principais configurações na integração de visão computacional e aprendizagem profunda: algoritmos e técnicas. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2021. |
Resumo: | Modelos baseados em Aprendizado Profundo ganharam notoriedade em diversas áreas, principalmente em Visão Computacional. Entretanto, devido à sua extensa literatura e o grande número de a serem ajustados, tornou-se um desafio para aqueles que desejam desenvolver soluções utilizando essa abordagem. Assim, o objetivo deste trabalho é sintetizar, revisar e apresentar os principais conceitos, configurações e aplicações que integram Aprendizado Profundo e Visão Computacional, através de experimentos e exploração de suas configurações, métodos e análises. São exploradas famílias de arquiteturas de Rede Neurais Convolucionais, Redes Auto codificadoras e Máquinas de Boltzmann Restritas como apoio para o pré treinamento, utilizando as bases de dados de imagens MNIST e CIFAR-10.Observou-se a eficiência dos modelos convolucionais na tarefa de classificação da base MNIST e redução do desempenho destes quando utilizadas as mesmas configurações na CIFAR-10. A Autocodificadora obteve valores de erros de reconstrução satisfatórios e um bom desempenho em conjunto com a Mobile Net na tarefa de classificação. As configurações exploradas podem ser utilizadas para auxiliar na construção de soluções em tarefas de Visão Computacional, e este trabalho pode ser utilizado como um guia para aqueles que pretendem conhecer ou aprofundar seus conhecimentos em Aprendizado Profundo aplicado à Visão Computacional. |
Abstract: | Models based on Deep Learning have gain attention in several areas, mainly in Computer Vision. However, due to its extensive literature and the large number ofhyper parameters to be adjusted, it became a challenge for those who wish to develop solutions using this approach. Thus, the objective of this work is to synthesize, review and present the main concepts, configurations and applications that integrate Deep Learning and Computer Vision, through experiments and exploration of their configurations, methods and analyses. Families of Convolutional Neural Network, Autocoding Networks and architectures are explored, also Restricted Boltzmann Machines for pretraining, using the MNIST and CIFAR-10 image databases. The efficiency of the convolutional models in the classification task of the MNIST base and performance reduction when using the same configurations in the CIFAR-10 was observed. The Autocoder obtained satisfactory reconstruction error values and a good performance together with MobileNet in the classification task. The explored configurations can be used to help build solutions in Computer Vision tasks, and this work can be used as a guide for those who want to know or deepen their knowledge in Deep Learning applied to Computer Vision. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/26544 |
Aparece nas coleções: | SH - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
SH_COCIC_2021_1_2.pdf | . | 7,84 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.