Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/32689
Título: | Um estudo comparativo de modelos de segmentação de objetos |
Título(s) alternativo(s): | A comparative study of object segmentation models |
Autor(es): | Brito, Gabriel Eugenio |
Orientador(es): | Minetto, Rodrigo |
Palavras-chave: | Imagens digitais Aprendizado do computador Segmentação de imagens Visão por computador Digital images Machine learning Image segmentation Computer vision |
Data do documento: | 27-Jun-2023 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Curitiba |
Citação: | BRITO, Gabriel Eugenio. Um estudo comparativo de modelos de segmentação de objetos. 2023. Trabalho de Conclusão de Curso de (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023. |
Resumo: | Segmentação de objetos é a tarefa de identificar, com precisão de pixel, todos os objetos de uma imagem. Ela tem diversas aplicações no mundo real, como sistemas de visão para carros autônomos e sistemas de monitoramento. O objetivo deste trabalho é comparar três abordagens diferentes para solucionar esse problema – Mask R-CNN, Yolact e SOLO –, todas relativamente recentes e baseadas em deep learning, e apresentar alguns pontos que possam ser explorados em pesquisas futuras. Ao executar os modelos em 200 imagens do dataset OpenImages, mostramos que o SOLO alcança os melhores resultados em relação à qualidade, com 42.4 de precisão média (AP), aproximadamente 4 pontos acima do segundo colocado, e o Yolact, em relação à velocidade, com aproximadamente metade do tempo de inferência do segundo colocado. Também foi possível constatar algumas limitações na área, como a falta de dados anotados no dataset e casos que são ignorados durante a avaliação (mais especificamente, objetos de classes que não possuem anotações em uma determinada imagem são ignorados durante o cálculo do AP). Todo o código está disponível em https://github.com/GabrielEug2/tcc-instance-segm. Esperamos que estes pontos possam ser explorados mais a fundo em pesquisas futuras, para avançar a pesquisa na área ainda mais. |
Abstract: | Object segmentation is the task of identifying, with pixel precision, all the objects on an image. It has several applications in the real world, such as vision systems for autonomous cars and monitoring systems. The goal of this paper is to compare three different approaches of solving that problem – Mask R-CNN, Yolact and SOLO –, all relatively recent and based on deep learning, and present some points that can be explored in future researches. By executing the models on 200 images of the OpenImages dataset, we showed that SOLO achieves the best results in terms of quality, with 42.4 of average precision (AP), about 4 points ahead of the runner-up, and Yolact, in terms of speed, with approximately half the inference time of the second place. It was also possible to observe some limitations in the area, such as the lack of annotated data on the dataset and cases that are ignored during the evaluation (more specifically, objects of classes that do not have annotations on a given image are ignored durante the AP calculations). All the code is available at https://github.com/GabrielEug2/tcc-instance-segm. Hopefully those points can be further explored in future researches, to advance the research on the area even more. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/32689 |
Aparece nas coleções: | CT - Sistemas de Informação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
comparativamodelossegmentacaoobjetos.pdf | 10,09 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons