Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/37321
Título: Desenvolvimento de extensão para geração de conjuntos de dados sintéticos
Título(s) alternativo(s): Extension development for generating synthetic datasets
Autor(es): Ribeiro, Vinícius Cerqueira
Orientador(es): Andrade, Mauren Louise Sguario Coelho de
Palavras-chave: Visão por computador
Processamento de imagens
Aprendizado do computador
Ambientes virtuais compartilhados
Computer vision
Image processing
Machine learning
Shared virtual environments
Data do documento: 5-Fev-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: RIBEIRO, Vinícius Cerqueira. Desenvolvimento de extensão para geração de conjuntos de dados sintéticos. 2025. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, 2025.
Resumo: Uma das principais dificuldades no desenvolvimento de modelos de inteligência artificial baseados em redes neurais profundas é a obtenção de dados de alta qualidade para a criação de conjuntos de treinamento. À medida que as tarefas se tornam mais complexas, os custos de anotação e a dificuldade de obtenção dos dados aumentam, tornando o processo mais demorado e oneroso. Como alternativa, pesquisadores têm explorado o uso de ambientes virtuais para automatizar a anotação de conjuntos de dados de baixo custo e livres de erros. Neste contexto, este trabalho apresenta o desenvolvimento de um plugin extensível em Python para o software open-source Blender, que utiliza o motor gráfico para a geração de conjuntos de dados sintéticos fotorrealistas, voltados para desafios de Visão Computacional, como segmentação e detecção por caixas delimitadoras. Ao final, a ferramenta foi utilizada para criar um conjunto de dados com imagens de produtos de varejo, com o objetivo de avaliar a qualidade das anotações geradas e o impacto dos dados sintéticos no treinamento. O modelo Faster R-CNN com backbone ResNet50, pré-treinado no conjunto COCO, foi treinado no conjunto de 10 mil imagens, contendo 5 classes de produtos, alcançando um mAP@0.5:0.95 de 48,1% no conjunto de validação sintético e mAP@0.5:0.95 24,8% no conjunto real.
Abstract: One of the main challenges in developing artificial intelligence models based on deep neural networks is obtaining high-quality data for training datasets. As tasks become more complex, the costs of annotation and the difficulty of acquiring data increase, making the process more time-consuming and expensive. As an alternative, researchers have explored the use of virtual environments to automate the annotation of low-cost, error-free datasets. In this context, this work presents the development of an extensible Python plugin for the open-source software Blender, which uses the graphics engine to generate photorealistic synthetic datasets aimed at computer vision challenges such as segmentation and bounding box detection. In the end, the tool was used to create a dataset with retail product images, with the goal of evaluating the quality of the generated annotations and the impact of synthetic data on training. The Faster R-CNN model with ResNet50 backbone, pre-trained on the COCO dataset, was trained on a set of 10,000 images containing 5 product classes, achieving a mAP@0.5:0.95 of 48,1% on the synthetic validation set and a mAP@0.5:0.95 of 24,8% on the real validation set.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/37321
Aparece nas coleções:PG - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
extensaogeracaoconjuntossinteticos.pdf3,19 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons