Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/37321
Título: | Desenvolvimento de extensão para geração de conjuntos de dados sintéticos |
Título(s) alternativo(s): | Extension development for generating synthetic datasets |
Autor(es): | Ribeiro, Vinícius Cerqueira |
Orientador(es): | Andrade, Mauren Louise Sguario Coelho de |
Palavras-chave: | Visão por computador Processamento de imagens Aprendizado do computador Ambientes virtuais compartilhados Computer vision Image processing Machine learning Shared virtual environments |
Data do documento: | 5-Fev-2025 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Ponta Grossa |
Citação: | RIBEIRO, Vinícius Cerqueira. Desenvolvimento de extensão para geração de conjuntos de dados sintéticos. 2025. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, 2025. |
Resumo: | Uma das principais dificuldades no desenvolvimento de modelos de inteligência artificial baseados em redes neurais profundas é a obtenção de dados de alta qualidade para a criação de conjuntos de treinamento. À medida que as tarefas se tornam mais complexas, os custos de anotação e a dificuldade de obtenção dos dados aumentam, tornando o processo mais demorado e oneroso. Como alternativa, pesquisadores têm explorado o uso de ambientes virtuais para automatizar a anotação de conjuntos de dados de baixo custo e livres de erros. Neste contexto, este trabalho apresenta o desenvolvimento de um plugin extensível em Python para o software open-source Blender, que utiliza o motor gráfico para a geração de conjuntos de dados sintéticos fotorrealistas, voltados para desafios de Visão Computacional, como segmentação e detecção por caixas delimitadoras. Ao final, a ferramenta foi utilizada para criar um conjunto de dados com imagens de produtos de varejo, com o objetivo de avaliar a qualidade das anotações geradas e o impacto dos dados sintéticos no treinamento. O modelo Faster R-CNN com backbone ResNet50, pré-treinado no conjunto COCO, foi treinado no conjunto de 10 mil imagens, contendo 5 classes de produtos, alcançando um mAP@0.5:0.95 de 48,1% no conjunto de validação sintético e mAP@0.5:0.95 24,8% no conjunto real. |
Abstract: | One of the main challenges in developing artificial intelligence models based on deep neural networks is obtaining high-quality data for training datasets. As tasks become more complex, the costs of annotation and the difficulty of acquiring data increase, making the process more time-consuming and expensive. As an alternative, researchers have explored the use of virtual environments to automate the annotation of low-cost, error-free datasets. In this context, this work presents the development of an extensible Python plugin for the open-source software Blender, which uses the graphics engine to generate photorealistic synthetic datasets aimed at computer vision challenges such as segmentation and bounding box detection. In the end, the tool was used to create a dataset with retail product images, with the goal of evaluating the quality of the generated annotations and the impact of synthetic data on training. The Faster R-CNN model with ResNet50 backbone, pre-trained on the COCO dataset, was trained on a set of 10,000 images containing 5 product classes, achieving a mAP@0.5:0.95 of 48,1% on the synthetic validation set and a mAP@0.5:0.95 of 24,8% on the real validation set. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/37321 |
Aparece nas coleções: | PG - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
extensaogeracaoconjuntossinteticos.pdf | 3,19 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons