Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33554
Título: Uso de amostras sintéticas no treinamento de modelos para a identificação do estado de chaves seccionadoras em subestações de transmissão de energia elétrica
Título(s) alternativo(s): Use of synthetic samples on model training for disconnect switch state identification in transmission substations
Autor(es): Gomes, Victor Barpp
Orientador(es): Nassu, Bogdan Tomoyuki
Palavras-chave: Sistemas de coleta automática de dados
Visão por computador
Classificação - Imagem
Redes neurais (Computação)
Subestações elétricas
Energia elétrica - Transmissão
Automatic data collection systems
Computer vision
Classification - Imaging
Neural networks (Computer science)
Electric substations
Electric power transmission
Data do documento: 15-Fev-2024
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: GOMES, Victor Barpp. Uso de amostras sintéticas no treinamento de modelos para a identificação do estado de chaves seccionadoras em subestações de transmissão de energia elétrica. 2024. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2024.
Resumo: A geração de dados sintéticos está sendo crescentemente explorada na visão computacional devido à capacidade de produzir grandes volumes de dados extremamente variados e rotulados automaticamente, minimizando custos e preenchendo lacunas existentes em conjuntos de dados reais. Dados sintéticos são especialmente interessantes para viabilizar aplicações que impõem dificuldades na coleta de dados reais em quantidade e variedade suficientes para o aprendizado de máquina. Contudo, os dados são gerados a partir de simplificações da realidade, como simulações computacionais e modelos estatísticos, levando a uma distanciação entre o domínio sintético e o real e, consequentemente, a uma dificuldade na transferência de aprendizado. Este trabalho apresenta uma avaliação experimental de dados sintéticos em uma aplicação particular: o reconhecimento do estado de chaves seccionadoras em subestações de transmissão, um problema de grande importância para o setor elétrico, mas que está sujeito às dificuldades de um ambiente repleto de restrições de segurança e de equipamentos críticos para o fornecimento de energia. Os dados foram gerados por renderização de modelos tridimensionais de subestações usando randomização de domínio, isto é, a manipulação aleatória dos parâmetros de simulação, incluindo a abertura e fechamento das chaves. A tarefa de reconhecimento foi modelada como um problema de classificação, para o qual foram avaliadas seis arquiteturas de redes convolucionais distintas, treinadas inicialmente apenas com dados sintéticos e, posteriormente, com adição de uma pequena quantidade de dados reais. Em testes com imagens capturadas por câmeras físicas instaladas nas subestações, a maioria dos modelos treinados apenas com dados sintéticos obteve taxas de acerto entre 87% e 97%, demonstrando haver um distanciamento entre os domínios sintético e real que limita o desempenho. Isso foi mitigado com a adição de dados reais no treinamento, com os quais se alcançaram resultados entre 95% e 99%. Ainda, a abordagem proposta se mostrou especialmente eficaz no reconhecimento de eventos raros, com taxas de acerto superiores a 90%.
Abstract: Synthetic data generation is being increasingly explored in computer vision due to its capacity to produce large volumes of highly varied and automatically labeled data. This type of data minimizes costs and can fill gaps in real datasets. Synthetic data are especially relevant to enable applications that impose constraints for collecting real data in sufficient quantity and variety for machine learning. However, the data are generated from simplifications of reality, such as computer simulations and statistical models, creating a gap between the real and synthetic domains, consequently leading to difficulties in transferring the learned features. This work presents an experimental evaluation of synthetic data in a particular application: disconnect switch state recognition in transmission substations, a problem of great importance to the electric sector, but which is subject to the difficulties of a restricted environment full of equipment critical to power delivery. The data were generated by rendering virtual tridimensional models of substations and employing domain randomization, that is, the random manipulation of simulation parameters, including the act of opening and closing switches. We modeled the recognition task as a classification problem and evaluated six distinct convolutional network architectures, initially trained only on synthetic data and later with the addition of a small amount of real data. In tests with images captured by physical cameras installed in substations, most of the models trained solely on synthetic data achieved between 87% and 97% accuracy, demonstrating the existence of a synthetic-to-real domain gap that limits performance. Adding real data to the training set mitigated this effect, raising the accuracy to values between 95% and 99%. Furthermore, the proposed approach performed remarkably well in the recognition of rare events, achieving rates above 90%.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/33554
Aparece nas coleções:CT - Programa de Pós-Graduação em Computação Aplicada

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
amostrassinteticasestadoseccionadoras.pdf31,15 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons