Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/32061
Título: Melhorias na classificação de imagens contextuais através de grafos convolucionais e caminhada aleatória
Título(s) alternativo(s): Improvements in contextual image classification through graph convolutional networks and random walks
Autor(es): Silva, William Sdayle Marins
Orientador(es): Bugatti, Pedro Henrique
Palavras-chave: Redes neurais (Computação)
Imagens como recursos de informação
Bioinformática
Neural networks (Computer science)
Pictures as information resources
Bioinformatics
Data do documento: 15-Mar-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: SILVA, William Sdayle Marins. Melhorias na classificação de imagens contextuais através de grafos convolucionais e caminhada aleatória. 2023. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2023.
Resumo: Sabe-se que pessoas conseguem assimilar o contexto entre informações a partir de dados pouco percebidos, e essa afirmação se aplica ao contexto em imagens. No aprendizado de máquina, o contexto de uma imagem pode ser representado e previsto usando Graph Convolutional Networks (GCNs). Nesse contexto, as redes convolucionais em grafos precisam da estrutura do grafo para aplicar o método convolucional entre os nós. Com base no trabalhos anteriores, grafos convolucionais com politicas de conexão totalmente conectadas e por cortes com base em pesos são políticas que podem ser usadas para criar gráficos de contexto de imagem. No entanto, as políticas de conexão entre objetos geralmente utilizadas na criação de grafos convolucionais podem não ser as melhores em termos de classificação ou número de arestas, o que pode confundir os modelos de classificação. Com o objetivo de tornar os grafos de contexto mais expressivos e melhorar a precisão das classificações de imagens contextuais, este trabalho propõe um método eficiente baseado em passeios aleatórios que podem obter melhores resultados de classificação em comparação com a literatura. Para aumentar o nível de comparação do método proposto, foram utilizados outros dois métodos aleatórios; corte aleatório e arestas aleatórias. Algumas arquiteturas de redes neurais pré-treinadas foram usadas para extrair características de cada objeto das imagens. Diferentes tamanhos de passeios também foram testados para o passeio aleatório, tornando o projeto mais abrangente. Foram utilizados diferentes contextos de rótulos em quatro conjuntos de imagens para avaliar as políticas de conexão de arestas do grafo. A abordagem proposta apresentou melhores resultados em quase todos os conjuntos e conjuntos de arestas menores de que a política totalmente conectada em todos os datasets. O método proposto performou 56,20% de precisão em comparação com 50,37% da política totalmente conectada e 53,85% do método por cortes com base em pesos.
Abstract: Humans can manage to assimilate the context between information from little perceived data, and this statement applies to the context in images. In machine learning, an image’s context can be represented and predicted using Graph Convolutional Networks (GCNs). In this context, graph convolutional networks need the graph structure to apply the convolutional method between nodes. Based on previous work, fully connected and threshold weights are edge policies that can be used to create image context graphs. However, the connection policies between objects generally used in the creation of convolutional graphs may not be the best in terms of classification or number of edges, which may confuse the classification models. Aiming to make context graphs more expressive and improve the accuracy of contextual image classifications, this paper proposes an efficient method based in random walks that can get better classification results compared to the literature. To increase the level of comparison of the proposed method, two other random methods were used; random cut and random edge. Some pre-trained neural network architectures were used to extract features of each object from the images. Different sizes of walks were also tested for the random walk, making the project more comprehensive. Were used different label contexts in four datasets to evaluate the graph edge connection policies. The proposed approach could perform better results in almost all the datasets and having edge sets smaller than the fully connected policy in all datasets. The proposed method could perform 56.20% of precision compared to 50.37% of the fully connected policie and 53.85% of the threshold weights method.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/32061
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
melhoriasclassificacaodeimagensgrafos.pdf9,02 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.