Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/36088
Título: Margin-based learning to enhance open-set semantic segmentation
Título(s) alternativo(s): Aprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto aberto
Autor(es): Brilhador, Anderson
Orientador(es): Lazzaretti, André Eugênio
Palavras-chave: Imagens digitais
Aprendizado profundo (Aprendizado do computador)
Computação semântica
Segmentação de imagem
Sistemas de reconhecimento de padrões
Visão por computador
Redes neurais (Computação)
Digital images
Deep learning (Machine learning)
Semantic computing
Image segmentation
Pattern recognition systems
Computer vision
Neural networks (Computer science)
Data do documento: 12-Fev-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: BRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
Resumo: A segmentação semântica recebeu grande atenção como uma solução viável para interpretar efetivamente informações em imagens digitais. As soluções são normalmente construídas com uma percepção estática de conjunto fechado, onde todos os rótulos são conhecidos a priori. No entanto, em aplicações do mundo real, é preciso lidar com objetos de classes desconhecidas. A segmentação semântica de conjunto aberto (OSSS) é uma abordagem que incorpora a percepção de conjunto aberto na segmentação semântica, permitindo o reconhecimento de classes desconhecidas de objetos. Embora vários estudos tenham explorado o OSSS, seu desempenho permanece limitado devido à baixa qualidade de representação de características e desafios como dados desbalanceados, regiões de limites incertas e mudanças semânticas. Esses desafios resultam em modelos de segmentação semântica de conjunto fechado que constroem espaços de incorporação com limites de decisão sobrepostos e espaço aberto insuficiente para acomodar classes desconhecidas, impactando negativamente o desempenho do reconhecimento de conjunto aberto. Esta tese apresenta duas novas funções de perda baseadas em aprendizado baseado em margem e atenção a amostras difíceis para aprimorar o reconhecimento de conjunto aberto. Dois novos classificadores de conjunto aberto são propostos: um que emprega Componentes Principais e o outro que usa Distância Prototípica. Ambos são projetados para se beneficiar dos recursos gerados pelas funções de perda propostas. Experimentos foram conduzidos em seis conjuntos de dados, dos quais três foram originalmente propostos neste trabalho, e os resultados demonstram que os métodos propostos superam estratégias de aprendizado de última geração em OSSS. Essas descobertas ressaltam a importância de tais abordagens de aprendizagem, abrindo caminho para sua aplicação em sistemas do mundo real que exigem reconhecimento robusto de conjuntos abertos.
Abstract: Semantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/36088
Aparece nas coleções:CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
marginopensetsegmentation.pdf62,51 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons