Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/36088
Registro completo de metadados
Campo DCValorIdioma
dc.creatorBrilhador, Anderson-
dc.date.accessioned2025-03-13T20:39:27Z-
dc.date.available2025-03-13T20:39:27Z-
dc.date.issued2025-02-12-
dc.identifier.citationBRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/36088-
dc.description.abstractSemantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_BR
dc.subjectImagens digitaispt_BR
dc.subjectAprendizado profundo (Aprendizado do computador)pt_BR
dc.subjectComputação semânticapt_BR
dc.subjectSegmentação de imagempt_BR
dc.subjectSistemas de reconhecimento de padrõespt_BR
dc.subjectVisão por computadorpt_BR
dc.subjectRedes neurais (Computação)pt_BR
dc.subjectDigital imagespt_BR
dc.subjectDeep learning (Machine learning)pt_BR
dc.subjectSemantic computingpt_BR
dc.subjectImage segmentationpt_BR
dc.subjectPattern recognition systemspt_BR
dc.subjectComputer visionpt_BR
dc.subjectNeural networks (Computer science)pt_BR
dc.titleMargin-based learning to enhance open-set semantic segmentationpt_BR
dc.title.alternativeAprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto abertopt_BR
dc.typedoctoralThesispt_BR
dc.description.resumoA segmentação semântica recebeu grande atenção como uma solução viável para interpretar efetivamente informações em imagens digitais. As soluções são normalmente construídas com uma percepção estática de conjunto fechado, onde todos os rótulos são conhecidos a priori. No entanto, em aplicações do mundo real, é preciso lidar com objetos de classes desconhecidas. A segmentação semântica de conjunto aberto (OSSS) é uma abordagem que incorpora a percepção de conjunto aberto na segmentação semântica, permitindo o reconhecimento de classes desconhecidas de objetos. Embora vários estudos tenham explorado o OSSS, seu desempenho permanece limitado devido à baixa qualidade de representação de características e desafios como dados desbalanceados, regiões de limites incertas e mudanças semânticas. Esses desafios resultam em modelos de segmentação semântica de conjunto fechado que constroem espaços de incorporação com limites de decisão sobrepostos e espaço aberto insuficiente para acomodar classes desconhecidas, impactando negativamente o desempenho do reconhecimento de conjunto aberto. Esta tese apresenta duas novas funções de perda baseadas em aprendizado baseado em margem e atenção a amostras difíceis para aprimorar o reconhecimento de conjunto aberto. Dois novos classificadores de conjunto aberto são propostos: um que emprega Componentes Principais e o outro que usa Distância Prototípica. Ambos são projetados para se beneficiar dos recursos gerados pelas funções de perda propostas. Experimentos foram conduzidos em seis conjuntos de dados, dos quais três foram originalmente propostos neste trabalho, e os resultados demonstram que os métodos propostos superam estratégias de aprendizado de última geração em OSSS. Essas descobertas ressaltam a importância de tais abordagens de aprendizagem, abrindo caminho para sua aplicação em sistemas do mundo real que exigem reconhecimento robusto de conjuntos abertos.pt_BR
dc.degree.localCuritibapt_BR
dc.publisher.localCuritibapt_BR
dc.creator.IDhttps://orcid.org/0000-0002-1936-140Xpt_BR
dc.creator.Latteshttp://lattes.cnpq.br/0341341858649732pt_BR
dc.contributor.advisor1Lazzaretti, André Eugênio-
dc.contributor.advisor1IDhttps://orcid.org/0000-0003-1861-3369pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7649611874688878pt_BR
dc.contributor.advisor-co1Lopes, Heitor Silvério-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0003-3984-1432pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4045818083957064pt_BR
dc.contributor.referee1Lazzaretti, André Eugênio-
dc.contributor.referee1IDhttps://orcid.org/0000-0003-1861-3369pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/7649611874688878pt_BR
dc.contributor.referee2Gomes, David Menotti-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-2430-2030pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6692968437800167pt_BR
dc.contributor.referee3Lopes, Fabrício Martins-
dc.contributor.referee3IDhttp://orcid.org/0000-0002-8786-3313pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/1660070580824436pt_BR
dc.contributor.referee4Pedrini, Hélio-
dc.contributor.referee4IDhttps://orcid.org/0000-0003-0125-630Xpt_BR
dc.contributor.referee4Latteshttp://lattes.cnpq.br/9600140904712115pt_BR
dc.contributor.referee5Bugatti, Pedro Henrique-
dc.contributor.referee5IDhttps://orcid.org/0000-0001-9421-9254pt_BR
dc.contributor.referee5Latteshttp://lattes.cnpq.br/2177467029991118pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica e Informática Industrialpt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
dc.subject.capesEngenharia Elétricapt_BR
Aparece nas coleções:CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
marginopensetsegmentation.pdf62,51 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons