An efficient strategy for estimation of visually salient regions in images

Lie, Maiko Min Ian

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/3302

Título:	An efficient strategy for estimation of visually salient regions in images
Título(s) alternativo(s):	Uma estratégia eficiente para estimação de regiões visualmente salientes em imagens
Autor(es):	Lie, Maiko Min Ian
Orientador(es):	Vieira Neto, Hugo
Palavras-chave:	Percepção visual Atenção - Simulação por computador Visão por computador Processamento de imagens - Técnicas digitais Algorítmos computacionais Sistemas de reconhecimento de padrões Métodos de simulação Engenharia de computador Engenharia elétrica Visual perception Attention - Computer simulation Computer vision Image processing - Digital techniques Computer algorithms Pattern recognition systems Simulation methods Computer engineering Electric engineering
Data do documento:	28-Mar-2018
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	LIE, Maiko Min Ian. An efficient strategy for estimation of visually salient regions in images. 2018. 69 f. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2018.
Resumo:	A informação incidente no sistema visual humano é limitada por um mecanismo de seleção, conhecido como atenção visual. Este mecanismo é responsável por restringir a informação visual incidente a um subconjunto menor e potencialmente importante para processamento adicional, permitindo que o sistema visual responda rapidamente apesar da enorme quantidade de informação ao qual normalmente está sujeito. Sistemas de visão computacional empregam reproduções deste mecanismo para redução de espaço visual, visto que essa estratégia pode levar a substanciais ganhos em eficiência. Esta dissertação trata do problema de computação eficiente de atenção visual, em particular o caso de detecção de regiões salientes. Uma estratégia com base em sobreamostragem conjunta (joint upsampling), de estimativas de saliência em baixa resolução é apresentada com esse propósito. Isso permite explorar tanto as vantagens de estimativa em baixa-resolução (redução de custo computacional, abstração de detalhes desnecessários) quanto as de bordas em alta-resolução (alta acurácia). Com base na alta redundância de dados e importância espacialmente-variável no conteúdo de imagens de cenas reais, duas formulações de saliência visual são apresentadas para estimativa em baixa resolução na estratégia proposta. A primeira opera em nível de pixel, baseada em distâncias de cor aleatórias. A segunda opera em nível de patch, baseada em erro de reconstrução por bases obtidas através de Análise de Componentes Principais nas margens da imagem. A eficácia e eficiência da estratégia proposta são demonstradas através de avaliação nos bancos de imagens ASD, MSRA10K, ECSSD, e DUTOMRON. Uma comparação com outros sete métodos do estado-da-arte em termos de precisão, abrangência, F-measure e tempo de execução demonstra que a estratégia proposta é altamente competitiva, alcançando uma das maiores relações custo-benefício entre acurácia e tempo de execução.
Abstract:	The information incident on the human visual system is bound by a selection mechanism, known as visual attention. This mechanism is responsible for restricting incomingvisual information to a smaller and potentially important subset for further processing,enabling the visual system to respond rapidly, despite the enormous amount of information to which it is subject. Computer vision systems often employ reproductionsof this mechanism in order to reduce visual search space, since this strategy can leadto substantial improvement in efficiency. This thesis addresses the problem of efficient computation of visual attention, particularly the case of salient region detection. A strategy based on joint upsampling of coarse-scale saliency estimates is presented for that purpose. This approach allows leveraging both the advantages of coarsescale estimation (reduction of computational cost, abstraction of unnecessary details) and fine-scale edge information (high accuracy). Based on the highly redundant data and spatially-varying importance of content in images of real-world scenes, two visual saliency formulations are presented for coarse-scale estimation in the proposed strategy. The first approach operates on a pixel level, based on random color distances. The second approach operates on a patch level, based on the reconstruction error computed from the Principal Component Analysis of the image boundaries. The efficacy and efficiency of the proposed strategy are demonstrated through assessment on the ASD, MSRA10K, ECSSD, and DUT-OMRON datasets. Comparison with other seven state-of-the-art methods in terms of precision, recall, F-measure, and execution time demonstrate that the proposed strategy is highly competitive, achieving one of the best trade-offs between accuracy and execution time.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/3302
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
CT_CPGEI_D_Lie, Maiko Min Ian_2018.pdf		18,62 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas