Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder

Enembreck, Fábia Isabella Pires

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5231

Título:	Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder
Título(s) alternativo(s):	Person re-identification in digital images using siamese and triplet neural networks based on a convolutional neural network and an autoencoder
Autor(es):	Enembreck, Fábia Isabella Pires
Orientador(es):	Morais, Erikson Freitas de
Palavras-chave:	Pessoas - Identificação Vigilância eletrônica Imagens digitais Redes neurais (Computação) Persons - Identification Electronic surveillance Digital images Neural networks (Computer science)
Data do documento:	18-Ago-2020
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Ponta Grossa
Citação:	ENEMBRECK, Fábia Isabella Pires. Re-Identificação de pessoas em imagens digitais utilizando redes neurais siamesas e triplet baseadas em uma rede neural convolucional e um autoencoder. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2020.
Resumo:	Em ambientes monitorados por câmeras de segurança, o problema de determinar se uma pessoa que está sendo observada já esteve presente na cena ou não, independente se o sistema utiliza uma ou mais câmeras, é chamado de re-identificação de pessoas. Este problema é considerado desafiador, uma vez que as imagens obtidas por câmeras estão sujeitas a sofrer grandes variações, como iluminação e perspectiva. Além disso, pessoas em imagens podem passar por transformações e oclusões parciais. Com isso, este trabalho tem como objetivo o desenvolvimento de duas abordagens para re-identificação de pessoas que sejam robustas a essas variações, por meio de técnicas de aprendizagem profunda. A primeira abordagem proposta utiliza uma arquitetura de rede neural siamesa, composta por duas sub-redes idênticas, esse modelo recebe duas imagens de entrada que podem ser ou não de uma mesma pessoa. A segunda abordagem consiste em uma rede neural triplet, com três sub-redes idênticas e que recebe de entrada uma imagem de referência de uma determinada pessoa, uma segunda imagem da mesma pessoa e outra imagem de uma pessoa diferente. Ambas as redes possuem sub-redes idênticas, formadas por uma rede neural convolucional que irá extrair características gerais de cada imagem e uma rede autoencoder, responsável por tratar as grandes variações que as imagens da entrada podem sofrer. Para analisar e comparar as redes desenvolvidas foram utilizados três datasets, sendo que as medidas de avaliação escolhidas para análise foram a acurácia e a curva CMC. Experimentos realizados comprovaram uma melhora de até 71,05% nos resultados com a utilização do autoencoder nas sub-redes. Além disso, os experimentos também mostraram uma superioridade da rede neural triplet desenvolvida neste trabalho em relação a rede neural siamesa e a outros métodos do estado da arte.
Abstract:	In environments monitored by security cameras, the problem of identifying if a person being watched has ever been in the scene or not, independent of the system uses one or more cameras, is called person re-identification. This problem is considered challenging, since the images obtained by cameras are subject to many variations, such as lighting and perspective. In addition, people in pictures may undergo transformations and partial occlusions. This work aims to develop two approaches for person re-identification robust to these variations, through deep learning techniques. The first approach proposed uses a Siamese neural network architecture, composed of two identical subnets, this model receives two input images that may or may not be from the same person. The second approach consists of a triplet neural network, with three identical subnets, which receives a reference image from a certain person, a second image from the same person and another image from a different person. Both networks have identical subnets, formed by a convolutional neural network that will extract general characteristics from each image and an autoencoder network, responsible for dealing with the great variations that the input images may undergo. To analyze and compare the developed networks, three datasets were used, and the metrics chosen for analysis were accuracy and the CMC curve. Experiments carried out proved an improvement up to 71.05% in the results with the use of the autoencoder in the subnets. Also, the experiments showed a superiority of the triplet neural network developed in this work to the siamese neural network and other state-of-the-art methods.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/5231
Aparece nas coleções:	PG - Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
reidentificacaopessoasimagensdigitais.pdf		3,11 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas