Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/29695
Título: Re-identificação de pessoas em múltiplas câmeras por meio de imagens digitais
Título(s) alternativo(s): Re-identification of people in multiple cameras through digital images
Autor(es): Cordeiro, Alexssandro Ferreira
Orientador(es): Paula Filho, Pedro Luiz de
Palavras-chave: Pessoas – Identificação
Vigilância eletrônica
Redes neurais (Computação)
Persons - Identification
Electronic surveillance
Neural networks (Computer science)
Data do documento: 27-Mai-2021
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Medianeira
Citação: CORDEIRO, Alexssandro Ferreira. Re-identificação de pessoas em múltiplas câmeras por meio de imagens digitais. 2021. Dissertação (Mestrado em Tecnologias Computacionais para o Agronegócio) - Universidade Tecnológica Federal do Paraná, Medianeira, 2021.
Resumo: A detecção de pessoas ainda é um problema na visão computacional, bem como o rastreamento e a RE-ID (pré-identificação de pessoas), principalmente em ambientes com múltiplas câmeras. Os avanços das redes neurais convolucionais para essas tarefas implicaram em ganho de desempenho nos últimos anos, visto que há um aumento na quantidade de dados públicos anotados para treinamento supervisionado, desta maneira permitindo treinamentos mais eficientes. Porém com as dificuldades presentes nas tarefas de detecção ao RE-ID e rastreamento de pessoas como oclusões, variações da iluminação e a qualidade da imagem capturada ainda se faz necessário estudos a fim de aumentar a acurácia destas tarefas. Usando uma plataforma para a análise do fluxo de pessoas e possível fornecer informações as quais podem otimizar a segurança, vigilância e demais setores da agroindústria, local com forte presença humana. O estudo apresentado aqui se utilizou de técnicas de processamento digital de imagens e redes neurais convolucionais como a Darknet-53 com o framework YOLOV3, o qual apresentou resultados no estado da arte na detecção de objetos e ser utilizado para efetuar a detecção de pessoas e, a partir desta detecção, ser ˜ a possível efetuar a pré-identificação com base na área de interesse detectada. Para o problema de RE-ID foi utilizada a rede neural RESNET50 nas arquiteturas siamesa e triplet loss com os datasets públicos CUHK03 e Market-1501, sendo o primeiro utilizado para o treinamento e o segundo para validação. Os resultados apresentados no treinamento de RE-ID com a arquitetura triplet loss no dataset CUHK03 foram comparados ao estado da arte e apresentaram resultados superiores nos requisitos mAP com 81,40% em relação 80,70% do benchmark e CMC RANK-1 de 84,80% em relação a 84,30% do ` benchmark no dataset CUHK03, na validação com o dataset Market-1501 a rede triplet loss apresentou CMC RANK-1 de 84,50% em relação a 85,00% do benchmark, demonstrando capacidade de generalização em ambientes nunca vistos pela rede. Estes resultados confirmam que e possível obter informações sobre o fluxo de pessoas a fim de auxiliar setores da agroindústria como segurança, vigilância e administração de pessoal.
Abstract: The detection of people is still a key issue in computer vision, along with tracking and REID (re-identification of people), especially in environments with multiple cameras which have variations in the monitored views. The advances in convolutional neural networks for these tasks implicated in performance gains in recent years, since there is an increase in the amount of public data recorded for supervised training, thus allowing for more efficient training. However, considering the difficulties present in the tasks of detection, RE-ID and tracking of people, such as occlusions, variations of lighting and the quality of the captured image, studies are still needed in order to increase the accuracy of these tasks. Using a platform for analyzing the flow of people, it is possible to provide information which can optimize security, surveillance and other sectors of the agro-industry, a field with a strong human presence. The study presented here used techniques from digital image processing and convolutional neural networks like Darknet-53 with the YOLOV3 framework, which showed satisfactory results in the state of the art of research in object detection and will be used to perform the detection of people and, based on this detection, it will be possible to carry out the re-identification based on the area of interest detected. For the RE-ID problem, the RESNET50 neural network was used in the Siamese and triplet loss architectures with the public datasets CUHK03 and Market15-01 for training, the first being used for training and the second for validation. The results presented in RE-ID training with the triplet loss architecture in the CUHK03 dataset were compared to the state of the art and presented superior results in the mAP requirements with 81.40% in relation to at 80.70% of the benchmark and CMC RANK-1 of 84.80% in relation to 84.30% of the benchmark in the CUHK03 dataset, in the validation with the Market-1501 dataset, the triplet loss network presented CMC RANK-1 of 84.50% in relation to 85.00% of the benchmark, demonstrating the ability to generalization in environments never seen by the network. These results confirm that it is possible to obtain information on the flow of people in order to assist sectors of the agribusiness such as security, surveillance and personnel management.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/29695
Aparece nas coleções:MD - Programa de Pós-Graduação em Tecnologias Computacionais para o Agronegócio

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
reidentificacaopessoasimagensdigitais.pdf5,01 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons