Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33241
Título: Sistema de contagem, classificação de grupo de idade e segmentação de vestimenta de pessoas em vídeos utilizando deep learning
Título(s) alternativo(s): Counting, age group classification and clothing segmentation system of people in videos using deep learning
Autor(es): Ramos, Rafael Hora
Dias, Moises de Paulo
Orientador(es): Lopes, Heitor Silvério
Palavras-chave: Redes neurais (Computação)
Aprendizado profundo (Aprendizado do computador)
Banco de dados distribuído
Sistemas de reconhecimento de padrões
Banco de dados não relacionais
Visão por computador
Big data
Neural networks (Computer science)
Deep learning (Machine learning)
Distributed databases
Pattern recognition systems
Non-relational databases
Computer vision
Data do documento: 12-Dez-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: RAMOS, Rafael Hora; DIAS, Moises de Paulo. Sistema de contagem, classificação de grupo de idade e segmentação de vestimenta de pessoas em vídeos utilizando deep learning. 2022. Trabalho de Conclusão de Curso de (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2022.
Resumo: Devido ao crescimento do número de estabelecimentos comerciais e dos métodos de inteligência e visão artificiais, tem surgido interesse na aplicação de tais métodos para entender o comportamento de clientes e do mercado, objetivando vender mais e/ou vender melhor. O processo de automatização da obtenção de informações, como grupo de idade e vestimenta, pode ser muito relevante do ponto de vista econômico. Através da análise destes dados, um estabelecimento comercial pode obter informações interessantes sobre o seu público-alvo de tal maneira a impulsionar vendas e gerar retorno monetário ao direcionar o conteúdo do estabelecimento para este público. O presente trabalho propõe um sistema de ponta-a-ponta para auxiliar a obtenção de informações relevantes do público-alvo. São utilizados métodos de visão computacional e deep learning para realizar a contagem de pessoas, a classificação de grupo de idade, bem como a segmentação e classificação de vestimenta de pessoas em vídeos. Para isto, foi utilizado o algoritmo StrongSORT em conjunto com o YOLO-v5 para o tracking de pessoas, bem como métodos de detecção e reconhecimento facial, além de alinhamento das faces para remover ruídos de background. Os módulos foram implementados sobre um sistema complexo de comunicação e processamento distribuídos utilizando o Apache Kafka. Para a persistência dos dados foi utilizado um banco de dados MongoDB, que fornece as informações consumidas na última etapa do sistema, que é a visualização dos dados processados em um dashboard de forma amigável ao usuário final. Ao fim do trabalho foram obtidos resultados bastante satisfatórios em todos os módulos propostos com diferentes condições de contorno aplicadas aos mesmos, além de resultar em um sistema com uma arquitetura de dados robusta e facilmente escalável.
Abstract: Due to the growth in the number of commercial establishments and artificial intelligence and vision methods, there has been interest in the application of such methods to understand the behavior of customers and the market, aiming to sell more and/or sell better. The process of automating obtaining information, such as age group and clothing, can be very relevant from an economic point of view. Through the analysis of this data, a commercial establishment can obtain interesting information about its target audience in such a way as to boost sales and generate monetary return by directing the establishment’s content to this audience. This work proposes an end-to-end system to help obtain relevant information from the target audience. Computer vision and deep learning methods are used to perform people counting, age group classification, as well as segmentation and clothing classification of people in videos. For this, the StrongSORT algorithm was used together with YOLO-v5 for the tracking of people, as well as methods of detection and facial recognition, in addition to face alignment to remove noise from the background. The modules were implemented on a complex distributed communication and processing system using Apache Kafka. For the persistence of the data, a MongoDB database was used, which provides the information consumed in the last stage of the system, which is the visualization of the processed data in a dashboard in a friendly way for the end user. At the end of the work, very satisfactory results were obtained in all proposed modules with different boundary conditions applied to them, in addition to resulting in a system with a robust and easily scalable data architecture.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/33241
Aparece nas coleções:CT - Engenharia de Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
classifica.pdf7,04 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons