Reconhecimento de ações humanas para controle de VANTS: uma abordagem baseada em deep learning

Cabral, Iohana Angélica Torres

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40622

Título:	Reconhecimento de ações humanas para controle de VANTS: uma abordagem baseada em deep learning
Título(s) alternativo(s):	Human action recognition for UAV control: a deep learning-based approach
Autor(es):	Cabral, Iohana Angélica Torres
Orientador(es):	Wehrmeister, Marco Aurélio
Palavras-chave:	Drone Veículos espaciais - Sistemas de controle Aprendizado profundo (Aprendizado do computador) Redes neurais (Computação) Interação humano-máquina Reconhecimento de gestos (Ciência da Computação) Processamento eletrônico de dados em tempo real Drone aircraft Space vehicles - Control systems Deep learning (Machine learning) Neural networks (Computer science) Human-computer interation Gesture recognition (Computer science) Real-time data processing
Data do documento:	19-Fev-2026
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Curitiba
Citação:	CABRAL, Iohana Angélica Torres. Reconhecimento de ações humanas para controle de VANTS: uma abordagem baseada em deep learning. 2026. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2026.
Resumo:	Esta dissertação propõe uma arquitetura para controle de Veículos Aéreos Não Tripulados (VANTs) baseada em redes neurais convolucionais, visando uma interação homem-máquina mais natural e acessível por meio do reconhecimento de gestos humanos. Foram utilizados modelos da família YOLOv8, em suas variações para tarefas de classificação e detecção, treinados com um conjunto de dados personalizado contendo 1.175 imagens rotuladas, capturadas em ambientes reais e simulados. O modelo YOLOv8x-cls apresentou o melhor desempenho, com acurácia de 95,83% e menor ocorrência de erros críticos. A solução foi integrada a um drone Tello EDU e avaliada em testes práticos, demonstrando latência média de 1.042 ms e comportamento estável por meio de um mecanismo de validação temporal (filtro de assertividade) e lógica de falha segura (fail-safe). Os resultados indicam que a aplicação de aprendizado profundo para reconhecimento de gestos é viável, segura e eficaz para o controle visual de drones em cenários controlados.
Abstract:	This work presents an architecture for the control of Unmanned Aerial Vehicles (UAVs) based on convolutional neural networks, aiming to provide a more natural and accessible human-machine interaction through human gesture recognition. YOLOv8 models, in both classification and detection variants, were trained on a custom-labeled dataset comprising 1,175 images collected in both real and simulated environments. The YOLOv8x-cls model achieved the best performance, with an accuracy of 95.83% and the lowest rate of critical errors. The solution was integrated into a Tello EDU drone and evaluated in practical tests, demonstrating an average response latency of 1,042 ms and stable behavior through a temporal validation mechanism (assertiveness filter) combined with safe landing protocols. Results indicate that applying deep learning techniques for gesture recognition is feasible, safe, and effective for visual drone control in controlled environments.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/40622
Aparece nas coleções:	CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
reconhecimentoacoescontrolevants.pdf		9,35 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons