Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40622
Título: Reconhecimento de ações humanas para controle de VANTS: uma abordagem baseada em deep learning
Título(s) alternativo(s): Human action recognition for UAV control: a deep learning-based approach
Autor(es): Cabral, Iohana Angélica Torres
Orientador(es): Wehrmeister, Marco Aurélio
Palavras-chave: Drone
Veículos espaciais - Sistemas de controle
Aprendizado profundo (Aprendizado do computador)
Redes neurais (Computação)
Interação humano-máquina
Reconhecimento de gestos (Ciência da Computação)
Processamento eletrônico de dados em tempo real
Drone aircraft
Space vehicles - Control systems
Deep learning (Machine learning)
Neural networks (Computer science)
Human-computer interation
Gesture recognition (Computer science)
Real-time data processing
Data do documento: 19-Fev-2026
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: CABRAL, Iohana Angélica Torres. Reconhecimento de ações humanas para controle de VANTS: uma abordagem baseada em deep learning. 2026. Dissertação (Mestrado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2026.
Resumo: Esta dissertação propõe uma arquitetura para controle de Veículos Aéreos Não Tripulados (VANTs) baseada em redes neurais convolucionais, visando uma interação homem-máquina mais natural e acessível por meio do reconhecimento de gestos humanos. Foram utilizados modelos da família YOLOv8, em suas variações para tarefas de classificação e detecção, treinados com um conjunto de dados personalizado contendo 1.175 imagens rotuladas, capturadas em ambientes reais e simulados. O modelo YOLOv8x-cls apresentou o melhor desempenho, com acurácia de 95,83% e menor ocorrência de erros críticos. A solução foi integrada a um drone Tello EDU e avaliada em testes práticos, demonstrando latência média de 1.042 ms e comportamento estável por meio de um mecanismo de validação temporal (filtro de assertividade) e lógica de falha segura (fail-safe). Os resultados indicam que a aplicação de aprendizado profundo para reconhecimento de gestos é viável, segura e eficaz para o controle visual de drones em cenários controlados.
Abstract: This work presents an architecture for the control of Unmanned Aerial Vehicles (UAVs) based on convolutional neural networks, aiming to provide a more natural and accessible human-machine interaction through human gesture recognition. YOLOv8 models, in both classification and detection variants, were trained on a custom-labeled dataset comprising 1,175 images collected in both real and simulated environments. The YOLOv8x-cls model achieved the best performance, with an accuracy of 95.83% and the lowest rate of critical errors. The solution was integrated into a Tello EDU drone and evaluated in practical tests, demonstrating an average response latency of 1,042 ms and stable behavior through a temporal validation mechanism (assertiveness filter) combined with safe landing protocols. Results indicate that applying deep learning techniques for gesture recognition is feasible, safe, and effective for visual drone control in controlled environments.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40622
Aparece nas coleções:CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
reconhecimentoacoescontrolevants.pdf9,35 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons