Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/39157
Título: Avaliação de técnicas de reconhecimento de gestos da língua de sinais utilizando sensores vestíveis
Título(s) alternativo(s): Evaluation of sign language gesture recognition techniques using wearable sensors
Autor(es): Dias, Thiago Simões
Orientador(es): Pichorim, Sérgio Francisco
Palavras-chave: Lingua de sinais
Gestos - Identificação
Língua de sinais americana
Língua brasileira de sinais
Sistemas de reconhecimento de padrões
Redes neurais (Computação)
Luvas
Surdos - Meios de comunicação
Equipamentos de autoajuda para pessoas com deficiência
Detectores
Sign language
Gesture - Identification
American sign language
Brazilian sign language
Pattern recognition systems
Neural networks (Computer science)
Gloves
Deaf - Means of communication
Self-help devices for people with disabilities
Detectors
Data do documento: 4-Dez-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Curitiba
Citação: DIAS, Thiago Simões. Avaliação de técnicas de reconhecimento de gestos da língua de sinais utilizando sensores vestíveis. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
Resumo: Os sistemas de reconhecimento de sinais, em especial os baseados em luvas instrumentadas, surgiram como ferramentas promissoras para ampliar a acessibilidade das pessoas surdas na sociedade e em ambientes digitais. Como exemplos de aplicação, destacam-se jogos digitais e sistemas de tradução em ambientes de realidade virtual. Os principais desafios nessa área de estudo envolvem a capacidade de generalização dos modelos de classificação diante de novos usuários e a limitação do tamanho das bases de dados, que são fatores que impactam diretamente o desempenho dos sistemas de reconhecimento de sinais. Para avaliar esses fatores, esta tese apresenta dois estudos de caso complementares. No primeiro, a influência do tamanho da base de dados foi investigada a partir da abordagem tradicional de classificação que envolveu análise de engenharia de características. Para isso, uma base de dados pública de 50 palavras da Língua Americana de Sinais (ASL), baseada em um par de luvas instrumentadas com sensores triboelétricos foi utilizada. No segundo estudo de caso, além da influência do tamanho da base de dados, analisou-se a capacidade de generalização dos modelos considerando tanto a abordagem tradicional de classificação quanto a abordagem baseada em Rede Neural Recorrente (RNN). Adicionalmente, uma arquitetura com camada Global Max Pooling foi proposta com o objetivo de melhorar o desempenho das RNNs. Para as análises, uma base de dados de 26 letras da Língua Brasileira de Sinais (Libras) foi criada a partir de uma luva instrumentada com sensores flexíveis, inerciais e de contato. Os resultados do primeiro estudo de caso indicam que, apesar da grande quantidade de classes, a abordagem tradicional de classificação é menos afetada pela redução do tamanho da base de dados. No segundo estudo de caso, a arquitetura de RNN proposta apresentou resultados superiores à abordagem tradicional, inclusive em condições com base de dados reduzida e considerando novos usuários. A arquitetura proposta foi validada por meio de comparações com outros modelos de deep learning e avaliada em bases de dados públicas, alcançando resultados que superam o estado da arte. Nesta tese, o termo “gestos” é adotado como sinônimo de “padrões” e de “sinais da Libras”.
Abstract: Gesture recognition systems, especially those based on instrumented gloves, have emerged as promising tools to enhance accessibility for deaf individuals, both in society and in digital environments. Examples of applications include digital games and translation systems in virtual reality contexts. The main challenges in this research area involve the generalization capability of classification models when faced with new users, as well as the limitation of dataset size, which directly affect system performance. To investigate these factors, this thesis presents two complementary case studies. In the first, the influence of dataset size on classification performance was analyzed using a traditional classification approach involving a feature-engineering process. For this purpose, a public dataset comprising 50 American Sign Language (ASL) gestures, collected with a pair of gloves instrumented with triboelectric sensors, was employed. In the second case study, in addition to analyzing the influence of dataset size, the generalization capability of the models was examined through a comparison between traditional classification approaches and those based on Recurrent Neural Network (RNN)s. Additionally, an architecture incorporating a Global Max Pooling layer was proposed to improve RNN performance. For the experiments, a new dataset was created comprising 26 letters of the Brazilian Sign Language (Libras), captured using a glove equipped with flexible, inertial, and contact sensors. The results of the first case study indicate that, despite the large number of gesture classes, the traditional classification approach is less affected by reductions in dataset size. In the second case study, the proposed RNN architecture outperformed the traditional approach even under conditions with limited data and unseen users. The proposed architecture was further validated through comparisons with other deep learning models and evaluated on public datasets, achieving results that surpass the state of the art. In this thesis, the term ‘gestures” is adopted as a synonym for ‘patterns” and for ‘Libras signs”.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/39157
Aparece nas coleções:CT - Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
reconhecimentogestoslibravestivel.pdf8,76 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons