Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40035
Título: Aplicação de IA generativa em respostas automatizadas sobre interação humano-computador
Título(s) alternativo(s): Application of generative ai in automated responses on human-computer interaction
Autor(es): Cerquiare, Felipe Alves
Orientador(es): Sestito, Camila Dias de Oliveira
Palavras-chave: Inteligência artificial
Interação homem-máquina
Conhecimento e aprendizagem
Artificial intelligence
Human-computer interaction
Knowledge and learning
Data do documento: 30-Jun-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: CERQUIARE, Felipe Alves. Aplicação de IA generativa em respostas automatizadas sobre interação humano-computador. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.
Resumo: A Inteligência Artificial Generativa (GenAI), impulsionada por Modelos de Linguagem de Grande Escala (LLMs) como o GPT, tem se consolidado como ferramenta promissora na geração de conteúdo complexo. Este trabalho desenvolveu e avaliou um modelo baseado em Geração Aumentada por Recuperação (RAG), utilizando o modelo Gemini, com foco em artigos científicos publicados no Simpósio Brasileiro sobre Fatores Humanos em Sistemas Computacionais (IHC-SBC) e no HCI International. O modelo, denominado IAHChatbot, foi alimentado com 280 artigos e avaliado por meio de métodos qualitativos e quantitativos. A avaliação humana envolveu seis especialistas da área de IHC, que atribuíram médias elevadas aos critérios de precisão (4,83), clareza (4,67) e relevância (4,50), com destaque para a precisão factual (5,00) na avaliação geral. O IAHChatbot demonstrou desempenho competitivo frente a modelos como ChatGPT, Claude e Gemini, sendo especialmente reconhecido pela adequação conceitual e contextual. Por outro lado, observou-se menor completude nas respostas (3,67), atribuída à natureza da base de dados utilizada, com escassez de definições formais e exemplos práticos. A avaliação automatizada, realizada com a ferramenta ragas, indicou resultados variados conforme a natureza das perguntas. A maior acurácia foi observada na questão diretamente relacionada a um artigo da base (Context Recall: 1,0; Faithfulness: 1,0; Factual Correctness (F1): 0,56). A média geral das métricas foi: Context Recall: 0,5; Faithfulness: 0,58; e F1: 0,77. As análises revelaram que a qualidade semântica das respostas geradas permaneceu consistente mesmo em casos com baixo aproveitamento explícito do contexto recuperado. Conclui-se que o modelo apresenta alto potencial de aplicação como ferramenta de apoio a atividades educacionais e de pesquisa na área de Interação Humano-Computador, desde que aliado a estratégias de curadoria textual e refinamento contínuo. A metodologia proposta mostra-se replicável e alinhada às demandas do contexto científico brasileiro.
Abstract: Generative Artificial Intelligence (GenAl), driven by Large Language Models (LLMs) such as GPT, has emerged as a promising tool for producing complex content. This study developed and evaluated a Retrieval-Augmented Generation (RAG) system using the Gemini model, based on scientific articles published in the Brazilian Symposium on Human Factors in Computing Systems (IHC-SBC) and the HCI International conference. The resulting model, named IAH- Chatbot, was trained on a corpus of 280 articles and assessed through both qualitative and quantitative approaches. Human evaluation involved six experts in Human-Computer Interaction (HCI), who rated the model highly for factual accuracy (mean 5.00), clarity (4.67), and relevance (4.50). The IAHChatbot showed competitive performance compared to established models such as ChatGPT, Claude, and Gemini, particularly in terms of conceptual and contextual alignment. However, it scored lower on completeness (3.67), likely due to limitations in the dataset, which lacked formal definitions and practical examples. Automated evaluation using the ragas toolkit showed varying performance depending on question type. The best results were observed in a question directly linked to a document in the training corpus (Context Recall: 1.0; Faithfulness: 1.0; Factual Correctness (F1): 0.56). Overall average scores were: Context Recall: 0.5; Faithfulness: 0.58; and F1: 0.77. The analysis indicates that the model often generated semantically correct responses even when the retrieved context was limited or not directly used. The findings suggest that the model holds strong potential as a pedagogical and research-support tool in the field of Human-Computer Interaction, especially when enhanced by curated textual data and iterative refinement. The proposed methodology is replicable and well-aligned with the needs of the Brazilian scientific context.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40035
Aparece nas coleções:CP - Engenharia da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
iagenerativaihc.pdf1,88 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons