Pré-processamento inteligente de requisitos textuais de software para refinamento de estimativa de esforço

Koxne, Cristiano

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/34386

Título:	Pré-processamento inteligente de requisitos textuais de software para refinamento de estimativa de esforço
Título(s) alternativo(s):	Intelligent preprocessing of textual requirements software for effort estimation refinement
Autor(es):	Koxne, Cristiano
Orientador(es):	Fávero, Eliane Maria De Bortoli
Palavras-chave:	Processamento de linguagem natural (Computação) Aprendizado do computador Inteligência Artificial Linguagem de programação (Computadores) Natural language processing (Computer science) Machine learning Artificial intelligence Programming languages (Electronic computers)
Data do documento:	19-Jun-2024
Editor:	Universidade Tecnológica Federal do Paraná
Câmpus:	Pato Branco
Citação:	KOXNE, Cristiano. Pré-processamento inteligente de requisitos textuais de software para refinamento de estimativa de esforço. 2024. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2024.
Resumo:	O presente trabalho foca na aplicação de métodos e técnicas de Inteligência Artificial (IA), com foco em Processamento de Linguagem Natural (PLN), que objetivam aprimorar a estimativa de esforço de software por analogia (EESA). A análise de textos de requisitos (ex. história de usuário) possibilita a geração de características para a classificação textual, que permitem automatizar e melhorar a precisão da EESA. A estimativa de esforço por analogia exige uma compreensão profunda de dados históricos, quando os requisitos são apresentados em formato textual. Neste contexto, este estudo propõe um processo inteligente de pré-processamento de requisitos textuais de software, a fim de refinar as estimativas de esforço. O objetivo é classificar eficientemente os requisitos dos usuários e usar essa categorização para inferir estimativas de esforço. A metodologia adotada se inspira em estudos anteriores, os quais exploraram os modelos pré-treinados GPT-3 e BERT para EESA. No entanto, este estudo aprimora a abordagem, com foco no método de pré-processamento textual, incluindo a aplicação do GPT-3.5. Foram delineadas duas estratégias distintas de pré-processamento. A primeira, utiliza um método convencional, com o Regular Expression (do inglês, RegEx). A segunda estratégia explora a API do GPT-3.5 para obter uma base de dados pré-processada, utilizando o modelo para produzir textos limpos e normalizados. Após o pré-processamento, foram realizados dois experimentos para a inferência de EESA, fazendo uso de dois métodos diferentes, um via arquitetura de rede neural própria e outro via API do GPT-3.5. Desta forma, foram extraídas as métricas Erro Quadrático Médio (MSE), Erro Absoluto Médio (MAE) e Mediana dos Erros Absolutos (MdAE). Após obter as métricas dos dois experimentos, compararam-se os resultados com os obtidos nos estudos anteriores (Z-SE2 de Baratto (2022) e SE3M de Fávero, Casanova e Pimentel (2022)). Destaca-se o valor de MAE de 0,56 ± 0,15, proveniente do experimento que utilizou um particionamento entre-repositórios a partir de um modelo neural próprio.
Abstract:	The present work focuses on the application of Artificial Intelligence (AI) methods and techniques, with an emphasis on Natural Language Processing (NLP), aiming to improve software effort estimation by analogy (EESA). The analysis of requirements texts (e.g., user stories) enables the generation of features for text classification, allowing for the automation and improvement of EESA accuracy. Effort estimation by analogy requires a deep understanding of historical data when the requirements are presented in textual format. In this context, this study proposes an intelligent process for pre-processing textual software requirements to refine effort estimates. The goal is to efficiently classify user requirements and use this categorization to infer effort estimates. The methodology adopted is inspired by previous studies, which explored pre-trained models GPT-3 and BERT for EESA. However, this study enhances the approach by focusing on the textual pre-processing method, including the application of GPT-3.5. Two distinct pre-processing strategies were outlined. The first uses a conventional method with Regular Expressions (RegEx). The second strategy explores the GPT-3.5 API to obtain a pre-processed database, using the model to produce clean and normalized texts. After pre-processing, two experiments were conducted for EESA inference, using two different methods, one via a proprietary neural network architecture and the other via the GPT-3.5 API. Metrics such as Mean Squared Error (MSE), Mean Absolute Error (MAE), and Median Absolute Error (MdAE) were extracted. After obtaining the metrics from the two experiments, the results were compared with those obtained in previous studies (Z-SE2 by Baratto (2022) and SE3M by Fávero, Casanova e Pimentel (2022)). Notably, the MAE value of 0.56 ± 0.15 came from the experiment that used inter-repository partitioning from a proprietary neural model.
URI:	http://repositorio.utfpr.edu.br/jspui/handle/1/34386
Aparece nas coleções:	PB - Engenharia de Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
estimativasoftwaregpt.pdf		611,89 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Recomendar este item Visualizar estatísticas

Este item está licenciada sob uma Licença Creative Commons