Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/31718
Título: Pré-processamento de dados de texto de requisitos de software utilizando técnicas de aprendizado de máquina
Título(s) alternativo(s): Text data preprocessing of software requirements using machine learning techniques
Autor(es): Copatti, Brenda Sabrina
Orientador(es): Casanova, Dalcimar
Palavras-chave: Aprendizado do computador
Processamento de linguagem natural (Computação)
Algorítmos computacionais
Machine learning
Natural language processing (Computer science)
Computer algorithms
Data do documento: 11-Nov-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Dois Vizinhos
Citação: COPATTI, Brenda Sabrina. Pré-processamento de dados de texto de requisitos de software utilizando técnicas de aprendizado de máquina. 2022. Monografia (Especialização em Ciências de Dados) - Universidade Tecnológica Federal do Paraná, Dois Vizinhos, 2022.
Resumo: A execução de algoritmos de aprendizado de máquina aplicando processamento de linguagem natural tem auxiliado os seres humanos e automatizado muitas tarefas do dia a dia. Contudo, uma das etapas que mais consome tempo no processo de implementação é o tratamento do dataset para que fique ideal para o treinamento do algoritmo, devido à falta de um padrão de digitação ou estrutura dos dados, resultando em textos com muitos dados ruidosos. Diante disso, o presente estudo se dedica à execução de técnicas de pré-processamento de dados de texto utilizando expressões regulares para tratar ruídos que possuem um padrão de escrita, além de técnicas de aprendizado de máquina para buscar soluções de substituição de ruído em textos que não possuem um padrão de escrita, com o intuito de agilizar o pré-processamento dos dados utilizados na implementação de algoritmos de processamento de linguagem natural.
Abstract: The execution of machine learning algorithms applying natural language processing has been helping humans and automating many everyday tasks. However, one of the most time-consuming steps in the implementation process is the treatment of dataset so that it is ideal for training the algorithm, which happens due to the impossibility of having a typing pattern or data structure, causing the texts available for searches to contain a lot of noisy data. Therefore, the present study is dedicated to the execution of techniques for pre-processing text data using regular expressions, to treat noises that have a writing pattern and machine learning techniques to seek solutions to replace noise in texts that they do not have a writing standard, in order to speed up the pre-processing of the data used for the implementation of natural language processing algorithms.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/31718
Aparece nas coleções:DV - Ciência de Dados

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
processamentotextoaprendizadomaquina.pdf4,56 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons