Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/6024
Título: Um estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação
Autor(es): Paula, Samuel de
Orientador(es): Ré, Reginaldo
Palavras-chave: Falhas de sistemas de computação
Aprendizado do computador
Software - Validação
Computer system failures
Machine learning
Computer software - Validation
Data do documento: 23-Jun-2016
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: PAULA, Samuel de. Um estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação. 2016. 47 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2016.
Resumo: Predizer defeitos em software é uma tarefa difícil, principalmente quando o projeto alvo está em fase inicial de desenvolvimento, pois nessa fase o projeto não possui uma base de dados histórica consolidada que possa ser utilizada para treinar um modelo de predição. Neste caso, é preciso encontrar projetos semelhantes ao projeto alvo para que, a partir de seus dados históricos, modelos de predição possam ser elaborados, essa técnica recebe o nome de predição cruzada de defeitos. Esse trabalho tem como objetivo analisar uma forma alternativa para o agrupamento de projetos. A proposta consiste em agrupar modelos de predição de forma que possam compartilhar seus conjuntos de dados de treinamento. Os agrupamentos foram criados pelo algoritmo de clusterização BSAS (do inglês, Basic Sequential Algorithmic Scheme), utilizando uma medida de correlação denominada MCC (do inglês, Matthews correlation coefficient) para cálculo de semelhança dos modelos. Uma vez agrupados, os dados de treinamento dos modelos podem formar um único conjunto de treinamento, dando origem a modelos de predição cruzada de defeitos. Os resultados obtidos através da análise dos valores de MCC obtidos pelos modelos de predição indicam que os modelos criados possuem baixo desempenho preditivo enquanto que os indicadores utilizados em trabalhos semelhantes indicam modelos com bom desempenho. Portanto, conclui-se que, a medida de correlação MCC é uma medida de desempenho mais robusta que as demais para análise de modelos de predição e que ela contribui para a redução do problema de desbalanceamento de classes.
Abstract: Defect prediction in software is a difficult task, especially when the target project is in early stage of development, because in this stage the project does not have historical data that can be used to train a prediction model. In this case, it is necessary to find projects that matches to the target project in order to use their historical data. This aproach is named cross-project prediction. This work aims to analyze an alternative method to clustering the projects. Our proposal is to group prediction models so that they can share their sets of training data. The groups were created by clustering algorithm called Basic Sequential Algorithmic Scheme (BSAS), using a measure of correlation known as Matthews Correlation Coefficient (MCC) to compute similarity models. When grouped, the training data models results to a single training set, giving rise to models cross-project prediction. The results obtained by analyzing the MCC values computed by prediction models indicate that the created models have low predictive performance, while the indicators used in similar studies indicate models with good performance. Therefore, we can concluded that the MCC correlation measure is a more robust measure of performance than other prediction models, and it contributes to the reduction of the class imbalance problem.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/6024
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CM_COCIC_2016_1_03.pdf891,97 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.