Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40172
Título: Avaliação de um modelo de previsão utilizando métricas estatísticas: um estudo de caso
Título(s) alternativo(s): Evaluation of a forecast model using statistical Metrics: a case study
Autor(es): Brito, André Ribeiro de
Orientador(es): Casanova, Dalcimar
Palavras-chave: Estatística
Modelos matemáticos
Análise de regressão
Statistics
Mathematical models
Regression analysis
Data do documento: 4-Mar-2024
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Dois Vizinhos
Citação: BRITO, André Ribeiro de. Avaliação de um modelo de previsão utilizando métricas estatísticas: um estudo de caso. 2024. Monografia (Especialização em Ciência de Dados) - Universidade Tecnológica Federal do Paraná, Dois Vizinhos, 2024.
Resumo: Este trabalho apresenta uma análise e avaliação de modelos de regressão por meio de diversas métricas estatísticas. A análise do modelo de regressão na ciência de dados e a necessidade de uma avaliação criteriosa do desempenho dos modelos, destacando a relevância das métricas de desempenho ainda é algo que no estado da arte que há poucos trabalhos. Para o desenvolvimento dessa análise foi considerado o conjunto de dados de passageiros de linhas aéreas, bem como a avaliação das métricas estatísticas para o classificador linear. Neste contexto, foram consideradas as métricas Mean Squared Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Relative Error (MARE), Relative Absolute Error (RAE), Mean Absolute Percentage Error (MAPE), Median Absolute Error (MeAE), Geometric Mean Absolute Error (GMAE), Soma dos Erros Quadrados (SSE), Geometric Root Mean Squared Error (GRMSE), divergência Kullback-Leibler, divergência de Cauchy-Schwarz, distância de Bhattacharyya, distância de Hellinger, distância de Manhattan, distância Euclidiana, distância de Neyman Chi-Square e divergência de Jensen-Shannon (JS), aplicadas ao classificador de regressão linear. Sendo assim, o desafio da avaliação e análise de métricas estatísticas na análise de dados é destacado, ressaltando que a abordagem tradicional baseada na distância euclidiana nem sempre é eficaz. Essa diversidade de métricas, fundamentadas na teoria da informação, permite ajustar modelos matemáticos para capturar nuances específicas dos dados, resultando em análises mais precisas e decisões mais informadas. Os experimentos computacionais conduzidos revelaram que a métrica de distância de Hellinger teve desempenho superior em comparação com outras métricas que adotam uma metodologia de valores variando de 0 até um valor infinito. A métrica Cauchy-Schwarz também se destacou em uma escala de valor variando de 0 a 1.
Abstract: This work presents an analysis and evaluation of regression models through various statistical metrics. The analysis of regression models in data science and the need for a thorough evaluation of model performance, highlighting the relevance of performance metrics, is still an area where there are few studies in the state of the art. For the development of this analysis, the dataset of airline passengers was considered, as well as the evaluation of statistical metrics for the linear classifier. In this context, metrics such as Mean Squared Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Relative Error (MARE), Relative Absolute Error (RAE), Mean Absolute Percentage Error (MAPE), Median Absolute Error (MeAE), Geometric Mean Absolute Error (GMAE), Sum of Squared Errors (SSE), Geometric Root Mean Squared Error (GRMSE), Kullback-Leibler divergence, Cauchy-Schwarz divergence, Bhattacharyya distance, Hellinger distance, Manhattan distance, Euclidean distance, Neyman Chi-Square distance, and Jensen-Shannon divergence (JS) were considered, applied to the linear regression classifier. Thus, the challenge of evaluating and analyzing statistical metrics in data analysis is highlighted, emphasizing that the traditional approach based on Euclidean distance is not always effective. This diversity of metrics, based on information theory, allows for the adjustment of mathematical models to capture specific nuances of the data, resulting in more precise analyses and informed decisions. Computational experiments revealed that the Hellinger distance metric outperformed other metrics that adopt a methodology with values ranging from 0 to infinity. The Cauchy-Schwarz metric also stood out on a scale of values ranging from 0 to 1.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40172
Aparece nas coleções:DV - Ciência de Dados

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
avaliacaomodeloprevisaometricas.pdf724,32 kBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons