Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/37344
Título: Avaliação do impacto do MP2.5 na saúde: comparação entre regressão estatística e rede neural artificial
Título(s) alternativo(s): Evaluation of the impact of PM2.5 on health: comparison between statistical regression and artificial neural network
Autor(es): Iltchechen, Luiza Carla Calamara
Orientador(es): Tadano, Yara de Souza
Palavras-chave: Modelos lineares (Estatística)
Aparelho respiratório - Doenças
Análise de regressão
Redes neurais (Computação)
Linear models (Statistics)
Respiratory organs - Diseases
Regression analysis
Neural networks (Computer science)
Data do documento: 27-Jun-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: ILTCHECHEN, Luiza Carla Calamara. Avaliação do impacto do MP2.5 na saúde: comparação entre regressão estatística e rede neural artificial. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Bioprocessos e Biotecnologia) - Universidade Tecnológica Federal do Paraná, 2023.
Resumo: O material particulado é um dos poluentes mais prejudiciais à saúde humana. Ele é classificado de acordo com o seu tamanho. As partículas consideradas finas, também chamadas de MP2,5, possuem até 2,5μm de diâmetro aerodinâmico. As altas concentrações de material particulado estão relacionadas com o aumento da prevalência de efeitos adversos à saúde, principalmente por problemas respiratórios e circulatórios. Estudos nessa linha de pesquisa são mais comuns utilizando Modelos Lineares Generalizados (GLM), porém estudos requerem uma grande quantidade de dados e o mínimo de descontinuidade. Já as redes neurais artificiais (RNAs) são uma modelagem matemática de importante aplicação em engenharia, considerada mais flexível e adaptável do que os GLM. Neste sentido, o objetivo do presente trabalho foi comparar o desempenho da RNA perceptron de múltiplas camadas (MLP) com um GLM com distribuição de Poisson. Como estudo de caso, considerou-se o impacto do MP2,5 no número de internações por doenças respiratórias para a população da cidade de Ponta Grossa, Paraná, 4ª cidade mais populosa do estado. A base de dados contém 564 amostras datadas de 01/10/2016 até 17/04/2018. As seguintes variáveis de entrada foram consideradas: concentração de MP2,5, temperatura média, umidade relativa do ar, dia da semana e se o dia é ou não feriado, e a saída é o valor esperado das internações por problemas respiratórios. Para a MLP os dados foram divididos em treinamento (70%), validação (20%) e teste (10%), já para o GLM, os dados foram divididos em treinamento (90%) e teste (10%). Como resultado, obteve-se um erro de 37% (MAPE) para a MLP e 42% (MAPE) para o GLM, porém as outras duas métricas de erros (MAE e RMSE) foram menores para o GLM, observando então, que para este estudo de caso, o GLM teve melhor desempenho. Em muitos casos, é suficiente a aplicação do GLM, por ser uma modelagem mais simples e rápida em comparação às RNAs. Entretanto, as RNAs são consideradas alternativas à aplicação do GLM, ao se trabalhar com bancos de dados com muita descontinuidade, que é frequente em países em desenvolvimento, como o Brasil.
Abstract: Particulate matter is one of the most harmful pollutants to human health. It is classified according to its size. The particles considered fine, also called PM2.5, have up to 2.5 μm in aerodynamic diameter. High concentrations of particulate matter are related with increased prevalence of adverse health effects, mainly due to respiratory and circulatory problems. Studies in this line of research are more common using Generalized Linear Models (GLM), but studies require a large amount of data and minimal discontinuity. Artificial neural networks (ANNs) are a mathematical modeling of important application in engineering, considered more flexible and adaptable than GLM. In this sense, the objective of the present study was to compare the performance of multilayer perceptron RNA (MLP) with a GLM with Poisson distribution. As a case study, we considered the impact of PM2.5 on the number of hospitalizations due to diseases in the population of the city of Ponta Grossa, Paraná, the 4th most populous city in the state. The database contains 564 samples dated from 01/10/2016 to 17/04/2018. The following input variables were considered: PM2.5 concentration, mean temperature, relative humidity, day of the week and whether or not the day is a holiday, and the output is the expected value of hospitalizations for respiratory problems. For the MLP the data were divided into training (70%), validation (20%) and test (10%), while for the GLM, the data were divided into training (90%) and test (10%). As a result, an error of 37% (MAPE) was obtained for MLP and 42% (MAPE) for GLM, but the other two metrics (MAE and RMSE) were lower for GLM, noting that for this case study, GLM performed better. In many cases, the application of GLM is sufficient, as it is a simpler and faster modeling compared to RNAs. However, RNAs are considered alternatives to the application of GLM, when working with databases with a lot of discontinuity, which is frequent in developing countries, such as Brazil.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/37344
Aparece nas coleções:PG - Engenharia de Bioprocessos e Biotecnologia

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
regressaopoissonredeneural.pdf1,16 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons