Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/33666
Título: Aplicação de técnicas de machine learning para estudar a satisfação de passageiros em aeroportos brasileiros
Título(s) alternativo(s): Application of machine learning techniques to study passengers satisfaction in brazilian airports
Autor(es): Felix, Guilherme Morete
Orientador(es): Santos, Bruno Samways dos
Palavras-chave: Aprendizado do computador
Mineração de dados (Computação)
Aeroportos (Brasil)
Satisfação do consumidor
Machine learning
Data mining
Airports (Brazil)
Consumer satisfaction
Data do documento: 24-Nov-2023
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Londrina
Citação: FELIX, Guilherme Morete. Aplicação de técnicas de machine learning para estudar a satisfação de passageiros em aeroportos brasileiros. 2023. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2023.
Resumo: A satisfação percebida do cliente em serviços e produtos é um fator chave para o sucesso de qualquer empresa. Com relação aos aeroportos, a satisfação do usuário compõe um dos quatorze indicadores de qualidade de serviço (IQS) elaborados pela Agência Nacional de Aviação Civil (ANAC), os quais descrevem o nível de qualidade do aeroporto e estão diretamente atrelados aos reajustes de tarifas aéreas. Dessa forma, para que aeroportos consigam melhorar a qualidade e aumentar o valor agregado de seu serviço, é necessário compreender as características e os aspectos que levam os usuários a terem a sensação de satisfação ou insatisfação do serviço prestado. Nesse contexto, o presente trabalho propôs de modelos de machine learning para a classificação da satisfação de usuários e identificar as variáveis mais importantes para a satisfação do usuário, a partir de dados fornecidos pela pesquisa de satisfação realizada pela Secretaria Nacional de Aviação Civil (SAC). Foram utilizados os algoritmos Árvore de Decisão, Floresta Aleatória, Regressão Logística, MultiLayer Perceptron, KNN, Naive-Bayes e XGBoost, sendo que a avaliação de cada modelo se baseou na acurácia, recall, precisão e f1-score. Hiperparametrização e estratégias de balanceamento de classe como oversampling, unsersampling e oversampling por resample foram empregadas. Como resultado, os modelos com melhores performances foram a Regressão Logística e Floresta Aleatória, com acurácia acima de 85% e recall para usuários insatisfeitos acima de 75%, mas precisões abaixo de 50% para a maioria dos modelos. Com relação às variáveis mais importantes, os modelos Regressão Logística e Floresta Aleatória consideraram como melhores preditoras as variáveis ligadas a conforto e limpeza, bem como localização e deslocamento no aeroporto.
Abstract: Perceived customer satisfaction in services and products is a key factor in the success of any company. In relation to airports, user satisfaction is one of the fourteen service quality indicators (IQS) prepared by the National Civil Aviation Agency (ANAC), which describe the airport's quality level and are directly linked to air fare adjustments. Therefore, for airports to be able to improve the quality and increase the added value of their service, it is necessary to understand the characteristics and aspects that lead users to feel satisfied or dissatisfied with the service provided. In this context, the present work proposed machine learning models to classify user satisfaction and identify the most important variables for user satisfaction, based on data provided by the satisfaction survey carried out by the National Civil Aviation Secretariat (SAC). The Decision Tree, Random Forest, Linear Regression, MultiLayer Perceptron, KNN, Naive-Bayes and XGBoost algorithms were used, with the evaluation of each model being based on accuracy, recall, precision and f1-score. Hyperparameterization and class balancing strategies such as oversampling, undersampling and oversampling by resample were employed. As a result, the best performing models were Logistic Regression and Random Forest, with accuracy above 85% and recall for dissatisfied users above 75%, but precision under 50% for most models. Regarding the most important variables, the Logistic Regression and Random Forest models considered variables linked to comfort and cleanliness, as well as location and movement at the airport, the best predictors.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/33666
Aparece nas coleções:LD - Engenharia de Produção

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
machinelearningsatisfacaopassageiros.pdf1,61 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons