Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40531
Título: Abordagem de CRM orientada por aprendizado de máquina para identificar evasão de cooperados em uma cooperativa agroindustrial brasileira: estudo de caso prático
Título(s) alternativo(s): A machine learning-driven CRM approach to identifying member churn in a Brazilian agro-industrial cooperative: a practical case study
Autor(es): Tanaka, Sergio Akio
Orientador(es): Siqueira, Hugo Valadares
Palavras-chave: Cooperativas
Clientes - Contatos
Aprendizado do computador
Governança corporativa
Cooperative societies
Customer relations
Machine learning
Corporate governance
Data do documento: 14-Abr-2026
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: TANAKA, Sergio Akio. Abordagem de CRM orientada por aprendizado de máquina para identificar evasão de cooperados em uma cooperativa agroindustrial brasileira: estudo de caso prático. 2026. Tese (Doutorado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2026.
Resumo: Este estudo aborda a evasão (churn) de cooperados em uma cooperativa agroindustrial brasileira por meio da operacionalização de um protocolo de aprendizado de máquina alinhado à governança e livre de vazamento de dados (leakage-aware) dentro do sistema de Customer Relationship Management (CRM) da organização. Utilizando dados reais de CRM sob restrições de confidencialidade, seguimos um fluxo de trabalho baseado em KDD. Esse fluxo inclui: (i) integração de múltiplas fontes de dados; (ii) pré-processamento direcionado com tratamento explícito do severo desbalanceamento de classes por meio de undersampling; (iii) um esquema unificado de validação com validação cruzada estratificada, busca de hiperparâmetros e benchmarking controlado com AutoML; (iv) comparação de modelos tabulares (Random Forest, XGBoost e Support Vector Machine) e um ensemble por votação; e (v) explicabilidade baseada em SHAP para apoiar a tomada de decisão transparente. O rebalanceamento das classes melhorou substancialmente o desempenho na classe minoritária; por exemplo, o recall da classe “Inativo” aumentou de 0,27 para 0,74 com o SVM. Ao longo de dez dobras (folds), o AutoML alcançou média competitiva de ROC-AUC (0,8844), seguido por XGBoost (0,8690) e Random Forest (0,8660); métricas globais sustentaram a viabilidade operacional (acurácia de 0,79-0,80; ROC-AUC de até 0,8876), enquanto o ensemble apresentou discriminação comparável (ROC-AUC 0,8845) com ganho modesto em precisão. As análises com SHAP identificaram fatores coerentes com o contexto de negócio e possibilitaram comunicação acionável em nível individual dentro do CRM. O módulo resultante, baseado em microserviços, disponibiliza propensões de churn ranqueadas e respectivas explicações em dashboards, permitindo estratificação de risco e priorização de ações de retenção. De modo geral, o trabalho fornece um arcabouço metodológico interpretável, reprodutível e pronto para produção para CRM preditivo em ambientes cooperativos sazonais, sob restrições de governança e confidencialidade.
Abstract: This study addresses member churn in a Brazilian agro-industrial cooperative by operationalizing a leakage-aware, governance-aligned machine-learning protocol within the organization’s Customer Relationship Management (CRM) system. Using real-world CRM data under confidentiality constraints, we followed a KDD-based workflow. This workflow includes: (i) multisource integration; (ii) targeted preprocessing with explicit handling of severe class imbalance via undersampling; (iii) a unified validation scheme with stratified cross-validation, hyperparameter search, and controlled AutoML benchmarking; (iv) comparison of tabular learners (Random Forest, XGBoost, and Support Vector Machine) and a voting ensemble; and (v) SHAP-based explainability to support transparent decision-making. Class rebalancing substantially improved minority-class performance; for instance, the “Inactive” recall increased from 0.27 to 0.74 with SVM. Across ten folds, AutoML achieved competitive mean ROC-AUC (0.8844), followed by XGBoost (0.8690) and Random Forest (0.8660); global metrics supported operational feasibility (accuracy 0.79-0.80; ROC-AUC up to 0.8876), while the ensemble delivered comparable discrimination (ROC-AUC 0.8845) with a modest precision gain. SHAP analyses yielded business-coherent drivers and enabled actionable, instance-level communication in the CRM. The resulting microservices-based module exposes ranked churn propensities and explanations in dashboards for risk stratification and prioritization of retention actions. Overall, the work provides an interpretable, reproducible, and production-ready methodological blueprint for predictive CRM in seasonal cooperative environments under governance and confidentiality constraints.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40531
Aparece nas coleções:PG - Programa de Pós-Graduação em Engenharia de Produção

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
crmaprendizadomaquinaevasao.pdf5,21 MBAdobe PDFThumbnail
Visualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons