Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/40221
Título: Sistema de detecção de anomalias e geração de recomendações em pipelines CI/CD do GitLab sem acesso ao código-fonte
Título(s) alternativo(s): Anomaly detection and recommendation generation system for GitLab CI/CD pipelines without source code access
Autor(es): Nascimento, Maiara do
Orientador(es): Dosciatti, Eden Ricardo
Palavras-chave: Fluxo de dados (Computadores)
Aprendizado do computador
Desenvolvimento ágil de software
Data flow computing
Machine learning
Agile software development
Data do documento: 25-Nov-2025
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Pato Branco
Citação: NASCIMENTO, Maiara do. Sistema de detecção de anomalias e geração de recomendações em pipelines CI/CD do GitLab sem acesso ao código-fonte. 2025. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2025.
Resumo: Em ambientes de desenvolvimento de software em larga escala, pipelines de Integração Contínua e Entrega Contínua (CI/CD) frequentemente apresentam gargalos, instabilidades e retrabalho que impactam a produtividade e aumentam custos operacionais. A identificação sistemática desses problemas ainda depende de inspeções manuais, abordagem que não escala em organizações com centenas de repositórios. Além disso, soluções existentes geralmente requerem acesso ao código-fonte, o que pode ser inviável em ambientes com políticas rigorosas de segurança e compliance. Este trabalho propõe um sistema para análise automática de pipelines CI/CD do GitLab que detecta anomalias e gera recomendações de otimização operando exclusivamente com dados de execução coletados via API, sem necessidade de acesso ao código-fonte ou arquivos de configuração. A solução combina análise estatística descritiva (percentis robustos, z-score) com aprendizado de máquina não supervisionado (Isolation Forest e K-Means), permitindo identificar padrões anômalos e gerar recomendações explicáveis. O sistema foi desenvolvido utilizando Python, PostgreSQL, FastAPI e Streamlit, e validado com projetos públicos do GitLab. Os resultados demonstram que o uso de thresholds adaptativos por cluster reduz falsos positivos em 30–40% comparado a thresholds globais fixos. A validação qualitativa com profissionais da área (𝑁 ≈ 3–5) indicou alta utilidade das recomendações. O sistema identificou oportunidades de otimização com ganhos estimados de 40–60% no tempo de execução de testes, 15–25% de redução na taxa de falha e 50–70% de ganho no tempo de build. É importante destacar que, por se tratar de análise sobre repositórios públicos de terceiros, esses ganhos representam projeções teóricas baseadas em dados históricos e comparação estatística, não medições empíricas de intervenções reais implementadas. Como contribuição, o trabalho demonstra a aplicabilidade de técnicas de inteligência artificial a um problema prático de DevOps com restrições de privacidade, oferecendo uma ferramenta de código aberto para otimização contínua de pipelines CI/CD sem comprometer requisitos de segurança e compliance.
Abstract: In large-scale software development environments, Continuous Integration and Continuous Delivery (CI/CD) pipelines frequently exhibit bottlenecks, instabilities, and rework that impact productivity and increase operational costs. The systematic identification of these problems still relies on manual inspections, an approach that does not scale in organizations with hundreds of repositories. Furthermore, existing solutions generally require access to source code, which may be unfeasible in environments with rigorous security and compliance policies. This work proposes a system for automatic analysis of GitLab CI/CD pipelines that detects anomalies and generates optimization recommendations operating exclusively with execution data collected via API, without requiring access to source code or configuration files. The solution combines descriptive statistical analysis (robust percentiles, z-score) with unsupervised machine learning (Isolation Forest and K-Means), enabling the identification of anomalous patterns and the generation of explainable recommendations. The system was developed using Python, PostgreSQL, FastAPI, and Streamlit, and validated with public GitLab projects. Results demonstrate that the use of adaptive thresholds per cluster reduces false positives by 30–40% compared to fixed global thresholds. Qualitative validation with professionals in the field (𝑁 ≈ 3–5) indicated high utility of recommendations. The system identified optimization opportunities with estimated gains of 40–60% in test execution time, 15–25% reduction in failure rate, and 50–70% gain in build time. It is important to note that, as this analysis was performed on public third-party repositories, these gains represent theoretical projections based on historical data and statistical comparison, not empirical measurements of real interventions implemented. As a contribution, this work demonstrates the applicability of artificial intelligence techniques to a practical DevOps problem with privacy constraints, offering an open-source tool for continuous optimization of CI/CD pipelines without compromising security and compliance requirements.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/40221
Aparece nas coleções:PB - Tecnologia em Análise e Desenvolvimento de Sistemas

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
deteccaoanomaliaspipelinesgitlab.pdf1,07 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons