Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/38127Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Nascimento, Erik Henrique dos Santos | - |
| dc.date.accessioned | 2025-08-29T17:37:05Z | - |
| dc.date.available | 2025-08-29T17:37:05Z | - |
| dc.date.issued | 2025-06-27 | - |
| dc.identifier.citation | NASCIMENTO, Erik Henrique dos Santos. Geração de pipelines de gerenciamento de dados escaláveis para arquiteturas de inteligência artificial. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Santa Helena, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/38127 | - |
| dc.description.abstract | This study proposes the development of a scalable data management pipeline for the retail sector, focusing on automation and optimization of data flow in cloud computing environments. The main motivation was the growing demand for solutions capable of integrating large volumes of transactional data, enabling analysis and decision-making support. To address this, an architecture was designed and implemented using orchestration tools such as Dagster and distributed processing libraries like Dask, within an environment based on the Google Cloud Platform (GCP). The pipeline evaluation considered performance metrics such as execution time, CPU and memory usage, in addition to operational costs, comparing two cluster configurations (c2-standard-4 and c2-standard-8). The results demonstrated that the pipeline is efficient and scalable, with the lower-capacity configuration offering the best cost-effectiveness, although the intensive data granularity increases the costs of read and write operations. This work contributes a modular and adaptable solution, applicable to various analytical scenarios, promoting operational efficiency and supporting artificial intelligence in the retail domain | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0 | pt_BR |
| dc.subject | Big data | pt_BR |
| dc.subject | Comércio varejista | pt_BR |
| dc.subject | Computação em nuvem | pt_BR |
| dc.subject | Inteligência artificial | pt_BR |
| dc.subject | Retail trade | pt_BR |
| dc.subject | Cloud computing | pt_BR |
| dc.subject | Artificial intelligence | pt_BR |
| dc.title | Geração de pipelines de gerenciamento de dados escaláveis para arquiteturas de inteligência artificial | pt_BR |
| dc.title.alternative | Generation of scalable data management pipelines for artificial intelligence architectures | pt_BR |
| dc.type | bachelorThesis | pt_BR |
| dc.description.resumo | Este estudo propõe o desenvolvimento de um pipeline de gerenciamento de dados escalável para o setor varejista, com foco na automação e otimização do fluxo de dados em ambientes de computação em nuvem. A motivação principal foi a crescente demanda por soluções que integrem grandes volumes de dados transacionais, permitindo análises e suporte à tomada de decisão. Para isso, foi projetada e implementada uma arquitetura que utiliza ferramentas de orquestração, como Dagster, e bibliotecas de processamento distribuído, como Dask, em um ambiente baseado na Google Cloud Platform (GCP). A avaliação do pipeline considerou métricas de desempenho, como tempo de execução, uso de CPU e memória, além de custos operacionais, comparando duas configurações de cluster (c2-standard-4 e c2-standard-8). Os resultados demonstraram que o pipeline é eficiente e escalável, com a configuração de menor capacidade oferecendo melhor custo-benefício, embora a granularização intensiva de dados eleve os custos de operações de leitura e escrita. O trabalho contribui com uma solução modular e adaptável, aplicável a cenários analíticos diversos, promovendo eficiência operacional e suporte à inteligência artificial no varejo. | pt_BR |
| dc.degree.local | Santa Helena | pt_BR |
| dc.publisher.local | Santa Helena | pt_BR |
| dc.contributor.advisor1 | Naves, Thiago França | - |
| dc.contributor.referee1 | Penna, Diego Lopes | - |
| dc.contributor.referee2 | Conti, Giuvane | - |
| dc.contributor.referee3 | Naves, Thiago França | - |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.program | Ciência da Computação | pt_BR |
| dc.publisher.initials | UTFPR | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| Aparece nas coleções: | SH - Ciência da Computação | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| pipelinesdadosinteligenciaartificial.pdf | 4,55 MB | Adobe PDF | ![]() Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons

