Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/35499
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSilva, Pedro Augutos de Lima e-
dc.date.accessioned2024-11-21T20:54:33Z-
dc.date.available2024-11-21T20:54:33Z-
dc.date.issued2023-03-14-
dc.identifier.citationSILVA, Pedro Augusto de Lima e. Processo de desenvolvimento de uma feature store a partir de dados de web scraping. 2022. Trabalho de Conclusão de Curso de Especialização (Ciência de Dados e suas Aplicações) - Universidade Tecnológica Federal do Paraná, Curitiba, 2022.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/35499-
dc.description.abstractWith the growth of the electronic games industry and the dependence on data for decision making, the work seeks to present a data transformation process until it is significantly safe and ready for analysis or to be acquired by an machine model learning . As an example, let’s use event data from Counter Strike championship matches. This process consists of an web scraping step, where it was necessary to develop an script in Python to standardize the process, and another data transformation step using the Spark processing engine, since the amount of extracted data was considerably large. The result is an feature store, which is a set of data about the statistics of professional players in championships with prizes above 100 thousand dollars.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectSistemas de coleta automática de dadospt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectArmazenamento de dadospt_BR
dc.subjectProcessamento eletrônico de dadospt_BR
dc.subjectPython (Linguagem de programação de computador)pt_BR
dc.subjectEstruturas de dados (Computação)pt_BR
dc.subjectAutomatic data collection systemspt_BR
dc.subjectData miningpt_BR
dc.subjectData Warehousingpt_BR
dc.subjectElectronic data processingpt_BR
dc.subjectPython (Computer program language)pt_BR
dc.subjectData structures (Computer science)pt_BR
dc.titleProcesso de desenvolvimento de uma feature store a partir de dados de web scrapingpt_BR
dc.title.alternativeFeature store development processpt_BR
dc.typespecializationThesispt_BR
dc.description.resumoCom o crescimento da indústria de jogos eletrônicos e a dependência de dados para as tomadas de decisões, o trabalho busca apresentar um processo transformação dos dados até estar significativamente estruturado e pronto para a análise ou para ser consumido por um modelo de machine learning. Como exemplo, vamos utilizar dados de eventos de partidas de campeonatos de Counter Strike. Esse processo é composto por uma etapa de web scraping, onde foi necessário desenvolver um script em Python para padronizar o processo, e outra etapa de transformação dos dados utilizando o motor de processamento Spark, uma vez que a quantidade de dados extraídos foi consideravelmente grande. O resultado é uma feature store, onde é um conjunto de dados sobre as estatísticas dos jogadores profissionais em campeonatos com premiações acima de 100 mil dólares.pt_BR
dc.degree.localCuritibapt_BR
dc.publisher.localCuritibapt_BR
dc.contributor.advisor1Gritti, Marcos Cesar-
dc.contributor.advisor-co1Berardi, Rita Cristina Galarraga-
dc.contributor.referee1Gritti, Marcos Cesar-
dc.contributor.referee2Berardi, Rita Cristina Galarraga-
dc.contributor.referee3Rosa, Marcelo de Oliveira-
dc.publisher.countryBrasilpt_BR
dc.publisher.programCiência de Dados e suas Aplicaçõespt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
Aparece nas coleções:CT - Ciência de Dados e suas Aplicações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
CT_CCDA_2020_1_09.pdf899,25 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.