Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/16753
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Silva, Guilherme Santiago Ribeiro | |
dc.creator | Urban, Lincoln Moro | |
dc.date.accessioned | 2020-11-19T21:04:52Z | - |
dc.date.available | 2020-11-19T21:04:52Z | - |
dc.date.issued | 2016-05-24 | |
dc.identifier.citation | SILVA, Guilherme Santiago Ribeiro; URBAN, Lincoln Moro. Implementação do paradigma MapReduce por meio do Hadoop integrado ao framework Hive: um estudo prático. 2016. 78 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2016. | pt_BR |
dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/16753 | - |
dc.description.abstract | Nowadays, with the advancement of technology and the constant creation of new applications, many companies are faced with a crucial issue for the segment of the IT (Information Technology) services as a storage and handling of large volumes of data. Companies like Facebook, Twitter, Google, among others, has its technologies and innovations guided per a new concept called Big Data. This new tendency allow the development of solutions that can meet the market demand, considering that the Relational Database Management Systems, although still widely used, encounter problems with regard to performance, scalability and processing of large databases. One of the most widely used concepts nowadays, when mention the Big Data, is the MapReduce paradigm. This was developed by Google and has its operation based on the processing and distribution of data in a set of computers (cluster), interconnected over a network, thus enabling greater flexibility in handling such data. Considering the MapReduce paradigm, some technologies were created to implement their concepts, one of them is Hadoop, which has modules that perform the management and distribution of databases between multiple machines. This paper proposes the implementation and practical implementation of the MapReduce paradigm through the Hadoop in a virtualized environment. Therefore was used an experimental environment, compound per virtualization technologies and benchmark techniques, which simulate analytical workloads on synthetic databases. The results in turn, point to the analysis in the time of execution of the queries submitted to this environment and also serve as a base for future work and related searches. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
dc.rights | openAccess | pt_BR |
dc.subject | Banco de dados relacionais | pt_BR |
dc.subject | Benchmarking (Administração) | pt_BR |
dc.subject | Big Data | pt_BR |
dc.subject | Relational databases | pt_BR |
dc.subject | Benchmarking (Management) | pt_BR |
dc.title | Implementação do paradigma MapReduce por meio do Hadoop integrado ao framework Hive: um estudo prático | pt_BR |
dc.title.alternative | Implementation of the MapReduce paradigm through Hadoop integrated into the framework Hive: a practical study | pt_BR |
dc.type | bachelorThesis | pt_BR |
dc.description.resumo | Atualmente, com o avanço da tecnologia e a criação constante de novas aplicações, muitas empresas deparam-se com uma questão crucial para o segmento dos serviços de TI (Tecnologia da Informação), como por exemplo o armazenamento e manipulação de grandes volumes de dados. Empresas como o Facebook, Twitter, Google, entre outras, têm suas tecnologias e inovações pautadas sobre um novo conceito chamado Big Data. Essa nova tendência possibilitou o desenvolvimento de soluções que atendem a demanda do mercado, visto que os Sistemas Gerenciadores de Banco de Dados Relacionais, mesmo que ainda muito utilizados, deparam-se com problemas de desempenho, escalabilidade e processamento de bases de dados volumosas. Um dos conceitos mais utilizados atualmente, quando trata-se de Big Data, é o paradigma MapReduce. Este foi desenvolvido pela Google e tem seu funcionamento baseado no processamento e distribuição de dados em um conjunto de computadores (cluster), interligados por uma rede, possibilitando assim, uma maior flexibilidade na manipulação desses dados. Considerando o MapReduce um paradigma, algumas tecnologias foram criadas para implementar os seus conceitos, uma delas é o Hadoop, o qual possui módulos que realizam o gerenciamento e a distribuição de bases de dados entre diversas máquinas. O presente trabalho propõe a implementação e execução prática do paradigma MapReduce por intermédio do Hadoop em um ambiente virtualizado. Para tanto, fêz-se uso de um cenário experimental composto de tecnologias de virtualização e técnicas de benchmark, as quais simulam cargas de trabalho analíticas sobre bases de dados sintéticas. Os resultados por sua vez, apontam para a análise no tempo de execução das consultas submetidas a este cenário e também servem como base para trabalhos futuros e pesquisas relacionadas. | pt_BR |
dc.degree.local | Ponta Grossa | pt_BR |
dc.publisher.local | Ponta Grossa | pt_BR |
dc.contributor.advisor1 | Bini, Tarcizio Alexandre | |
dc.contributor.referee1 | Bini, Tarcizio Alexandre | |
dc.contributor.referee2 | Almeida, Simone de | |
dc.contributor.referee3 | Ribeiro, Richard Duarte | |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Departamento Acadêmico de Informática | pt_BR |
dc.publisher.program | Tecnologia em Análise e Desenvolvimento de Sistemas | pt_BR |
dc.publisher.initials | UTFPR | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
Aparece nas coleções: | PG - Tecnologia em Análise e Desenvolvimento de Sistemas |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
PG_COADS_2016_1_02.pdf | 1,6 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.