Criação de um banco de dados não relacional a partir de informação extraída de textos

Xavier, Eduardo Semkiw; Batista, Jonathan da Silva

Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/16814

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Xavier, Eduardo Semkiw
dc.creator	Batista, Jonathan da Silva
dc.date.accessioned	2020-11-19T21:06:10Z	-
dc.date.available	2020-11-19T21:06:10Z	-
dc.date.issued	2018-05-29
dc.identifier.citation	XAVIER, Eduardo Semkiw; BATISTA, Jonathan da Silva. Criação de um banco de dados não relacional a partir de informação extraída de textos. 2018. 39 f. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.	pt_BR
dc.identifier.uri	http://repositorio.utfpr.edu.br/jspui/handle/1/16814	-
dc.description.abstract	Information and data are currently concentrated in huge amounts within text files. And the fact that most information treated by humans is in unstructured texts justifies the importance of extracting data. The purpose of this paper is to develop an application capable of analyzing and extracting useful information from PDF files. The application will use an external tool to convert PDF and extract the content into text file. It will then search for patterns, such as addresses and dates. Finally, it will store the treated data in a NoSQL database. Since the extraction of information in PDF files generates a large amount of data, there is a need for automated support to the user, due to the difficulty of doing so in a totally manual way.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Tecnológica Federal do Paraná	pt_BR
dc.rights	openAccess	pt_BR
dc.subject	Banco de dados não relacionais	pt_BR
dc.subject	Processamento de textos (Computação)	pt_BR
dc.subject	Análise de envoltória de dados	pt_BR
dc.subject	Non-relational databases	pt_BR
dc.subject	Text processing (Computer science)	pt_BR
dc.subject	Data envelopment analysis	pt_BR
dc.title	Criação de um banco de dados não relacional a partir de informação extraída de textos	pt_BR
dc.title.alternative	Creation of a non-relational database from information extracted from texts	pt_BR
dc.type	bachelorThesis	pt_BR
dc.description.resumo	As informações e dados estão atualmente concentradas em enorme quantidade dentro de arquivos de texto. E o fato da maior parte das informações tratadas por humanos estarem em textos não estruturados, justifica a importância de se extrair dados. O objetivo deste trabalho é desenvolver uma aplicação capaz de analisar e extrair informações úteis a partir de arquivos PDF. A aplicação irá utilizar uma ferramenta externa para converter PDF e realizar a extração do conteúdo em arquivo de texto. Logo em seguida irá efetuar uma busca por padrões, como endereços e datas. Finalmente fará o armazenamento dos dados tratados em um banco de dados NoSQL. Visto que a extração de informação em arquivos PDF gera uma grande quantidade de dados, surge a necessidade de apoio automatizado ao usuário, devido dificuldade de se realizar isso de forma totalmente manual.	pt_BR
dc.degree.local	Ponta Grossa	pt_BR
dc.publisher.local	Ponta Grossa	pt_BR
dc.contributor.advisor1	Koscianski, André
dc.contributor.referee1	Koscianski, André
dc.contributor.referee2	Morais, Erikson Freitas de
dc.contributor.referee3	Bini, Tarcizio Alexandre
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Departamento Acadêmico de Informática	pt_BR
dc.publisher.program	Tecnologia em Análise e Desenvolvimento de Sistemas	pt_BR
dc.publisher.initials	UTFPR	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO	pt_BR
Aparece nas coleções:	PG - Tecnologia em Análise e Desenvolvimento de Sistemas

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
PG_COADS_2018_1_05.pdf		1,26 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas