Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/16814
Registro completo de metadados
Campo DCValorIdioma
dc.creatorXavier, Eduardo Semkiw
dc.creatorBatista, Jonathan da Silva
dc.date.accessioned2020-11-19T21:06:10Z-
dc.date.available2020-11-19T21:06:10Z-
dc.date.issued2018-05-29
dc.identifier.citationXAVIER, Eduardo Semkiw; BATISTA, Jonathan da Silva. Criação de um banco de dados não relacional a partir de informação extraída de textos. 2018. 39 f. Trabalho de Conclusão de Curso (Tecnologia em Análise e Desenvolvimento de Sistemas) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2018.pt_BR
dc.identifier.urihttp://repositorio.utfpr.edu.br/jspui/handle/1/16814-
dc.description.abstractInformation and data are currently concentrated in huge amounts within text files. And the fact that most information treated by humans is in unstructured texts justifies the importance of extracting data. The purpose of this paper is to develop an application capable of analyzing and extracting useful information from PDF files. The application will use an external tool to convert PDF and extract the content into text file. It will then search for patterns, such as addresses and dates. Finally, it will store the treated data in a NoSQL database. Since the extraction of information in PDF files generates a large amount of data, there is a need for automated support to the user, due to the difficulty of doing so in a totally manual way.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Tecnológica Federal do Paranápt_BR
dc.rightsopenAccesspt_BR
dc.subjectBanco de dados não relacionaispt_BR
dc.subjectProcessamento de textos (Computação)pt_BR
dc.subjectAnálise de envoltória de dadospt_BR
dc.subjectNon-relational databasespt_BR
dc.subjectText processing (Computer science)pt_BR
dc.subjectData envelopment analysispt_BR
dc.titleCriação de um banco de dados não relacional a partir de informação extraída de textospt_BR
dc.title.alternativeCreation of a non-relational database from information extracted from textspt_BR
dc.typebachelorThesispt_BR
dc.description.resumoAs informações e dados estão atualmente concentradas em enorme quantidade dentro de arquivos de texto. E o fato da maior parte das informações tratadas por humanos estarem em textos não estruturados, justifica a importância de se extrair dados. O objetivo deste trabalho é desenvolver uma aplicação capaz de analisar e extrair informações úteis a partir de arquivos PDF. A aplicação irá utilizar uma ferramenta externa para converter PDF e realizar a extração do conteúdo em arquivo de texto. Logo em seguida irá efetuar uma busca por padrões, como endereços e datas. Finalmente fará o armazenamento dos dados tratados em um banco de dados NoSQL. Visto que a extração de informação em arquivos PDF gera uma grande quantidade de dados, surge a necessidade de apoio automatizado ao usuário, devido dificuldade de se realizar isso de forma totalmente manual.pt_BR
dc.degree.localPonta Grossapt_BR
dc.publisher.localPonta Grossapt_BR
dc.contributor.advisor1Koscianski, André
dc.contributor.referee1Koscianski, André
dc.contributor.referee2Morais, Erikson Freitas de
dc.contributor.referee3Bini, Tarcizio Alexandre
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento Acadêmico de Informáticapt_BR
dc.publisher.programTecnologia em Análise e Desenvolvimento de Sistemaspt_BR
dc.publisher.initialsUTFPRpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
Aparece nas coleções:PG - Tecnologia em Análise e Desenvolvimento de Sistemas

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_COADS_2018_1_05.pdf1,26 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.