Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/5994
Título: Estudo comparativo da morfologia textual de laudos médicos e de textos de propósito geral
Título(s) alternativo(s): Comparative study of the textual morphology of medical reports and general purpose texts
Autor(es): Oliveira, Gabrielle Piezzoti
Orientador(es): Valentin, Lucio Geronimo
Palavras-chave: Processamento de linguagem natural (Computação)
Prescrição médica
Linguística de corpus
Natural language processing (Computer science)
Prescription writing
Corpora (Linguistics)
Data do documento: 21-Jun-2017
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Campo Mourao
Citação: OLIVEIRA, Gabrielle Piezzotti. Estudo comparativo da morfologia textual de laudos médicos e de textos de propósito geral. 2017. 58 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2017.
Resumo: Contexto: O entendimento da linguagem humana por parte de computadores já é questão de pesquisa há anos e pode ser usada com diferentes finalidades. Esta monografia se utiliza do Processamento de Linguagem Natural (PLN) para realizar um levantamento morfológico do conteúdo de laudos médicos. Tais informações podem auxiliar pesquisas futuras desse tipo de texto, pois há uma carência na literatura de estudos sobre sua estrutura. Objetivo: O objetivo é identificar as características morfológicas predominantes nesse tipo de texto e analisar como diferem de outros tipos de textos. Para isso, são usados dois corpora: um de cunho jornalístico e um de cunho acadêmico. Método: O primeiro passo da pesquisa é a formatação de tais corpora, deixando-os em um formato compatível com a ferramenta de análise morfológica usada, seguido por uma limpeza, para correção e remoção de elementos indesejados. Os laudos exigiram ainda etapas extras, para a seleção das amostras que compõem o corpus. Segue-se então com o processamento dos corpora e o levantamento das seguintes informações: classes gramaticais, lemas, unigramas, bigramas e trigramas mais frequentes. Resultados: As estatísticas levantadas em cima dos dados obtidos no processamento mostram uma variação considerável entre o conteúdo morfológico dos laudos e dos demais corpora, reforçando as hipóteses empíricas de que há uma limitação e especificidade nos laudos, além de uma diferença significativa na proporção de adjetivos, verbos e números, para com os outros textos. Conclusões: A análise traçou o perfil morfológico dos laudos como sendo um texto com mais substantivos, números e adjetivos que os demais, mas com menos verbos, pronomes e determinantes. Além disso, possui frases mais simples e diretas, com um vocabulário limitado. Outras pesquisas podem ser feitas, variando os corpora, para enriquecer a análise morfológica apresentada nesta monografia.
Abstract: Context: The understanding of human speech by computers has been a research question for years and can be applied to different goals. This monograph uses Natural Language Processing (NLP) to perform a morphological survey of the content of medical reports. This data can help future studies of this type of text, since there is a lack of analysis about medical reports in the literature. Objective: The goal is to identify the predominant features of this type of text and analyze how it differs from other types of texts. In order to do this, an academic and a journalistic corpora will be used. Method: The first step was the formatting of these corpora, so they are compatible with the analysis tool, followed by an cleanup for correction and removal of unwanted elements. The medical reports required extra steps, for the selection of the 500 reports that compose the corpus. The next thing is the processing of the corpora and the gathering of the following informations: the most frequent parts of speech, lemmas, unigrams, bigrams and trigrams. Results: The statistics extracted from the data provided by the tool show a considerable amount of variation between the morphological content of the medical reports and the other texts, which reinforces the empirical hypotheses: there is a significant difference in the specification of the medical reports and the proportion of adjectives, verbs and numbers, compared to the other types of texts. Conclusion: The analysis described the morphological profile of the medical reports as being a type of text with more nouns, numbers and adjectives than the others, but with fewer verbs, pronouns and determinants. Moreover, they have simpler and more direct sentences, with a limited vocabulary. Further research could be done, varying the corpora, to enrich the morphological analysis presented in this monograph.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/5994
Aparece nas coleções:CM - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
morfologiatextuallaudosmedicos.pdf840,28 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.