Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/12515
Título: | Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
Título(s) alternativo(s): | Detection of anomalies in public administration data using machine learning technique |
Autor(es): | Vieira, Marcos Aurélio |
Orientador(es): | Pessini, Evando Carlos |
Palavras-chave: | Aprendizado do computador Mineração de dados (Computação) Linguagem de programação (Computadores) Machine learning Data mining Programming languages (Electronic computers) |
Data do documento: | 8-Jul-2019 |
Editor: | Universidade Tecnológica Federal do Paraná |
Câmpus: | Medianeira |
Citação: | VIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019. |
Resumo: | O uso de aprendizado de máquina (AM) tem sido utilizado em diversas áreas da sociedade e organizações. Com isso diversas aplicações e descobertas tem surgido dessa área. O objetivo desse trabalho é encontrar anomalias em dados referente a gastos fornecidos pelas prefeituras utilizando técnicas de aprendizado de máquina e mineração de dados. Para o desenvolvimento desse trabalho, é utilizado a linguagem de programação Python,as bibliotecas, Pandas, NumPy, SciKit-learn. A primeira etapa realizada foi selecionar os dados que tenham algum tipo de correlação, assim optou-se por utilizar os dados do Sistema de Informação Contábil e Fiscal (SICONFI) do portal do Tesouro Nacional, mais especificamente os dados referente a gastos das prefeituras com educação, saúde, e segurança pública, entre outros atributos. Em seguida foram unificadas com dados do Índice Firjan de Gestão Fiscal (IFGF), Índice Firjan de Desenvolvimento Municipal (IFDM), dados do Departamento de Informática do Sistema Único de Saúde (DataSUS). Com essa nova proposta, novas anomalias de interesse foram encontradas. Outras cidades que, no experimento apenas com a base do SICONFI, eram consideradas como anomalias, nessa nova abordagem, passaram a não ser, e nos 10 casos analisados, o gasto dessas cidades eram justificados pelos índices propostos. |
Abstract: | The use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes. |
URI: | http://repositorio.utfpr.edu.br/jspui/handle/1/12515 |
Aparece nas coleções: | MD - Ciência da Computação |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
anomaliasdadosaprendizadomaquina.pdf | 908,35 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.