Mineração de Dados com Rastro: Boas Práticas para Documentação de Processo e sua Aplicação em um Projeto de Classificação Textual
Trabalhos acadêmicos
- Autor:
- Marcus Vinicius Borela de Castro
- Data:
- 01/09/19
- Áreas temáticas:
- Institucional Serviços Essenciais ao Estado Tecnologia da Informação Institucional
- Palavras-chave:
- Big data Mineração de dados Metodologia Gestão do conhecimento Documentação Análise de dados
- Unidades técnicas:
- ISC Setic Sefti STI SGI
Documentos
- Mineração de dados com rastro - boas práticas para documentação de processos e sua aplicação em um projeto de classificação textual
- Versão do trabalho publicada na edição n. 145 da Revista do TCU (dezembro de 2020)
- Apresentação em PowerPoint
- Vídeo da defesa do TCC (em 15/8/2019)
- Vídeo da apresentação realizada no 5º Seminário Internacional de Análise de Dados na Administração Pública (em 17/10/2019) (Rastro-DM)
- Vídeo da apresentação realizada no 5º Seminário Internacional de Análise de Dados na Administração Pública (em 17/10/2019) (Cladop)
- Versão do trabalho publicada na edição n. 145 da Revista do TCU (dezembro de 2020)
Este trabalho propõe um conjunto de boas práticas de apoio a projetos de mineração de dados (DM), Rastro-DM, com foco na documentação de alguns conceitos basilares: as Definições de Ação, os Treinamentos realizados e os Aprendizados concebidos. As práticas propostas são complementares às metodologias estruturantes de DM, tal como o CRISP-DM, que trazem todo o arcabouço metodológico e paradigmático para o processo de DM. Ilustra-se o seu uso em um projeto de classificação textual de documentos em PDF associados a danos ao Erário Público Federal Brasileiro denominado Cladop. Mostra-se, no contexto do Cladop, o uso do rastro documental para a geração semi-automática de relatórios e a sua integração com uma rotina de monitoramento automático proposta para classificadores em produção. A construção do rastro DM em um projeto é um passo fundamental em direção a um potencial salto organizacional, a ser obtido com a partilha e o uso do rastro de forma corporativa.