Mineração de Dados com Rastro: Boas Práticas para Documentação de Processo e sua Aplicação em um Projeto de Classificação Textual

tcc_rastro_dm_marcus_vinicius_borela_de_castro_pós_banca.png

Trabalhos acadêmicos

Autor:
Marcus Vinicius Borela de Castro
Data:
01/09/19
Áreas temáticas:
Tecnologia da Informação Serviços Essenciais ao Estado
Palavras-chave:
Análise de dados Mineração de dados Metodologia Documentação Big data Gestão do conhecimento
Unidades técnicas:
ISC Setic STI SGI Sefti
Este trabalho propõe um conjunto de boas práticas de apoio a projetos de mineração de dados (DM), Rastro-DM, com foco na documentação de alguns conceitos basilares: as Definições de Ação, os Treinamentos realizados e os Aprendizados concebidos. As práticas propostas são complementares às metodologias estruturantes de DM, tal como o CRISP-DM, que trazem todo o arcabouço metodológico e paradigmático para o processo de DM. Ilustra-se o seu uso em um projeto de classificação textual de documentos em PDF associados a danos ao Erário Público Federal Brasileiro denominado Cladop. Mostra-se, no contexto do Cladop, o uso do rastro documental para a geração semi-automática de relatórios e a sua integração com uma rotina de monitoramento automático proposta para classificadores em produção. A construção do rastro DM em um projeto é um passo fundamental em direção a um potencial salto organizacional, a ser obtido com a partilha e o uso do rastro de forma corporativa.