Implementação de um classificador de documentos públicos de licitações do portal de compras do Governo Federal
Trabalhos acadêmicos
- Autor:
- Castro, Luiz Rodrigo
- Data:
- 19/03/20
- Áreas temáticas:
- Produtividade Serviços Essenciais ao Estado Tecnologia da Informação Temas transversais Governança de TI
- Palavras-chave:
- Análise de dados Mineração de dados Processamento de dados Gestão documental Licitação
- Clientela:
- TCU
- Unidades técnicas:
- ISC
Alice (Sistema de Análise de Licitações e Contratos) é um sistema do Tribunal de Contas da União (TCU) que tem como funcionalidade consolidar, resumir e agrupar informações e alertas sobre certames licitatórios publicados diariamente no Portal de Compras do Governo Federal. A validade e a pertinência dos alertas estão ligadas a tipologias dependentes do contexto em que são localizadas. Embora tenha trazido inegáveis ganhos à produtividade dos auditores, algumas evoluções podem aperfeiçoar o sistema. Entre essas evoluções, destaca-se a implementação de um classificador de documentos licitatório, que auxiliará o sistema a aumentar a eficácia e a efetividade dos seus alertas. O classificador proposto usa técnicas de mineração de dados textuais, como normalização e bag of words. Testou-se três modelos possíveis (Naive Bayes, Regressão Logística e Floresta Aleatória) com diversos parâmetros distintos, de modo a identificar a solução com melhor custo-benefício. A rotulação de dados foi feita usando como critério os nomes dos arquivos constantes da base de treino. As bases de teste e treino superaram as acurácias alvo, em especial para o algoritmo Floresta Aleatória. Usou-se ainda uma base reduzida de validação, obtendo-se uma acurácia próxima daquela desejada.