InovaTCU

  »Projetos

Utilização de Deep Learning em Bases de Dados não Estruturados

Descrição

Aplicar modelos baseados em Deep Learning à classificação e extração automática de informações contidas em fontes de dados não estruturados.




Contexto

Grande parte das informações utilizadas pelo Tribunal de Contas da União são oriundas de fontes de dados não estruturados e exigem grande esforço por parte da equipe técnica para a consequente estruturação desses dados por meio do cadastro manual em sistemas corporativos especializados como, por exemplo, o sistema Radar. Faz-se necessária, portanto, uma iniciativa de inovação com o uso de técnicas e ferramentas adequadas a este propósito.





Objetivos

Elaborar ferramenta que auxilie o trabalho de cadastro de informações sobre deliberações contidas em acórdãos com o mínimo possível de intervenção manual.




Resultados

 
A ferramenta proposta já é capaz de classificar as deliberações contidas no texto dos acórdãos com uma precisão média de 99,62%. Além disso, múltiplas ocorrências de deliberações em um mesmo parágrafo são evidenciadas ao submeter arquivos individuais de acórdãos ou atas completas em qualquer formato de documento eletrônico. Não obstante, a extração de informações de cada tipo de deliberação encontra-se ainda em desenvolvimento e, ao final do projeto, pretende-se alcançar também os casos mais complexos de acórdãos cadastrados pela área técnica.




 

Período

Início: 01/07/2015

Fim: 31/12/2015

Unidades

  • ISC
  • SGI
  • STI
  • Setic

Pessoas

  • LUÍS ANDRÉ DUTRA E SILVA

Documentos