Prezado usuário, este portal não é compatível com o navegador Internet Explorer ou outros navegadores antigos.

Recomenda-se o uso de versões atualizadas dos navegadores Google Chrome, Microsoft Edge ou Mozilla Firefox.

Classificação automática de acórdãos a partir de enunciados da jurisprudência selecionada: análise comparativa de técnicas e fontes de dados

tcc-leonardo_augusto_da_silva_pacheco.png

Trabalhos acadêmicos

Autor:
Pacheco, Leonardo
Data:
24/03/20
Áreas temáticas:
Tecnologia da Informação Serviços Essenciais ao Estado
Palavras-chave:
Acórdão Mineração de dados Machine learning Jurisprudência
Clientela:
TCU
Unidades técnicas:
ISC

O presente trabalho visa verificar a viabilidade da classificação automática de enunciados de jurisprudência e acórdãos do Tribunal de Contas da União em áreas de jurisprudência, a partir de textos de enunciados, de excertos de acórdãos e de inteiros teores de acórdãos, empregando redes neurais. Técnicas tradicionais de aprendizado de máquina e baseadas em redes neurais são comparadas a fim de identificar a mais adequada para cada tarefa de classificação. Além disso, diferentes técnicas de geração de word embeddings e seu impacto nas tarefas de classificação são verificados. Os experimentos consistiram em testes com diferentes arquiteturas e hiperparâmetros, e comparação estatística de alguns modelos e configurações selecionados por meio de validação cruzada e medidas F1. No caso de textos mais curtos de entrada, como enunciados, excertos, e acórdãos reduzidos, os resultados apontaram melhor desempenho em redes recorrentes com embeddings pré-treinados a partir de textos do mesmo domínio do conhecimento. Para textos mais longos, redes convolucionais e modelos não neurais apresentaram melhor desempenho, e o pré-treinamento de embeddings foi menos relevante.