Classificação automática de acórdãos a partir de enunciados da jurisprudência selecionada: análise comparativa de técnicas e fontes de dados
Trabalhos acadêmicos
- Autor:
- Pacheco, Leonardo
- Data:
- 24/03/20
- Áreas temáticas:
- Tecnologia da Informação Serviços Essenciais ao Estado
- Palavras-chave:
- Acórdão Mineração de dados Machine learning Jurisprudência
- Clientela:
- TCU
- Unidades técnicas:
- ISC
O presente trabalho visa verificar a viabilidade da classificação automática de enunciados de jurisprudência e acórdãos do Tribunal de Contas da União em áreas de jurisprudência, a partir de textos de enunciados, de excertos de acórdãos e de inteiros teores de acórdãos, empregando redes neurais. Técnicas tradicionais de aprendizado de máquina e baseadas em redes neurais são comparadas a fim de identificar a mais adequada para cada tarefa de classificação. Além disso, diferentes técnicas de geração de word embeddings e seu impacto nas tarefas de classificação são verificados. Os experimentos consistiram em testes com diferentes arquiteturas e hiperparâmetros, e comparação estatística de alguns modelos e configurações selecionados por meio de validação cruzada e medidas F1. No caso de textos mais curtos de entrada, como enunciados, excertos, e acórdãos reduzidos, os resultados apontaram melhor desempenho em redes recorrentes com embeddings pré-treinados a partir de textos do mesmo domínio do conhecimento. Para textos mais longos, redes convolucionais e modelos não neurais apresentaram melhor desempenho, e o pré-treinamento de embeddings foi menos relevante.