Title: | Modelo de conhecimento baseado em tópicos de acórdãos para suporte à análise de petições iniciais |
Author: | Faraco, Fernando Melo |
Abstract: |
O direito é um domínio complexo, com papel determinante na pacificação de conflitos. O Estado possui o monopólio da jurisdição, o que traz a necessidade de que toda demanda deva ser apresentada ao Poder Judiciário para sua resolução. No Brasil, o resultado disso é um conjunto de 106 milhões de processos em tramitação, para os quais o Judiciário não tem fôlego e nem recursos humanos para dar solução em um tempo razoável. Nesse cenário, a Engenharia do Conhecimento é capaz de fornecer o ferramental necessário para apoiar o papel dos operadores de direito em suas tarefas intensivas em conhecimento, a partir de ativos de conhecimento já disponíveis no judiciário, combinados com os avanços recentes no campo da Inteligência Artificial. Nesta pesquisa, somaram-se a Engenharia do Conhecimento, o Processamento Linguístico Computacional, modelos probabilísticos baseados em tópicos obtidos através de aprendizagem de máquina não supervisionada e conceitos do direito. A reunião destes elementos resultou em um modelo de conhecimento estruturado a partir do processamento de um corpus de acórdãos obtidos no TRF4, através da Análise Latente de Dirichlet (LDA), com o objetivo de apoiar o analista processual na análise das petições iniciais. A pesquisa foi guiada pela metodologia da Design Science Research (DSR) e compreendeu o projeto, desenvolvimento e a aplicação de um modelo de conhecimento baseado em tópicos, que foi avaliado a partir de métricas específicas como a coerência, obtendo-se o valor Cv de 0.6299, bastante próximo ao padrão de referência para esta abordagem. O modelo também foi verificado junto aos especialistas de domínio, por meio de aplicação de um questionário, que consideraram que o modelo traz informações relevantes (82%) e pode reduzir o tempo de análise das petições iniciais (82%). Para aplicação do modelo desenvolvido, foram criados três cenários, nos quais os elementos de análise, como petições iniciais em sua íntegra, foram decompostos em um conjunto de tokens e submetidos ao modelo para realização de consultas. No primeiro cenário, foram recuperados tópicos com maior probabilidade de possuírem relação com o elemento de análise, demonstrando que os tópicos gerados representam decomposições semanticamente significativas dos acórdãos utilizados na criação do modelo. Em um segundo cenário, o modelo foi capaz de recuperar os acórdãos com maior probabilidade de similaridade ao documento de entrada, a partir da medida das distâncias vetoriais entre os tópicos do modelo e o resultado da decomposição do documento de entrada. Para isto foi utilizada a divergência de Jensen-Shannon (DJS) uma medida de distâncias entre termos no espaço dos tópicos. No terceiro cenário, foi apresentada uma nuvem de termos, a partir dos tópicos obtidos. O processo de construção do modelo é apresentado em detalhes, assim como a aplicação nos três cenários descritos. O conhecimento obtido a partir da construção do modelo também é descrito. Ao final, são apresentadas as considerações finais e trabalhos futuros dessa área promissora.<br> Abstract: Law is a complex domain, with a determining role in pacifying people?s conflicts. The State has the monopoly on jurisdiction, implying that all demands should be allowed to the courts resolution. In Brazil, the result is a set of 106 million cases pending, for which the judiciary has neither the stamina nor the human resources to settle in a reasonable time. In this scenario, Knowledge Engineering is capable of providing the required tools to support the role of legal operators in their knowledge-intensive tasks, from knowledge assets already available in the judiciary, combined with recent advances in the field of Artificial Intelligence. In this research, Knowledge Engineering, Computational Linguistic Processing, unsupervised probabilistic topic models and legal concepts summed up. The gathering of these elements resulted in a knowledge based topic model, assembled from a set of sentences from the TRF4 appeal court, through the Latent Analysis of Dirichlet (LDA), in order to support the lawsuit analyst on the initial petitions analysis task. The research was carried out on the Design Science Research (DSR) methodology, and covered the design, development and application of a knowledge based topic model, which was evaluated using specific metrics such as coherence, obtaining the value Cv of 0.6299, very close to the reference standard for this approach. The model was also verified with domain experts, through the application of a questionnaire, who considered that the model brings relevant information (82%) and can reduce the analysis time of the initial petitions (82%). From the knowledge based model developed, three application scenarios were created, querying the model by submitting complete documents, such as Initial Petitions in their entirety as an analysis element, decomposed into a set of tokens. In the first scenario, were recovered topics with a higher probability of being related to the element of analysis, showing that the generated topics represent semantically significant decompositions of the sentences used in the model assembling. In a second scenario, the model was able to recover the most similar appeal?s court sentences given the analysis element, based on the decomposition of the initial petition. The Jensen-Shannon (DJS) divergence was used as a distance measure between terms in the topic space. In the third scenario, a WordCloud of terms was presented, based on the topics obtained. The model construction process is presented in detail, as well as the application in the three described scenarios. The knowledge obtained from the construction of the model is also described. At the end, final considerations and future works of this promising area are presented |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2020. |
URI: | https://repositorio.ufsc.br/handle/123456789/216404 |
Date: | 2020 |
Files | Size | Format | View |
---|---|---|---|
PEGC0631-D.pdf | 3.219Mb |
View/ |