Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira

DSpace Repository

A- A A+

Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira

Show simple item record

dc.contributor Universidade Federal de Santa Catarina
dc.contributor.advisor Araújo, Gustavo Medeiros de
dc.contributor.author Santana, Jairo Brandão de
dc.date.accessioned 2021-01-14T18:11:33Z
dc.date.available 2021-01-14T18:11:33Z
dc.date.issued 2020
dc.identifier.other 370597
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/219522
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2020.
dc.description.abstract Uma das competências da Polícia Federal é analisar os Relatórios de Inteligência Financeira (RIF), gerados pelo Conselho de Controle de Atividades Financeiras (COAF). Essa análise verifica a existência de algum indício de crime de lavagem de dinheiro e, se for o caso, inicia uma investigação. Essa análise é realizada de forma manual, o agente deve ler o RIF e catalogar em uma planilha todos os envolvidos e operações financeiras realizadas. Esse processo é custoso, pois o RIF pode ter dezenas de páginas. Além disso, vários relatórios são gerados mensalmente, o que agrava a demora no processamento dos RIFs. Esse projeto vem propor uma avaliação das tecnologias atuais de Mineração de Texto, mais especificamente o Reconhecimento de Entidades Nomeadas (REN) em português. A aplicação de Reconhecimento de Entidades Nomeadas ao RIF visa automatizar o processo de extração de informações do texto, submetendo o documento a um sistema computacional que faça sua leitura detalhada e retorne as informações contidas no relatório, como entidades, operações, valores, datas e vínculos entre as entidades. Dessa forma, pretende-se tornar mais ágil a análise dos RIFs. Após a leitura automatizada do texto contido no RIF, as informações extraídas podem ser armazenadas em uma de base dados e disponibilizadas de forma estruturada. Essa etapa automatizada irá facilitar a etapa seguinte de análise de vínculo, na qual consiste em detectar vínculos por meio de uma ferramenta de diagramação e análise de redes. Além disso, a organização e armazenamento dessas informações, também permitiria o cruzamento dos vínculos de diversos RIFs e manter o seu histórico.
dc.description.abstract Abstract: One of the responsibilities of the Federal Police to analyze the Financial Intelligence Reports(RIF), generated by the Council for Financial Activities Control (COAF). This analysis checksfor evidence of a money laundering crime and, if applicable, initiates an investigation. Thisanalysis is performed manually, the agent must read the RIF and catalog in a spreadsheet allthose involved and financial operations carried out. This process is costly because the RIF mayhave dozens of pages. In addition, several reports are generated on a monthly basis, whichaggravates the delay in processing RIFs. This project proposes an assessment of current textmining technologies, more specifically the Recognition of Named Entities (REN) inPortuguese. The application of Recognition of Named Entities to the RIF aims to automate theprocess of extracting information from the text, submitting the document to a computer systemthat reads it in detail and returns the information contained in the report, such as entities,operations, values, dates and links between entities. Thus, it is intended to make the analysis ofRIFs more agile. After the automated reading of the text contained in the RIF, the extractedinformation can be stored in a database and made available in a structured way. This automatedstep will facilitate the next step of link analysis, which consists of detecting links using adiagramming and network analysis tool. In addition, the organization and storage of thisinformation would also allow the crossing of the links of several RIFs and maintain theirhistory. en
dc.format.extent 106 p.| il.
dc.language.iso por
dc.subject.classification Ciência da informação
dc.subject.classification Lavagem de dinheiro
dc.subject.classification Lingüística
dc.subject.classification Finanças
dc.subject.classification Aprendizado do computador
dc.subject.classification Informação estratégica
dc.subject.classification Inteligência artificial
dc.title Desenvolvimento e análise de corpus para reconhecimento de entidades nomeadas em relatórios de inteligência financeira
dc.type Dissertação (Mestrado)
dc.contributor.advisor-co Ramos, Vinicius Faria Culmant


Files in this item

Files Size Format View
PCIN0241-D.pdf 2.667Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar