Abstract:
|
A Polícia Militar de Santa Catarina recebe diariamente uma média de 6.000 chamadas telefônicas. Estas chamadas geram registros de ocorrências (ROs). Para checar se o RO está classificado na natureza de operação correta, é necessário ler todos os ROs um a um, validando se a descrição da ocorrência está coerente com a natureza de operação informada. Essa tarefa torna-se árdua e pouco ágil, já que boa parte desses ROs não se encontram classificados corretamente. A mineração de texto auxilia neste processo, pois classificando e tratando esses documentos, facilita na procura e contagem dessas ocorrências policiais pela sua natureza de operação. A Secretaria de Estado da Segurança Pública e da Cidadania de Santa Catarina, que é o órgão responsável em contabilizar, fazer os levantamentos estatísticos e apontar diretrizes para o combate ao crime, necessita de um processo automatizado para validar os dados. Este estudo tem por objetivo minerar 2.684 ROs policiais do ano de 2003 na Região Metropolitana da Grande Florianópolis. Verifica com isso a confiabilidade e valida a classificação já atribuída ao RO, apontando registros com erro na classificação, que deverão ser revisados pelo analista da Diretoria de Combate ao Crime Organizado (DIRC). Com o software ABC Clean, pode-se corrigir automaticamente os erros de ortografia. Para a mineração dos dados, foi desenvolvido o software ABC Mining e utilizou-se o Weka® para a geração das regras de decisão do tipo Se..Então, utilizando como técnica de classificação, a árvore de decisão. Os softwares foram desenvolvidos na linguagem de programação Delphi®. Com a geração das regras de decisão, pode-se validar se o registro de ocorrência está classificado na natureza de operação correta e sugerir a DIRC que implemente em seu sistema de cadastro de RO essas regras, evitando-se assim que os novos RO sejam cadastrados com a natureza de operação distorcida em relação a descrição. Dos 2.684 RO estudados, 5,4396% deles encontravam-se cadastrados na natureza de operação incorreta. Deve-se levar em consideração que os dados enviados pela DIRC já foram previamente selecionados para atender algumas naturezas de operação, e já se esperava que muitos deles estivessem classificados corretamente. |