Abstract:
|
Existem atualmente diversos serviços no Brasil que atuam fornecendo informativos de licitação, tal como a empresa Liciexpress. Essas empresas atuam fornecendo para seus clientes informações sobre editais de licitação publicados em meios oficiais e que são de interesse desses clientes. Dentro do fluxo de trabalho dessas empresas, cada edital publicado é avaliado individualmente por operadores humanos para decidir se tal edital é de interesse de um determinado cliente e este edital é classificado em uma dada categoria. Neste trabalho será construído um classificador automático de editais, baseado em técnicas de aprendizagem de máquina, visando automatizar o processo de classificação dos editais. O problema foi modelado como um Document Classification Problem, permitindo aplicação de técnicas de aprendizagem de máquina sobre dados textuais. Serão implementadas e testadas técnicas/algoritmos tais como Support Vector Machine, Random Forest e Redes Neurais Artificiais. O treino e avaliação das técnicas foi feito utilizando um conjunto de editais pré-classificados proveniente da empresa Liciexpress. A técnica que obteve melhor resultado dentre as que foram implementadas obteve um score de 88% nas métricas definidas. |