Title: | Detecção de conluio em licitações utilizando algoritmos de machine learning |
Author: | Nunes, Leonardo Vieira |
Abstract: |
O conluio consiste em uma prática criminosa onde empresas concordam secretamente valores de lances entre si em determinada licitação com o objetivo de maximizarem o seu lucro. Esse tipo de prática inflaciona os preços e prejudica a qualidade dos produtos e serviços adquiridos pela administração pública, impactando diretamente na vida dos cidadãos. Nesse contexto, surgiram abordagens utilizando métodos baseados em aprendizado de máquina que analisam grandes quantidades de dados para detectarem a presença de conluio. Todavia, a falta de um fluxo pré-estabelecido para analisar e comparar o comportamento dos algoritmos e conjuntos de dados torna a tomada de decisão mais desafiadora. Diante disso, este estudo busca implementar um fluxo de trabalho para auxiliar na tomada de decisão em relação aos melhores algoritmos de machine learning a serem utilizados para determinado conjunto de dados. Para isso, foram reproduzidos resultados encontrados na literatura, otimizados os hiperparâmetros dos modelos, selecionado o que obteve a melhor acurácia balanceada e, por fim, analisado a importância das features, distribuição das classificações pelas features e o teste U de Mann-Whitney. A partir desses resultados, concluiu-se que há a necessidade de enriquecimento em conjuntos menores, uma vez que resultou em um alto desvio padrão da acurácia balanceada. Também notou-se que houve um ganho de desempenho significativo nos modelos treinados com conjuntos maiores, apresentando uma acurácia balanceada em torno de 83% para o de St. Gallen e Graubünden. The collusion consists of a criminal practice where companies secretly agree on bid values among themselves in a particular tender with the aim of maximizing their profit. This type of practice inflates prices and harms the quality of products and services acquired by the public ad- ministration, directly impacting the lives of citizens. In this context, approaches using machine learning methods have emerged that analyze large amounts of data to detect the presence of collusion. However, the lack of a pre-established workflow to analyze and compare the behav- ior of algorithms and datasets makes decision-making more challenging. Therefore, this study aims to implement a workflow to assist in decision-making regarding the best machine learning algorithms to be used for a specific dataset. To achieve this, results found in the literature were reproduced, the hyperparameters of the models were optimized, the one with the best balanced accuracy was selected, and finally, the importance of the features, distribution of classifications by features, and Mann-Whitney U Test were analyzed. From these results, it was concluded that there is a need for enrichment in smaller datasets, as it resulted in a high standard devia- tion of balanced accuracy. It was also noted that there was a significant performance gain in models trained with larger datasets, with a balanced accuracy of around 83% for St. Gallen and Graubünden. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação. |
URI: | https://repositorio.ufsc.br/handle/123456789/255797 |
Date: | 2024-07-07 |
Files | Size | Format | View | Description |
---|---|---|---|---|
monografia-leonardo-nunes.pdf | 1.642Mb |
View/ |
TCC |