| Title: | Studies of income distribution functions in econophysics using particle swarm optimization |
| Author: | Santos, Paulo Henrique dos |
| Abstract: |
O estudo apresenta um modelo contínuo de duas classes para a distribuição de renda no Brasil, que combina um regime exponencial de Boltzmann-Gibbs para a população de baixa renda e uma cauda de Pareto para a de alta renda, respectivamente. Utilizando microdados da PNAD anual de 2001 a 2011 e da PNAD Contínua de 2012 a 2019, aplicou-se um algoritmo de otimização por enxame de partículas para estimar três parâmetros principais: a renda de transição entre regimes, a temperatura efetiva da distribuição e o índice de Pareto. O modelo foi ajustado por meio de duas funções de perda, do erro médio quadrático logarítmico e da estimação de máxima verossimilhança ponderada, e validado com simulações de regressão. Os dados foram estratificados por sexo/gênero e cor/raça, permitindo avaliar desigualdades econômicas entre grupos. As análises temporais indicam que o coeficiente de Gini teórico, dependente apenas do índice de Pareto e da proporção de rendas altas, apresenta forte correlação com o Gini empírico, demonstrando que o modelo captura de forma consistente a dinâmica da desigualdade no período analisado. A análise de importância das variáveis, baseada em florestas aleatórias e árvores de inferência condicional, mostra que ocupação e idade são os principais preditores de renda, seguidos por educação, raça e sexo/gênero. Essa hierarquia revela que fatores ligados ao mercado de trabalho e à trajetória profissional explicam grande parte da variação da renda, enquanto características educacionais e demográficas modulam as diferenças entre indivíduos e grupos. Conclui-se que o modelo proposto representa adequadamente a estrutura da renda brasileira e constitui uma ferramenta sólida para estudos comparativos e análises longitudinais sobre desigualdade. Abstract: This study presents a continuous two-class model for income distribution in Brazil, combining an exponential Boltzmann-Gibbs regime for the low-income population and a Pareto tail for the high-income group, respectively. Using microdata from annual PNAD 2001-2011 and continuous PNAD from 2012-2019, a particle swarm optimization algorithm was applied to estimate three key parameters: the crossover income between regimes, the effective temperature of the distribution, and the Pareto index. The model was fitted using two loss functions, the root mean squared logarithmic error and weighted maximum likelihood estimation, and validated through regression simulations. The data were stratified by sex/gender and color/race, allowing the assessment of economic inequalities across groups. Temporal analyses indicate that the theoretical Gini coefficient, dependent only on the Pareto index and the proportion of high-income households, shows a strong correlation with the empirical Gini, demonstrating that the model consistently captures the dynamics of inequality over the analyzed period. The variable importance analysis, based on random forests and conditional inference trees, shows that occupation and age are the main income predictors, followed by education, race, and sex/gender. This hierarchy reveals that labor market and professional trajectory factors explain much of the income variation, while educational and demographic characteristics modulate differences among individuals and groups. It is concluded that the proposed model adequately represents Brazil's income structure and constitutes a robust tool for comparative and longitudinal studies on inequality. |
| Description: | Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Físicas e Matemáticas, Programa de Pós-Graduação em Física, Florianópolis, 2025. |
| URI: | https://repositorio.ufsc.br/handle/123456789/270024 |
| Date: | 2025 |
| Files | Size | Format | View |
|---|---|---|---|
| PFSC0480-T.pdf | 12.24Mb |
View/ |