|
Abstract:
|
Este trabalho analisou corpora anotados em português do Brasil utilizados na detecção de discurso de ódio, com foco na representação e no tratamento do ódio racial contra a população afro-brasileira. Identificamos limitações recorrentes: baixa proporção de instâncias explicitamente racistas, dificuldade em distinguir crítica legítima de conteúdo ofensivo, ausência de diretrizes claras para casos ambíguos e falta de rótulos mais específicos. Também observamos estratégias de coleta e seleção de dados pouco documentadas, o que pode comprometer a diversidade textual. Testamos a integração de subconjuntos de discursos anti-negros de diferentes bases; embora metodologicamente desafiadora, a estratégia mostrou-se viável para compor um recorte temático mais específico e resultou no Afro-BR Hate (v1.0), um corpus derivado focalizado em ódio racial contra pessoas negras, documentado no formato Datasheets e adequado a análises exploratórias e experimentos piloto. Como próximo passo, propomos a criação e expansão de um corpus focalizado de ódio racial contra pessoas negras no Brasil, a partir de postagens de diversas redes sociais publicadas por pessoas negras com relevância pública no território brasileiro. Recomendamos diretrizes anotativas refinadas, fundamentadas em literatura de autoras e autores negros e em debates contemporâneos sobre gênero, raça e classe, visando uma abordagem mais ética, representativa e eficaz na modelagem computacional do discurso de ódio racial. |