Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações

Sousa, Lucas Coelho Pini de

Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações

DSpace Repository

A- A A+

Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações

Show simple item record

dc.contributor	Universidade Federal de Santa Catarina.	pt_BR
dc.contributor.advisor	Silvano, Wellington Fernandes
dc.contributor.author	Sousa, Lucas Coelho Pini de
dc.date.accessioned	2025-12-11T03:15:35Z
dc.date.available	2025-12-11T03:15:35Z
dc.date.issued	2025-12-10
dc.identifier.uri	https://repositorio.ufsc.br/handle/123456789/270861
dc.description	TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Ciências da Computação.	pt_BR
dc.description.abstract	O avanço das tecnologias de inteligência artificial e sua ampla disseminação intensi- ficam as preocupações quanto à proteção de informações pessoais de seus usuários. Organizações armazenam e processam diariamente grandes volumes de dados que, co- mumente, incluem informações pessoais, financeiras e de saúde. Seu manejo inade- quado pode comprometer direitos fundamentais e violar legislações como a Lei Geral de Proteção de Dados (LGPD) e a General Data Protection Regulation (GDPR). Tradi- cionalmente, as técnicas de anonimização baseiam-se em métodos como mascaramento, pseudonimização, generalização, perturbação de dados e introdução de dados sintéti- cos. Embora eficazes, essas abordagens enfrentam limitações, sobretudo em cenários de alta complexidade textual, nos quais informações pessoais podem aparecer de forma implícita e contextual. Nesse contexto, os recentes avanços no processamento de lin- guagem natural (PLN) e, em especial, dos modelos de linguagem de larga escala (Large Language Models - LLMs), os colocam como alternativas promissoras no auxílio da solução dessa problemática. A capacidade desses sistemas de compreender semantica- mente, realizar inferências contextuais e apoiar tarefas de classificação de texto reforça seu potencial para a detecção e anonimização automatizada de dados textuais. Este tra- balho tem como objetivo investigar a viabilidade do uso de modelos de linguagem para a detecção e anonimização automática de dados pessoais em texto. Pretende-se, assim, avaliar os potenciais e as limitações dessa abordagem.	pt_BR
dc.description.abstract	The advancement and widespread adoption of artificial intelligence technologies have intensified concerns regarding the protection of users’ personal information. Organi- zations routinely store and process large volumes of data, often including personal, financial, and health-related information. Improper handling of such data may com- promise fundamental rights and violate regulations such as Brazil’s General Data Pro- tection Law (LGPD) and the European Union’s General Data Protection Regulation (GDPR). Traditionally, anonymization relies on deterministic methods such as mask- ing, pseudonymization, generalization, data perturbation, and the use of synthetic data. Although effective in specific scenarios, these approaches face limitations in complex textual contexts, where personal information may appear implicitly or contextually. In this setting, recent advances in natural language processing (NLP) and, in particular, large language models (LLMs) position them as promising alternatives to address this challenge. Their ability to semantically understand content, perform contextual infer- ence, and support text classification tasks highlights their potential for the automated detection and anonymization of personal textual data. This study aims to investigate the feasibility of using language models for the automatic detection and anonymization of personal data in text, seeking to assess both the potentials and inherent limitations of this approach.	pt_BR
dc.format.extent	109	pt_BR
dc.language.iso	por	pt_BR
dc.publisher	Florianópolis, SC.	pt_BR
dc.rights	Open Access.
dc.subject	Dados Pessoais	pt_BR
dc.subject	Anonimização de Dados	pt_BR
dc.subject	Modelos de Linguagem de Larga Escala	pt_BR
dc.subject	Processamento de Linguagem Natural	pt_BR
dc.title	Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações	pt_BR
dc.type	TCCgrad	pt_BR
dc.contributor.advisor-co	Custódio, Ricardo Felipe

Files in this item

Files	Size	Format	View	Description
TCC___Lucas_Pin ... otenciais_e_Limitações.pdf	1.355Mb	PDF	View/Open	TCC Lucas Coelho Pini de Sousa

This item appears in the following Collection(s)

TCC Ciências da Computação [941]
Ciências da Computação

Show simple item record

Search DSpace

Advanced Search

Browse

All of DSpace
This Collection
- By Issue Date
- Authors
- Titles
- Subjects

Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações

DSpace Repository

Anonimização como pilar de segurança em interações com modelos de linguagem: potenciais e limitações

Files in this item

This item appears in the following Collection(s)

Search DSpace

Browse

All of DSpace

This Collection

My Account

Statistics

Compartilhar