Title: | Um método para o apoio e análise de documentos textuais empregando mineração de texto e taxonomia |
Author: | Tozzi, Tatiana |
Abstract: |
A complexidade envolvida na leitura e interpretação de documentos é destacada neste trabalho, evidenciando como a compreensão dos textos pode variar significativamente em função da presença de termos técnicos e do conhecimento prévio do leitor. A introdução do estudo ressalta os desafios enfrentados pelos leitores ao se depararem com documentos que contêm linguagem especializada. Propõe-se que esses desafios possam ser mitigados por meio do uso integrado de técnicas de Mineração de Texto (Text Mining - TM) e Visualização de Dados. Mais especificamente, a adoção de uma taxonomia estruturada e hierárquica é sugerida como uma ferramenta essencial para melhorar a organização e a categorização de informações, tornando a análise de documentos mais acessível e intuitiva. O principal objetivo deste trabalho é desenvolver um método que emprega técnicas de Mineração de Texto e uma taxonomia definida para auxiliar na análise de documentos textuais em contextos especializados. Este método busca facilitar a interpretação e compreensão de textos com terminologias técnicas, por meio da identificação de características textuais relevantes, da especificação de uma taxonomia adequada, e da aplicação de técnicas de TM adaptadas ao domínio do conhecimento. Tal abordagem multidisciplinar, integra conhecimentos da Engenharia do Conhecimento, Representação de Conhecimento por meio de Taxonomia, Desenvolvimento de Sistemas e Engenharia de Software, demonstrando como a interação entre essas áreas pode resolver problemas complexos de análise documental. Os resultados alcançados com a implementação do método proposto indicam uma melhoria significativa na análise de documentos textuais. A aplicação prática deste método, revelou que a organização hierárquica de termos e a visualização intuitiva de dados podem proporcionar uma compreensão mais adequada e estruturada do conteúdo dos documentos. Como conclusão tem-se que a inclusão de uma taxonomia bem definida e a aplicação de técnicas de TM não apenas facilitam a identificação e compreensão de termos técnicos, mas também aprimoram significativamente a interação entre o usuário e as informações, facilitando o processo de análise documental em diversos contextos profissionais e acadêmicos. Abstract: This work highlights the complexity involved in reading and interpreting documents, demonstrating how the comprehension of texts can vary significantly due to the presence of technical terms and the reader's prior knowledge. The study's introduction emphasizes the challenges faced by readers when encountering documents containing specialized language. It proposes that these challenges can be mitigated through the integrated use of Text Mining (TM) techniques and data visualization. More specifically, the adoption of a structured and hierarchical taxonomy is suggested as an essential tool to improve the organization and categorization of information, making document analysis more accessible and intuitive. The main goal of this work is to develop a method that employs advanced Text Mining techniques and a carefully defined taxonomy to assist in the analysis of textual documents in specialized contexts. This method aims to facilitate the interpretation and understanding of texts filled with technical terminologies, through the identification of relevant textual characteristics, the specification of an appropriate taxonomy, and the application of Machine Learning and TM techniques adapted to the knowledge domain. Such a multidisciplinary approach integrates knowledge from Knowledge Engineering, Ontologies, Systems Development, and Software Engineering, demonstrating how the interaction between these areas can solve complex problems in document analysis. The results achieved with the implementation of the proposed method indicate a significant improvement in the analysis of textual documents. The practical application of this method revealed that the hierarchical organization of terms and intuitive data visualization can provide a deeper and more structured understanding of the document content. The study concludes that the inclusion of a well-defined taxonomy and TM techniques not only facilitates the identification and understanding of technical terms but also significantly enhances the interaction between the user and the information, making the document analysis process more efficient and effective in various professional and academic contexts. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2024. |
URI: | https://repositorio.ufsc.br/handle/123456789/260682 |
Date: | 2024 |
Files | Size | Format | View |
---|---|---|---|
PEGC0820-D.pdf | 7.511Mb |
View/ |