Abstract:
|
Atualmente as informações textuais, disponíveis nos mais variados formatos, constituem-se como um importante recurso uma vez que mapeiam parte considerável das atividades diárias nas organizações. Nesse sentido, os desafios residem em como sintetizar grandes volumes de informação e em como revelar, através de processos automáticos ou semi-automáticos, o conhecimento latente inerente aos documentos, objetivando auxiliar o estabelecimento de estratégias que promovam suporte aos gestores organizacionais. Para tal, o presente trabalho propõe um modelo de descoberta de conhecimento baseado na correlação de elementos textuais e na expansão de unidades de análise chamado Latent Relation Discovery (LRD). O processo de correlação identifica, considerando-se um elemento textual de origem, o conjunto de elementos textuais mais relacionados. Esses relacionamentos são então utilizados na expansão de unidades de análise, ou seja, na redefinição do contexto de documentos. A avaliação do modelo é realizada em cinco cenários comparando-se LRD com outros métodos, entre eles, Latent Semantic Indexing (LSI), Phi-squared, Mutual Information e derivação deste, e Z score. No primeiro cenário o modelo proposto foi aplicado à recuperação de informação e, em seguida, à tarefa de agrupamento de documentos. Os demais cenários utilizaram informação provida por avaliadores humanos e por um mecanismo de busca tradicional para mensurar o grau de aderência entre os pares de elementos textuais e os métodos acima mencionados. Em todos os cenários, LRD apresentou melhores resultados em relação aos demais métodos. A principal contribuição do trabalho reside na definição de um modelo de correlação e expansão vetorial com o intuito de descobrir relacionamentos latentes entre elementos textuais, promover melhoramentos na representação de documentos e fornecer suporte a aplicações de Engenharia e Gestão do Conhecimento. |