Abstract:
|
Sistemas de Recuperação de Informação (SRI) tradicionalmente se apóiam na correspondência léxica entre as palavras-chave usadas na consulta formulada pelo usuário e palavras encontradas nos metadados usados para descrever objetos informacionais (artigos, objetos multimídia, etc.) ou no próprio conteúdo desses objetos informacionais (OI). O objetivo é recuperar os objetos que satisfazem as consultas, com rapidez, boa precisão e boa cobertura. Porém tais sistemas são afetados por fenômenos lingüísticos e limitações semânticas. Nossa abordagem usa conhecimento especí?co de domínios, presente em Vocabulários Controlados (VC) e adaptado ao formalismo de ontologias tanto na anotação dos objetos (i.e., preenchimento de certos campos de metadados) quanto para o processamento das buscas, visando minimizar tais problemas. Para amparar usuários na anotação de OIs nosso trabalho utiliza interfaces grá?cas que direcionam a escolha dos valores de metadados a termos de VCs. A recuperação dos OIs na nossa abordagem leva em conta as relações semânticas formalizadas em ontologias e as estabelecidas para anotar os OIs com termos de VCs, as quais formam uma Rede Semântica (RS). Tal estrutura permite expandir semanticamente as buscas a partir dos termos usados como palavras-chave na especi?cação das consultas valendo-se da técnica de Spreading Activation (SA). Testes de usabilidade realizados com usuários em um estudo de caso na área da saúde permitiram identi?car as interfaces baseadas em conhecimento por eles consideradas mais apropriadas para anotação. Testes com diferentes con?gurações de parâmetros e testes de carga com o SA apontaram valores de parâmetros adequados para otimizar o SA e mostraram a sua viabilidade em termos de desempenho, com um VC contendo dezenas de milhares de termos e coleções com tamanho crescente de objetos anotados. |