Abstract:
|
O trabalho propõe um modelo de recuperação de documentos para a língua portuguesa. Este modelo é uma extensão de um modelo de Miyamoto, considerando, além de similaridades semânticas determinadas por co-ocorrências de descritores, também similaridades lexicais. A extensão proposta considera, por um lado, a detemminação de um thesaurus difuso através de um índice difuso determinado pelas similaridades dos descritores dos documentos e, por outro lado, a possibilidade de utilização de um vocabulário não-controlado através da determinação de similaridades entre descritores dos documentos e expressões de consultas. Testes preliminares indicam que a extensão do thesaurus difuso leva a uma maior qualidade na recuperação dos documentos e que a possibilidade de utilização de um vocabulário não-controlado leva a uma perda na qualidade dos resultados da recuperação, mantendo, contudo, a precisão nos níveis de evocação. |