Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa

DSpace Repository

A- A A+

Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa

Show full item record

Title: Seleção de vizinhança baseada em análise de características dos itens para mitigar o problema da esparsidade de dados na recomendação colaborativa
Author: Fernandes, Bruno Bandeira
Abstract: Os sistemas de recomendação (SRs) mais populares empregam algoritmos de Filtragem Colaborativa (FC) requerendo que usuários avaliem explicitamente os itens acessados por eles. Baseado nessas avaliações, uma matriz de avaliação Usuário-Item é gerada e usada para selecionar os itens a serem recomendados para um usuário-alvo. Uma etapa importante neste processo é determinar a vizinhança de um usuário-alvo, ou seja, um conjunto de usuários que classificaram os itens de forma similar ao usuário-alvo. Uma das limitações da FC é justamente a exigência de dados de avaliação fornecidos voluntariamente pelos usuários. Em muitos cenários, a falta de interesse dos usuários em fornecer esse tipo de dado aumenta o problema de esparsidade de dados na matriz de avaliação Usuário-Item. Este trabalho propõe o uso de realimentação implícita para a seleção de vizinhos próximos, para reduzir o problema de esparsidade em RSs baseados em FC. Nesta proposta, os Perfis de Usuários (PUs) são criados com base nas características dos itens acessados ou comprados pelos usuários e não necessariamente avaliados por esses usuários. Estes PUs são usados exclusivamente para a seleção de vizinhança, que, ao invés de considerar as avaliações dos itens, leva em consideração as características dos itens que os usuários acessaram ou compraram. A técnica foi implementada com o Framework Apache Mahout e avaliada nos domínios de filmes e livros. Para isto, foram usados os conjuntos de dados do projeto GroupLens. Os resultados demonstraram que a técnica proposta produz recomendações de melhor qualidade em termos de predição das recomendações quando comparadas às FC clássicas, principalmente na presença de escassez de dados de avaliação.Abstract : The most popular Recommender systems (RSs) employ Collaborative Filtering (CF) algorithms where users explicitly rate items. Based on these ratings, a user-item rating matrix is generated and used to select the items to be recommended for a target user. An important step in this process is to determine the neighborhood of a target user, i.e, a set of users who rate items similarly to this user. One of the limitations of CF is precisely the need for rating data provided voluntarily by users. The lack of interest of users to provide this kind of information increases the data sparsity problem of the ratings matrix. In this work, we propose the use of implicit feedback for neighbors selection to alleviate the sparsity problem in CF-based RSs. In this proposal, user profiles (UPs) are built based on the characteristics of items that have been accessed or purchased, and not necessarily rated by the users. This UP is used exclusively to the neighborhoods formation, which considers not how they have rated items, but by the characteristics of the items that they have accessed or purchased. Our technique was implemented with Apache Mahout Framework and evaluated across experiments in the domain of movies and books by using datasets from project GroupLens. The results demonstrated that our technique produces better quality in terms of predicting the recommendations when compared to the classic CF mainly in presence of sparsity of rating data.
Description: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
URI: https://repositorio.ufsc.br/handle/123456789/204998
Date: 2018


Files in this item

Files Size Format View
PGCC1130-D.pdf 2.021Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar