WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas

DSpace Repository

A- A A+

WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas

Show full item record

Title: WANQA: uma abordagem para identificar novas questões não respondíveis em comunidades de perguntas e respostas
Author: Knochenhauer, Lucas Viana
Abstract: Grandes repositórios de conhecimento estão distribuídos pela Web, sendo um dos mais populares e colaborativos as comunidades de perguntas e respostas, ou as chamadas Community Question Answering (CQA). Nessas comunidades, os usuários perguntam e respondem questões uns dos outros, além de avaliarem o conteúdo produzido. Entretanto, devido ao grande volume de questões postadas diariamente, muitas dessas questões não recebem respostas. Esse problema vem sendo estudado para entender sua razão e evitar que novas questões permaneçam sem retorno. Nesses estudos, características específicas presentes nestas comunidades foram exploradas de forma a se criar abordagens que classifiquem questões recém postadas em respondíveis ou não respondíveis. Entretanto, as abordagens anteriores são altamente dependentes das características existentes em uma determinada comunidade, como votos que o usuário recebe ou pontos de reputação. Dessa forma não é possível sua portabilidade a comunidades que não possuem as mesmas características. Para resolver este problema, neste trabalho é proposta uma abordagem que gera um modelo capaz de classificar uma nova questão em respondível ou não respondível que seja aplicável na maioria, ou até mesmo em todas as comunidades. Para isso, diferentes comunidades foram analisadas a fim de se extrair o maior número de características comuns possíveis. Com esse conjunto pode-se treinar um modelo de classificação para uma categoria de questões em qualquer comunidade de perguntas e respostas. A finalidade desse modelo é avaliar novas questões no momento em que o usuário as submete. Dessa forma, as novas questões não respondíveis serão detectadas pelo modelo classificador e assim o usuário pode ser informado para ajustar a questão sendo postada. A proposta WANQA foi testada através de um conjunto de experimentos realizados em diferentes comunidades de pergunta e resposta, com diferentes algoritmos classificadores. Os resultados foram maior acurácia, precisão e revocação do que os baselines experimentados.<br>Abstract : There are large knowledge repositories spread over the web. A kind of these repositories is the Community Question Answering (CQA). In these communities, the people ask and answer questions one from another. Besides, the users can evaluate the posted content. However, because of the large daily volume of new questions, many of them remain unanswered. This problem has been studied to understand its reason and to avoid new questions without answers. In these projects, the question and user features were explored to classify the questions' answerability. The previous approaches are highly dependent of the existing characteristics of each community as votes and user reputation. This condition turns the approaches not portable to other communities with different features. To solve this problem, our approach generates a classification model to identify new questions as answerable or not and that it can be used in the most of the communities. For this, we analyzed several communities to find a set of common characteristics. With this set, we can train a classification model for a category of questions in any community question answering. The goal of this model is to prove a new question at the time when the user submit it. Thus, the new unanswerable questions can be detected by the classifier model and the user can be informed to adjust a submitted question. The WANQA approach was tested through a set of experiments with data from several communities and different classification algorithms. The results were better values for accuracy, precision and revocation than seen at the baseline experiments.
Description: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
URI: https://repositorio.ufsc.br/handle/123456789/214550
Date: 2019


Files in this item

Files Size Format View
PGCC1145-D.pdf 2.850Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar