KDC: uma abordagem baseada em conhecimento para classificação de documentos

DSpace Repository

A- A A+

KDC: uma abordagem baseada em conhecimento para classificação de documentos

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Dorneles, Carina Friedrich pt_BR
dc.contributor.author Silva, Gleidson Antônio Cardoso da pt_BR
dc.date.accessioned 2016-10-19T13:16:10Z
dc.date.available 2016-10-19T13:16:10Z
dc.date.issued 2015 pt_BR
dc.identifier.other 338993 pt_BR
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/169614
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015. pt_BR
dc.description.abstract Classificação de documentos fornece um meio para organizar as informações, permitindo uma melhor compreensão e interpretação dos dados. A tarefa de classificar é caracterizada pela associação de rótulos de classes a documentos com o objetivo de criar agrupamentos semânticos. O aumento exponencial no número de documentos e dados digitais demanda formas mais precisas, abrangentes e eficientes para busca e organização de informações. Nesse contexto, o aprimoramento de técnicas de classificação de documentos com o uso de informação semântica é considerado essencial. Sendo assim, este trabalho propõe uma abordagem baseada em conhecimento para a classificação de documentos. A técnica utiliza termos extraídos de documentos associando-os a conceitos de uma base de conhecimento de domínio aberto. Em seguida, os conceitos são generalizados a um nível maior de abstração. Por fim, é calculado um valor de disparidade entre os conceitos generalizados e o documento, sendo o conceito de menor disparidade considerado como rótulo de classe aplicável ao documento. A aplicação da técnica proposta oferece vantagens sobre os métodos convencionais como a ausência da necessidade de treinamento, a oportunidade de atribuir uma ou múltiplas classes a um documento e a capacidade de aplicação em diferentes temas de classificação sem a necessidade de alterar o classificador.<br> pt_BR
dc.description.abstract Abstract : Document classification provides a way to organize information, providing a better way to understand available data. The classification task is characterized by the association of class labels to documents, aiming to create semantic clusters. The exponential increase in the number of documents and digital data demands for more precise, comprehensive and efficient ways to search and organize information. In this context, the improvement of document classification techniques using semantic information is considered essential. Thus, this paper proposes a knowledge-based approach for the classification of documents. The technique uses terms extracted from documents in association with concepts of an open domain knowledge base. Then, the concepts are generalized to a higher level of abstraction. Finally a disparity value between generalized concepts and the document is calculated, and the best ranked concept is then considered as a class label applicable to the document. The application of the proposed technique offers advantages over conventional methods including no need for training, the choice to assign one or multiple classes to a document and the capacity to classify over different subjects without the need to change the classifier. en
dc.format.extent 58 p.| il., grafs., tabs. pt_BR
dc.language.iso por pt_BR
dc.subject.classification Computação pt_BR
dc.subject.classification Documentos pt_BR
dc.subject.classification Classificação pt_BR
dc.subject.classification Recuperação da informação pt_BR
dc.subject.classification Banco de dados textuais pt_BR
dc.title KDC: uma abordagem baseada em conhecimento para classificação de documentos pt_BR
dc.type Dissertação (Mestrado) pt_BR


Files in this item

Files Size Format View
338993.pdf 1.410Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar