DeepEC: uma abordagem para extração e catalogação de conteúdo presente na Deep Web

DSpace Repository

A- A A+

DeepEC: uma abordagem para extração e catalogação de conteúdo presente na Deep Web

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Mello, Ronaldo dos Santos pt_BR
dc.contributor.author Souza, Augusto Ferreira de pt_BR
dc.date.accessioned 2014-08-06T17:11:02Z
dc.date.available 2014-08-06T17:11:02Z
dc.date.issued 2013 pt_BR
dc.identifier.other 323922 pt_BR
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/122641
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2013. pt_BR
dc.description.abstract Esta dissertação apresenta uma solução chamada DeepEC (DeepWeb Extraction and Cataloguing Process) para realizar a extração e catalogação de dados relevantes em bancos de dados presentes na Deep Web, também denominados de bancos de dados escondidos. Essas informações são extraídas a partir de um conjunto de páginas HTML geradas a partir de consultas definidas sobre formulários Web. A intenção é adquirir conhecimento sobre esses bancos de dados e, consequentemente, permitir buscas estruturadas sobre esse conteúdo escondido. Experimentos comprovaram a eficácia da abordagem proposta. Comparado com trabalhos relacionados, as contribuições desta dissertação são a realização conjunta e sequencial de um processo de extração e catalogação dos dados de bancos de dados escondidos, um processo de extração automático com suporte de uma base de conhecimento e um processo de catalogação que gera registros estruturados e é capaz de realizar a detecção de atributos cujos valores não estão presentes nos dados extraídos. <br> pt_BR
dc.description.abstract Abstract : This work presents an approach called DeepEC (Deep Web Extraction and Cataloguing Process) that performs the extraction and cataloging of relevant data presented in Deep Web databases, also called hidden databases. This information is extracted from a set of HTML pages generated by queries posed on web forms. The intention is to obtain knowledge about these databases and thus enable structured queries over this hidden content. Experiments have shown the effectiveness of the proposed approach. Compared to related work, the contributions of this paper are the simultaneous process of data extraction and cataloging of hidden databases, an automatic extraction process with a knowledge base support, and a cataloging process that generates structured records and it is able to detect attribute values that are missing in the extracted data. en
dc.format.extent 63 p.| il. pt_BR
dc.language.iso por pt_BR
dc.subject.classification Informatica pt_BR
dc.subject.classification Computação pt_BR
dc.subject.classification Mineração de dados (Computação) pt_BR
dc.subject.classification Banco de dados pt_BR
dc.title DeepEC: uma abordagem para extração e catalogação de conteúdo presente na Deep Web pt_BR
dc.type Dissertação (Mestrado) pt_BR


Files in this item

Files Size Format View
323922.pdf 1.606Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar