Definição e avaliação de métodos para determinação de similaridade entre tabelas na web

DSpace Repository

A- A A+

Definição e avaliação de métodos para determinação de similaridade entre tabelas na web

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Mello, Ronaldo dos Santos pt_BR
dc.contributor.author Silva, Filipe Roberto pt_BR
dc.date.accessioned 2016-04-15T13:16:45Z
dc.date.available 2016-04-15T13:16:45Z
dc.date.issued 2015 pt_BR
dc.identifier.other 337788 pt_BR
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/160567
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2015 pt_BR
dc.description.abstract A Web e uma grande fonte de dados. Grandes quantidades de dados são inseridos diariamente e muitos desses dados estão na forma de tabelas HTML. Alguns trabalhos têm proposto formas de extrair e integrar o conteúdo dessas tabelas para torna-los mais acessíveis para o consumo humano. Porem, essa e uma tarefa complexa e um problema ainda em aberto visto que tabelas Web n~ao possuem um padrão de representação. Alem disso, o uso de sinônimos e abreviações torna difícil a comparação dos conteúdos dessas tabelas. Assim sendo, este trabalho propõe uma nova abordagem para determinar a similaridade entre tabelas Web capaz de lidar com suas diferentes estruturas e termos sinônimos. Trabalhos relacionados não lidam, ao mesmo tempo,com essas duas problemáticas. Experimentos realizados mostram que a abordagem e promissora.<br> pt_BR
dc.description.abstract Abstract : The Web is a huge information source. Large amounts of data are publisheddaily and great part of them is available as HTML tables. Someworks have proposed approaches to extract and integrate Web tables'content in order to make it more accessible for human consumption.However, this is a complex task and still an open issue given that Webtables do not have a unique representation pattern. Besides, the useof synonyms and abbreviations become hard the comparison of tables'content. Given that, we propose a new approach to determine similaritybetween Web tables which is able to deal with distinct structuresand synonym terms. Related works do not deal, at the same time,with both problematics. Experimental evaluations had shown that theapproach is promising. en
dc.format.extent 86 p.| il., tabs., grafs. pt_BR
dc.language.iso por pt_BR
dc.subject.classification Computação pt_BR
dc.subject.classification Serviços da Web pt_BR
dc.subject.classification Tabelas pt_BR
dc.subject.classification Lógica pt_BR
dc.title Definição e avaliação de métodos para determinação de similaridade entre tabelas na web pt_BR
dc.type Dissertação (Mestrado) pt_BR


Files in this item

Files Size Format View
337788.pdf 1.470Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

Statistics

Compartilhar