Proposta de uma função de similaridade para listas HTML extraídas da Web

DSpace Repository

A- A A+

Proposta de uma função de similaridade para listas HTML extraídas da Web

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Mello, Ronaldo dos Santos
dc.contributor.author Venancio, Filipe Guedes
dc.date.accessioned 2017-07-23T13:58:12Z
dc.date.available 2017-07-23T13:58:12Z
dc.date.issued 2017-06-20
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/177697
dc.description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. pt_BR
dc.description.abstract A Web tornou-se uma fonte rica em dados, diversificada pela popularização dos sites, redes de relacionamento e aplicativos, sendo utilizada para a extra- ção seletiva de conteúdo útil para consumo humano. Entretanto, a extração e análise dos dados contidos na Web são um desafio devido ao crescimento das massas de dados e a variabilidade da representação destas informações. Entre estas informações estão as listas HTML, que tendem a ser apenas um agrupamento onde os itens de dados presentes nela possuem um contexto comum, como por exemplo, uma lista de informações sobre cidades ou uma lista de músicas. Alguns trabalhos relacionados buscam a comparação das listas HTML que possuam características semelhantes e que seguem um determinado padrão, pois assumem que as listas são provenientes de respostas produzidas por aplicativos e sistemas. Diferente desses trabalhos, este trabalho de conclusão de curso considera listas HTML extraídas da Web com contextos desconhecidos, que necessitam de uma análise e padronização de sua estrutura, de forma a considerar uma possível variabilidade estrutural, visando determinar se elas dizem respeito a um mesmo assunto. O objetivo principal deste trabalho é propor uma técnica de comparação entre listas HTML que resulte em um escore de similaridade que possa ser utilizado para diversas finalidades, como integração de dados e buscas aproximadas de dados com foco em listas na Web. pt_BR
dc.format.extent 103 f. pt_BR
dc.language.iso por pt_BR
dc.publisher Florianópolis, SC. pt_BR
dc.subject Dados pt_BR
dc.subject Web pt_BR
dc.subject Similaridade pt_BR
dc.subject Lista pt_BR
dc.subject Weblist pt_BR
dc.subject Comparação pt_BR
dc.subject HTML pt_BR
dc.title Proposta de uma função de similaridade para listas HTML extraídas da Web pt_BR
dc.type TCCgrad pt_BR


Files in this item

Files Size Format View Description
monografia-tcc-vfinal.pdf 1.265Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar