WT2RT: taxonomia, classificação e algoritmos para uniformização de tabelas web

Repositório institucional da UFSC

A- A A+

WT2RT: taxonomia, classificação e algoritmos para uniformização de tabelas web

Mostrar registro simples

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Dorneles, Carina Friedrich pt_BR
dc.contributor.author Lautert, Larissa Rodrigues pt_BR
dc.date.accessioned 2014-08-06T17:39:27Z
dc.date.available 2014-08-06T17:39:27Z
dc.date.issued 2013 pt_BR
dc.identifier.other 325552 pt_BR
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/122994
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2013. pt_BR
dc.description.abstract A Web é o maior repositório de dados disponível, contando com mais de 150 milhões de tabelas com dados relacionais de qualidade. Muitos trabalhos têm unido esforços a fim de utilizá-las como base para consultas, porém, a heterogeneidade de formatações em que os dados se encontram limita a 17,75% a quantidade de tabelas aptas para este tipo de processamento. A fim de aumentar o aproveitamento das informações estruturadas na Web, esta dissertação apresenta o WT2RT (Web Table to Relational Table), uma solução para catalogação das categorias de tabelas utilizadas com maior frequência, formalização destas e definição de algoritmos para uniformização estrutural. Para a catalogação, foi implementado o framework WTClassifier, baseado em Redes Neurais Artificiais. Seu aprendizado se dá através da análise de padrões em tabelas, escolhidas aleatoriamente, cujas categorias são conhecidas. Nos experimentos realizados, o WTClassifier apresentou valores altos de F-measure para a maioria das estruturas definidas. Após a categorização, são aplicados algoritmos em cada caso heterogêneo, de modo a trazer todas as tabelas para uma estrutura única.<br> pt_BR
dc.description.abstract Abstract : The Web is the largest repository of available data, with over 150 million high-quality tables. Several works have combined efforts to allow queries on these tables, however, their heterogeneous structures limit to 17.75% the amount of tables suitable for this type of processing. In order to increase the use of structured information on the Web, this work presents an approach called WT2RT (Web Table to Relational Table), that catalogsWeb table categories used more often, formalize them and defines structural uniformization algorithms. For the cataloging purpose, framework WTCLASSIFIER was implemented, using Artificial Neural Networks. It learns analyzing patterns of tables whose categories are known. In experiments, WTCLASSIFIER presented high F-measure values for most cases. After identifying table category, algorithms are applied in order to bring all tables to a single structure. en
dc.format.extent 65 p.| il., grafs. pt_BR
dc.language.iso por pt_BR
dc.subject.classification Informatica pt_BR
dc.subject.classification Computação pt_BR
dc.subject.classification Processamento de dados pt_BR
dc.subject.classification Sistemas de recuperação da informação pt_BR
dc.subject.classification Taxinomia pt_BR
dc.subject.classification Classificação (Computadores) pt_BR
dc.subject.classification Algoritmos de computador pt_BR
dc.title WT2RT: taxonomia, classificação e algoritmos para uniformização de tabelas web pt_BR
dc.type Dissertação (Mestrado) pt_BR


Arquivos deste item

Arquivos Tamanho Formato Visualização
325552.pdf 979.1Kb PDF Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta

Estatística

Compartilhar