Title: | Uma abordagem automática para enriquecimento semântico de serviços de dados web |
Author: | Oliveira, Bruno Cesar Neves de |
Abstract: |
A disponibilização de Web Services que se destinam a fornecer uma interface de acesso e manipulação a fontes de dados (também conhecidos como serviços de dados) tem aumentado consideravelmente nos últimos anos, mostrando-se uma estratégia prática e eficiente para compartilhamento de dados entre sistemas computacionais. No entanto, em geral, estes serviços não especificam a semântica dos dados, podendo ainda representar os dados em formatos heterogêneos, o que resulta em dificuldades para seu processamento e reuso. Em vista disso, novas abordagens e ferramentas têm surgido com o intuito de auxiliar no enriquecimento semântico de serviços, adicionando significado aos dados geridos e aprimorando processos de composição e descoberta de serviços. Todavia, tais abordagens ainda requerem um esforço humano significativo para construção de ontologias que descrevem os conceitos semânticos utilizados para descrição dos serviços de dados. Além disso, as propostas encontradas na literatura focam, majoritariamente, na geração de descrições semânticas das interfaces dos serviços, dando pouca atenção às representações dos dados por eles fornecidos. Nesse contexto, esta dissertação propõe uma arquitetura, denominada OntoGenesis, capaz de i) construir e evoluir ontologias de domínio para serviços de dados e ii) alinhar as propriedades das ontologias geradas com ontologias de fontes externas, de modo a reutilizar conceitos já existentes e facilitar a integração com outros agentes de software. Desse modo, a arquitetura provê mecanismos para enriquecer tanto as descrições quanto as representações fornecidas por serviços de dados, tendo como base os conceitos semânticos da ontologia gerada. Como contribuição, espera-se abstrair, do ponto de vista dos desenvolvedores de software, o processo oneroso de enriquecer semanticamente serviços conectados a fontes que armazenam dados sem informação semântica, fomentando, assim, a execução de análises de dados mais sofisticadas. Experimentos utilizando dados abertos nos âmbitos científico e governamental mostram a aplicabilidade da proposta e revelam que são alcançados níveis adequados de conformidade (precisão e cobertura), bem como desempenho superior em relação a abordagens similares encontradas na literatura. Abstract : The availability of Web Services meant to provide an interface to access and manipulate data sources (also called data services) has been sharply increasing in recent years, being a practical and efficient strategy for data sharing among computing systems. However, in general, these services do not specify the semantics of data, and can represent it in heterogeneous formats, which hinders its effective processing and reuse. As a result, many approaches and tools have emerged to support the semantic enrichment of Web services, expliciting semantic to managed data, and enhancing processes such as service composition and discovery. Nevertheless, such approaches still require significant human effort to build ontologies that describe the semantic concepts employed for describing data services. Moreover, most proposals found in the literature focus on the generation of semantic descriptions of the service interface, disregarding the data representations provided by them. In this context, this dissertation proposes an architecture, named OntoGenesis, capable of i) constructing and evolving domain ontologies for data services and ii) matching the properties of such ontologies with ontologies of external sources, in order to reuse existing concepts and ease the integration with other software agents. Thus, the architecture provides mechanisms to enrich both the descriptions and representations provided by data services based on the semantic concepts of the generated ontology. As a contribution, it is expected to minimize, from the viewpoint of software developers, the time-consuming tasks of semantically enriching services attached to sources that store data without semantic information, therefore enabling more sophisticated reasoning tasks. Experiments using open datasets from scientific and governmental domains show the applicability of our proposal and reveal that it can achieve satisfactory levels of compliance (precision and recall), as well as better performance in comparison with similar approaches found in the literature. |
Description: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018. |
URI: | https://repositorio.ufsc.br/handle/123456789/198616 |
Date: | 2018 |
Files | Size | Format | View |
---|---|---|---|
PGCC1125-D.pdf | 4.367Mb |
View/ |