Ciência da informação em contextos de e-science: bibliotecários de dados em tempos de Data Science

Repositório institucional da UFSC

A- A A+

Ciência da informação em contextos de e-science: bibliotecários de dados em tempos de Data Science

Mostrar registro simples

dc.contributor Universidade Federal de Santa Catarina
dc.contributor.advisor Pinto, Adilson Luiz
dc.contributor.author Semeler, Alexandre Ribas
dc.date.accessioned 2018-04-13T19:38:38Z
dc.date.available 2018-04-13T19:38:38Z
dc.date.issued 2017
dc.identifier.other 352464
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/185593
dc.description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação, Programa de Pós-Graduação em Ciência da Informação, Florianópolis, 2017.
dc.description.abstract A tese de doutorado "Ciência da Informação em contextos de e-Science: bibliotecários de dados em tempos de Data Science" tem como objetivo geral investigar como as relações entre Ciência da Informação, e-Science e Data Science influenciam a Biblioteconomia de Dados. O objeto de estudo da Ciência da Informação é a informação e as transformações impulsionadas pelas tecnologias na sociedade contemporânea. A e-Science é entendida como a base para o pensamento das ciências orientadas ao uso intensivo de dados. A Data Science é o conjunto de habilidades, métodos, técnicas e tecnologias da Estatística e da Ciência da Computação utilizadas para extrair conhecimento de dados e para a criação de produtos e serviços a partir de dados. A Biblioteconomia de Dados é uma disciplina que aplica Ciência da Informação, e-Science e Data Science em Bibliotecas. Acredita-se que os repositórios digitais de dados de pesquisa são a parte da ciberinfraestrutura de e-Science que deve ser investigada pelos bibliotecários de dados. No capítulo 2, contempla-se a fundamentação teórica. O objetivo desse capítulo é refletir a respeito de questões básicas, como: o que é informação? O que é tecnologia? O que são dados de pesquisa? O que é Biblioteconomia de Dados? O que é a Data Science? Quais as habilidades necessárias aos cientistas de dados que podem ser aproveitadas pelos bibliotecários de dados? O método apresenta-se nas seguintes etapas: coleta de dados (web scraping), manipulação e análise descritiva da frequência dos dados (limpeza, organização, tratamento de desambiguação e formato de dados) e visualização (criação de gráficos e grafos). No capítulo 3, apresenta-se o resultado do método que representa o cenário internacional dos Repositórios de Dados de Pesquisa em Geociências disponíveis no Registry of Research Data Repositories (re3data). Esses repositórios são fontes de dados heterogêneas que possibilitam o acesso e a preservação a uma ampla gama de tipos de dados de pesquisa em Geociências. Disponíveis em países da América do Norte e da Europa. Em setembro de 2017 haviam 604 RDPGs registrados no re3data, dos quais é possível sumarizar as seguintes características: (a) tipos de dados: documentos de escritório, dados científicos e estatísticos, imagens e dados brutos; (b) os países: USA, DEU, CAN, GBR, AUS e FRA e a língua preponderante nos dados de pesquisa é o inglês; (c) áreas do conhecimento: Ciências atmosféricas e Oceanografia, sendo as principais temáticas: o clima, as mudanças climáticas, a geologia, a hidrologia, o sensoriamento remoto e a oceanografia; (d) em sua maioria, são de acesso de aberto e utilizam licenças Creative Commons; (e) os softwares para desenvolvimento desses repositórios são desconhecidos, 37 utilizam softwares como Ckan, DSpace, DataVerse, e-Prints e Fedora. Conclui-se com uma discussão a respeito do Diagrama de Venn da Biblioteconomia de Dados, o qual representa as bases Ciência da Informação, e-Science e Data Science como fundamento para Biblioteconomia de dados.
dc.description.abstract Abstract : A doctoral thesis "Information Science in e-Science Contexts: data librarians in the age of Data Science" aims to investigate how the relationships between Information Science, e-Science and Data Science influences Data Librarianship. The object of study of the Information Science is the information and the changes by technology in contemporary society. e-Science is understood as the grounding for the thinking about the data-intensive sciences. Data Science is the set of the skills, methods, techniques and technologies of the Statistics and of the Computer Science used to extract knowledge of data and to create products and services from data. Data Librarianship is a discipline that applies Information Science, e-Science and Data Science in Libraries. It is believed that digital repositories of research data are part of the cyberinfrastructure of e-Science that should be investigated by data librarians. In this context, the thesis presents in four sections. The chapter 1, presents an introduction to the subject of the thesis, the context of the study, the research problem, objectives and methodology. The chapter 2 considers the theoretical foundation. The aim of this chapter is to reflect on basic questions such as: what is information? What is technology? What is search data? What is Data Librarianship? What is Data Science? What are the skills needed to data scientists who can be taken advantage of by data librarians? The method is presented in the following steps. Data collection (web scraping), handling and descriptive analysis of the data frequency (cleaning, organization, processing disambiguation and data format) and visualization (creating charts and graphs). In Chapter 3, we present the result of the method that represents the international scenario of the Research Data Repositories in Geosciences available in the Registry of Research Data Repositories (re3data). These repositories are heterogeneous data sources that enable access and preservation to a wide range of types of research data in Geosciences. In September 2017 there were 604 RDPGs recorded in re3data, and we can summarize the characteristics: (a) data types: office documents, scientific and statistical data, images and raw data; (b) the countries: USA, DEU, CAN, GBR, AUS and FRA and the preponderant language in the research data is the English; (C) knowledge areas: Atmospheric Sciences and Oceanography, the main subjects: climate, climate change, geology, hydrology, remote sensing and oceanography; (d) for the most part, they are open access and use Creative Commons licenses; (e) the software for the development of these repositories are unknown, 37 use software such as Ckan, DSpace, DataVerse, e-Prints and Fedora. It concludes presents the Venn Diagram of Data Librarianship which represents the bases (Information Science, e-Science and Data Science) as fundamentals of Data Librarianship. en
dc.format.extent 165 p.| il., gráfs., tabs.
dc.language.iso por
dc.subject.classification Ciência da informação
dc.subject.classification Biblioteconomia
dc.subject.classification Pesquisa
dc.subject.classification Banco de dados
dc.subject.classification Sistemas de recuperação da informação
dc.subject.classification Bibliotecários
dc.title Ciência da informação em contextos de e-science: bibliotecários de dados em tempos de Data Science
dc.type Tese (Doutorado)


Arquivos deste item

Arquivos Tamanho Formato Visualização
PCIN0168-T.pdf 4.284Mb PDF Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Navegar

Minha conta

Estatística

Compartilhar