Title: | Ferramentas Digitais para Historiadores: Web Scraping e PLN na UFSC |
Author: | Santos, Thamiris Fátima dos |
Abstract: |
Esta pesquisa busca analisar a relação entre História e tecnologia, a partir das Humanidades Digitais e da História Digital. O estudo apresenta a origem, as especificidades e desafios atuais, construindo um panorama da área mundialmente e o cenário brasileiro. A partir de uma abordagem teórico-aplicada, incluindo revisão bibliográfica e o desenvolvimento Front-End de Software, o trabalho descreve o processo de criação da ferramenta WoKE (Word and Knowledge Embedding Model), desenvolvida pelo Grupo de Estudos e Pesquisa em IA e História da UFSC. A ferramenta integra técnicas de Web Scraping e Processamento de Linguagem Natural (PLN) para coleta, organização e análise de fontes digitais, visando facilitar o acesso de pesquisadores a grandes bases de dados acadêmicos, no caso desta ferramenta, ao Repositório Institucional da UFSC. A pesquisa partiu da necessidade de discutir o cenário atual da área no Brasil, e expor sua interdisciplinaridade, dada a crescente diluição das fronteiras entre tecnologia, ciência e as humanidades, de forma que os pesquisadores também hoje são convidados e necessários no desenvolvimento de ferramentas, próprias para investigação acadêmica. O projeto reforça a importância da interdisciplinaridade entre História, Linguística Computacional e Ciência da Computação, propondo soluções para democratizar o uso de tecnologias digitais na pesquisa histórica. This research analyzes the relationship between History and technology, based on Digital Humanities and Digital History. The study presents the origins, specificities and current challenges, building a panorama of the area worldwide and the Brazilian scenario. Using a theoretical-applied approach, including a literature review and front-end software development, the paper describes the process of creating the WoKE (Word and Knowledge Embedding Model) tool, developed by the UFSC AI and History Research Group. The tool integrates Web Scraping and Natural Language Processing (NLP) techniques for collecting, organizing and analyzing digital sources, with the objective of making it easier for researchers to access large academic databases, in the case of this tool, the UFSC Institutional Repository. The research emerged from the need to discuss the current scenario of the field in Brazil and expose its interdisciplinarity, given the growing dilution of the boundaries between technology, science and the humanities, so that researchers are now also invited and required to develop their own tools for academic research. The project reinforces the importance of interdisciplinarity between History, Computational Linguistics and Computer Science, proposing solutions to democratize the use of digital technologies in historical research. |
Description: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro de Filosofia e Ciências Humanas, História. |
URI: | https://repositorio.ufsc.br/handle/123456789/266210 |
Date: | 2025-07-02 |
Files | Size | Format | View |
---|---|---|---|
Ferramentas Dig ... Scraping e PLN na UFSC.pdf | 1.393Mb |
View/ |