Lei de Zipf em discursos orais : uma comparação entre trabalhos acadêmicos escritos e suas apresentações

DSpace Repository

A- A A+

Lei de Zipf em discursos orais : uma comparação entre trabalhos acadêmicos escritos e suas apresentações

Show full item record

Title: Lei de Zipf em discursos orais : uma comparação entre trabalhos acadêmicos escritos e suas apresentações
Author: Cassettari, Rafael
Abstract: A lei de Zipf é uma teoria com base na matemática e linguística que analisa e quantifica como as palavras são distribuídas dentro de um determinado texto. Desta forma, é possível representar por meio de gráficos e análises estatísticas quais são os termos que mais se repetem de modo que seja possível criar um ranking de palavras-chave. Esta pesquisa verificou, por meio da lei de Zipf, as variações e uniformidades de trabalhos acadêmicos escritos (artigos) e os mesmos apresentados de forma oral. As apresentações orais foram inseridas em forma de vídeo no Youtube, para que fosse possível recuperar, de forma automática, a transcrição do áudio. Por meio de um script executado em Bash, os textos e as apresentações transcritas foram quantificadas e organizadas, sendo possível criar nuvens de tags e tabelas com os rankings, facilitando a análise entre os conteúdos. Foi possível identificar as esferas dos conteúdos, identificar as palavras em comum ou muito distantes e analisar e comparar matematicamente o que foi escrito com o que foi apresentado.Zipf's law is a theory based on mathematics and linguistics that analyzes and quantifies how words are distributed within a text. It is possible to represent by graphs and statistical analyzes which are the terms that are repeated over so that a ranking of keywords is created. This research found, through the Zipf's law, variations and uniformities of written academic papers and they presented orally. The oral presentations were inserted in video form on Youtube, it was possible to recover automatically the transcript of the audio. Using a Bash script, texts and transcribed presentations were quantified and organized, thereby creating tag clouds and tables with rankings, facilitating the analysis of the contents. It was possible to identify the spheres of content, identifying common words or not and, mathematically, analyze and compare what was written with what was presented.
Description: TCC (graduação) - Universidade Federal de Santa Catarina. Centro de Ciências da Educação. Curso de Biblioteconomia.
URI: https://repositorio.ufsc.br/xmlui/handle/123456789/122226
Date: 2014-07-09


Files in this item

Files Size Format View Description
tcc_rafael_cassettari_20141.pdf 1.479Mb PDF View/Open PDF/A

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar