Seleção e Avaliação Experimental de Ferramentas para Anotação Morfossintática Automática

DSpace Repository

A- A A+

Seleção e Avaliação Experimental de Ferramentas para Anotação Morfossintática Automática

Show simple item record

dc.contributor Universidade Federal de Santa Catarina pt_BR
dc.contributor.advisor Fileto, Renato
dc.contributor.author Sorato, Danielly
dc.date.accessioned 2016-12-12T21:21:35Z
dc.date.available 2016-12-12T21:21:35Z
dc.date.issued 2016-11-16
dc.identifier.uri https://repositorio.ufsc.br/xmlui/handle/123456789/171423
dc.description TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. pt_BR
dc.description.abstract Documentos disponíveis na Web (e.g., conteúdos de bibliotecas digitais) e postagens em mídias sociais (e.g., Twitter, Facebook) são fontes abundantes de informações. Nesses textos pode-se encontrar componentes semanticamente ricos denominados palavras relevantes. Essas palavras podem ser, por exemplo, entidades nomeadas (i.e., menções a locais, pessoas, instituições, etc.) ou componentes e expressões que possuem valor sintático e semântico relevantes (e.g., substantivos, verbos, adjetivos, adjuntos). Atualmente, existe uma grande variedade de ferramentas para reconhecimento de palavras relevantes em textos. Tais ferramentas possibilitam extrair, desambiguar e classificar informações valiosas a partir de textos de diversas fontes (literatura, notícias, microblogs, etc). Porém, o desempenho computacional e a qualidade dos resultados produzidos por estas ferramentas costumam ser degradados quando o texto usado é oriundo de mídias sociais. Isso acontece porque o texto de mídias sociais apresenta conteúdo informal, possuindo erros ortográficos e gramaticais, acrônimos, gírias, etc. Este trabalho apresenta uma revisão da literatura sobre técnicas e ferramentas para a extração de palavras relevantes de textos e uma análise experimental de ferramentas para anotação morfossintática automática, com foco em mídias sociais, especialmente microblogs, como o Twitter. As ferramentas de PoS Tagging selecionadas são avaliadas em 3 estudos de caso: (i) um benchmarch de classificação morfossintática de textos de tweets com regras ouro para mensurar precisão e cobertura; (ii) uma amostra do corpus histórico do português Tycho Brahe e (iii) um volume considerável de tweets. Com isso pretende-se analisar a cobertura e precisão usando o benchmark além do desempenho em dados reais de um corpus eletrônico e de um microblog. Os resultados mostram evidência experimental de que os resultados das ferramentas de PoS Tagging para textos oriundos de mídias sociais são piores do que para textos de linguagem formal. pt_BR
dc.format.extent 94 f. pt_BR
dc.language.iso por pt_BR
dc.publisher Florianópolis, SC. pt_BR
dc.subject Processamento de linguagem natural pt_BR
dc.subject Reconhecimento de palavras relevantes pt_BR
dc.subject extração de informações pt_BR
dc.subject Anotação morfossintática pt_BR
dc.subject Tweets pt_BR
dc.title Seleção e Avaliação Experimental de Ferramentas para Anotação Morfossintática Automática pt_BR
dc.type TCCgrad pt_BR
dc.contributor.advisor-co Goularte, Fábio Bif


Files in this item

Files Size Format View Description
RelatorioFinalDanielly.pdf 1.320Mb PDF View/Open TCC

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar