Criação da base de dados Via/Genoma da Chromobacterium violaceum - CvioCyc e análise das informações geradas pelo Software Pathway Tools

DSpace Repository

A- A A+

Criação da base de dados Via/Genoma da Chromobacterium violaceum - CvioCyc e análise das informações geradas pelo Software Pathway Tools

Show full item record

Title: Criação da base de dados Via/Genoma da Chromobacterium violaceum - CvioCyc e análise das informações geradas pelo Software Pathway Tools
Author: Goudel, Artiva Maria
Abstract: Microrganismos, cujo genoma já foram completamente seqüenciados, como é o caso da Chromobacterium violaceum, possuem dados de anotação genômica em geral produzidos por uma equipe que analisa a fisiologia do organismo e os correlaciona com os dados produzidos pelo projeto de seqüenciamento. Esses dados são geralmente armazenados em bases de dados públicas, e precisam muitas vezes ser verificados, ou seja, validados por via experimental. Todavia, os recentes avanços na área de bioinformática e biologia computacional permitem que certas condições fisiológicas sejam verificadas computacionalmente como, por exemplo, a existência ou não de uma dada via metabólica. Vários grupos têm desenvolvido técnicas para predição de vias metabólicas de organismos a partir da anotação do genoma, produzindo bases de dados integradas via/genoma (pathway/genome database). Este trabalho teve como objetivo construir uma base de dados para a C. violaceum (CvioCyc), uma bactéria Gram-negativa, seqüenciada pelo Brazilian National Genome Project Consortium, de grande potencial biotecnológico e biomédico. A C. violaceum produz um pigmento violeta conhecido como violaceína, ao qual são atribuídas propriedades anti-tumorais, anti-chagazíticas, entre outras; além disso, essa bactéria é capaz de produzir biopolímeros de grande interesse comercial. A base de dados via/genoma - CvioCyc (cviocy.intelab.ufsc.br), criada a partir do conjunto de softwares Pathway Tools, mostrou-se uma importante ferramenta de análise do genoma da C. violaceum. Através da análise de 61 vias metabólicas, de um total de 233 geradas automaticamente pelo software, 17 vias foram removidas (27,86%) e 44 mantidas (72,13%). Além da inclusão da via de biossíntese da violaceína a partir do aminoácido triptofano, essas 61 vias foram diretamente curadas a partir dos resultados do Pathway Tools, da análise de dados da literatura, e pelo uso de várias outras ferramentas de bioinformática disponíveis na web, tais como ferramentas BLAST e bases de dados de enzimas (KEGG, ENZYME e BRENDA). Trinta e nove ORFs (quadros abertos de leitura), relacionadas às vias analisadas, foram alteradas na base CvioCyc. Isto representa aproximadamente 24,3% de erro numa amostra de 160 ORFs analisadas. Este resultado está dentro da faixa de erros comumente encontrada na literatura, que varia de 8% a 25%. Vários erros se encaixam nos erros de anotação mais comumente encontrados na literatura, como ORFs falso-positivas, falso-negativas, erros de digitação, e falta de padronização nos nomes de enzimas e de genes. A análise dos genes envolvidos na biossíntese da violaceína nos permite sugerir que a ORF CV3270 pode fazer parte do operon vio, de acordo a predição do Pathway Tools. É, portanto, provável a existência de mais um gene no operon vioABCD. Entre essa ORF e o gene vioD, há uma distância de apenas 12 pares de bases, e observa-se uma estrutura em grampo, à jusante desta ORF, o que indica o término da transcrição após a ORF CV3270. Microorganisms that have already had their genomes completely sequenced, as in the case of Chromobacterium violaceum, have their genome annotation generally produced by a team that analyze the organism's physiology and its correlation to data produced by the sequencing project. These data are generally stored in public domain databases and most of the time they need to be verified, i.e., experimentally validated. However, recent advances in bioinformatics and computational biology allow us to computationally verify some physiological conditions, such as, for instance, the presence or lack of a particular metabolic pathway. Several research groups have developed techniques to predict metabolic pathways from genomic annotation, thus producing integrated pathway/genome database. The main objective of this work was to build a database for C. violaceum (CvioCyc), a Gram-negative bacterium sequenced by the Brazilian National Genome Project Consortium. C. violaceum is a microorganism of great biotechnological and biomedical potential. C. violaceum produces a violet pigment known as violacein, to which it is attributed anti-tumoral and anti-Trypanosoma cruzi properties, among others; moreover, this bacterium is able to synthesize biopolymer of great commercial interest. The pathway/genome database - CvioCyc (cviocyc.intelab.ufsc.br), was built from a suite of programs in the Pathway Tools package, and was shown to be an important tool to analyze the C. violaceum genome. It allowed us re-annotating 61 out of 233 automatically generated metabolic pathways, 17 were removed (27.86%) and 44 were remained (72.13%). Besides the violacein biosynthesis pathway included in the database, from its precursors (tryptophan), those 61 metabolic pathways were directly curated from the results generated by Pathway Tools, and from literature research, and the use of bioinformatics tools available on the web, such as BLAST and enzyme databases (KEGG, ENZYME and BRENDA). Thirty-nine ORFs (open reading frames) were modified in CvioCyc. That represents approximately 24.3% error in the 160 examined ORFs. This result is in agreement with what we have found for other genome annotations (8 to 25%). Most of those errors are among the frequently found in the literature, such as false-positive and false-negative ORFs, typo errors, and lack of standardization in enzyme and gene names. The analysis done on violacein biosynthesis suggests that ORF CV3270 may be part of the vio operon, according to Pathway Tools predictions. Thus, it is likely that it might exist another gene in the vioABCD operon. We have found that there is only a 12 bp distance between the ORF3270 and the vioD gene; besides that, there is a stem-loop (hairpin) structure downstream that ORF, what suggests a transcription termination moiety after CV3270.
Description: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Química.
URI: http://repositorio.ufsc.br/handle/123456789/101600
Date: 2005


Files in this item

Files Size Format View
223237.pdf 1.975Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record

Search DSpace


Browse

My Account

Statistics

Compartilhar