Home

Aulas

Exercícios

Notícias

Downloads

Bibliografia

Animações

  Programa Links ProGeNE Pós-graduação Medicina  

3.  Fluxo da informação genética: transcrição e tradução

O DNA é o depósito de toda a informação genética estável nos procariotos e eucariotos. Nos genomas dos seres vivos, sejam eles organizados na forma circular (comum aos procariotos) ou linear (como nos eucariotos, formando cromossomos), toda a informação genética necessária ao organismo para enfrentar uma gama imensa de condições ambientais distintas está estocada no DNA. Se pensarmos nos metazoários, todo o programa para a formação e desenvolvimento do embrião, com as complexas relações espaciais e temporais entre as células formadoras de um indivíduo, tudo isto está "escrito" no DNA. Mas, a qualquer momento, uma célula emprega apenas uma fração consideravelmente reduzida de toda esta informação genética. A forma com que esta informação é selecionada será discutida no próximo item. Procuraremos aqui focalizar nossa atenção na produção dos intermediários da informação gênica, as moléculas de RNA, e no produto final da expressão de um gene, a proteína.

As moléculas de RNA existentes na células são todas sintetizadas a partir da transcrição de trechos do DNA (genômico, mitocondrial ou de cloroplasto) e têm uma estrutura geral mostrada na figura a seguir. Devemos ter em mente que, mais uma vez, o pareamento de bases é determinante na síntese da nova fita de RNA: a adenina do DNA pareia com uma uracila no RNA, a timina com a adenina e a guanina e a citosina com a citosina e a guanina, como na fita dupla de DNA.

Modelo plano da molécula de RNA. Há, como no DNA, a tendência ao pareamento entre as bases, o que gera grampos na estrutura do RNA. Assim, na natureza, os RNAs apresentam-se muito dobrados e com muitos trechos em fita dupla.

 

Podemos agrupar a maior parte dos RNAs em três grandes grupos: a) os RNA mensageiros ou mRNAs, que serão lidos pelos ribossomos e que trazem, assim a informação genética para a síntese de proteínas; b) os RNA ribossomais ou rRNA, que, junto com mais de 3 dezenas de diferentes proteínas, formam os ribossomos. Cada ribossomo é composto de duas sub-unidades diferentes. Na menor há um rRNA e na maior dois. Estas sub-unidades estão separadas no citossol e só se unem para a síntese protéica, como veremos mais adiante; c) os RNA transportadores, ou tRNAs, que são "carregados" com aminoácidos de uma forma extraordinariamente precisa pela enzima aminoacil-tRNA sintase. Os tRNAs têm a função de trazer ao ribossomo o aminoácido requerido pelo códon apresentado pelo mRNA na cavidade A da sub-unidade maior do ribossomo. Veremos este mecanismo com mais detalhe no sub-item dedicado à síntese proteica.

 

III.a. A transcrição

Qual a diferença fundamental entre a transcrição e a tradução? Uma analogia pode nos esclarecer isto. Imagine a palavra PTERIGON. O que poderia significar isto? Os caracteres são obviamente escritos num alfabeto que não é o nosso. Contudo, e usando regras muito simples, podemos transcrever a palavra para nosso alfabeto. Basta lembrar que a primeira letra é a letra grega maiúscula pi, que equivale a um p, a quarta letra é um maiúsculo, equivalente a um r, e assim por diante. A palavra escrita no alfabeto cirílico aparece como PTÉRIGON em nosso alfabeto. Muito bem, e daí? O que significa afinal Ptérigon? Para compreendermos o significado da palavra, mesmo após a transcrição, precisamos de um mecanismo muito mais sofisticado: a tradução. O significado é aproximadamente asa. Da mesma forma, o processo de transcrição se limita a reproduzir em RNA o que está escrito em DNA, o que não apresenta maiores dificuldades: as bases A, T, G e C da fita molde de DNA comandam o pareamento de U, A, C e G na fita recém sintetizada de RNA.

A enzima que sintetiza RNA é a RNA polimerase. Nos procariotos parece haver apenas uma RNA pol, mas nos eucariotos elas são distintas, especializadas na síntese de cada um dos grupos de RNAs. Focalizemos nossa atenção no modelo procarioto, pois até o momento as técnicas da engenharia genética que empregam a RNA pol baseiam-se mais neste grupo de organismos. A RNA polimerase precisa iniciar a síntese de um novo RNA precisamente em um determinado local. Analogamente, se pedíssemos que o leitor transcrevesse com letra de mão o segundo parágrafo do capítulo II de um certo livro, o leitor deveria identificar o capítulo e saber como se caracteriza um parágrafo para iniciar seu trabalho. A nível molecular este processo é feito pela identificação pela RNA pol de uma sequência de bases do DNA conhecida como promotor.

A RNA pol não precisa "abrir" o DNA para ler as sequências de bases. Ela procura a sequência característica do promotor deslizando sobre o DNA e procurando a sequência através da fenda maior da dupla hélice. Seria como se procurássemos identificar um grupo de amigos olhando-os pelas costas ou pelo lado. Afinal, não é tão difícil, principalmente se pensarmos que só há 4 "amigos": A, T, G e C. A figura a seguir mostra as diferenças entre "perfis" ou "lados" dos pareamentos AT e GC.

Como os pares de bases no DNA podem ser reconhecidos pelos seus perfis, sem necessidade de se abrir a dupla hélice. Na figura estão mostrados 2 pares vistos num sentido ao longo da molécula de DNA. No outro sentido as imagens são especulares para os pares CG e TA.

Para o reconhecimento do promotor a RNA polimerase utiliza a sub-unidade sigma (s). A enzima é formada de 6 sub-unidades: 2 sub-unidades a, uma b e uma b, uma w e a sub-unidade s. A sub-unidade s não se liga fortemente às demais, que formam um núcleo enzimaticamente ativo a2bbw. Assim que a RNA pol se liga ao promotor, a sub-unidade s se desliga do núcleo enzimático, que prossegue na síntese do RNA até alcançar um terminador (ver adiante). Mas afinal, como é este promotor?

Como quase tudo na natureza, o promotor não é único. Existe, sim, um consenso em torno de sua sequência. Se tomarmos a primeira base transcrita em RNA como a base +1, a sequência de consenso de um promotor da bactéria Escherichia coli (o fusquinha da genética de microrganismos) será como mostrado na figura a seguir. A redução da afinidade e, portanto, da frequência com que um promotor é ligado e o gene é transcrito pela RNApol, está diretamente associada à homologia com a sequência de consenso. É através da variação das sequências nas duas caixas (conhecidas como caixa TATA, ou caixa de Pribnow, e caixa -35) que é modulada a transcrição relativa dos genes constitutivos (aqueles que são expressos o tempo todo durante a vida da célula). Um gene cujo produto deva ser abundante tem um promotor com sequência mais próxima ao consenso, enquanto que um gene cujo produto deva ser raro na célula tem, em geral, um promotor com as sequências das duas caixas bastante divergentes do consenso. Alterações fora das caixas são menos importantes, desde que não diminuam a distância entre elas.

Diagrama representativo de um promotor genérico de E. coli. As caixas -35 e -10 (também chamada caixa de Pribnow ou caixa TATA) são muito conservadas entre distintos promotores. Pequenas variações nestas sequências podem reduzir drasticamente a afinidade do fator sigma da RNA pol pelo promotor. A base +1 é, por convenção, aquela onde se inicia a transcrição. A RNA pol, uma vez acoplada ao promotor, ocupa cerca de 5 voltas do DNA.

Para reforçar a idéia do que seja o consenso de uma sequência, imagine a palavra PRESIDENTE. Escrita desta forma consensual (ou seja, aceita como correta por todos os alfabetizados da língua portuguesa), seria sempre associada ao conceito Presidente. Entretanto, se trocássemos alguma letra, por exemplo, o S por Z, a grafia errônea PREZIDENTE não faria com que o sentido se perdesse, ao menos na maior parte dos casos (um purista poderia argumentar que o redator não queria dizer Presidente). Se alterássemos a grafia de forma mais drástica, por exemplo, para PRESIDEMTI, poderíamos, ao menos em alguns casos, reconhecer a idéia presidente na palavra. Podemos afirmar que as alterações discutidas enfraquecem (ou corrompem) progressivamente o conteúdo informacional da palavra. Entretanto, basta uma pequena mudança (do S para V), e a grafia PREVIDENTE perderia completamente su associação com o conceito Presidente. Da mesma forma, no caso dos promotores bacterianos, a troca de algumas bases nas caixas de consenso pode enfraquecer o promotor, fazendo com que a afinidade do fator s por ele seja consideravelmente reduzida.  Também no caso dos promotores, a troca de certas bases por outras elimina completamente a função promotora da estrutura. Assim, algumas das bases são 100% conservadas, dentro das duas caixas de consenso.

Embora se tenha mais liberdade em alterar a sequência da região promotora fora das caixas de consenso, não podemos retirar nem acrescentar bases entre as caixas, porque a distância entre elas (aproximadamente duas voltas de DNA ou 20 pares de bases) deve ser mantida. Chegamos, então, a um importante conceito na biologia molecular: distância também é informação. O fator s deve reconhecer as duas caixas de consenso (primeiro a TATA e depois a -35) e para tal elas devem estar a uma determinada distância entre si. Uma redução desta distância (ou um aumento) seria equivalente a um alargamento ou estreitamento de um par de trilhos de trem: os vagões não poderiam mais caminhar sobre eles, porque a distância entre as rodas (os sítios de reconhecimento das caixas de consenso no fator s) é fixa, determinada pela estrutura do eixo de rodas (ou da molécula, no caso do s).

Este tipo de arranjo particular da estrutura do promotor permite que, com apenas um par de 6 bases (cada caixa consenso tem em geral uma dúzia de bases) um promotor seja determinado com imensa precisão. O que queremos dizer com isto? Podemos formular a questão de outra forma: qual a probabilidade de uma sequência de 6 bases ocorrer ao acaso no DNA? Para cada base a probabilidade de ser um T, digamos, é 1/4, pois podemos ter T, A, G ou C. O mesmo se aplica para as demais bases da sequência, portanto, a probabilidade de se ter a sequência TAATTA, por exemplo, ao acaso, é 1/4x1/4x1/4x1/4x1/4x1/4= (1/4)6 ou, aproximadamente, 1/4000. Não é uma probabilidade muito pequena, considerando que há de 2 a 10 milhões de bases num genoma procarioto. Mas, se considerarmos que há uma segunda caixa, a probabilidade conjunta das duas terem as sequências esperadas é (1/4)6x(1/4)6 = (1/4)12 ou, aproximadamente, 1/16 milhões. Neste caso, o encontro de uma tal sequência não pode ser fortuito! Além disso, a distância entre elas deve ser de aproximadamente 20 bases, e a caixa TATA deve estar abaixo (3') da caixa -35. Estas duas outras restrições fazem com que um par de caixas com estas características seja, fatalmente, um promotor.

Finalmente, podemos agora claramente perceber que a Natureza desenvolveu um sistema extremamente preciso para determinar o início da transcrição, dando-lhe, contudo, flexibilidade para criar promotores fracos (para genes cuja expressão não deva ser muito grande) e promotores fortes (para genes cujo produto seja necessário em grandes quantidades).

A Natureza também usa o recurso de troca de fatores s para orquestrar o silenciamento e a ativação de grupos de genes. Um exemplo disso é a troca do fator s70, que é a sub-unidade normalmente empregada pela E. coli a 37oC, pelo fator s28, após um choque térmico (elevação da temperatura de cultivo para 42oC ou mais). Quando a bactéria é submetida a um choque térmico, a partir de um promotor reconhecido pelo fator sigma normal (o s70 ), o mRNA para uma nova proteína, o fator  s28, é sintetizado. À medida em que aumenta a concentração deste novo fator no citosol bacteriano, ele vai substituindo o velho sigma, pois tem maior afinidade pelo núcleo enzimático da RNA polimerase. Em pouco tempo todas as RNA polimerases têm este novo sigma associado a elas e só reconhecem promotores de choque térmico, que comandam a síntese de mRNAs para as cahamadas HSPs ou proteínas de choque térmico. O promotor de choque térmico também tem duas caixas de consenso, mas as sequências são um pouco diferentes das de um promotor normal, e mais distantes entre si.

A substituição por competição do fator s normal por um fator s viral é uma das estratégias adotadas por vírus bacterianos para controlar a maquinária biossintética da célula hospedeira. A substituição sequencial de fatores s por microrganismos que formam cistos ou esporos é também uma forma elegante de orquestrar a ativação sequencial de muitos genes.

Uma vez iniciada a transcrição, o fator sigma se separa das demais subunidades, que seguem na tarefa de polimerizar o novo RNA, até que alcancem um trecho no DNA que sinaliza o fim da transcrição. Como se dá esta sinalização? Em princípio somos tentados a imaginar um sistema semelhante ao do promotor: a polimerase reconheceria uma região terminadora e se desacoplaria do DNA. Entretanto, não é isto que ocorre: de fato, há uma região terminadora, mas a RNA polimerase a transcreve em RNA e é este transcrito que, formando uma estrutura muito especial chamada grampo de terminação, sinaliza à RNA pol que ela deve parar a síntese de RNA. A análise de muitas dezenas de regiões terminadoras mostrou que sua sequência apresenta características comuns, que podem ser resumidas da seguinte forma: na fita de DNA que está servindo de molde para a síntese do RNA surge uma sequência com cerca de 8 bases que, após um espaçador de tamanho variável (4 a 15 bases, em geral), é seguida de outra sequência complementar a ela, porém em sentido contrário; logo após esta região simétrica há uma sequência longa de Timinas (um poliT), na fita 5’-3’. Quando a polimerase transcreve esta região, o RNA formado vai tender a parear as duas regiões homólogas, restando uma cauda poliU. Esta estrutura, conhecida como grampo de terminação, sinaliza para a polimerase que ela deve terminar a síntese de RNA.

Sinais de início e término da síntese de RNA pela RNA polimerase bacteriana. O sinal de início é o promotor, reconhecido pelo fator sigma. O sinal de término é reconhecido a posteriori (isto é, pela estrutura formada no RNA), e tem, no DNA, uma simetria diádica, seguida de um poli-T.

Através destes dois sistemas a bactéria determina onde começa e onde termina a síntese de um RNA, da mesma forma que sabemos onde se inicia e onde termina um parágrafo num texto qualquer. O que determina que parágrafo deve ser lido, e quantas vezes deveremos repetir a leitura é assunto do ítem sobre controle da expressão gênica.

Nos eucariotos os promotores são muitas vezes bem mais complexos do que esboçado aqui para E. coli. É comum que somente a caixa TATA seja identificada. Sequências auxiliares, que comandam a expressão, podem estar próximas à posição +1, mas também podem estar distantes centenas ou mesmo milhares de pares de bases. Estas sequências, conhecidas como "enhancers" ou estimuladores, são raramente encontrados em procariotos.  Para uma visão da transcrição em eucariotos, que envolve inclusive o processamento do RNA primário para retirada de introns, consulte o link para a página da extinta disciplina de Genética para Medicina.

O controle da transcrição em eucariotos é um assunto ainda em franco desenvolvimento, mas já está claro que há enormes diferenças nos sistemas de controle. Mesmo em procariotos pode haver um sistema semelhante ao ativador, como mostrado na figura abaixo, mas é muito menos comum que nos eucariotos.

(A) Ativação gênica à distância: NtrC é uma proteína reguladora de gene bacteriana e atua como um enhancer. A ativação requer mudança conformacional do DNA e a hidrólise de ATP. Embora rara em procariotos, esta forma de ativação é a regra em eucariotos. (B) Agrupamento dos fatores de transcrição (TF) gerais necessários ao início da transcrição de um gene eucarioto pela RNA polimerase II.

 

III.b A tradução

Afinal, qual é o destino dos RNAs na bactéria? A verdade é que a vida média de um mRNA bacteriano é muito curta, raramente ultrapassando 60 segundos. Por que? Temos que ter em mente que a “vida" de uma E. coli dura meia hora. Neste intervalo ela passa por profundas transformações metabólicas. Por isso, um mRNA só é necessário por breves instantes, sendo em seguida descartado. Em eucariotos, contudo, os mRNA podem ter vida média muito mais longa. Os demais RNAs também tem uma vida média curta, porém bem maior que a dos mRNA pois são necessários de uma forma mais homogênea ao longo do ciclo de vida da bactéria. O “turn over” (substituição de uma molécula por outra mais nova) é um fenômeno geral e está relacionado com a instabilidade termodinâmica de qualquer estrutura a nível molecular.  

No caso dos mRNA de procariotos, a sua degradação é controlada por um processo engenhoso. A transcrição e a tradução estão de tal forma acopladas que, imediatamente após a síntese de um pequeno trecho de mRNA, os ribossomos já se ligam a este RNA nascente, protegendo-o da degradação pelas RNases bacterianas. O acoplamento da transcrição com a tradução é uma característica dos procariotos. Nos eucariotos o transcrito primário do DNA que dará origem a um mRNA é feito no núcleo, enquanto o mRNA e traduzido no citoplasma (recentemente um grupo de pesquisadores mostrou que pode haver tradução no núcleo! veja Iborra et al., Science 293:1139, 2001). A figura a seguir mostra o acoplamento da transcrição e da tradução.

Representação esquemática do acoplamento entre a transcrição e a tradução em procariotos.

 

O processo de tradução se inicia pela ligação da sub-unidade menor do ribossoma a um sítio (sequência) específica no mRNA chamado RBS (ribosome binding site). Esta ligação é mediada, provavelmente, pelo pareamento de uma sequência do rRNA 16 S (que faz parte da composição da sub-unidade leve) com a sequência de Shine-Delgarno (ou RBS). À sub-unidade menor acopla-se, então, o primeiro tRNA (sempre para formil-metionina, em E. coli), e o conjunto desliza pelo mRNA até encontrar o códon AUG (identificado pelo anticódon correspondente no tRNA). Mais uma vez, é necessário um ajuste preciso da posição de início da leitura do mRNA pelo ribossoma. Para cada mRNA existem potencialmente três diferentes quadros de leitura (já que as bases são lidas em trincas), porém só um quadro de leitura é correto. Pode parecer estranho que uma sub-unidade aberta (sem o acoplamento prévio da outra), junto com um tRNA para formil-metionina, seja necessária para encontrar o códon de início da síntese proteica. Mas, se ponderarmos sobre a questão, veremos que o tRNA sozinho não poderia se ligar ao códon de iniciação, pois ele apenas reconhece um códon AUG (ou GUG) e desta forma se ligaria a qualquer uma destas trincas, em qualquer quadro de leitura, ao longo do mRNA. A sub-unidade leve, por sua vez, não tem como reconhecer o códon AUG, mas "sabe" onde é a sequência RBS e determina, assim, que a primeira trinca AUG abaixo de seu sítio de ligação será o início da síntese protéica. Então, fica claro que a associação das duas moléculas, tRNA e sub-unidade leve do ribossoma, é imprescindível.

Ao conjunto sub-unidade menor/ tRNA, já na posição exata para início da síntese proteica, liga-se, então, a sub-unidade maior, completando o ribossoma. O ribossoma tem formada, assim, uma cavidade P (à esquerda, no desenho), onde está o tRNA com a formil-metionina, e uma cavidade A, ainda vazia, a sua direita, aguardando a chegada do próximo tRNA transportando o aminoácido correspondente ao códon apresentado no fundo da cavidade. Quando isto acontece uma reação química (ligação peptídica) ocorre entre o primeiro aminoácido e o segundo, transferindo desta forma o primeiro para se ligar ao segundo, que permanece pelo seu lado ligado ao seu tRNA. O primeiro tRNA, agora ocupando a cavidade P do ribossomo, está descarregado. O ribossomo então desloca-se no mesmo sentido que já vinha fazendo, descartando assim o tRNA vazio (provisoriamente alojado numa cavidade E, que significa exit), posicionando o segundo tRNA com os dois aminoácidos a ele aderidos na cavidade P e liberando a cavidade A para receber um novo tRNA carregado. O processo se repete até que um sinal de terminação seja encontrado. Neste caso o ribossoma espera não um tRNA mas uma proteína conhecida como fator de terminação, que se liga no sítio A ao códon de terminação, desestabiliza o ribossomo e interrompe irreversivelmente a síntese. Há vários fatores proteicos chamados fatores de iniciação e fatores de alongamento que colaboram neste processo. Como as técnicas em genética molecular raramente lançam mão da síntese proteica in vitro, não nos deteremos mais neste assunto. O leitor é convidado a consultar os livros-texto sugeridos ou qualquer outro bom livro que trate do assunto a nível molecular (Bioquímica, Lehninger; p. ex.). A figura a seguir ilustra o mecanismo de síntese proteica em procariotos.

Neste modelo do processo de tradução há um sítio E ( “empty” = vazio), onde se aloja o tRNA descarregado antes de sair do ribossomo.Estão representados os diversos fatores que participam do processo de tradução, além do ribossoma e dos tRNAs. Para uma descrição do processo, cf. texto acima.

 

         Novamente, em eucariotos a complexidade do processo de transcrição/ tradução é consideravelmente maior (para uma abordagem da tradução em eucariotos, escrita para página, clique aqui).. Isto se dá por duas razões: primeiro, os genes eucariotos costumam ser interrompidos por sequências que não codificam aminoácidos. Estas sequências, chamadas introns, e as sequências que serão empregadas pelo ribossoma (ou para formar tRNA ou rRNA) são transcritas para um longo RNA, chamado transcrito primário, ou ainda RNA heterogêneo nuclear. Deste transcrito primário têm que ser retirados os introns, o que é feito por um processo enzimático chamado “splicing” (lê-se “spláicin). Além disso o pré-mRNA ainda sofre outras alterações, como a adição de uma cauda poliA na extremidade 3´ e de um “cap" 7-metil-guanosina na extremidade 5´ antes de se tornar um mRNA e poder passar ao citoplasma, onde será traduzido.

O splicing de RNA é catalizado pelo spliceossomo, formado pelas snRNP (pequenas ribonucleoproteinas nucleares) U1, U2, U5 e U4/U6, além de outros componentes, não representados na figura. Na primeira etapa do slicing o nucleotídeo ramificado A, próximo ao sítio de splicing 3’, ataca o sítio 5’ de splicing e corta o RNA.  A extremidade 5’ resultante fica ligada covalentemente ao A. Na segunda etapa, a extremidade 3’ do exon da esquerda, deixada livre na etapa anterior, ataca o sítio de splicing 3’ do intron, clivando o lariat (laço) e unindo os dois exons.

 

         O mecanismo de splicing mostrado acima é essencialmente igual para todos os mRNAs eucariotos que contenham um intron.  A figura a seguir mostra a forma com que o transcrito primário do gene para a ovalbumina de galinha é processado para gerar um mRNA maduro;

A figura mostra a remoção organizada de 7 introns necessários para a obtenção do mRNA de ovalbumina maduro, a partir do transcrito primário. Os sítios de splicing nas posições 5’ e 3’  estão representados pelas letras D e A (doador e aceptor, respectivamente).

         Uma animação  sobre splicing de mRNA pode ser vista na página da revista Nature Reviews - Neurosciences, como indicado a seguir (embora não seja muito elucidativa):

http://www.nature.com/nrn/journal/v2/n1/animation/nrn0101_043a_swf_MEDIA1.html

        Duas outras animações podem ser vistas: a primeira mostra uma visão geral do processo, semelhante à da animação acima, e a segunda detalha o mecanismo de quebra de ligações covalentes e transferências para outros ligantes no processo de splicing.

Se as animações acima não rodarem automaticamente você deve baixar deste site http://www.apple.com/quicktime/download/  o visualizador de animações QuckTime e instalar na sua máquina

    O splicing de tRNAs e de rRNAs pode ser feito sem a participação do spliceossomo. De fato, é o próprio RNA que se auto processa, numa reação conhecida como self splicing. Esta atividade enzimática do RNA contraria a antiga assertiva da bioquímica que diz “toda enzima é uma proteína”.

        Em conclusão para esta aula: devido a estas etapas intermediárias no processamento do RNA, desde hnRNA (ou transcrito primário) até mRNA, é possível observar-se em eucariotos sistemas de controle da expressão gênica muito diversos do que se vê em procariotos. Para uma visão mais aprofundada do assunto consulte o site

http://www.blc.arizona.edu/marty/411/Modules/mod15.html

ou aguarde até que uma nova página feita por esta equipe detalhe a organização do genoma eucarioto (com enfoque no homem e em Leishmania) e o controle da expressão gênica em eucariotos. Consulte também os capítulos VII e VIII do livro de Stracham e cols., recomendado na bibliografia.

 

volta ao topo               volta à página de distribuição de aulas