Início | Aulas |Bibliografia | Exercícios  | Artigos | Animações  |Links |

|A Equipe |  Contato | Sua Opinião | Notícias Completas | Termo de Uso| Mapa do Site

 

Ferramentas da Genética Molecular Humana

(uma visão rápida do conjunto de técnicas da genética molecular aplicadas ao estudo do genoma e das doenças genéticas)

 

Este capítulo seguirá essencialmente o assunto abordado no capítulo 4 do livro Genética Médica (Thompson e Thompson). Em muitos pontos, entretanto, o assunto será abordado de forma muito mais aprofundada,  adicionado para isto informações de outros livros e de artigos científicos, ou remetendo o leitor a uma uma mais aulas do website BiolMol.

 

Um dos principais objetivos da genética médica é compreender a base molecular das doenças genéticas. Uma vez que se compreenda o mecanismo molecular da doença, deve ser possível desenvolver um sistema diagnóstico aperfeiçoado, voltado ao DNA ou a RNA, e ainda intervir para a cura da doença. Após o enorme avanço do conhecimento representado pelo Projeto Genoma Humano, passou a ser outro objetivo importante da genética médica a compreensão do pano-de-fundo genético que determina a susceptibilidade/ resistência a doenças, a tolerância a medicamentos e muitos outros parâmetros indiretamente relacionados à doença, mas que estão na base da diversidade dos seres humanos e na sobrevivência da espécie.

 

O avanço concreto na compreensão dos mecanismos moleculares que explicam os fenômenos descritos acima foi possível graças à introdução de um grande número de técnicas novas no estudo da genética. Neste capítulo falaremos de várias delas, com maior ou menor profundidade de acordo com suas aplicações mais imediatas na genética médica, procurando ao mesmo tempo evitar um detalhamento excessivo, que não contribuiria diretamente à compreensão das aplicações das técnicas na genética médica, razão principal do capítulo. Em muitos casos o leitor será encaminhado para a webpage Biolmol, onde a maior parte das técnicas está discutida em detalhe (particularmente aquelas ligadas à tecnologia do DNA recombinante, à PCR e ao sequenciamento de DNA.

 

Sumário

I. A linguagem da tecnologia do DNA recombinante

II. Clonagem gênica

1.Primeiros passos

2. Restrição e Modificação: a ferramenta escondida na bactéria

3. Ainda um pouco sobre as enzimas de restrição

4. Vetores (falta)

5. Construção de Bibliotecas

6. Biblioteca genômica: todo o genoma em pedaços...

7.  Clonagem e expressão: o problema dos introns

8. Como fazer um DNA eucarioto sem introns?

9.  Biblioteca de cDNA e características de um vetor de expressão para Escherichia coli.

10. Seleção (triagem ou screening) de clones pela expressão da proteína recombinante.

11. Que genes estão representados numa biblioteca de cDNA?

12. Proteínas recombinantes: as quimeras são desejáveis?

III. PCR: uma técnica de múltiplas aplicações

IV. Sequenciamento de DNA

 

 

*******************************************************************

I. A linguagem da tecnologia do DNA recombinante

 

Como em toda área de conhecimento espeçífica, a linguagem da genética molecular parece impermeável ao leigo, numa primeira leitura. Entretanto, o significado de cada termo corriqueiramente usado pro geneticistas moleculares não é complexo, mas reflete o peso da técnica na fenomenologia estudada. Para que o leitor não se perca com um linguajar pouco familiar, vamos inicialmente definir certos termos de uso corrente na área. Estas definições podem ser encontradas em muitos livros e fontes na internet; aqui elas provêm da experiência dos responsáveis pela página.

 

Glossário da Genética Molecular (tenderá a se ampliar até o final das aulas sobre este tema)

 

Biblioteca: Conjunto de clones (aqui compreendidos como um hospedeiro albergando múltiplas cópias idênticas de um determinado vetor recombinante, ou ainda o próprio vetor, quando armazenado sem o hospedeiro, como no caso de bacteriófagos) gerados a partir de uma fonte de informação genética (DNA ou mRNA).  As bibliotecas feitas a partir de DNA do organismo são ditas genômicas e aquelas feitas a partir de mRNA são ditas de cDNA (e representam apenas os genes expressos do tecido empregado para extrair o mRNA)

  Northern blot: Transferência de RNAs bandeados por eletroforese para uma membrana adequada, em geral de nylon. O processo pode ser feito por campo elétrico (os RNAs são negativos e migram para o pólo positivo) ou arraste hidrodinâmico. As membranas de Northern blot podem ser hibridizadas com sondas de DNA ou RNA. O nome northern é uma alusão ao nome Southern, do inventor da transferência análoga de DNA.

Clone: Nome empregado em várias acepções distintas. Pode significar uma molécula de DNA recombinante contendo um gene ou sequência de DNA de interesse. A palavra é empregada para designar também o hospedeiro carreando o clone (no vetor) ou ainda qualquer organismo obtido por propagação vegetativa de outro (esta acepção está foram do contexto da genética molecular)

 

Oligonucleotídeo: Um filamento curto de ácido nucléico, em geral fita simples, que pode variar desde poucas bases até algumas dezenas. Em geral são sintéticos. São chamados abreviadamente de oligos (p. ex., oligodT, oligos para sequenciamento, etc.)

cDNA: Rigorosamente, DNA complementar. O nome é empregado para designar a fita simples de DNA  obtida pela transcrição reversa (geralmente parcial) de um mRNA, a partir de sua extremidade 3' (cauda poli A). A designação é estendida para o DNA fita dupla obtida pela síntese de uma segunda fita de DNA complementar à primeira por alguma DNA polimerase.

 

PCR: Sigla de polymerase chain reaction, ou reação em cadeia da polimerase. Reação de extensão de DNA que emprega dois primers que hibridizam próximos um ao outro na fita de DNA molde (ou alvo), e permitem a produção de milhões de cópias do fragmento de DNA situado entre os dois primers

dNTPs/ ddNTPs: Desoxinucleotídeos trifosfatados/ didesoxinucleotídeos trifosfatados. Precursores da síntese de DNA, são empregados para a extensão de fitas simples in vitro pela ação de uma DNA polimerase, a partir de primers e DNA moldes adicionados ao sistema. Os dideoxinucleotídeos, quando adicionados a uma cadeia crescente, interrompem a extensão da fita, pois não oferecem a hidroxila na posição 3', indispensável para a ligação fosfodiéster com o nucleotídeo seguinte. Podem ser dATP. dGTP. dTTP ou dCTP, ou seus análogos dideoxi.

 

Primers: iniciadores da síntese de DNA, são pequenos oligonucleotídeos sintéticos fita simples (de DNA). O primer vai hibridizar (ou parear) com uma fita do DNA alvo dupla fita. Para o PCR emprega-se em geral dois primers. Para o sequenciamento de DNA sempre um primer é empregado de cada vez. Tanto para PCR como para sequenciamento os primers costumam ter entre 10 e 25 bases.

Enzima de restrição: Enzimas que reconhecem sítios específicos no DNA fita dupla (em geral palíndromos) e cortam a dupla fita, formando extremidades abruptas (cegas) ou desencontradas (ou coesivas).  Os sítios reconhecidos por estas enzimas são designados sítios de restrição e os fragmentos de DNA gerados pela digestão de um DNA com estas enzimas são conhecidos como fragmentos de restrição.  

Sonda: Uma molécula de DNA ou RNA marcada com fósforo radioativo u conjugada com algum tipo de marcação que possa ser identificada posteriormente por um ensaio bioquímico (floresceína, biotina, digozigenina, etc.). A molécula pode ser fita simples ou fita dupla. As sondas devem ser produzidas em milhares de cópias e por isto em geral são segmentos clonados em plasmídeo ou produtos de PCR. Entretanto, em alguns casos, todos os fragmentos de um determinado genoma podem ser marcados e usados como sondas para hibridizar com outro genoma.

Hibridização: O pareamento de duas moléculas de DNA fita simples através da complementariedade de bases, seguindo a regra de Chargaff (A-T, G-C). Aplica-se a mesma designação para o pareamento RNA-DNA ou RNA-RNA.

 

Southern blot: Transferência de DNAs bandeados por eletroforese para uma membrana adequada, em geral de nylon. O processo pode ser feito por campo elétrico (os DNAs são negativos e migram para o pólo positivo) ou arraste hidrodinâmico. As membranas de Southern blot podem ser hibridizadas com sondas de DNA ou RNA. O nome  é uma homenagem ao inventor da transferência.

Hospedeiro: O organismo usado para isolar e propagar uma molécula de DNA clonada (em geral num vetor qualquer). Para clones inseridos em plasmídeos, em geral emprega-se a Escherichia coli como hospedeiro. Da mesma forma se bacteriófagos são usados. Células de mamíferos, de leveduras e de insetos são também muito empregadas.

 

Vetor: Qualquer unidade autoreplicativa de DNA (fita dupla ou simples) que possa servir para carregar um inserto de DNA exógeno de um hospedeiro para outro (da mesma espécie ou de espécies distintas, quando o vetor ganha o nome de vetor de transferência ou shuttle vector). Exemplos: plasmídeos (bacterianos ou eucriotos), bacteriófagos, vírus, cosmídeos, fagemídeos, BACs (cromossomos artificiais de bactérias) e YACs (cromossomos artificiais de leveduras). 

Inserção/ Inserto: Ato de inserir um DNA doador num DNA receptor/ Diz-se inserto ao DNA inserido (em geral num vetor, mas algumas vezes diretamente no genoma da célula transformada ou transfectada)   Western blot: Transferência de proteínas bandeadas por eletroforese para uma membrana adequada, em geral de nitrocelulose. O processo só pode ser feito por campo elétrico (os RNAs são negativos e migram para o pólo positivo). As membranas de western blot podem ser hibridizadas com sondas de anticorpos. O nome western, como o nome northern também, é uma alusão ao nome Southern, do inventor da transferência análoga de DNA. O western blot é frequentemente chamado imunoblot.

Ligação:  A união de dois segmentos de DNA fita simples pela ação da ligase. A enzima reconstitui a ligação fosfodiéster 3'5' entre dois nucleotídeos adjacentes.

   

 

II. Clonagem gênica

         Criar seres novos têm sido, por bilhões de anos, o privilégio da Natureza, através do processo contínuo de mutação e seleção natural e por outros mecanismos de alteração do DNA que agora começam a ser compreendidos. Mas a humanidade sempre "criou" seus próprios seres, geralmente extraordinários. Os gregos eram particularmente imaginativos, e a mitologia clássica é cheia de monstros como a Quimera, o cão Cérbero, o Minotauro, a Medusa e um sem-número de outros híbridos. Como se verá mais adiante, a palavra quimera foi tomada de empréstimo na mitologia para designar as construções artificiais de moléculas (em geral DNA). Inicialmente a imaginação do homem atribuía a algum deus a geração dos seres monstruosos ou, ao contrário, extraordinariamente belos. A idéia de que estes seres podiam ser fabricados por um ser humano só veio muito depois, mas em várias partes do mundo os homens criaram "protocolos"  para a geração de vida a partir de material "morto", desde simples insetos até o próprio ser humano. A partir do meio do século XVIII a ciência começou a mostrar a verdadeira face da criação e a esclarecer a origem das ossadas que eram em parte o combustível para a imaginação dos homens naquele tempo: a vida só podia ser criada a partir da vida e os ossos imensos ou estranhos achados em toda a parte eram de seres extintos, mas que tinham sido produto da Natureza, como todos os demais.

            Ainda assim, alguns seres exóticos mais "queridos"  da humanidade permaneceram por todo o século XVIII e boa parte do século XIX e alguns passaram "vivos" pelo século XX até hoje! O unicórnio "viveu"  feliz por todo o século XVIII, as serpentes marinhas monstruosas alcançaram a metade do século XX e os duendes e fadas estão muito bem de saúde, "vivendo" entre nós, civilizados. Os lobisomens e vampiros andam mais desacreditados, mas sempre se deve esperar um retorno triunfal, às custas do cinema ou de um livro, lançados por bons marqueteiros...

            Entretanto, a criação de híbridos de verdade é muito mais difícil do que insinua o cinema ou pensam as pessoas, porque a maior parte das espécies têm algum tipo de restrição para o cruzamento com uma espécie diversa. Na melhor das hipóteses o híbrido costuma ser estéril. Esta é a regra entre animais. Os híbridos entre vertebrados, por exemplo, são raros, e quando ocorrem, em geral são estéreis. É o caso da mula e do burro, híbridos de cavalos e jumentos. Entre plantas, contudo, a obtenção de híbridos é muito mais fácil e uma enorme fração das plantas que hoje cultivamos é produto de cruzamento entre duas ou mais espécies.

            Uma abordagem mais simples à produção de novas formas de vida (ao menos em teoria) é a clonagem de genes de um organismo e a transfecção destes para outro organismo. A vantagem desta abordagem é que se pode selecionar da espécie doadora apenas as marcas que interessam, evitando a introdução de genes indesejados. Adicionalmente, ela permite (também em teoria...) total controle sobre a construção final, contornando as recombinações que a Natureza produz durante a reprodução sexuada (entre indivíduos da mesma espécie ou não).

            Clonar genes parece simples a princípio, mas as ferramentas para cortar DNA e "emendar"  os fragmentos com um vetor (DNA que se replica e que desta forma conserva o pedaço "emendado" nele, chamado inserto) não eram conhecidas até o meio da década de 70.

1.Primeiros passos

         As primeiras tentativas de clonagem de genes foram feitas no fim da década de 70 com um vírus que infecta células de primatas (inclusive seres humanos): o SV40 (simian virus 40). Este vírus é capaz de entrar na célula do mamífero e em alguns casos integrar-se ao DNA cromossômico, em qualquer lugar do genoma. Ao sair, ocorre muitas vezes uma excisão anômala, e o vírus deixa no genoma da célula hospedeira uma parte de si, levando, ao contrário, um pequeno segmento do genoma da célula do primata. Ao invadir uma nova célula, o segmento transportado insere-se num outro ponto do DNA da célula hospedeira, totalmente diverso do que estava antes. Este procedimento embaralha o genoma e pode, ao acaso, produzir uma construção interessante, mas é muito grosseiro para permitir um avanço concreto no campo da clonagem. Adicionalmente, o SV40, assim como o fago l, do qual falaremos em outra aula, e vários outros vírus, têm uma limitação séria quanto ao tamanho de inserto que podem carregar, pois devem ser encapsulados para sair de uma célula e invadir a outra, e o volume do capsídeo não comporta muito mais DNA do que o que é normal no vírus. Desta forma, vetores virais empacotados em capsídeos devem ser previamente engenheirados de forma a que se retire um certo número de genes dispensáveis in vitro, fazendo espaço para mais bases do inserto.

       Como não havia uma forma simples e precisa de cortar DNA numa sequência ou posição específicas, produzindo segmentos de extremidades conhecidas, era impossível unir de forma eficiente um segmento de DNA de doador com as extremidades de um vetor (viral ou plasmidial, como veremos mais adiante). A falta desta tesoura molecular restringiu durante anos o avanço da nascente "engenharia genética", nome que a mídia deu ao que se chama nos meios acadêmicos de tecnologia do DNA recombinante. Além disso, o fato de todos os primeiros vetores de clonagem terem sido vírus que infectam o homem fez da engenharia genética uma tecnologia de alto risco. As legislações foram, compreensivelmente, duríssimas no princípio, com uma opinião pública inteiramente desfavorável, como ocorre hoje com a questão da clonagem de mamíferos. O cuidado era, contudo, muito importante. Apesar de todo cuidado, e um pouco antes das tentativas de se fazer engenharia genética de forma sistemática e abrangente, o SV40 acabou sendo o protagonista de uma infecção acidental de milhões de pessoas, através da vacina de poliomielite, nas décadas de 50 e 60. A infecção pelo SV40 não provocou, até onde se pode saber, qualquer problema de saúde nos indivíduos infectados, apesar de potencialmente ser possível a ação direta do vírus no organismo  ou através de sua recombinação in vivo com o S2, um vírus humano.

            A legislação evolui bastante à medida em que a engenharia genética tornava-se mais segura. Paralelamente, a ciência da Biossegurança emergiu da união entre conceitos de biologia e de direito, resultando num corpo de normas e diretrizes bastante coerente, que se atualiza continuamente através de workshops, congressos e outros encontros técnicos entre especialistas do mundo todo (para detalhamento consulte o site da CTNBio - Comissão Técnica Nacional de Biossegurança)

2. Restrição e Modificação: a ferramenta escondida na bactéria

            Os bacteriófagos, partículas virais que invadem e destroem bactérias, tiveram um papel central no desenvolvimento da Biologia Molecular. Já na década de 40 uma série de experimentos mostrou como funcionavam os genes de vários destes vírus. Uma geração depois experimentos com fagos levaram a uma descoberta fundamental - as enzimas de restrição. Estas "tesouras" moleculares, que a bactéria emprega para se defender dos bacteriófagos, poderiam ser aproveitadas para a pesquisa. Elas de fato forneceram a ferramenta há muito desejada pelos biólogos moleculares para estudar e manipular o DNA e fundamentaram o caminho para o desenvolvimento da engenharia genética.

            A descoberta das enzimas de restrição aconteceu ao longo de mais de duas décadas e demonstrou que as bactérias desenvolveram, durante a evolução, um eficiente mecanismo de defesa contra vírus a DNA. Fagos que se desenvolvem bem numa certa linhagem de bactéria, frequentemente produzem uma progênie pequena quando infectam pela primeira vez uma outra linhagem da mesma bactéria, mas os poucos fagos sobreviventes prosperam. O fenômeno, conhecido como restrição controlada pelo hospedeiro, foi descrito pela primeira vez no início da década de 50. Werner Arber, um microbiologista suíço, encontrou uma explicação molecular para o fenômeno. Ele sugeriu que as bactérias controlam os fagos com um sistema de reações geneticamente controladas que ele designou restrição - modificação.  A seguir analisaremos as observações de Arber.

            Quando os bacteriófagos entram numa bactéria da linhagem A, são em sua maioria mortos no interior da bactéria, que corta (cliva) o DNA em um ou mais pontos. Os poucos fagos que se replicam no interior da bactéria, contudo, parecem "aprender"  a evitar o ataque da bactéria e, numa segunda infecção, já produzem um grande número de partículas virais novas. Quando estes fagos procuram infectar uma bactéria da mesma espécie, porém de uma outra linhagem (digamos, B), inicialmente produz uma progênie pequena e apenas na segunda infecção na mesma linhagem bacteriana é que se adapta e produz um grande número de partículas virais novas. Se transportado a um tubo de ensaio com a bactéria A original, o fenômeno se repete, como se o fago tivesse "desaprendido"  a infectar a bactéria do tipo A. A situação está mostrada na figura abaixo.

Figura 1: A restrição controlada pela hospedeira: Fagos que se desenvolvem bem numa certa linhagem de bactéria, frequentemente produzem uma progênie pequena quando infectam pela primeira vez uma outra linhagem da mesma bactéria, mas os poucos fagos sobreviventes prosperam.

 

            Como poderia ser este "aprendizado"? Afinal, quando um fago entra na bactéria, apenas o seu DNA subsiste e se replica, ficando o capsídeo do lado externo da hospedeira. Então, todo o processo de adaptação teria que estar ligado ao DNA. Vejamos a hipótese de Arber (mostrada de forma esquemática na figura a seguir):

 Aqui cabe uma pergunta: como a bactéria "decide" se uma sequência deve ser modificada ou restrita? As enzimas de restrição (E.R.) estão dispersas no citosol bacteriano, mas as de modificação em geral têm uma proximidade com o aparato de replicação do DNA. Por isso, um DNA invasor é mais provavelmente restrito antes de ser modificado. Ao contrário, o DNA bacteriano recém sintetizado (uma fita nova, já que a outra, velha, já está modificada) será provavelmente modificado na fita nova antes de ser restrito. Além disso, uma hemi-metilação também confere um razoável grau de proteção contra o ataque de enzimas de restrição, o que faz com que o DNA bacteriano seja essencialmente imune à ação da enzima de restrição da própria bactéria. De forma equivalente, o DNA viral, que não tem nenhuma metilação, é muito mais sensível ao corte pela E.R..

            Esta explicação molecular foi fundamental para espantar o espectro de lamarckismo que obviamente ronda um experimento desta natureza.

Figura 2: Interpretação molecular do fenômeno da restrição pela hospedeira, de acordo com Werner Arber. As círculos vermelhos e verdes representam as modificações.

            Era notável a especificidade destas reações e os bioquímicos ficaram bastante esperançosos de que as enzimas de restrição pudessem ser empregadas para estudar e clivar o DNA, se pudessem ser purificadas. Enquanto Arber trabalhava com E. coli, outros pesquisadores experimentavam com outras bactérias, encontrando resultados similares. As esperanças, entretanto, enfraqueceram quando a primeira das enzimas purificada parecia cortar in vitro o DNA de forma aleatória, e não numa sequência de bases específica (conhecida como sítio de restrição).

            As esperanças ressurgiram na década de 70, através de uma série de trabalhos balizadores de Hamilton Smith, um biólogo molecular que trabalhava na Johns Hopkins University School of Medicine. Ele purificou a primeira enzima sítio-específica, a enzima Hind II, da bactéria Haemophilus influenzae. Esta descoberta crucial foi obra do acaso (com tantas outras): incubando bactérias e fagos juntos, Smith observou que o DNA do fago degradava aos poucos. Ele e seus colaboradores conseguiram purificar a enzima responsável pela degradação e posteriormente identificaram a sequência de seis pares de bases que ela reconhece e cliva, sempre na mesma posição, sempre da mesma forma! Logo muitas outras enzimas foram descobertas e agora há mais de 3000 já descritas. Cada enzima cliva o DNA num sítio específico e com estas enzimas foi possível manipular o DNA como nunca antes. Um dos trabalhos mais festejados, que vieram na cola das descobertas de Arber e Smith, foi o de Daniel Nathans com SV40, que pela primeira vez empregou estas enzimas para mapear fisicamente o DNA. Seus experimento levaram em 1972 à primeira tentativa bem sucedida de clonagem de DNA, conseguida por Paul Berg.

            Pelas suas descobertas, Hamilton Smith recebeu o Prêmio Nobel em Fisiologia ou Medicna em 1978, dividindo a premiação, merecidamente, com Arber e Nathan. As palestras dos três laureados, Arber, Nathans e Smith, com uma descrição de seus trabalhos, estão também disponíveis no site de downloads, no formato pdf.

3. Ainda um pouco sobre as enzimas de restrição

         Como vimos acima, cada bactéria possui em geral uma enzima que reconhece uma sequência de DNA curta, com 4 a 12 pares de bases. Nas diferentes bactérias estes sítios têm em sua maioria uma característica comum: a de terem a mesma sequência de bases quando lidas nas duas fitas complementares. As sequências abaixo, reconhecidas pela enzimas de restrição EcoR1 (obtida da Escherichia coli) e HindIII (obtida de Hemophilus influenzae) exemplificam o que chamamos de sítio de restrição. Observe a sequência e veja sua simetria. Sequências de DNA fita dupla com estas características são chamadas palíndromos.          

 

Figura 3: As setas indicam a ponte fosfodiester clivada pelas enzimas EcoRI e HindIII. A linha indica o eixo de simetria do palíndromo

         Quando uma enzima de restrição digere o DNA, ela produz um corte em cada fita, podendo resultar em extremidades colantes ou adesivas, como as geradas pelas enzimas acima, ou extremidades cegas, isto é, sem bases despareadas. Cada vez que elas encontram um sítio de restrição que lhes é próprio, clivam o sítio.

Figura 4:  Ação da enzima de restrição EcoR1, com geração de extremidades colantes(ou adesivas) e união de fragmentos de DNA de origens distintas

         Os sítios de restrição ocorrem ao acaso no DNA e tanto mais freqüentes são quanto mais curtos. A probabilidade de se ter uma seqüência qualquer definida de seis bases é (1/4)6, isto é 1: 4096.  Uma enzima que reconheça um sítio de restrição de 12 bases cortará o DNA com uma freqüência muito baixa. Após a digestão de um DNA longo por uma enzima de restrição muitos fragmentos são gerados, tanto menores quanto maior for o sítio de restrição.

           Para finalizar: qual a vantagem para um fago ter um sítio de restrição alvo de uma determinada enzima? Nenhuma, evidentemente, mas como os sítios ocorrem ao acaso, é provável que um fago possa ser restrito por várias de suas potenciais hospedeiras. Por outro lado, qual a vantagem para uma bactéria em ter uma enzima de restrição que reconhece sítios com 10 pb? Não será muito raro encontrar um sítio destes num fago? Provavelmente estas bactérias tem uma gama bastante restrita de fagos que lhes são infectivos e por isso não precisam estar prontas para clivar sítios frequentes, mas apenas aqueles que existem nos seus fagos invasores. Como a Natureza estabelece este balanço é uma questão de estudos ainda.

4. Vetores (falta)

Finalmente podemos discutir as bases da clonagem de DNA. Para exemplificar o procedimento empregaremos um plasmídeo como vetor de clonagem e cortaremos o plasmídeo e o DNA a ser clonado com uma enzima de restrição que forma extremidades coesivas. É preciso ter em mente contudo, que existem vários outros vetores de clonagem (dos quais discutiremos, em outro capítulo, o fago lambda e suas variantes comerciais) e diferentes formas de fragmentar e clonar o DNA (com enzimas de restrição que deixam extremidades cegas, com ou sem posterior encaudeamento, com nebulização, com prensa francesa, etc.). Em atualizações futuras cada uma destas técnicas será discutida. Por enquanto, recomendamos a visita do site português sobre vetores, para uma visão geral sobre os vários vetores de clonagem. A consulta aos livros-texto da disciplina se impõe, evidentemente.

5. Construção de Bibliotecas

O que é uma biblioteca? É o conjunto de clones (aqui compreendidos como hospedeiros albergando múltiplas cópias idênticas de um determinado vetor recombinante, ou ainda o próprio vetor, quando armazenado sem o hospedeiro, como no caso de bacteriófagos) gerados a partir de uma fonte de informação genética (DNA ou mRNA).  As bibliotecas feitas a partir de DNA do organismo são ditas genômicas e aquelas feitas a partir de mRNA são ditas de cDNA (e representam apenas os genes expressos do tecido empregado para extrair o mRNA)

Clonando DNA num plasmídeo        

            O processo se inicia pela extração do DNA das células doadoras e do plasmídeo (neste exemplo, um plasmídeo pequeno, de aprox. 2,5 kpb, da bactéria E. coli). A extração de DNA não é um processo complexo: resumidamente, as células são lisadas com um detergente, os restos celulares e boa parte das proteínas precipitadas por centrifugação em presença de uma concentração elevada de sal (em geral acetato de potássio) e o sobrenadante, transferido para outro tubo, é misturado com isopropanol. O DNA não é solúvel neste álcool, mesmo diluído com água, e tende a precipitar. Para acelerar o processo centrifuga-se o material a 13.000 rpm por alguns minutos e o precipitado é ressuspenso ém água ou num tampão adequado. O DNA que se obtém desta forma não é muito limpo, mas serve para uma boa parte das aplicações corriqueiras de laboratório. Atualmente kits comerciais permitem a extração rápida de DNA de praticamente qualquer tipo de célula, em quantidades e grau de pureza que satisfaçam ao mais exigente pesquisador.

            A extração do plasmídeo é semelhante à descrita acima, mas é preciso usar um estratagema para separar o plasmídeo do DNA bacteriano. O DNA plasmidial é muito menor que os fragmentos de DNA cromossômico bacteriano. O truque então consiste em adicionar à solução de lise uma certa quantidade de álcali. O pH alto desnatura o DNA. Logo em seguida adiciona-se ácido acético gracial e acetato de potássio: o ácido neutraliza o álcali e os DNAs tendem a renaturar. Porém, a presença de sal provoca a precipitação de todas as moléculas que não forem muito solúveis em água. O DNA desnaturado é pouco solúvel em água e precipita. É o caso dos fragmentos grandes de DNA cromossômico, que não conseguem se renaturar e precipitam (por centrifugação), junto com as proteínas da bactéria e restos celulares. O DNA plasmidial, ao contrário, renatura-se rapidamente e torna-se muito solúvel em água, não podendo ser precipitado. Assim, recolhendo o sobrenadante, teremos essencialmente DNA plasmidial, com uma contaminação pequena de DNA cromossômico bacteriano.

            Uma vez com os dois DNAs disponíveis (doador e plasmidial), resta cortá-los com a enzima de restrição escolhida e misturar os dois DNAs. A tendência será parear as extremidades coesivas, formando construções híbridas, ou quimeras. A adição de ligase completa a cadeia fosfodiéster em cada uma das fitas de DNA. Este passo está representado na parte superior da figura abaixo.

Figura 5:  Esquema para a obtenção de plasmídeos recombinantes, a partir do uso de uma enzima de restrição que cria extremidades coesivas. Para maiores detalhes veja o texto abaixo.

            Ao menos 5 produtos distintos podem ser formados a partir desta mistura. O produto 1 é o desejado, no qual um inserto (verde) foi clonado no plasmídeo (vermelho). Mas, lamentavelmente, outras construções também aparecem: o produto 2 é o mais danoso ao processo, pois se trata do plasmídeo vazio, fechado sem inserto. Ele é perfeitamente funcional e não pode ser descartado do processo. O produto 3 é a circularização de vários fragmentos de DNA do doador, numa ordem qualquer. Este "lixo" não é problemático, porque não contém uma origem de replicação bacteriana. É um DNA que será perdido ao longo do tempo. O produto 4 é a união de dois (ou mais) plasmídeos e não se replica tão rápido quando o plasmídeo vazio ou carregado com apenas um inserto, de forma que acaba desaparecendo ao longo do tempo. O último "lixo" é o plasmídeo carregado com vários insertos catenados (ligados em cadeia) ou com um inserto muito grande. É uma construção instável, também, e tende a desaparecer. Assim, excetuando o plasmídeo vazio, todos as outras quimeras "lixo", uma vez na bactéria, tendem a desaparecer e não são um problema para o experimentador.

            Uma vez ligado o inserto com o plasmídeo (e produzidos os vários possíveis lixos, também), é preciso introduzir estas construções na bactéria hospedeira. Isto é feito pela entrada passiva de DNA através da membrana de bactérias previamente tratadas com uma solução de cloreto de cálcio, ou ativamente, através de choques elétricos, num processo chamado eletroporação. A eficiência de transformação (entrada de DNA na bactéria) é bastante baixa (10-3 a 10-8), mas os transformantes terão o plasmídeo dentro deles, o que lhes deve conferir propriedades novas, que permitam uma seleção positiva. De fato, os plasmídeos têm uma gene que confere à bactéria a resistência a um certo antibiótico (suponhamos, ampicilina), de forma que basta adicionar ampicilina ao meio e eliminaremos rapidamente todas as bactérias que não tiverem plasmídeo (vazio ou carregado).

            E como se ver livre do "lixo" representado pelas bactérias que têm o plasmídeo vazio? Não é possível, pois o plasmídeo vazio confere a mesma resistência ao antibiótico que o plasmídeo carregado. Entretanto, é possível averiguar ao menos se, no conjunto de plasmídeos formados, a maior parte está carregada (com inserto) ou, ao contrário, vazia. Para tal os plasmídeos de clonagem têm uma segunda marca de resistência a antibióticos (em geral, tetraclina), que é perdida quando o plasmídeo é aberto e o inserto é clonado. Significa dizer que o sítio de clonagem é interno ao gene para a resistência à tetraciclina. Significa também dizer que as bactérias que têm plasmídeos vazios são resistentes a ampicilina e tetraciclina, enquanto as que têm plasmídeos com inserto só mostram resistência a ampicilina. O procedimento baseia-se na obtenção de uma réplica de uma placa de Petri contendo colônias crescidas em presença de ampicilina, que é então carimbada sobre uma nova placa de Petri contendo tetraciclina. As colônias que crescerem também em tetracilcina não interessam, mas podem ser contadas. A figura abaixo mostra esquematicamente o procedimento, desenvolvido para outros fins, há quase 50 anos, por Joshua Lederberg, que também recebeu o Prêmio Nobel pelos seus estudos (Joshua Lederberg, George Beadle e Edward Tatum receberam o prêmio Nobel de Fisiologia ou Medicina em 1958. Lederberg provou a existência da recombinação genética em bactérias e contribuiu de forma importante para o conhecimento da organização gênica de microrganismos. Beadle e Tatum mostraram que os genes agem regulando eventos químicos definidos. As Palestras Nobel dos três pesquisadores estão disponíveis no site de downloads).

Você pode ver uma animação da clonagem em plasmídeos neste site (é um arquivo muito grande e exige que você tenha o QuickTime movie player instalado):

http://www.ncbi.nlm.nih.gov/books/data/mcb/pictures/ch7/ch7anim2.mov

Figura 6.  O processo conhecido como réplica, na qual um carimbo de veludo estéril, facilmente improvisado sobre um cilindro de madeira, serve para transferir um pouco de bactérias de cada colônia de uma placa para outra. Após 24 horas o crescimento na nova placa é avaliado. Neste caso a primeira placa contém meio de cultura adicionado de ampicilina, enquanto na segunda o meio contém tetraciclina. Da figura pode-se concluir que a maior parte das bactérias da amostra é sensível à tetraciclina e alberga, portanto, plasmídeos recombinantes (quiméricos, ou com inserto).

 

6. Biblioteca genômica: todo o genoma em pedaços...           

O conjunto de bactérias albergando plasmídeos quiméricos ou recombinantes construídos a partir de DNA genômico é chamado biblioteca genômica. Em princípio, se cortamos um genoma de um organismo qualquer em pedaços com uma enzima e construímos uma biblioteca suficientemente grande (isto é, com muitos clones, ou bactérias, diferentes uns dos outros), teremos uma probabilidade alta de termos qualquer fragmento de DNA desejado em algum dos clones. Esta meta, contudo, não é tão simples de ser alcançada. As enzimas de restrição só cortam nos seus sítios específicos e as regiões ricas em repetições muitas vezes não têm nenhum sítio de restrição. Como o DNA dos eucariotos superiores é muito rico em regiões repetidas, o que ocorre é que uma parte relativamente grande do genoma não pode ser clonada desta forma.

            O recurso para obter fragmentos de tamanho razoável (1 a 4 kpb) ao longo de todo o genoma é a fragmentação do DNA por nebulização ou por outro método mecânico qualquer e a clonagem dos fragmentos em um vetor aberto com uma enzima que produz extremidades cegas. Desta forma pode-se obter mais facilmente uma biblioteca genômica que represente efetivamente todo o genoma.

7.  Clonagem e expressão: o problema dos introns

            Um dos principais objetivos da clonagem é a expressão do segmento clonado. Em geral entendemos por expressão do gene a proteína que ele codifica. Assim, se clonarmos um gene qualquer de um mamífero, desejamos em geral que ele possa ser expresso num outro organismo, digamos, uma bactéria, de forma que possamos obter grandes quantidades da proteína do mamífero a partir de uma cultura bacteriana. É o que imaginamos quando ouvimos falar na produção de insulina humana por bactérias. Entretanto, expressar genes eucariotos em bactérias não é uma tarefa tão fácil quanto a princípio possa parecer.

            Neste e nos próximos sub-itens vamos discutir as razões pelas quais um gene eucarioto em geral não pode ser expresso num procarioto se clonado diretamente num plasmídeo ou fago. Vamos discutir que estratégia pode ser adotada para contornar esta limitação. Vamos também discutir como deve ser o desenho de um plasmídeo (ou outro vetor) de expressão para permitir a produção de proteína a partir do gene clonado. E veremos como deve ser a hospedeira para que o produto final seja de interesse para o pesquisador. Por fim, vamos discutir como são as proteínas recombinantes, ou quimeras, e como podemos nos beneficiar destas construções protéicas artificiais.

            Como mostrado na aula 2, é comum nos eucariotos que o quadro aberto de leitura ou ORF (a região do gene que vai deste o primeiro ATG a ser traduzido até o códon de terminação) seja interrompido por um ou mais trechos de DNA que não serão posteriormente traduzidos, pois serão retirados do conjunto, no nível do RNA, no processo de maturação do RNA mensageiro. Este mecanismo de retirada de segmentos de DNA não codificantes, chamados íntrons, é conhecido como splicing.

            A figura abaixo mostra uma estrutura hipotética, genérica, de um gene eucarioto, e a geração de um mRNA eucarioto por splicing e adição de cauda poli-A, acompanhadas de modificação da extremidade 5´(capping). Adicionalmente, mostramos como seria a organização de um mRNA com introns, produzido a partir do mesmo segmento gênico, por um procarioto (por exemplo, a bactéria hospedeira de um plasmídeo recombinante).

Figura 7: Após a produção do transcrito primário, os spliceossomos aproximam o fim e o início de exons adjacentes e formal um laço com o intron, preparando o conjunto para a retirada da região intrônica (1). O RNA gerado após o splicing dos introns (2) ainda não é um mRNA maduro, pois terá ainda retirada uma porção 3´ após o sinal de poliadenilação, deverá receber uma cauda poli-A e a modificação da extremidade 5´(cap 7-metil-guanosina) (3). Um procarioto não é capaz de realizar o splicing e o sistema de tradução considerará como mRNA válido o RNA transcrito primário (4), desde que os ribossomos possam se ligar ao RBS da sequência (nos sistemas de clonagem com expressão veremos que o RBS faz parte do vetor).

 

            É fácil, após a análise da figura acima, entender que um procarioto não será capaz de produzir uma proteína igual àquela produzida pelo eucarioto, se iniciar o processo com genes contendo introns. Na verdade, mesmo um outro eucarioto poderá não fazê-lo se o sistema de splicing não compreender os sinais de splicing (sequências de bases) contidos no início e no fim dos introns. Por isso, a estratégia para se clonar e expressar genes eucariotos tem que ser distinta da apresentada na aula 5.

 

8. Como fazer um DNA eucarioto sem introns?

            Precisamos necessariamente partir de genes cujos introns já foram retirados (salvo algumas exceções, quando os genes não contiverem introns, como é o caso de muitos protozoários, por exemplo). Portanto, precisamos partir de RNAs mensageiros (que não contêm introns) e seguir um caminho inverso, inicialmente, produzindo DNA, para depois, então, clonar este DNA no vetor e permitir que seja traduzido de volta num mRNA sem introns.

            Há vários procedimentos para se produzir um DNA fita dupla a partir de um mRNA. Este DNA é chamado cDNA, pois a primeira etapa de sua construção envolve a produção de um DNA complementar (daí o C...), como será visto na próxima figura. Neste capítulo vamos discutir um método que permite criar um DNA fita dupla com extremidades coesivas diferentes nas pontas 5´e 3´, de tal forma que, na hora de se clonar o segmento no vetor, a clonagem será uni-direcional, isto é, o inserto entrará apenas num sentido.

            O processo se inicia pela extração do mRNA. Este processo é, do ponto de vista bioquímico, semelhante ao processo de extração de DNA, porém o RNA é muito lábil, sujeito à ação das RNAses do próprio organismo e de praticamente qualquer fluido biológico, inclusive a água não autoclavada. Tomadas as devidas precauções (e empregando kits comerciais, de preferência) pode-se obter uma boa quantidade de RNA praticamente a partir de qualquer célula eucariota. Mas o que queremos é mRNA, e não RNA total (uma mistura de RNA heterogêneo nucelar, RNA transportador, RNA ribossomal e pequenos RNAs do núcleo, além de mRNA). Por isso, empregamos uma segunda etapa de purificação, onde o mRNA é separado por cromatografia de afinidade dos demais RNAs. Geralmente se usa um kit, no qual uma pequena seringa cheia de gel de sepharose ligada a oligonucleotídeos poli-T serve de sistema de captura dos mRNAs (pela extremidade poli-A, que vai parear com os poli-T do gel). Após lavar com tampão tudo o que não ficou aderido, desloca-se o mRNA da coluna com uma solução de alta força iônica e, pronto! Temos em três ou quatro gotas de tampão mRNA suficiente para obter uma biblioteca de cDNA.

            Em seguida vamos discutir o processo de produção do DNA fita dupla a partir de mRNA. O processo, que é todo conduzido em tubo de ensaio, se inicia pela produção de um DNA complementar fita simples, a partir do mRNA. Como a transcriptase reversa necessita de um primer para iniciar sua tarefa, empregamos oligonucleotídeo poli-T. No caso mostrado na figura, detalhe (1), o oligo dT é prolongado, no sentido 5´, por um conjunto de bases que contém o sítio de restrição para uma enzima A (neste caso, a enzima XhoI, cujo sítio de restrição é 5´- CTCGAG - 3´). Esta é a forma de adicionarmos ao nosso futuro DNA um sítio de restrição conhecido bem na extremidade 3´.

            Uma vez pareado, o primer vai permitir a síntese da primeira fita de DNA, que será estendida com a ajuda da transcriptase reversa e com dNTPs (desoxirribonucleotídeos tri-fosfato), como na síntese de DNA normal (etapa (2)). Para proteger a fita de DNA contra a ação de enzimas de restrição (que serão empregadas mais adiante), o sistema de reação tem, no lugar de desoxicitosina-trifosfato, um precursor metilado, a 5´-metil-citosina-trifosfato, que vai impedir a ação das duas enzimas de restrição sobre o DNA recém sintetizado, numa etapa posterior que já iremos comentar. A transcriptase reversa tende a parar seu processo de síntese de DNA complementar antes de chegar ao início do mRNA (estamos produzindo o cDNA de "trás para frente"). Esta parada é ocasionada, em parte, por uma atividade RNásica residual da enzima, que pode degradar o RNA que ela mesma está prestes a copiar como DNA. Nos kits modernos a transcriptase reversa recombinante empregada tem uma atividade RNásica muito pequena, mas ainda assim se observa uma parada da produção do cDNA antes da extremidade do mRNA, por razões ainda não completamente compreendidas, e que acaba gerando um cDNA mais curto que o mRNA original. Mais adiante discutiremos a importância da perda de informação genética nesta região 5´ do cDNA.

            Para a síntese da segunda fita de DNA a maior parte dos kits comerciais usa um artifício, denominado nick translation (tradução por cortes), que é uma denominação muito mal encontrada pelos seus inventores para o processo de replicação de DNA descrito a seguir. Inicialmente, com o uso da atividade endonucleásica de uma enzima adequada, inserimos pequenos cortes na cadeia de fosfatos do RNA (os chamados nicks). Estes cortes criam automaticamente extremidades 3´-OH, que servirão de apoio para que a DNA polimerase (em geral o chamado fragmento Klenow da DNApol I bacteriana, que polimerisa mas não faz revisão da síntese). Estes nicks estão mostrados na etapa (3). A partir deles a DNApol I (ou o fragmento Klenow) sintetiza pequenos trechos de DNA, apoiando-se nas extremidades 3´-OH criadas pelos nicks. Ao término desta etapa a DNA pol produz uma série de fragmentos e reconstitui, em fita dupla, o sítio Xho I na extremidade 3´ do DNA (detalhe (5)).

 

Figura 8:  Síntese de cDNA para clonagem uni-direcional em vetor de expressão. Cada etapa está discutida no texto. Os círculos vermelhos representam as bases metiladas. A seta na etapa 4 aponta para um nick ou corte.

            Em seguida os fragmentos são ligados entre si pela ação da ligase (etapa (6)) e eventuais saliências (overhangs) da fita são retirados pela ação de uma exonuclease adicionada ao tubo. Esta ação é chamada de trimming (segundo detalhe (6)). A próxima etapa é a adição de adaptadores, que são pequenos fragmentos de DNA fita dupla contendo um sítio de restrição para uma segunda enzima (no exemplo, o sítio GAATTC, da enzima EcoRI). Estes adaptadores são colados durante algumas horas pela incubação do DNA 'trimado" na presença de ligase. O resultado é o que está mostrado na etapa (7). A adição de vários adaptadores em cada extremidade é minimizada por um artifício bioquímico, que envolve a desfosforilação de uma das extremidades 5´ dos adaptadores.

            O penúltimo passo é o corte do fragmento de DNA fita dupla com as duas enzimas de restrição para as quais adicionamos sítios (neste caso, Xho I e Eco RI), mostrado na etapa (8).  As duas enzimas cortam o DNA formando extremidades coesivas, isto é, deixando bases despareadas, numa saliência (overhang) 5´. As duas enzimas não podem cortar o DNA recém sintetizado em algum sítio de restrição interno, pois ele está protegido pela adição das bases metiladas na primeira etapa de síntese. Os adaptadores e o sítio XhoI, contudo, não têm esta proteção e podem ser clivados. Os fragmentos de DNA gerados por estes cortes são eliminados de nosso tubo por uma reação de filtração ou de precipitação e o DNA fita dupla, pronto para ser clonado unidirecionalmente, fica disponível finalmente (etapa (9)).

 

9.  Biblioteca de cDNA e características de um vetor de expressão para Escherichia coli.

               A clonagem dos insertos de cDNA em plasmídeo e a transformação de bactérias com estes plasmídeos gera uma biblioteca de cDNA. Assim, da mesma forma que definimos para biblioteca genômica, a biblioteca de cDNA é o conjunto de bactérias, cada qual transportando múltiplas cópias de um plasmídeo carreando um inserto representando um cDNA qualquer obtido do material biológico doador de mRNA. Se o plasmídeo tiver certas características básicas que permitam a expressão do inserto clonado, será produzida uma proteína recombinante. Como deve ser este plasmídeo?

                Inicialmente, devemos ter em mente que os cDNAs gerados pelo sistema descrito acima nem sempre contêm toda a ORF (o quadro aberto de leitura) do gene. O esquema abaixo mostra as várias possibilidades, fruto do fato de que a transcriptase reversa encerra aleatoriamente seu trabalho de síntese da primeira fita . 

 

  

Figura 10:  Vários cDNAs de tamanhos diferentes são produzidos a partir do mesmo mRNA. A razão desta variação é o abandono da síntese da primeira fita pela enzima transcriptase reversa em diferentes momentos da síntese, provavelmente devido à clivagem do RNA mensageiro adiante dela pela ação remanescente de RNAseH que existe naturalmente nesta enzima. O mRNA original (1) é em geral mais longo do que qualquer um dos cDNAs gerados pela ação da trascriptase reversa. O mais curto (4) não contém sequer um trecho da ORF. UTR = "untranslated region" ou região não traduzida.

            Como as ORFs costumam ser muito mais longas do que as UTRs (veja proporções no alto da figura 5.10), a maior pare dos cDNAs gerados cai no caso descrito em 3, isto é, contém uma parte da ORF e a região 3´ não traduzida (3´- UTR).

 

            Se clonarmos unidirecionalmente o cDNA com a estrutura mostrada em (3), Figura 5.10 num vetor de expressão, teremos que disponibilizar no vetor um promotor à esquerda (5´) do fragmento clonado. Deveremos também adicionar um operador ao sistema para que a hospedeira não corra o risco de se intoxicar e morrer com uma quantidade grande de proteína recombinante (que, por não ser normalmente um produto da hospedeira, perturba seu metabolismo, sobretudo quando está em grandes quantidades, o que é geralmente o caso de proteínas recombinantes). Além disso, pelo fato de que a ORF clonada é em geral incompleta e não contém o ATG inicial, precisamos também acrescentar um ATG (e um RBS antes dele) para garantir a síntese de proteína a partir do mensageiro. A figura abaixo mostra esquematicamente estas propriedades do plasmídeo e a conseqüente proteína recombinante gerada pela clonagem.

 

Figura 11  Esquema representativo de um vetor de expressão que emprega parte do operon lac (muito modificado) para garantir a expressão controlado dos insertos clonados no sítio múltiplo de restrição (MRS). Veja o texto abaixo para detalhes. A cabeça do cavalo é a parte aminoterminal da proteína (NH2) e cauda da tartaruga a extremidade carboxi-terminal (COOH).

            O exemplo dado na figura é bem próximo à realidade, isto é, assemelha-se a plasmídeos comerciais que são frequentemente usados nos laboratórios de pesquisa e desenvolvimento. Vamos analisar detalhadamente cada parte da figura.

             Observe que o local onde a clonagem será feita é chamado MRS ou sítio múltiplo de restrição, por conter vários sítios de restrição muito próximos e únicos em todo o plasmídeo. A vantagem deste arranjo sobre aquele que emprega uma única enzima é que o experimentador tem muito mais liberdade de escolher a enzima de restrição que irá empregar para contar o DNA doador. Além disso, ele pode cortar o vetor com duas enzimas e obter extremidades diferentes à esqueda (5´) e à direita (3´), o que permitirá a clonagem unidirecional dos fragmentos gerados com a técnica descrita na figura 5.8.

            A clonagem será feita, neste exemplo, dentro do gene lacZ. Consequentemente, se a bactéria hospedeira for lacZ-, ela se tornará lac+ quando receber o plasmídeo vazio (sem inserto) e permanecerá lac- se receber um plasmídeo recombinante (carregando um inserto). Mediante o uso de um indutor do sistema (no caso, um análogo de latose, o IPTG ou isopropil-tio-galactosídeo) e um indicador da atividade da b-galactosidase (a X-gal), é possível visualizar como colônias azuladas aquelas formadas por bactérias com plasmídeos vazios e como colônias transparentes aquelas formadas por bactérias com plasmídeos recombinantes. É a chamada "seleção por cor".

            Após o gene lacZ é indispensável um sinal de terminação da tradução, que terminará a síntese do mRNA. Ele está indicado como uma pequena caixa preta, marcada com um t. O mRNA, por sua vez, termina num grampo, seguido de um poli-U, representado por uma pequena elipse rosa cortada por 3 Us.

            A síntese de mRNA é iniciada no promotor e está sob controle do operador. Assim, a bactéria só irá expressar a proteína recombinante se houver indutor no meio, evitando que ela morra intoxicada com a proteína recombinante que está fazendo. Embora o promotor lac seja fraco na Natureza, o que se emprega para clonagem é um promotor mutante forte.

            Como não podemos ter certeza de que o primeiro ATG da ORF original do gene obtido do organismo doador está disponível (o que implicaria dizer que a transcriptase reversa teria copiado toda a região 3´não-traduzida mais toda a ORF antes de parar), convém contar com a presença de um ATG no plasmídeo, que é justamente o ATG do gene lacZ. É indispensável também ter um RBS procarioto antes deste ATG, como indicado pelas caixas azuis na figura, para fazer do RNA transcrito um verdadeiro mRNA.

            Na figura acima o inserto clonado contém parte da ORF do organismo doador e a extremidade 3´ não traduzida (3´ UTR). Quando se dá a clonagem, o gene lacZ fica interrompido. A primeira parte do gene servirá para codificar os primeiros aminoácidos da proteína recombinante (representados pela cabeça de cavalo ao final do esquema). A segunda metade nunca será expressa porque os ribossomos terminarão a síntese num códon de terminação muito anterior ao início do trecho restante do lacZ. No caso específico do exemplo da figura, o inserto contém parte da ORF (presumivelmente no mesmo quadro de leitura do lacZ, 1a. parte) e portanto há no fim desta ORF um códon de terminação do gene do organismo doador. Se o quadro de leitura estiver errado ou se apenas a extremidade 3´ UTR for clonada, existe uma pequena chance de que os ribossomos alcancem a 2a. parte do lacZ, mas provavelmente fora do quadro de leitura (2 chances em 3). De uma forma geral, podemos afirmar que a segunda parte do lacZ nunca é traduzida.

            A partir do ATG após o RBS plasmidial, forma-se então uma ORF que termina em geral no códon de terminação (stop) do gene doador. É necessariamente uma ORF recombinante, que dará consequentemente origem a uma proteína recombinante, ou quimérica. A proteína é sempre muito menor do que o mRNA sintetizado a partir do promotor lac do plasmídeo. A "cabeça" beta-galactosidase da proteína recombinante (ou quimérica) não é enzimaticamente ativa.

        Esgotada a discussão da figura, podemos ainda discutir outras características do plasmídeo de clonagem e expressão. Como o exemplo de plasmídeo discutido na construção de bibliotecas genômicas , este também deve conferir à bactéria uma marca seletiva. Em geral, esta marca é a resistência a um antibiótico. Os plasmídeos comerciais em geral empregam a marca de resistência à ampicilina. Por fim, o plasmídeo deve ter uma origem de replicação autônoma e relaxada, que permita a geração de um grande número de cópias por bactéria.

            Muitos plasmídeos apresentam outras características interessantes, mais ou menos comuns a todos. Uma delas é a existência de sequências de bases antes e depois do inserto que permitirão a hibridização de primers para o sequenciamento do inserto. No capítulo seguinte falaremos em maiores detalhes sobre esta estratégia.

            Como saber se a biblioteca de cDNA que construímos tem qualidade, isto é, têm a maior parte dos clones cheia com insertos? No exemplo dado na figura acima temos um poderoso recurso, a seleção por cor. De fato, basta plaquear no meio indicador (contendo IPTG e X-gal) a bactéria e poderemos em poucas horas avaliar se a porcentagem de colônias brancas é muito maior que a de colônias azuis. Uma biblioteca razoável deve ter ao menos 90% de colônias brancas.

    Outro aspecto importante é a representatividade de nossa biblioteca. Assim que a construímos, podemos calcular quantos clones (uma bactéria carregando um grande número de cópias do mesmo plasmídeo recombinante) independentes geramos no volume total de nosso ensaio. Se a maior parte dos clones estiver com inserto, podemos assumir que a biblioteca será representativa se tiver ao menos 500.000 clones. Mas porque um número tão grande, se não há nenhum organismo que expresse um número tão grande de genes? De fato, 100.000 genes é quase o limite para o número de genes de um organismo complexo como o homem. Entretanto, devemos nos lembrar que os genes muito expressos gerarão muitos cDNAs e, conseqüentemente, muitos clones, enquanto que os genes pouco expressos poderão gerar apenas um clone na mistura total. Por isso, é necessário sempre um número de clones independentes muito maior do que o total esperado de genes expressos no material empregado para a construção da biblioteca de cDNA.

10. Seleção (triagem ou screening) de clones pela expressão da proteína recombinante.

            Se desejarmos encontrar em nossa biblioteca de cDNA um clone qualquer, geralmente o que fazemos é procurar pelo clone que está expressando a proteína que queremos. Mesmo considerando que a proteína é quimérica, ela terá ao menos uma porção (final) da proteína de interesse. Para uma triagem voltada à proteína, geralmente empregamos como sondas anticorpos, obtidos pela imunização de camundongos ou coelhos com uma proteína de mesma função, purificada de outro organismo, ou mesmo recombinante, mas de outra origem. Como os anticorpos produzidos são policlonais e dirigidos contra múltiplos epitopos ao longo da proteína, é muito provável que reconheçam a parte da proteína recombinante que teve origem no inserto (o corpo de tartaruga da figura acima), mesmo que os anticorpos tenham sido feitos contra uma proteína semelhante de outro organismo.  

            Para que os anticorpos possam encontrar as proteínas recombinantes, é essencial que as bactérias sejam rompidas e o conteúdo protéico fixado num substrato adequado. De forma semelhante ao que fazemos na triagem de bibliotecas genômicas, uma membrana circular (desta vez de nitrocelulose, que adere proteínas; no caso das bibliotecas genômicas a membrana é de nylon, que adere o DNA) é colocada sobre uma placa de Petri quando as colônia de uma pequena alíquota da biblioteca ainda estão pequenas. Deixa-se que as colônias cresçam algumas horas em contato com a membrana, que é então retirada. A placa (master) deve ser mantida na geladeira. As bactérias são lisadas, o conteúdo bacteriano é sondado pelos anticorpos, que se ligarão às manchas protéicas onde há a proteína recombinante que eles reconhecem. O excesso de anticorpos é lavado com tampão e os anticorpos fixados são revelados pelo uso de um conjugado adequado (anticorpo anti-anticorpo, ligado à enzima peroxidase, por exemplo) e de um substrato que possa ser visualizado facilmente (no caso da peroxidase, pode ser empregada a tetrametilbenzidina como substrato cromogênico e o peróxido de hidrogênio como doador de oxigênio reativo). As manchas reativas indicarão na placa de Petri master a posição das colônias de interesse.

            É evidente que também podemos empregar, como fizemos para a triagem de bibliotecas genômicas, sondas de DNA, mas os clones encontrados não necessariamente estarão expressando os insertos na forma de proteínas recombinantes, porque os insertos podem estar fora do quadro de leitura inicial do lacZ.

            Há muitos detalhes técnicos na triagem que não discutimos, porém a base do processo está adequadamente esclarecida.

11. Que genes estão representados numa biblioteca de cDNA?

            Ao contrário de uma biblioteca genômica, que contém em princípio qualquer fragmento de DNA do organismo doador, a biblioteca de cDNA contém apenas os genes expressos pelas células empregadas na extração de mRNA, e ainda assim apenas aqueles expressos imediatamente antes do processamento das células no laboratório. Isto implica dizer que uma biblioteca feita com células do meristema apical de uma planta terá muitos genes diferentes de uma outra biblioteca feita a partir de estame. Mas também terá muitos outros iguais, pois há genes que são expressos em diferentes tecidos e mesmo outros expressos em qualquer tecido.

 

12. Proteínas recombinantes: as quimeras são desejáveis?

            Ao examinarmos a proteína recombinante esquematicamente representada na figura 11 poderíamos nos perguntar: para que serve uma proteína híbrida, parte beta-galactosidase bacteriana e parte proteína de meu organismo de estudo? Não seria mais sensato ter apenas a parte não bacteriana para ensaiar?

            Mesmo uma proteína quimérica pode ter aplicação imediata. Apenas como exemplo discutimos duas aplicações rotineiras: como antígeno diagnóstico e como vacina.

            Se desejamos empregar uma proteína recombinante para diagnóstico (suponhamos, uma proteína que se inicia com a beta-gal e termina com uma fração carboxi-terminal da tubulina de Leishmania), podemos fixá-la aos micropoços de uma placa de ELISA. Em seguida, o soro dos pacientes pode ser previamente misturado com uma solução contendo extrato de Escherichia coli, de forma a imunoadsorver na fase líquida todos os eventuais anticorpos do paciente contra proteína bacteriana, em geral, e contra a beta-galactosidase em particular. Por fim, basta pipetar o soro imunoadsorvido sobre os micropoços. Os anticorpos livres contra atubulina de Leishmania (presentes no soro dos pacientes com leishmaniose) vão aderir à à parte recombinante da tubulina e ficarão presos ao plástico. O excesso de anticorpos é lavado e a presença dos anticorpos fixados à tubulina detectada como descrito acima para a triagem de colônias. Poder-se-ía argumentar que os anticorpos humanos são produzidos contra a tubulina completa, e não reconheceriam apenas parte dela. Entretanto, com dito acima, a produção de anticorpos numa imunização e numa infecção é, em geral, policlonal, e dirigida contra muitos epitopos, que podem estar na parte amino (não presente na nossa proteína recombinante) ou na parte carboxi-terminal (representada pelo corpo de tartaruga da figura 11).

            Esta abordagem é especialmente interessante quando o antígeno (uma proteína ou uma mistura de componentes do organismo infectante) é difícil de conseguir. É o caso da filariose bancroftiana, pois o único hospedeiro do parasita Wuchereria bancrofti é o ser humano. Não é ético e viável obter grandes quantidades de microfilárias de um paciente para diagnosticar os demais! A produção de uma biblioteca de cDNA também depende de microfilárias ou vermes adultos de um paciente, mas é evento único e uma vez construída a biblioteca não será mais necessário voltar a obter parasitas do paciente.

            No caso de desejarmos fazer uma vacina, a abordagem é semelhante: basta inocularmos a proteína recombinante no mamífero que desejamos imunizar, com ou sem adjuvantes. É preciso apenas ter atenção para a imunogenicidade da parte plasmidial da proteína recombinante. A beta-galactosidase é pouco imunogênica e pode ser empregada, mas outras construções usam polipeptídeos mais imunogênicos,  que devem ser empregados com cautela.

                Se, por qualquer razão, não podemos de forma alguma usar uma proteína quimérica, podemos lançar mão de vetores que têm imediatamente antes do sítio de restrição empregado na clonagem uma sequência de bases que codifica um pequeno peptídeo reconhecido e cortado por uma enzima adequada. Na figura 11 é como se a cabeça de cavalo estivesse ligada ao corpo da tartaruga por uma pequena haste de peptídeo, que pode ser cortada por uma enzima. Podemos então capturar as proteínas recombinantes da lise bacteriana por uma coluna de cromatografia de afinidade com anticorpos dirigidos contra a parte plasmidial da proteína recombinante (a cabeça de cavalo). Uma vez lavada a coluna para retirar o material não fixado, adiciona-se a ela um pequeno volume de tampão contendo a enzima que corta a união entre a cabeça e o corpo, e recolhe-se no efluente da coluna apenas a parte que interessa (proteína do organismo doador) da proteína quimérica.

 

 

III. PCR - Uma técnica de mil e uma utilidades

Esta aula é bastante longa. Por isso optamos por construir internamente links para seus diversos temas, tabelados abaixo. Basta clicar sobre o tema de interesse.

Sinopse da aula

Primeiros passos - Introdução ao PCR
PCR na investigação de Paternidade
PCR na investigação de crimes
PCR no diagnóstico de enfermidades genéticas
PCR em tempo real - o sistema Taqman
Um pouco de história
Artigos importantes sobre PCR
 

 

A. Primeiros passos

Ainda na década de 60 muitos pesquisadores procuraram obter a síntese de DNA in vitro. É evidente que obter DNA em tubo de ensaio é o primeiro passo para um universo de experimentos em genética molecular. O primeiro a conseguir caminhar neste sentido foi Arthur Kornberg, de quem já falamos na aula sobre replicação do DNA. Era natural, já que Kornberg era um profundo conhecedor das DNA polimerases. A síntese de um DNA viral in vitro foi recebida com entusiasmo por todos, inclusive a imprensa leiga, que qualificou o feito como a criação da vida em laboratório. Esta metáfora tem sido usada pela imprensa com insistência em várias ocasiões, sempre que se trata de manipular o DNA de um ser vivo, e em geral provoca mal estar entre os pesquisadores, o que foi o caso de Arthur Kornberg.

Em 1983, Kary Mullis, então pesquisador empregado na Cetus Corporation, EUA, imaginou uma forma de fazer com que a DNA polimerase iniciasse e terminasse seu trabalho em trechos pré-determinados do DNA. Com o sistema seria possível amplificar milhões de vezes um pequeno trecho de um longo segmento de DNA. A idéia foi aprimorada na Cetus e apresentada pela primeira vez em 1985, numa conferência. Depois disso a técnica, conhecida como PCR, ganhou quase instantaneamente uma aceitação mundial e em menos de uma década tornou-se o procedimento básico de todo laboratório de genética molecular no mundo.

Mas, afinal, o que é a PCR?

A sigla significa "polymerase chain reaction", que em português seria reação em cadeia da polimerase. Então, a base da técnica é a ação in vitro da DNA ´polimerase. Para compreendermos como funciona a técnica, que é na verdade bem simples, precisamos recordar que, para iniciar a síntese de uma fita nova, a DNA polimerase precisa de um primer (de RNA ou de DNA), de um DNA molde e de precursores de síntese de DNA, coletivamente chamados dNTPs (desoxinucleotídeos tri-fostato, i.e., dATP, dTTP, dCTP e TGTP).

A idéia de Mullis era simples. Adicionava-se ao tubo de ensaio um pouco de DNA contendo o trecho que queria amplificar, os dNTPs, a DNA pol e dois primers de DNA feitos em laboratório, um hibridizando numa fita e "apontando" para o outro, que hibridizava com a outra fita e "apontava" para o primeiro. A distância entre os sítios de pareamento dos dois primers não podia ser muito grande, e foram escolhidos para testes trechos com menos de 1000 pb. Com todos os reagentes no tubo, a reação era inicialmente aquecida a 94 oC, para que todas as fitas de DNA se desnaturassem. Em seguida a temperatura era reduzida para permitir o pareamento dos primers, em geral para 50 oC. Por fim, a temperatura era reduzida ainda mais, até 37 oC, para que a DNA polimerase de E. coli pudesse trabalhar e estender duas fitas simples de DNA, uma a partir de cada primer, duplicando, assim, a sequência alvo escolhida. Ao se repetir o ciclo os primers encontrariam agora dois alvos cada um, a partir do primeiro alvo replicado: um no DNA original e outro na cópia recém sintetizada, gerando, por sua vez, ao fim do novo ciclo, 4 cópias do alvo. É claro que a repetição do processo geraria um número de cópias do alvo que se elevaria exponencialmente, com base 2.

Na verdade, a coisa não foi tão fácil assim: a DNA pol era termoinstável (como a maioria das proteínas dos seres vivos) e se inativava irreversivelmente a 94 oC. Era preciso adicionar mais DNApol no tubo a cada ciclo de extensão. Além disso, a baixa temperatura de funcionamento da DNApol de E. coli propiciava o aparecimento de pareamentos espúrios (sem sentido, errôneos) no sistema, gerando ao final produtos de PCR inesperados.

A solução foi encontrada logo: a DNA pol de E. coli foi substituída por uma DNA polimerase de um microrganismo termo-tolerante, o Thermus aquaticus. A enzima foi batizada de Taq polimerase e permitiu, finalmente, que o PCR se tornasse uma ferramenta extraordinariamente útil na genética molecular. Que propriedades têm a Taq polimerase que a fazem tão útil? Ela é termoestável e sua temperatura ótima de funcionamento é 72 oC. Com isto três problemas ficaram automaticamente resolvidos:

a) não havia mais necessidade de adicionar enzima no tubo a cada ciclo.

b) a menor temperatura do ciclo era a de hibridização, que podia ser mantida acima de 50 oC, evitando hibridizações espúrias.

c) o DNA molde não se renaturava por completo, permitindo uma rápida desnaturação ao se iniciar um novo ciclo.

Adicionalmente, a manutenção do tubo fechado evitava contaminação do material do laboratório e dos estoques de reagentes com os amplicons, nome genérico dado aos produtos de amplificação da PCR. É claro que um amplicon gerado com um par de primers qualquer serve perfeitamente de molde para uma nova reação de PCR com os mesmos primers. A contaminação de reagentes e pipetas com amplicons continua sendo um problema para todos que trabalham com PCR. 

Os eventos ligados às três temperaturas que mencionamos, 94 oC, 50 oC e 72 oC, estão esquematizados na figura abaixo. Observe que, a 94 oC, os primers e as fitas simples de DNA alvo estão misturados, mas não podem parear. Quando a temperatura é reduzida os primers rapidamente alcançam seus sítios de complementariedade, pois são moléculas pequenas e, portanto, muito móveis, e porque estão em concentração muito mais elevada que o DNA alvo. O DNA molde tende a renaturar, mas logo a temperatura é novamente elevada para 72 oC, que permite a extensão das novas fitas a partir dos primers, sem desparear os primers outra vez. Por fim, a temperatura volta a 94 oC, que desnatura todas as fitas, inclusive as recém sintetizadas, recomeçando o processo.

Figura 12: Eventos relacionados às três temperaturas básicas da PCR: Desnaturação a 94 oC, pareamento dos primers a 50 oC e extensão de novas fitas a 72 oC, supondo neste caso que a enzima empregada seja a Taq polimerase ou outra DNA polimerase termo-estável.

 

O processo descrito acima gera dois tipos de fitas simples: uma de comprimento variável, obtida a partir de um primer que tenha hibridizado com a fita de DNA original (em geral um longo fragmento de DNA obtido diretamente de um ser vivo ou de um vírus ou plasmídeo), e outra, de comprimento determinado, que é obtida sempre que um DNA previamente copiado é empregado como molde em sua síntese.

Esta situação está claramente representada na figura abaixo, que mostra os três primeiros ciclos de uma PCR. Observe que a fita estendida a partir de um primer hibridizado com o DNA molde original não tem comprimento fixo, porque o molde é muito longo. Seu comprimento final vai ser determinado  pelo instante em que o primer hibridizar com o sítio de complementariedade e pela tempo de extensão total, à temperatura de 72 oC. As duas primeiras fitas estendidas estão indicadas com a letra e à sua direita. Já as fitas que são produzidas a partir de primers que hibridizaram em fitas previamente copiadas têm fatalmente ser comprimento definido, já que inicia, no primer e terminam ao fim do DNA molde, que é exatamente a e extremidade 5´do primer já incorporado na fita molde. As fitas de comprimento definido aumentam de número exponencialmente, formando aos poucos um imenso número d fita duplas de comprimento definido, enquanto as fitas estendidas aumento linearmente (duas a cada ciclo, por alvo). Uma inspeção da figura a seguir esclarecerá o leitor sobre esta questão.

Figura 13:  Produção de novas fitas a partir de um DNA alvo pela PCR. Após hibridização dos primers a 56 oC, as fitas novas são sintetizadas a 72 oC, dando origem a fragmentos estendidos (indicados no primeiro ciclo pela letra e) e fragmentos amplificados (contornados em amarelo). Os fragmentos amplificados acumulam exponencialmente na reação.

A visualização dos produtos de uma reação de PCR costuma ser feita através do uso da eletroforese em gel. Pode-se usar um gel de poliacrilamida, que corre verticalmente, e corar as bandas de DNA com nitrato de prata ou se pode optar por correr um gel horizontal de agarose e visualizar as bandas por transiluminação UV, "corando" previamente o DNA com brometo de etídio (esta substância se intercala entre as fitas de DNA e nestas condições absorve o UV e fluoresce com cor alaranjada).  O produto de PCR será sempre um DNA fita dupla e o que distingue um do outro, no gel, será apenas o comprimento relativo. Esta situação está representada no esquema da figura seguinte.

Figura 14:  Visualização de três reações de PCR. Em a e b dois produtos são gerados, a partir de dois pares de primers diferentes. Os dois produtos têm comprimentos de 400 e 360 pb. A migração das bandas na eletroforese é de cima para baixo. O fragmento menor migra mais rápido e produz a banda em vermelho. O maior se desloca mais lentamente no gel e produz a banda em verde. A coluna c é um controle negativo, essencial em qualquer reação de PCR. A coluna d mostra os marcadores de peso molecular (neste caso, uma escada de DNA - DNA ladder - de 100 pb). Na transiluminação ou na coloração por prata, evidentemente, todas as bandas têm a mesma cor.

Quando fazemos um PCR, a prática aconselha a deixar o tubo com os reagentes por 5 a 10 minutos a 94 oC antes de iniciar o ciclo. Em geral 1 minuto a cda temperatura é suficiente para as etapas do ciclo, que é repetido de 35 a 40 vezes. Por fim, ao terminar a última extensão muitas vezes os protocolos experimentais sugerem a manutenção da temperatura de 72 oC por mais 5 a 10 minutos. A opção de esperar 10 minutos antes de começar o ciclo, mantendo o tubo aquecido, garante que todo o DNA alvo esteja desnaturado antes de se iniciar o ciclo. Por outro lado, o período final a 72 oC garante que todas as fitas terão o mesmo comprimento pois pode acontecer que, durante o ciclo, algumas fitas copiadas não tenham atingido o fim do molde. A figura a seguir sintetiza o ciclo da PCR.

Figura 15: Ciclo padrão de uma PCR. Antes de iniciar o ciclo o tubo com os reagentes é mantido a 94 oC para garantir a desnaturação inicial de todo DNA alvo. Da mesma forma, ao terminar o ciclo, a manutenção do tubo a 72 oC garante que todos as fitas tenham exatamente o mesmo número de bases.

Quando PCRs são realizadas, gerando produtos de diferentes comprimentos, e estes produtos são analisados por transiluminação UV em gel de agarose, o resultado que se obtém pode ser semelhante ao mostrado abaixo. O menor dos produtos migra mais rápido e gera a banda mais em baixo no gel. Em geral o gel de agarose separa bem fragmentos entre 150 pb e 1000 pb. Fora desta faixa pode ser necessário usar um gel de poliacrilamida.

Figura 16:  Imagem obtida de um gel de agarose mostrando bandas correspondentes a produtos de PCR com diferentes comprimentos (número total de pares de bases) (colunas 2 a 5). Na coluna 1 estão os marcadores de peso molecular, fragmentos de DNA fita dupla de comprimento conhecido, obtidos por digestão por enzima de restrição de um DNA conhecido ou sintetizados por máquinas. A coluna 6 é um controle negativo e a pequena banda difusa no fim do gel é apenas a fronteira da eletroforese.

Nos dias de hoje uma PCR é feita numa máquina chamada termociclador. É simplesmente um bloco aquecido, controlado por um sistema digital, que eleva e abaixa a temperatura do material nele inserido (tubos de ensaio pequenos, micro-placas de 96 poços, etc), de acordo com a programação digitada pelo operador. Mais de duas décadas foram necessárias para que estas máquinas pudessem atingir um grau de precisão e confiabilidade aceitáveis, aliado a um preço razoável. Também os reagentes para PCR reduziram de preço consideravelmente na última década, tornando o método comercialmente atrativo. Uma reação de PCR pode, agora, ser feita por US$ 1,00.

Além do cuidado com a contaminação de amplicons, a PCR exige atenção em vários outros detalhes. Um deles diz respeito ao pareamento dos primers: a última base da extremidade 3´ do primer tem que estar corretamente pareada com o DNA alvo, sem o que não ocorrerá amplificação. No restante do primer a necessidade de um pareamento exato não existe e, na extremidade 5´podemos até mesmo adicionar um segmento fita simples que não vai parear com o DNA alvo. Este ressalto (overhang) não atrapalha em nada a reação e pode adicionar propriedades importantes ao nosso amplicon final. Vejam um exemplo disso na construção da biblioteca de cDNA na aula 6!

Outro ponto importante é a questão dos erros na sequência devido à tautomeria de bases. A Taq polimerase não faz revisão (proof reading) in vitro. Se, ao copiar pela primeira vez o DNA alvo, ela introduzir uma base errada numa das duas fitas, 25% do produto final estará com sua sequência diferente nesta base. As consequências deste erro podem ser trágicas se estamos procurando fazer um diagnóstico genético (veja item correspondente). Para evitar isto todos os testes são feitos em duplicata. A idéia é que a probabilidade da Taq polimerase "errar" nas duas reações sempre na primeira extensão é muito reduzida e se um resultado conflitante surgir, fica claro que num dos tubos a Taq "errou". Se o "erro"  for cometido depois do terceiro ciclo ele já se torna praticamente imperceptível, pois uma pequena porcentagem das fitas terá erro e não será possível detectá-lo facilmente.

Seria ideal que pudéssemos disponibilizar em Downloads um relato de Mullis sobre o PCR a partir da sua apresentação na Academia Nobel. Entretanto, não há na página da Academia Sueca que coordena o Nobel (http://www.nobel.se) as palestras de Kary Mullis e Michael Smith. Uma apresentação on-line dos trabalhos dos dois laureados Nobel em Química, do ano de 1993 está disponível: Michael Smith (pelo aperfeiçoamento da tecnologia da mutação sítio-dirigida) e  Kary B. Mullis (pela invenção da PCR).

 http://www.nobel.se/chemistry/laureates/1993/illpres/index.html

 para outro.

B. PCR na investigação de Paternidade

Uma das aplicações mais conhecidas da PCR é a investigação de paternidade. Técnicas bioquímicas ou moleculares (voltadas ao DNA) já existiam muito antes da descoberta da PCR, mas foi com o desenvolvimento de sistemas diagnósticos baseados em PCR que a investigação de paternidade alcançou o mercado com mais abrangência, pela redução dos custos do exame e democratização dos reagentes (pode-se realizar o teste sem pagar royalties).

Para se compreender como funciona a técnica precisamos recordar um pouco a organização do genoma humano ( e de muitos outros organismos complexos). Apenas 3% do nosso genoma é composto de genes. Há, ao contrário, uma enorme parte dele composta de repetições mais ou menos longas, conforme o caso. Não sabemos ainda porque isto ocorre, mas estas repetições podem ser usadas vantajosamente como marcadores moleculares em muitos casos. Como não são genes, não estão sob uma pressão seletiva tão grande e mostram muito mais variação do que as sequências de genes propriamente ditas.

Dentre as regiões repetidas a investigação de paternidade por PCR costuma empregar uma classe de repetições conhecidas como STR - small tandem repeats ou pequenas repetições em tandem. São pequenas regiões de DNA com um número variável de repetições de 3 ou 4 nucleotídeos cada, flanqueadas por regiões conservadas. Um esquema simplificado de um STR está mostrado na figura abaixo. Como os seres humanos e os demais mamíferos são diplóides, cada região de um cromossomo (exceto nos machos o par XY) está presente no outro. Elas não precisam, contudo, ser exatamente iguais. Na representação da figura abaixo chamamos alelos as duas rgiões homólogas nos dois cromossomos, por analogia ao que fazemos com genes, embora os STRs não sejam genes. Observe que as regiões repetidas estão flanqueadas por regiões conservadas que se estendem à esquerda (5´) e à direita (3´) das repetições. Para qualquer ser humano estas regiões conservadas são as mesmas, mas cada um de nós pode ter um número diferente de repetições em cada alelo. Quanto maior o conjunto de diferentes repetições maior será a informação colhida pela realização da análise da região.  Assim, se o número de repetições para o caso estudado (cada caso é chamado sistema e em geral empregam-se 8 a 16 sistemas, cada um lançando mão de um STR de um cromossoma diferente) varia, digamos, de 3 a 15, haveria 12 possibilidades em cada alelo. Apenas como exercício, se a probabilidade na natureza fosse a mesma para qualquer uma das repetições (i.e., a frequência alélica fosse a mesma), a probabilidade de um indivíduo qualquer ter o arranjo de 4 e 9 repetições mostrado abaixo seria 1/12 x 1/12 = 1/ 144.

Figura 17: Representação esquemática de um STR e sua amplificação por PCR, através de primers dirigidos às regiões flanqueadoras conservadas. Os dois produtos gerados tem comprimentos diferentes pois a parte interna da sequência difere de um alelo para o outro.

Quando o sistema acima é analisado em gel de agarose, duas bandas serão visíveis se o indivíduo for heterozigoto para aquele STR. No caso de investigação de paternidade, o filho de um casal deve herdar um cromossoma do pai e outro da mãe. Isto que dizer que, para um sistema qualquer, o filho terá um STR (e uma banda) materno e outro paterno. A figura abaixo retrata a situação onde um casal avalia a paternidade de dois meninos. O primeiro (Fo.1) tem claramente uma banda de origem materna e a segunda banda está na mesma altura da banda paterna. Portanto, o marido não pode ser excluído de ser o pai. No segundo caso, contudo, a criança tem uma banda materna mas nenhuma que corresponda a alguma banda paterna. Esta situação exclui o marido de ser pai do segundo filho (Fo. 2).

Figura 18: Representação esquemática de um gel representando o resultado de um sistema de STR para investigação de paternidade. A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores de peso molecular. As colunas 2, 3, 4 e 5 mostram o resultado da amplificação de um sistema para o suposto pai, a mãe e dois filhos. A banda materna de cada filho está indicada e a banda paterna de um deles está contornada com uma elipse. O teste exclui o suposto pai da paternidade do segundo filho.

A inclusão obrigatória da mãe em testes de paternidade evita que uma eventual troca de recém-nascido na maternidade possa confundir os resultados. O mesmo processo descrito acima pode ser empregado em qualquer animal que tenha reprodução sexuada. É preciso apenas identificar os STRs candidatos e avaliar criteriosamente a distribuição dos alelos na população em estudo. Para os seres humanos os alelos estão distribuídos igualmente em todas as populações do globo, mas em  bovinos, por exemplo, devido ao cruzamento controlado pelo produtor, os STRs estão distribuídos de forma muito diferente de uma raça para outra. Ainda assim, a avaliação de pedigree em animais de raça é um campo crescente de aplicação desta tecnologia.

Apenas como lembrete: os STRs não são os únicos alvos possíveis para investigação de paternidade via DNA. Além disso, a investigação bioquímica e genética de paternidade já era um método bem estabelecido muito antes da invenção do PCR. Sugerimos que o leitor mais interessado procure informações na internet para complementar esta questão.

 

C. PCR na investigação de crimes

Outro campo fértil para o uso da PCR é a criminalística. A possibilidade de amplificar um pequeno trecho de DNA milhões de vezes permite, em muitos casos, amplificar de uma pequena amostra biológica (mancha de sangue, bulbo de cabelo, fragmentos de pele), mesmo em um estado de conservação, suficiente DNA para uma análise de STRs como a descrita acima. Um caso clássico é a investigação da procedência de uma mancha de sangue no casaco da vítima (ou resto de pele sob as unhas da vítima). Supondo, para fins deste exemplo, que o material não contivesse restos de células da própria vítima, o procedimento para análise do caso estaria em conformidade com o mostrado na figura abaixo.

Observe que, neste caso, cada suspeito aparece, para cada sistema com duas bandas (aparecerá apenas uma se o indivíduo for "homozigoto" para aquele STR). Na amostra as duas bandas do suspeito 2 estão claramente visíveis. O suspeito um tem apenas uma banda, a outra portanto o exclui de ser a fonte da amostra. O teste exclui dois indivíduos, mas não prova, como na paternidade, que o outro é o "dono" da amostra. A inclusão do resultado de 5 a 8 sistemas eleva a probabilbidade de não exclusão (como no caso de paternidade) para 99,99999999%. Isto quer dizer que não podemos excluir o suspeito dois com uma margem de acerto de 99,99999999%.

 

Figura 19: Representação esquemática de um gel representando o resultado de um sistema de STR para investigação criminal. Três suspeitos estão sendo investigados e uma amostra de sangue está disponível.  A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores de peso molecular. As colunas 2, 3 e 4 mostram o resultado da amplificação de um sistema para os possíveis criminosos. A coluna 5 mostra o resultado do mesmo sistema para a amostra. O padrão de duas bandas é idêntico ao do suspeito 2 e exclui os demais.

Os casos de estupro, em geral, trazem uma complicação adicional: o material colhido na vítima (por exemplo, esperma do criminoso) está misturado com o DNA da vítima (e com muito DNA contaminante não humano, da flora vaginal). Nestes casos o DNA dos suspeitos é sempre misturado com o DNA das vítimas antes da amplificação dos STRs. O resultado é feito por comparação do padrão de 4 bandas das misturas de DNA, uma a uma, de suspeito + vítima, com o padrão obtido da amostra colhida da vítima no corpo de delito. A figura abaixo ilustra este caso.

Figura 20: Representação esquemática de um gel representando o resultado de um sistema de STR para investigação criminal. Três suspeitos estão sendo investigados num caso de estupor e uma amostra de sangue está disponível.  A primeira coluna tem marcadores alélicos padrão, equivalentes aos marcadores de peso molecular. As colunas 2, 3 e 4 mostram o resultado da amplificação de um sistema para os possíveis criminosos, sempre em mistura com o DNA da vítima.. A coluna 5 mostra o resultado do mesmo sistema para a amostra colhida no corpo de delito que, supostamente contendo DNA da vítima e do criminoso. A última coluna da direita é a amplificação apenas do DNA da vítima. O padrão de quatro bandas da amostra é idêntico ao do suspeito 3 e exclui os demais.

As aplicações forenses (na justiça) da PCR são ilimitadas, mas não há espaço aqui para maior detalhamento.

 

D. PCR no diagnóstico de enfermidades genéticas e na identificação de portadores sãos de alelos mutantes.

Doenças genéticas podem, algumas vezes, ser difíceis de diagnosticar. Adicionalmente, no aconselhamento genético de casais é importante determinar inequivocamente se um indivíduo é portador de um alelo mutante (portador são). A identificação de mutações em genes pode ser feita também por PCR, em geral com a manipulação posterior do produto de amplificação. A seguir exemplificamos duas destas aplicações. Numa delas o nucleotídeo mutado faz parte de um sítio de restrição (se você lembrar que são mais de 600 as enzimas de restrição, cada uma com seu próprio sítio, não será muito difícil encontrar uma que corte um sítio incluindo o nucleotídeo em estudo). Na outra um artifício permite detectar qualquer nucleotídeo mutado, faça ele parte de um sítio de restrição ou não.

A figura abaixo ilustra o caso em que o sítio de restrição para EcoRI, GAATTC, inclui um nucleotídeo que está frequentemente mutado no caso da doença genética em estudo. No alelo normal o sítio de restrição está preservado e no alelo mutante ele foi perdido, pela troca de um par AT por um GC. Se o contrário tivesse acontecido, a técnica também poderia ser aplicada da mesma forma, apenas com a mudança equivalente na interpretação dos resultados. Quando o trecho de DNA em estudo é amplificado por dois primers anelando nas regiões acima e abaixo da mutação (em princípio todo o restante do gene é conservado), os produtos gênicos terão o mesmo tamanho, sejam provenientes do alelo normal (wt - wild type)ou do mutante. Então, será preciso uma  intervenção nos produtos para que uma distinção entre eles possa aparecer. Isto é feito pela ação da enzima de restrição escolhida (no caso, a EcoRI). O produto de PCR produzido a partir do alelo normal pode ser clivado pela enzima de restrição, dando origem a duas bandas. O produto originado da amplificação do alelo mutante não tem mais o sítio para EcoRI e não pode ser clivado, permanecendo do tamanho original. Assim, num indivíduo heterozigoto (portador são de uma mutação recessiva) o sistema produzirá três bandas: a maior, correspondente ao produto de PCR do alelo mutante, que não pôde ser clivado pela EcoRI, e duas menores, fruto da clivagem do produto de PCR do alelo normal.

Figura 21:  Princípio da identificação de mutações pontuais através da eliminação/criação de sítios de restrição e geração de fragmentos de digestão com polimorfismo de comprimento a partir de produtos de PCR (PCR/RFLP). A figura representa o caso de um indivíduo heterozigoto para a marca estudada. A mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A amplificação dos dois alelos produz fragmentos de mesmo comprimento. Entretanto, a digestão destes fragmentos com a enzima EcoRI gera um polimorfismo de comprimentos, com o alelo mutante permanecendo não cortado, enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto.

Na avaliação do resultado da PCR/RFLP discutida acima, o gel deve mostrar uma banda única apenas para o indivíduo afetado (homozigoto mutante, com clínica da doença), já que os produtos de PCR dos dois alelos não podem ser clivados pois perderam o sítio de restrição para EcoRI. Já o homozigoto normal terá seus os produtos de PCR de dois alelos clivados e no gel apenas duas bandas estarão visíveis. Apenas no caso já discutido (portador são, heterozigoto wt/m) serão visíveis três bandas. A figura abaixo representa de forma esquemática o resultado de uma análise PCR/RFLP.

Figura 22:  Resultado da investigação da presença de mutação no sítio EcoRI por PCR (PCR/RFLP). A figura representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), um indivíduo afetado e um normal homozigoto. A mutação elimina um sítio EcoRI existente no alelo selvagem (wt). A amplificação dos dois alelos produz fragmentos de mesmo comprimento. Entretanto, a digestão destes fragmentos com a enzima gera um polimorfismo de comprimentos, com o alelo mutante permanecendo não cortado, enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto.

 

Em muitos casos de mutações pontuais a técnica de PCR/RFLP não pode ser aplicada, seja porque não há sítio de restrição conhecido para o entorno da mutação, seja porque múltiplas mutações são possíveis no gene de interesse, tornando a abordagem acima impraticável. Uma alternativa é o mis-match PCR, ou PCR com pareamento errôneo. O princípio desta técnica, descrito pela primeira vez por Cotton et al., em 1988, e também conhecido com CMC - chemical mismatch cleavage - baseia-se na clivagem de DNA em locais com pareamento errôneo pela piperidina, e está representada na figura abaixo. Um indivíduo heterozigoto tem uma mutação pontual numa região qualquer do gene. Podemos amplificar esta região com primers dirigidos a suas extremidades, como fizemos na PCR/RFLP. Em seguida aquecemos o produto do PCR e deixamos esfriar rapidamente para induzir a formação de heteroduplexes (uma fita simples de um alelo e a complementar do outro) além dos homoduplexes (as dus fitas pareadas de volta, de um mesmo alelo). Nas região não pareadas ou com pareamento errôneo com bases C e T liga-se o produto hidroxilamina ou o tetróxido de ósmio, respectivamente. Uma vez ligados, estes produtos permitem a clivagem do DNA neste local pela piperidina. Assim, 50% dos produtos de PCR serão cortados por este sistema em todo lugar onde houver uma mutação. Em geral os fragmentos gerados pro este sistema são pequenos e devem ser visualizados em gel de poliacrilamida. A figura abaixo mostra como funciona este sistema.

Figura 23:  Resultado da investigação da presença de mutação em uma base desconhecida pela técnica de PCR-mismatch. A figura representa o caso de um indivíduo heterozigoto para a marca estudada: o alelo selvagem tem o par TA e o mutante o par GC. A amplificação por PCR do trecho onde a mutação está usa primers que estão a alguma distância à direita e à esquerda da provável mutação. Quando o produto do PCR é aquecido os dois tipos de fita (TA e GC) se separam, dando origem a 4 fitas simples. Quando a mistura é rapidamente aquecida, as fitas simples se reassociam ao acaso de 4 formas distintas, pois a diferença de uma única base não impede o pareamento das fitas quase complementares. Após o uso de um sistema químico adequado, os pares de base errôneos são clivados e as fitas com mis-match geram dois fragmentos no gel, ao contrário das fitas com pareamento perfeito. O heretozigoto aparece, no gel, com três bandas (veja figura abaixo).

O resultado do experimento descrito acima está esquematicamente representado na figura seguinte. O portador são, heterozigoto, tem uma mutação na posição descrita na figura anterior. O primeiro afetado tem esta mutação nos dois alelos. Já o segundo afetado tem um alelo com a mutação da figura anterior e outro alelo com uma mutação mais a direita, como representado na barra vertical ao lado do gel.

Figura 24:  Resultado da investigação da presença de mutação pela técnica de mismatch PCR. A figura representa o caso de um indivíduo heterozigoto para a marca estudada (coluna b), dois indivíduo afetados e um normal homozigoto. A amplificação dos dois alelos produz fragmentos de mesmo comprimento. Entretanto, a clivagem destes fragmentos pela piperidina gera um polimorfismo de comprimentos, com o alelo mutante permanecendo não cortado, enquanto o alelo selvagem é clivado em dois pedaços de tamanho distinto. No caso do primeiro afetado (homozigoto) não há mismatch interno porque os dois alelos são idênticos. Nocaso do afetado heterozigoto cada alelo é diferente do outro em dois pontos distintos, o que gera três fragmentos pela piperidina, mais o produto não clivado do homoduplex.

Não se deve esquecer, contudo, que a presença de um mismatch não significa diretamente uma mutação, pois há na natureza diferenças individuais entre qualquer ser vivo. Estad diferenças, que não significam doença mas diferenças simples entre indivíduos são chamadas  SNPs. O teste final para o reconhecimento de presença de uma mutação é, de fato, o sequenciamento direto do produto de PCR. Se houver diferença entre os alelos, no lugar correspondente eletroferograma haverá duas bases possíveis (p.ex. T ou A). (veja aula sobre sequenciamento, a seguir). A consulta num banco de dados público de SNPs será essencial, também (ver aula de Introdução à Bioinformática, mais adiante).

 

E. PCR em tempo real - o sistema Taqman

Recentemente foi desenvolvido um sistema pela empresa Applied Biosystems (fundida com a Celera na atual Applera), para detectar o produto do PCR à medida em que esta vai sendo sintetizado na reação. O engenhoso sistema é baseado no uso de uma sonda, dirigida contra uma região interna da sequência que se deseja amplificar, e que tem dois fluorocromos, um em cada extremidade da sonda (um DNA fita simples). Na extremidade 5´ há um fluorocromo que só fluoresce se estiver distante fisicamente do fluorocromo na posição 3´. Este segundo fluorocromo funciona como capturador de energia (quencher) e não deixa com que a energia luminosa usada para excitar a sonda chegue em quantidade suficiente para excitar o primeiro fluorocromo. Estes dois fluorocromos estão representados como R e Q (para quencher). Quando o primer hibridiza na região 5´, a sonda também o faz no meio da sequência. À medida em que a Taq polimerase avança sintetizando a  fita nova, ela vai degradando a sonda à sua frente, liberando o fluorocromo R da sonda e permitindo que absorva energia e emita luz. A energia para a excitação dos fluorocromos provem de um feixe de laser que atravessa a amostra e o equipamento que faz isto chama-se PCR em tempo real (real time PCR) ou Taqman. A figura abaixo esclarece este princípio.

Figura 25:  Princípio de funcionamento do Taqman, ou PCR em tempo real. Uma sonda fita simples com dois florocromos é adicionada à reação de PCR. O fluorocromo Q atua com atenuador da fluorescência de R, sendo protanto um quencher. Para isto é preciso que esteja próximo a R. A TAq polimerase separa os dois fluorcromos à medida em que degrada a sonda quando sintetiza a fita nova. O fluorocromo R recém liberado da sonda emite então  luz num comprimento de onda característico, diferente de Q. A excitação dos fluorocromos é feita com laser que atravesse o tubo de reação.

A medição da radiação é feita pelo aparelho, que taça um gráfico com a absorção obtida após cada ciclo de PCR. O ciclo em que o patamar (limite) de negatividade é ultrapassado está diretamente relacionado à quantidade de DNA molde na mistura. Com isto, a quantificação de DNA molde passou a ser não apenas possível, mais rápida. O sistema ainda é bastante dispendioso mas tenderá a se tornar mais barato à medida em que novos sistemas entrarem no mercado e um maior número de máquinas for disponível.

Figura 26:   Gráfico obtido com o Taqman. A seta indica o ciclo em que a reação ultrapassa o limite da reação negativa. Quanto menor a quantidade de DNA molde no tubo de reação maior o número de ciclos necessários para ultrapassar o limite da negatividade. A reação de PCR no Taqman emprega em geral apenas duas temperaturas (94 oC para desnaturação e 60 oC, para hibridização e extensão) e o resultado da PCR pode ser dado em menos de 30 minutos.

 

F.  Um pouco de história (em construção)

A reação em cadeia da polimerase foi desenvolvida a partir de uma idéia de Kary B. Mullis.

K. Mullis nasceu em 1944 em Lenoir, Carolina do Norte, EUA. Obteve o grau de bacharel em química em 1966 no Instituto de Tecnologia da geórgia e o PhD em Bioquímica pela Universidade da Califórnia em Berkeley. Passou então 7 anos como pós-doutor em Cardiologia Pediatria e Química Farmacêutica na Escola de Medicina da Universidade de Kansas (EUA). Em seguida reebu um convite para trabalhar como técncio na Cetur Corporation, em Emeryville, em 1978. Foi lá que teve a idéia da PCR.

Segundo ele, foi dirigindo seu carro de San Francisco para sua casa em La Jolla, California, que ele começou a imaginar uma maneira simples de determinar uma sequência de nucleotídeos a partir de um trecho de DNA. Ele então, como querem para si outros cientistas, tece uma inspiração súbita: a solução não era apenas para seu problema original, mas tinha um alcance muito maior. Ele imaginou uma forma de fazer a DNA polimerase iniciar e terminar seu trabalho em pontos pré-determinados e, consequentemente, pelo uso desta proipriedade, descobriu uma maneira de amplificar exponencialmente uma sequencia de DNA num tubo de ensaio.

Mullis então levou a idéia para seus colegas da Cetus e juntos eles a colocaram para trabalhar de verdade. Ela foi apresentada pela primeira vez ao público numa conferência em 1985 e foi pronta e amplamente aceita pela comunidade científica. A popularidade da técnica, assim como seu conceito, ganhou crescente popularidade ao longo dos anos seguintes.

Em 1989 a revista Science escolheu a molécula usada na PCR, a Taq polimerase, como a primeira  "Molécula do Ano".

Em 1991 a PCR se tornou extremamente comum em laboratórios pelo mundo afora e referências ao uso da técnica já somavam milhares nas revistas científicas. Um ano depois a Cetus, depois de uma reorganização corporativa, vendeu a patente da PCR para a Hoffman - La Roche por US$ 300.000.000,00.

Devido ao alcance e popularidade da PCR Kary Mullis foi apontado e recebeu o prêmio Nobel de Química em 1995. Esta indicação foi duramente contestada por muitos que acreditavam que a PCR foi apenas um desenvolvimento de técnica e que sua concepção não era suficiente para dar a Mullis o status de nobelista. Mullis argumentou a seu favor que a união das técnicas pré-existentes no formato por ele criado fazia toda a diferença.

Para uma história um pouco mais detalhada sobre o desenvolvimento da PCR veja o site http://usitweb.shef.ac.uk/~mba97cmh/history/history.htm

 

G. Artigos importantes sobre PCR

Uma seleção dos mais importantes artigos sobre PCR, tanto durante o desenvolvimento da técnica quanto para diversas aplicações, pode ser encontrada na página específica da Universidade de Berkeley:

http://sunsite.berkeley.edu/pcr/foundationalPCR.html#anchor1239949

Vale a pena conferir!

 

 

 

IV. Sequenciamento de DNA

Até meados da década de 70 não era nada simples obter uma sequência de DNA, fosse ele fita simples ou dupla. De fato, trabalhar com DNA era muito mais complicado do que com proteínas e o conhecimento sobre os ácidos nucléicos avançava de forma lenta. No início da década de 80 uma técnica relativamente rápida de sequenciamento de DNA foi desenvolvida, que empregava a quebra de uma cadeia de DNA com diferentes produtos químicos e a visualização dos fragmentos gerados por eletroforese. Havia necessidade de fazer-se a marcação radiativa das moléculas porque a quantidade de material produzida era muito pequena e não podia ser detectada de outra forma. Mesmo com todas estas dificuldades houve então um rápido progresso no conhecimento de sequências de DNA. Poucos anos depois um novo avanço tecnológico foi alcançado pela introdução da técnica de interrupção da sequência pela incorporação aleatória de um nucleotídeo modificado (sem a hidroxila na posição 3´), que ficou conhecida como técnica de didesoxi ou dideoxi. Esta técnica suplantou imediatamente a anterior e permitiu o desenvolvimento de sequenciadores automáticos de DNA, sobre os quais versa este capítulo. Ainda se faz eventualmente o sequenciamento manual, mas é muito mais trabalhoso, caro e arriscado, pois emprega substâncias radiativas. De uma forma geral quando desejamos saber uma sequência de bases de um fragmento qualquer de DNA, purificamos o fragmento e enviamos para sequenciamento numa empresa prestadora deste serviço.

Mas, afinal, como produzir um DNA para sequenciamento e do que se trata a técnica de dideoxi?

A primeira parte da pergunta é crucial: de fato, se queremos sequenciar um trecho de DNA, temos que ter uma grande quantidade dele no nosso tubo de ensaio. Duas formas corriqueiras de se obter grandes quantidades de uma determinada sequência de DNA são a clonagem em plasmídeo e a PCR. Se o DNA que queremos sequenciar for o inserto de um plasmídeo, tudo o que precisamos é crescer 200 microlitros da bactéria com o plasmídeo e, empregando as técnicas já usuais de extração de DNA, obter o plasmídeo purificado, que será empregado na reação de sequenciamento.  Se ainda não tivermos o material clonado, podemos empregar a PCR e amplificar o trecho a ser sequenciado, purificando a banda do gel e usando o material assim obtido para iniciar a reação do sequenciamento. Neste caso, precisamos saber apenas as sequências das extremidades do trecho a ser sequenciado. 

A segunda parte da pergunta exige uma explicação mais detalhada.

Inicialmente, temos que recordar o que seja um didesoxinucleotídeo trifosfasto, ou ddNTP.  O precursor normal da síntese de DNA é o dNTP, ou desoxiribonucleotídeo trifosfato, que apresenta uma hidroxila na posição 3´. É a partir desta hidroxila que a fita nascente é estendida. Um ddNTP, entretanto, não tem esta hidroxila. Logo, se for incorporado a uma fita de DNA, interrompe a incorporação de outros nucleotídeos a partir dele. Se o ddNTP for marcado associado à radiação ou fluorescência, a fita interrompida ficará radiativa ou fluorescente e poderá ser detectada mais facilmente. Para fins desta aula vamos admitir que cada didesoxibase está marcada com uma florescência diferente. Portanto, as fitas terminadas em A, T, G ou C vão emitir cores diferentes quando excitadas com luz de um determinado comprimento (em geral, de um feixe laser).

Em seguida temos que entender como a reação de sequenciamento pode começar sempre exatamente da mesma base, a partir do DNA molde que adicionamos à reação. Para tal, basta recordarmos que uma nova fita simples só é sintetizada se tivermos um DNA molde, uma DNA polimerase, dNTPs (e neste caso, um pouco de ddNTPs fluorescentes) e, finalmente, um primer! É neste primer que reside o segredo do início exato da reação de extensão: o primer sempre pareia exatamente na posição esperada, jamais uma base antes ou uma depois, por exemplo. Por isso, todas as fitas estendidas a partir deste primer iniciam rigorosamente na mesma base, a partir do primer e copiando a fita molde.

Por fim, basta recordarmos que as fitas assim produzidas devem ser muito numerosas para poderem ser detectadas. Por isso, temos que começar a reação de sequenciamento com muito mais DNA do que uma reação de PCR. As fitas produzidas podem ser separadas pelo tamanho em eletroforese de poliacrilamida, e a base final da sequência da fita identificada pela fluorescência emitida quando a banda eletroforética correspondente à fita cruza o ponto do gel que é iluminado por um feixe de laser. Neste sistema de detecção a eletroforese não pára, as bandas passando no fim (em baixo) do gel é que são detectadas em movimento. Com isto, podemos identificar com precisão 600 a 700 bases a partir do primer.

Na figura abaixo exemplificamos como surgem as fitas simples estendidas a partir de um primer (seta preta pequena) que pareia com uma sequência específica (em vermelho) do plasmídeo (trechos em amarelo), no qual foi clonado um inserto (azul) entre os sítios de restrição EcoRI e XhoI. Observe que o inserto pode ter um comprimento muito variável, tipicamente entre 500 e 3000 pb. No exemplo estamos admitindo que, numa determinada posição na sequência do inserto, uma parte dele tem uma base A e outra uma base G. É o que ocorre se clonarmos um trecho de DNA de um alelo para o qual o doador é heterozigoto.  Observe também que, do lado direito do inserto, há uma sequência (em verde) na qual pode parear um outro primer, que será empregado no sequenciamento quando quisermos vir da direita para a esquerda sobre o inserto. Jamais, contudo, os dois primers são empregados simultaneamente, e por isto a reação de sequenciamento NÃO É UMA PCR!!! Por isso, não temos tanta preocupação com contaminação como nas reação de PCR: podemos fazer múltiplas reações de sequenciamento, lado a lado, numa placa de 96 micropoços e mesmo reutilizar boa parte do material plástico empregado no preparo do DNA ou na reação de sequenciamento, em si, bastando para isto lavar bem o material.

Ainda na figura, podemos ver que fragmentos de diferentes tamanhos são gerados, porém nunca (exceto no caso onde houver moldes de DNA com polimorfismo de base, como no caso A/G mostrado) dois fragmentos de igual tamanho terminarão em bases diferentes. Na parte de baixo da figura todos os fragmentos representados na parte de cima estão organizados por ordem de tamanho. Observe que:

a) podem existir muitos fragmentos (fitas simples estendidas a partir do primer) do mesmo tamanho, mas fatalmente terminarão na mesma base (exceto no caso do polimorfismo do DNA molde);

b) podem existir fitas terminado na mesma base (afinal, só temos 4 opções, A,T,G ou C!), com comprimentos diferentes. Não há qualquer restrição para isto.

c) há espaços mostrados na sequência, onde não havia nenhum fragmento gerado do tamanho esperado. Isto só acontece quando a reação gera poucos fragmentos, mas uma reação deste tipo gera centenas de milhares de fragmentos de cada tamanho e é muito pouco provável que existam sequências não representadas de um comprimento qualquer.

d) apenas onde há polimorfismo de base do DNA molde há fragmentos do mesmo tamanho terminando em bases diferentes (é o caso A/G).

Examine, por favor, atentamente a figura abaixo antes de continuar a leitura desta aula.

Figura 27: Fragmentos de diferentes comprimentos gerados a partir do primer, interrompidos quando um didesoxinucleotídeo é incorporado na fita. Os didesoxinucleotídeos são marcados com substâncias fluorescentes diferentes, conforme a base (A,T,G ou C).

 

Quando os fragmentos gerados numa reação de sequenciamento são separados por eletroforese, os fragmentos menores vão à frente, seguidos dos demais, sendo a distância entre as bandas aproximadamente igual, pois representa sempre a diferença de uma base a mais ou a menos. A figura 8.2 mostra esquematicamente como esta separação acontece e como a fluorescência nas bandas é identificada, à medida em que elas atravessam um trecho do gel que é iluminado por um feixe laser (representado pela barra verde na parte de baixo do gel).  Observe que a distância entre as bandas é regular. Um gel pode permitir o sequenciamento de 600-700 bases para cada reação, e podemos correr até 96 reações por gel. Há no mercado também sequenciadores de DNA de última geração nos quais o gel foi substituído por um feixe de capilares, que são automaticamente preenchidos por um polímero, ao invés de gel. Cada reação de sequenciamento é separada no seu capilar e a fluorescência detectada individualmente. o que evita uma eventual confusão entre sequências causada pelos desalinhamentos das corridas eletroforéticas, comum nos géis. Há máquinas com feixes de 1 a 384 capilares. As maiores são capazes de produzir mais de 2 mil sequências em 24 horas.

Examine, por favor, atentamente a figura 8.2 abaixo antes de continuar a leitura desta aula.

Figura 28: Os fragmentos de diferentes comprimentos migram no gel, os menores na frente. São iluminados por um feixe de laser e fluorescem quando atravessam a janela do feixe. Um gel pode resolver 96 sequências simultaneamente. Os géis têm sido substituídos por capilares preenchidos de polímero nas máquinas mais modernas. As bandas pretas indicam ausência de material e são apenas um recurso gráfico usado aqui para indicar o espaço aumentado entre bandas que aconteceria neste caso. Entretanto, isto não ocorre na reação de sequenciamento finalizada, porque o número de fragmentos gerados é muito grande e a probabilidade de uma classe de tamanho não ser representada na reação é praticamente nula.

 

A fluorescência emitida pela passagem de uma banda pela janela de medição é registrada por um sistema de microcâmaras sensoras, que por sua vez transforma o sinal num gráfico, conhecido como eletroferograma. Os picos representam as bandas, e quanto mais altos e agudos mais qualidade têm, isto é, maior será a probabilidade de que a base registrada seja correta. O valor de qualidade é medido por um programa chamado Phred, que leva em conta vários parâmetros (espaçamento entre bandas, largura e altura do pico, intensidade absoluta do sinal, ruído de fundo, etc). Geralmente emprega-se como padrão aceitável de qualidade o valor Phred 20, que corresponde a aprox. 99% de certeza da base indicada. A figura 8.3 abaixo mostra um eletroferograma obtido no sequenciamento de um inserto de cDNA do parasita Leishmania chagasi. Observe que, neste trecho, a qualidade do sequenciamento é muito alta, com espaçamento regular dos picos (que indica espaçamento regular das bandas) e picos agudos. Não há nenhum polimorfismo de bases, nem poderia haver, pois esta sequência foi obtida a partir de um clone de cDNA.

Figura 29: Eletroferograma parcial de uma sequência de DNA obtida no sequenciador automático ABI3100 Prism, da Applied Biosystems, na Unidade de Genômica do Laboratório de Genética Molecular do Departamento de Genética da UFPE. Observe que os picos são agudos e regularmente separados, o que indica alta qualidade do sequenciamento neste trecho

Esperamos que este texto tenha esclarecido a maior parte das questões básicas pertinentes ao sequenciamento de DNA. Entretanto, julgamos que uma visita à nossa sub-página de animações é essencial, pois a animação sobre sequenciamento é muito ilustrativa do que foi dito aqui.

Em edições futuras desta aula outras questões serão abordadas e discutidas:

a) a qualidade da sequência e o aspecto do eletroferograma

b) a identificação de polimorfismos

c) a contaminação de primers e de clones

d) as limitações do sequenciamento automático de DNA