Home

Aulas

Exercícios

Notícias

Downloads

Bibliografia

Animações

  Programa Links ProGeNE Pós-graduação Medicina  

8 Sequenciamento de DNA

Até meados da década de 70 não era nada simples obter uma sequência de DNA, fosse ele fita simples ou dupla. De fato, trabalhar com DNA era muito mais complicado do que com proteínas e o conhecimento sobre os ácidos nucléicos avançava de forma lenta. No início da década de 80 uma técnica relativamente rápida de sequenciamento de DNA foi desenvolvida, que empregava a quebra de uma cadeia de DNA com diferentes produtos químicos e a visualização dos fragmentos gerados por eletroforese. Havia necessidade de fazer-se a marcação radiativa das moléculas porque a quantidade de material produzida era muito pequena e não podia ser detectada de outra forma. Mesmo com todas estas dificuldades houve então um rápido progresso no conhecimento de sequências de DNA. Poucos anos depois um novo avanço tecnológico foi alcançado pela introdução da técnica de interrupção da sequência pela incorporação aleatória de um nucleotídeo modificado (sem a hidroxila na posição 3´), que ficou conhecida como técnica de didesoxi ou dideoxi. Esta técnica suplantou imediatamente a anterior e permitiu o desenvolvimento de sequenciadores automáticos de DNA, sobre os quais versa este capítulo. Ainda se faz eventualmente o sequenciamento manual, mas é muito mais trabalhoso, caro e arriscado, pois emprega substâncias radiativas. De uma forma geral quando desejamos saber uma sequência de bases de um fragmento qualquer de DNA, purificamos o fragmento e enviamos para sequenciamento numa empresa prestadora deste serviço.

Mas, afinal, como produzir um DNA para sequenciamento e do que se trata a técnica de dideoxi?

A primeira parte da pergunta é crucial: de fato, se queremos sequenciar um trecho de DNA, temos que ter uma grande quantidade dele no nosso tubo de ensaio. Duas formas corriqueiras de se obter grandes quantidades de uma determinada sequência de DNA são a clonagem em plasmídeo e a PCR. Se o DNA que queremos sequenciar for o inserto de um plasmídeo, tudo o que precisamos é crescer 200 microlitros da bactéria com o plasmídeo e, empregando as técnicas já usuais de extração de DNA, obter o plasmídeo purificado, que será empregado na reação de sequenciamento.  Se ainda não tivermos o material clonado, podemos empregar a PCR e amplificar o trecho a ser sequenciado, purificando a banda do gel e usando o material assim obtido para iniciar a reação do sequenciamento. Neste caso, precisamos saber apenas as sequências das extremidades do trecho a ser sequenciado. 

A segunda parte da pergunta exige uma explicação mais detalhada.

Inicialmente, temos que recordar o que seja um didesoxinucleotídeo trifosfasto, ou ddNTP.  O precursor normal da síntese de DNA é o dNTP, ou desoxiribonucleotídeo trifosfato, que apresenta uma hidroxila na posição 3´. É a partir desta hidroxila que a fita nascente é estendida. Um ddNTP, entretanto, não tem esta hidroxila. Logo, se for incorporado a uma fita de DNA, interrompe a incorporação de outros nucleotídeos a partir dele. Se o ddNTP for marcado associado à radiação ou fluorescência, a fita interrompida ficará radiativa ou fluorescente e poderá ser detectada mais facilmente. Para fins desta aula vamos admitir que cada didesoxibase está marcada com uma florescência diferente. Portanto, as fitas terminadas em A, T, G ou C vão emitir cores diferentes quando excitadas com luz de um determinado comprimento (em geral, de um feixe laser).

Em seguida temos que entender como a reação de sequenciamento pode começar sempre exatamente da mesma base, a partir do DNA molde que adicionamos à reação. Para tal, basta recordarmos que uma nova fita simples só é sintetizada se tivermos um DNA molde, uma DNA polimerase, dNTPs (e neste caso, um pouco de ddNTPs fluorescentes) e, finalmente, um primer! É neste primer que reside o segredo do início exato da reação de extensão: o primer sempre pareia exatamente na posição esperada, jamais uma base antes ou uma depois, por exemplo. Por isso, todas as fitas estendidas a partir deste primer iniciam rigorosamente na mesma base, a partir do primer e copiando a fita molde.

Por fim, basta recordarmos que as fitas assim produzidas devem ser muito numerosas para poderem ser detectadas. Por isso, temos que começar a reação de sequenciamento com muito mais DNA do que uma reação de PCR. As fitas produzidas podem ser separadas pelo tamanho em eletroforese de poliacrilamida, e a base final da sequência da fita identificada pela fluorescência emitida quando a banda eletroforética correspondente à fita cruza o ponto do gel que é iluminado por um feixe de laser. Neste sistema de detecção a eletroforese não pára, as bandas passando no fim (em baixo) do gel é que são detectadas em movimento. Com isto, podemos identificar com precisão 600 a 700 bases a partir do primer.

Na figura abaixo exemplificamos como surgem as fitas simples estendidas a partir de um primer (seta preta pequena) que pareia com uma sequência específica (em vermelho) do plasmídeo (trechos em amarelo), no qual foi clonado um inserto (azul) entre os sítios de restrição EcoRI e XhoI. Observe que o inserto pode ter um comprimento muito variável, tipicamente entre 500 e 3000 pb. No exemplo estamos admitindo que, numa determinada posição na sequência do inserto, uma parte dele tem uma base A e outra uma base G. É o que ocorre se clonarmos um trecho de DNA de um alelo para o qual o doador é heterozigoto.  Observe também que, do lado direito do inserto, há uma sequência (em verde) na qual pode parear um outro primer, que será empregado no sequenciamento quando quisermos vir da direita para a esquerda sobre o inserto. Jamais, contudo, os dois primers são empregados simultaneamente, e por isto a reação de sequenciamento NÃO É UMA PCR!!! Por isso, não temos tanta preocupação com contaminação como nas reação de PCR: podemos fazer múltiplas reações de sequenciamento, lado a lado, numa placa de 96 micropoços e mesmo reutilizar boa parte do material plástico empregado no preparo do DNA ou na reação de sequenciamento, em si, bastando para isto lavar bem o material.

Ainda na figura, podemos ver que fragmentos de diferentes tamanhos são gerados, porém nunca (exceto no caso onde houver moldes de DNA com polimorfismo de base, como no caso A/G mostrado) dois fragmentos de igual tamanho terminarão em bases diferentes. Na parte de baixo da figura todos os fragmentos representados na parte de cima estão organizados por ordem de tamanho. Observe que:

a) podem existir muitos fragmentos (fitas simples estendidas a partir do primer) do mesmo tamanho, mas fatalmente terminarão na mesma base (exceto no caso do polimorfismo do DNA molde);

b) podem existir fitas terminado na mesma base (afinal, só temos 4 opções, A,T,G ou C!), com comprimentos diferentes. Não há qualquer restrição para isto.

c) há espaços mostrados na sequência, onde não havia nenhum fragmento gerado do tamanho esperado. Isto só acontece quando a reação gera poucos fragmentos, mas uma reação deste tipo gera centenas de milhares de fragmentos de cada tamanho e é muito pouco provável que existam sequências não representadas de um comprimento qualquer.

d) apenas onde há polimorfismo de base do DNA molde há fragmentos do mesmo tamanho terminando em bases diferentes (é o caso A/G).

Examine, por favor, atentamente a figura 8.1 abaixo antes de continuar a leitura desta aula.

Figura 8.1: Fragmentos de diferentes comprimentos gerados a partir do primer, interrompidos quando um didesoxinucleotídeo é incorporado na fita. Os didesoxinucleotídeos são marcados com substâncias fluorescentes diferentes, conforme a base (A,T,G ou C).

 

Quando os fragmentos gerados numa reação de sequenciamento são separados por eletroforese, os fragmentos menores vão à frente, seguidos dos demais, sendo a distância entre as bandas aproximadamente igual, pois representa sempre a diferença de uma base a mais ou a menos. A figura 8.2 mostra esquematicamente como esta separação acontece e como a fluorescência nas bandas é identificada, à medida em que elas atravessam um trecho do gel que é iluminado por um feixe laser (representado pela barra verde na parte de baixo do gel).  Observe que a distância entre as bandas é regular. Um gel pode permitir o sequenciamento de 600-700 bases para cada reação, e podemos correr até 96 reações por gel. Há no mercado também sequenciadores de DNA de última geração nos quais o gel foi substituído por um feixe de capilares, que são automaticamente preenchidos por um polímero, ao invés de gel. Cada reação de sequenciamento é separada no seu capilar e a fluorescência detectada individualmente. o que evita uma eventual confusão entre sequências causada pelos desalinhamentos das corridas eletroforéticas, comum nos géis. Há máquinas com feixes de 1 a 384 capilares. As maiores são capazes de produzir mais de 2 mil sequências em 24 horas.

Examine, por favor, atentamente a figura 8.2 abaixo antes de continuar a leitura desta aula.

Figura 8.2: Os fragmentos de diferentes comprimentos migram no gel, os menores na frente. São iluminados por um feixe de laser e fluorescem quando atravessam a janela do feixe. Um gel pode resolver 96 sequências simultaneamente. Os géis têm sido substituídos por capilares preenchidos de polímero nas máquinas mais modernas. As bandas pretas indicam ausência de material e são apenas um recurso gráfico usado aqui para indicar o espaço aumentado entre bandas que aconteceria neste caso. Entretanto, isto não ocorre na reação de sequenciamento finalizada, porque o número de fragmentos gerados é muito grande e a probabilidade de uma classe de tamanho não ser representada na reação é praticamente nula.

 

A fluorescência emitida pela passagem de uma banda pela janela de medição é registrada por um sistema de microcâmaras sensoras, que por sua vez transforma o sinal num gráfico, conhecido como eletroferograma. Os picos representam as bandas, e quanto mais altos e agudos mais qualidade têm, isto é, maior será a probabilidade de que a base registrada seja correta. O valor de qualidade é medido por um programa chamado Phred, que leva em conta vários parâmetros (espaçamento entre bandas, largura e altura do pico, intensidade absoluta do sinal, ruído de fundo, etc). Geralmente emprega-se como padrão aceitável de qualidade o valor Phred 20, que corresponde a aprox. 99% de certeza da base indicada. A figura 8.3 abaixo mostra um eletroferograma obtido no sequenciamento de um inserto de cDNA do parasita Leishmania chagasi. Observe que, neste trecho, a qualidade do sequenciamento é muito alta, com espaçamento regular dos picos (que indica espaçamento regular das bandas) e picos agudos. Não há nenhum polimorfismo de bases, nem poderia haver, pois esta sequência foi obtida a partir de um clone de cDNA.

Figura 8.3: Eletroferograma parcial de uma sequência de DNA obtida no sequenciador automático ABI3100 Prism, da Applied Biosystems, na Unidade de Genômica do Laboratório de Genética Molecular do Departamento de Genética da UFPE. Observe que os picos são agudos e regularmente separados, o que indica alta qualidade do sequenciamento neste trecho

Esperamos que este texto tenha esclarecido a maior parte das questões básicas pertinentes ao sequenciamento de DNA. Entretanto, julgamos que uma visita à nossa sub-página de animações é essencial, pois a animação sobre sequenciamento é muito ilustrativa do que foi dito aqui.

Em edições futuras desta aula outras questões serão abordadas e discutidas:

a) a qualidade da sequência e o aspecto do eletroferograma

b) a identificação de polimorfismos

c) a contaminação de primers e de clones

d) as limitações do sequenciamento automático de DNA

e) os avanços na técnica a partir de 2000.

 

volta ao topo               volta à página de distribuição de aulas