Portal BiolMol    Genomas:Geral        Genomas virais        Genomas procariotos        Genomas de eucariotos         Genomas de organelas

 

 

Distribuição de genes nos genomas eucariotos - Roteiro de aula

 

Introdução

 

 

O conhecimento das seqüência de nucleotídeos de genomas inteiros proporcionou muitas informações e um novo desafio. Como podemos extrair informações destas seqüências? Este desafio, entre outros de igrande complexidade, faz parte de uma nova disciplina chamada Bioinformática.

 

O NCBI (National Center for Biotechnology Information) tem muito a contribuir ao entendimento e bom uso das informações genéticas. Possuindo o maior computador civil do mundo, o NCBI permite operações em tempo real, acesso simples e rápido a seus software, a livros e a uma infinidade de informações.

 

Neste novo contexto insere-se esta parte de nossa disciplina, o estudo da distribuição dos genes em genomas de vários organismos e em genomas virais, não se utilizando da seqüência pura de nucleotídeos para análise, mas sim, de um estudo comparativo da organização dos gene no genoma e suas conseqüências para a diversidade dos seres vivos, uma vez que a biologia não faz sentido senão a luz da evolução. 

 

Neste módulo será observada a distribuição dos genes em genomas eucariotos, consultando-se o portal do NCBI para exemplos esclarecedores.

 

 

Sobre Eucariotos

 

Todos os Eucariotes possuem um núcleo definido que é limitado por uma membrana dupla, a membrana nuclear. Dentro desta membrana nuclear há cromossomos filamentosos complexos nos quais o DNA está associado a proteínas histônicas.

A levedura do pão, Saccharomyces cerevisiae, foi o primeiro organismo eucariótico a ter todo o seu genoma seqüenciado. A seqüência completa tem 12.068 kb, com 5.885 potenciais genes codificantes de proteína, cerca de 140 genes especificando RNA ribossômico, 40 genes para moléculas de pequeno RNA nuclear e mais de 200 genes para tRNA. 

Em seguida, 99% do genoma do verme modelo Caenorhabditis elegans foi publicada em 1998, e as seqüências quase completas dos genomas da mosca-da-fruta Drosophila melanogaster e da planta modelo Arabidopsis thaliana foram publicadas em 2000. A liberação dos primeiros rascunhos das seqüências do genoma humano em 2001 provavelmente recebeu a maior cobertura dos noticiários internacionais do que qualquer outro acontecimento da biologia.

Certo, mas o que aprendemos com todas estas seqüências? Em contraste com os genomas de Archaea e eubactérias, a densidade de genes varia muito entre espécies diferentes de eucariotos, indo de 1gene para cada 900 pb na levedura e a um gene por 127.900 pb em humanos. Os genomas de eucariotos unicelulares têm uma densidade, com o da levedura, de ume gene a cada 1.000 pb a 2.000 pb. A densidade diminui para um gene por 4.000 a 5.000 em Arabidopsis thaliana, um gene por 9.500 pb em Drosophila melanogaster , um gene por 15.000 pb no baiacu e a menor em mamíferos, com um gene por 115.000 pb a 129.000 pb.

A diminuição observada da densidade gênica com o aumento da complexidade relacionada ao desenvolvimento levanta dúvidas sobre as funções do DNA não codificante. Um dos motivos para a diminuição da densidade genética nos genomas eucariotos é que estes genomas contêm quantidades consideráveis de DNA repetitivo. Mas certamente devem haver múltiplas funções neste "excesso" de DNA que aos poucos serão esclarecidas. A presença de regiões que codificam microRNAs já é uma indicação de que funções até agora insuspeitas surgirão desta análise.

A levedura apresenta pouco DNA repetitivo, porém, muitas de suas seqüências apresentam-se duplicadas, cerca de 30% de seus genes. Em contraste, os genomas de eucariotos pluricelulares (metazoários) contêm muito DNA repetitivo, e a quantidade deste material, na maioria dos casos, é diretamente relacionado com o tamanho do genoma.

Um exemplo disto é que apenas 10% do genoma de C. elegans consiste em DNA moderadamente repetitivo, enquanto que 45% dos grandes genomas de mamíferos são compostos de seqüências de DNA moderadamente repetitivo. A maioria destas sequências moderadamente repetitivas é derivada de elementos de transposição.

O DNA altamente repetitivo também é mais abundante nos genomas maiores. Entretanto não há correlação direta entre a quantidade de DNA altamente repetitivo e o tamanho do genoma.

Íntrons são um componente significativo do DNA eucariótico e são mais prevalentes e maiores nos grandes genomas eucariotos. As regiões inter gênicas também são maiores nos genomas eucariotos grandes. Em contraste, o número de domínios distintos de proteínas – codificada por genes não parece variar muito com o tamanho do genoma. Entretanto, seres humanos e outros vertebrados usam mais as vias alternativas de recomposição do transcrito (splicing alternativo) para embaralhar esses domínios em mais combinações, aumentando a diversidade de proteína. Estas questões estão também discutidas em parte no texto inicial sobre genomas, desta parte da disciplina.   

Pesquisas genômicas mostram que mesmo espécies muito distintas têm muitos dos mesmos genes. Por exemplo, 18% dos gene de Arabidopsis e 50% dos genes em Drosophila têm homólogos humanos. Em espécies muito próximas, a proporção de genes homólogos e ainda maior, sendo 99% dos genes de camundongo homólogo de genes humanos.  No texto inicial sobre genomas discute-se também esta questão e se mostra, com uma figura, como novos genes vão sendo incorporados aos genomas de organismos complexos, mas sem perda daqueles que representam funções comuns a todos os organismos.

Por motivos didáticos dividiremos a nossa análise da distribuição de genes nos genomas enfocando separadamente os eucariotos inferiores (menos complexos) e os superiores. Trabalharemos com Leishmania major como modelo para eucariotos inferiores e traçaremos todos os caminhos até aprofundar em seus genes. Em seguida visitaremos os genomas de outros organismos, incluindo uma alga, um inseto, dois mamíferos, Canis lupus familiares, o cão domestico e Ornithorhynchus anatinus, o ornitorrinco, e duas plantas, uma empregada para alimentar boa parte da humanidade, o arroz, que é uma monocotiledônia, e outra empregada como modelo de pesquisa, a Arabidopsis thaliana, uma dicotiledônia..  

 

 

Distribuição de genes em genomas de eucariotos inferiores                   (siga diretamente para a análise dos genes em genomas eucariotos superiores)

Acessando a página do NCBI (http://www.ncbi.nlm.nih.gov/), deve-se procurar o item Genomic Biology, localizado a esquerda na página (contornado em vermelho na figura 1). Este link fornece várias ferramentas e recursos, incluindo páginas de organismos específicos, links para vários sites da internet e bancos de dados.

página de abertura do NCBI

Figura 1: Página de abertura do NCBI. Contornado em vermelho o link para Genome Biology

 

 

 

Em seguida, segundo a figura 2, ao abrir a página, a esquerda, vê-se uma barra azul no qual se localizam vários links ferramentas e banco dados. Outra barra transversal no qual se encontra “Search” onde se pode selecionar por categorias de informação. Ao lado observa-se um quadro vazio no qual deve-se colocar o nome da espécie ou qualquer outra classe taxonômica. Abaixo desta barra de ferramentas podemos encontrar “Assembly and Annotation Information”, “Announcements” e “The Human Genome”, respectivamente. Announcements que significa pronunciamentos corresponde a uma lista de genomas recém anotados. No lado direito pode ser visto o Genome Resources no qual se pode escolhe uma área de pesquisa. Além da opção Organism-Specific que trata de organismos específicos. Para esta busca devemos nos dirigir a opção Genome Resources e selecionar o item “Eukaryotic”, segundo mostra a figura 2, logo abaixo.

 

página de entrada do Genome Biology (NCBI)

 

           
Figura 2: Página do Genomic Biology, referente ao NCBI. Opção “Eukaryotic” sinaliza a área a ser explorada.                

Na página seguinte (figura 3), acessada pelo link Eukaryotic, mostrado com um contorno vermelho na figura 3 acima, observa-se uma grande tabela colorida, que corresponde a vários organismos Eucariotos com informações genéticas presente no banco de dados. Pode-se refazem a pesquisa com as opções “Organism Group”, referente ao grupo de eucariotos que preferi.


tabela de genomas eucaritos


Figura 3: Parte incial da tabela de genomas eucariotos que pode ser acessada a partir do link na coluna da direita na página de entrada do portal Genome Biology, do NCBI.


A inspeção da tabela mostra alguns pontos para nossa relexão. Há quase 500 genomas eucariotos listados, mas poucos estão completos. estes dados, embora não totalmente atualizados, mostram que é muito mais difícil obter um genoma completo de um eucarioto, mesmo um eucarioto simples, como um protozoário, do que sequenciar todo o genoma de uma bactéria. Isso se dá não apenas pelo tamanho consideravelmente maior dos genomas eucariotos, mas também por certas particularidades, como a presença de regiões ricas em repetições. Em três outras disciplinas as razões desta dificuldade serão aprofundadas: Técnicas Moleculares em Biologia, Bioinformática aplicada à Biologia e Genômica.


O genoma da galinha é 3 vezes menor que o nosso, mas o número de cromossomos é quase o dobro. Há outros organismos que têm um genoma do tamanho do nosso, mas 1/3 do número de cromossomos. Assim, a natureza parece ter uma grande flexibilidade na forma como "empacota" o genoma, podendo dentro de uma mesma ordem juntar vários cromossomos, em duas espécies de gêneros próximos, fazendo com que o genoma, sem variar em tamanho, esteja dividido em números bastante diferentes de cromossomos.

A variação do tamanho dos genomas é, por sua vez, embora menor do que entre os vírus, maior do que entre as bactérias, com o maior genoma tendo perto de 3800 MB e o menor 2,5 Mb, portanto uma diferença de tamanho de mais de 1000 X! Esta diferença reflete a diferença de complexidade dos organismos, embora nem sempre haja uma relação evidente entre as duas coisas (veja a discussão deste tema na parte inicial de Genomas). Mesmo sem uma correlação muito forte, parece evidente, pela inspeção da tabela, que os genomas de mamíferos são os maiores, outros vertebrados têm genomas geralmente bem menores. Da mesma forma, as dicotiledôneas costumam ter genomas maiores que a monocotiledônias. Vermes têm genomas menores que peixes, e assim por diante, dando uma indicação de que o aumento da complexidade exige em geral um aumento do genoma.

Bem mais abaixo na tabela mostrada na figura 3, aparecem os dados do genoma de Leishmania major, nosso primeiro exemplo em eucariotos simples (ou inferiores).


GPID Organismo  Grupo Sub-grupo TaxID Tamanho do genoma Número de cromossomos Status Método Data da versão Quem fez
10724  Leishmania major strain Friedlin Protists Kinetoplasts 347515    5.44       36 Assembly WGS 03/17/1999       Friedlin Consortium [more]

 

Uma simples inspeção dos dados nos mostra que o genoma não é muito grande: com 5,44 Mbases, ele é um pouco maior do que a média das bactérias, que é em torno de 2,5 Mb. O número de genes, nã mostrados aqui, é pouco inferior a 10.000, o que é pouco mais do dobro dos genes de uma bactéria comum. O curioso aqui é a distribuição do genoma num grande conjunto de pequenos cromossomos. Parece estranho que um organismo unicelular parasita precise de 36 pares de cromossomos, mas o fato é que todos eles são muito pequenos e não se comparam mesmo com o menor cromossomo humano. Este genoma já está concluído e foi obtido por um conjunto de estratégias, incluindo o sequenciamento de pequenos fragmentos genômicos (whole genome shotgun sequencing, ou WGS, como mostrado na tabela) obtidos de DNA nuclear global ou de cromossomos individualizados em eletroforese de campo pulsado.

 

Selecionada a opção Leishmania major, automaticamente entramos na página que corresponde à figura 4 abaixo.

 

 

Figura 4. Página de abertura para o genoma de Leishmania major. No quadro central estão representados todos os cromossomos, que podem ser acessados por um click sobre qualquer um deles.

 

Logo observamos um barra à esquerda, “Resource Links”, com opções como “NCBI  Resource” (mapas e Blast genômico), “Organism Data in GenBank” (Dados baseados em seqüências EST, Genômicas, mRNA e proteínas) e “Sequencing Center” (com diversos centros de seqüenciamento), entre outros. Ao centro encontra-se um breve comentário sobre o indivíduo em estudo, mais embaixo observa-se “Lineage” que corresponde a posição taxonômica do individuo. Logo após vê-se um quadro com os 36 cromossomos da Leishmania major. Selecionaremos o cromossomo 1 clicando logo em cima do número do cromossomo na figura. Abre-se a figura mostrada abaixo:

 

 

 

Figura 5: Representação das informações disponíveis no NCBI sobre o cromossomo 1 de Leishmania major. À esquerda a linha vermelha oval contorna o trecho do cromossomo detalhado à direita, no caso todo o cromossomo. A flecha vermelha em cima dela indica a ferramenta de zoom, para ampliação do cromossomo, que mostrará maior detalhamento na parte direita da figura. Os quadros com as letrs A, B e C representam as três formas de mostrar o cromossomo: A letra A mostra o contig, isto é, uma longa sequência de DNA formada de centenas de cequências menores e que, neste caso, sozinha já cobre todo o cromossomo. A letra B indica as sequências de referência, que são sequências de genes transcritos muito confiáveis e bem definidas e a letra C representa os genes identificados pelo consorcio que sequenciou a L. major. As setas curvas na parte de baixo da figura mostram que há informações complementares sobre A, B e C na parte final da figura. A linha pontilhada acima mostra o ponto no cromossoma onde há troca do sentido da transcrição (e, consequentemente, da fita transcrita).

 

 

 

No quadro central temos uma opção para selecionar quaisquer dos 36 cromossomos de Leishmania major. Numa grande barra azul do lado esquerdo 2 caixas brancas são bem visíveis, seguidas do botão Go. Elas são úteis para digitar o intervalo de bases no cromossomo que queremos analisar. Logo abaixo delas, encontramos outra caixa com barrinhas azuis, que equivalem ao zoom do cromossomo: quanto menor a barrinha maior o zoom. Ao selecionarmos barrinhas menores aumentamos em 10x, alcançando até o zoom de 10.000x, correspondendo a ultima barrinha. Mais abaixo, observa-se uma grande caixinha está representa todo o cromossomo 1 e sua parte cinza e vermelha a área de visualização, quanto maior o zoom menor a porção cinza. Ao lado direito, como podemos observar na figura 6, contém três fitas que representam a mesma sequência de DNA do cromossomo 1. A primeira representa o “Contig”, isto é, uma longa sequência formada por centenas de pequenas sequências parcialmente sobrepostas. Neste caso apenas um contig contem todas as bases do cromossomo 1. A segunda fita, “Ref Seq RNA” representa os genes transcritos da Leishmania e a terceira fita “Genes_Seq” os genes anotados pelo consórcio que sequenciou o genoma da Leishmania. Ao lado da fita “Genes_Seq” estão alguns genes destacados em azul e ligados por setas as áreas correspondentes no cromossomo. Ao lado de cada gene encontra-se sua orientação na fita, que equivale a uma seta para cima ou para baixo. Há ainda a opção “links”, que permite a visualização de mais informações sobre o gene; por fim a coluna “Description” resume o que se sabe sobre as funções de cada gene. O cromossomo tem 84 genes (o que pode ser visto no final da figura, nas descrições de B e C), mas poucos estão representados neste zoom, por questões de clareza.

 

O que salta às vistas como não usual? O fato de todos os primeiros genes até a linha vermelha tracejada serem transcrito num sentido e todos os demais em outro. Por que será isso? Este parasita e todos os demais da mesma família (a família Trypanosomatidae, da qual fazem parte os gêneros Trypanosoma e Leishmania, entre outros) têm uma forma muito estranha de transcrever seus genes: um longo transcrito (pré-mRNA_ contendo dezenas de genes é produzido, independentemente da necessidade ou não dos produtos daqueles genes. Em seguida todos os genes são separados entre si por um mecanismo também muito peculiar, chamado trans-splicing, para finalmente só serem traduzidos quando de fato necessário. Este controle da tradução é devido a sinais nas regiões 3´-UTR e 5´-UTR, mas principalmente na primeira. Então, nestes organismos, o controle da expressão gênica é pós-transcricional e se dá, efetivamente, no nível da tradução. Esta estranha disposição de genes foi observada primeiramente para o cromossomo 1 (Myler PJ et al., 1999). Será que todos os cromossomos mostram esta característica. Observemos um cromossomo grande, o 33 por exemplo.

 

Figura 6: Recorte da imagem que mostra a distribuição dos geme no cromossomo 33. Observe-se que, como no cromossoma 1, há uma mudança no sentido de transrição dos genes, que são transcritos em dois grandes blocos, cada um a partir de uma fita.

 

É evidente da figura 6 que, também para o cromossomo 33, os genes de uma mesma fita estão dispostos um atrás do outro. Há umas poucas exceções, e são genes de rRNA ou tRNA, que são transcritos a parti de promotores próprios. Os demais genes devem ter um promotor a região de mudança de direção da transcrição.

 

Esta peculiaridade está presente em todos os cromossomos da Leishmania major (Ivens AC et al., 2005) e, em verdade, em todos o cromossomos dos tripanosomatídeos.

Se fizermos um zoom sobre o cromossomo 1, digamos entre 114 k e 120k, obteremos uma visão de quão próximos estão os genes e se são interrompidos ou não. O figura abaixo mostra este zoom. De fato, os genes de tripanosomatídeos não tem íntrons (fora pouquíssimas exceções) e a distância media entre os genes é apenas um pouco maior do que a média entre bactérias, em parte pela grande extensão das regiões 3´-UTR nestes organismos: neste cromossomo a distância média é de um gene a cada 3.200 bases.

 

 

Figura 7

 

 

 Podemos então chegar a algumas conclusões quanto à distribuição de genes no genoma de L. major.

 

 

 

Nosso segundo exemplo de genoma eucarioto será o de Ostreococcus lucimarinus, uma alga verde, que tem um dos menores genomas eucariotos já estudados. A figura 8 mostra alguns dados do organismo, que aparecem quando se seleciona seu nome na tabela mostrada na figura 3. Observamos de imediato que apesar de ter apenas 13,5 Mb, o genoma está dividido em 21 cromossomos! Uma análise da distribuição dos genes para o cromossomo 1 mostra que há 684 genes distribuídos de forma mais ou menos aleatória nas duas fitas, ao contrário do que vimos para Leishmania. Para um tamanho de cromossomo de 1150 kb temos uma densidade de 1,68 genes/ 1000 pb, o que está dentro da faixa dos genomas procarioto e, portanto, abaixo da densidade de genes de Leishmania, embora as diferenças sejam pequenas como veremos quando analisarmos a densidade de genes num mamífero.

 

 

Figura 8: Página de entrada ao genoma de Ostreococcus lucimarinus. Apesar do pequeno tamanho do genoma, ele está dividido em 21 mini-cromossomos, como o genoma da Leishmania major.

 

 

 

 

 

 

 

Distribuição de genes em genomas de eucariotos superiores                       (volte para a análise dos genes em genomas de eucariotos inferiores)

 

Nosso terceiro exemplo iniciará a análise dos organismos multicelulados (Metazoa). Observemos como se distribuem os genes no genoma de um inseto, neste caso a drosófila. O genoma completo tem 180 Mb, muito maior portanto que o da Leishmania major. Ele está distribuído, como na maioria dos insetos, em poucos cromossomos (5 maiores e dois bem pequenos, além do genoma mitocondrial).Ao visitarmos um dos cromossomos (o mapa do cromossomo #4 está mostrado abaixo), observamos que, além das usuais linhas verticais representando os contigs, refseq e genes, há agora uma linha com uma figura alongada denominada ideograma, que é a forma como os cromossomos destas moscas de fruta aparecem na microscopia. O ideograma é, portanto, um mapa citogenético (padrões de bandas) dos braços eucomáticos dos chamados cromossomos politênicos. Clicando sobre o link sobre cada uma destas linhas verticais é possível acessar uma detalhada definição de cada uma destas representações do genoma.

 

Figura 9:

 

 

Densidade: 0,066 genes por cada 1000 pb, o que pode ser convertido para pouco menos de um gene a cada 10.000 pb. Já começamos a observar um aumento do espaço entre os genes e precisamos nos questionar o por quê disso. Vamos olhar "de perto" um gene para ver se podemos inferir as causas.

 

Escolhendo um gene qualquer, clicando sobre ele e optando pelo Display "Graphics" vemos a figura abaixo. Observamos de imediato que as sequências codificadoras dos genes são interrompidas por íntrons, em geral não muito longos. A seta preta vertical aponta para um gene com um longo intron inicial (veja a questão do comprimento médio do primeiro íntron neste paper). Mas a distância entre os genes, efetivamente, não parece ser maior do que em Leishmania, por exemplo. Então, podemos admitir que, quando surgem íntrons nos genes, a densidade gênica diminui e o genoma, para acomodar mais genes necessários aos metazooários,  costuma crescer.

 

 

Figura 10:

 

 

Nosso quarto exemplo já nos leva à análise da distribuição do genes e de suas características em mamíferos. Vamos examinar de perto os cromossomos de um dos mamíferos mais primitivos, o ornitorrinco, através de uma visita ao seu genoma.

 

O cromossomo 1 tem 270 genes anotados em 48 Mb, dando uma densidade de um gene a cada 177 kb. Esta densidade é claramente menor do que a observada para drosófila e muito menor do que a de genomas de eucariotos com genes sem íntrons ou com poucos íntrons apenas. No caso do genoma da drosófila, vimos que os íntrons contribuiam para a maior parte do aumento do genoma em relação a um eucarioto primitivo. E o que, na distribuição de genes do ornitorrinco, provoca uma queda de densidades de gene tão grande?

Se olharmos o cromossomo 1 numa ampliação de 100X vamos observar que há um enorme espaço entre os genes. Esta já é uma característica dos genomas de mamíferos e assim, mesmo no ornitorrinco, ela já está presente, vindo portanto, de algum antepassado longínquo dos mamíferos atuais. Se olharmos um gene qualquer por exemplo, o LOC100078696, podemos ver que os éxnos são relativamente pequenos, ficando "imersos numa grande lagoa de íntorns", como mostrado na figura 11 abaixo. No caso de genes outros mamíferos e mesmo no caso do ornitorrinco, há genes cujos exons são diminutos em relação aos íntrons, e muito numerosos, o que provoca per se uma expansão considerável do tamanho do genoma, independentemente do aumento relativo da distância entre os genes.

Figura 11:

Nosso último exemplo de distribuição de genes em vertebrados está baseado no genoma do cão, Canis lupus familiaris, um mamífero "moderno". O genoma está distribuído em 38 cromossomos somáticos e dois sexuais (Xe Y), de forma análoga ao genoma humano. O cromossomo 1 apresenta 1144 anotados em 126 Mb, o que redunda numa densidade de um gene a cada 110 kb. Isso não é significativamente distinto do que foi observado no genoma do ornitorrinco e sugere que uma solução para a distribuição de genes foi alcançada pela evolução em mamíferos, que aparece desde o mais primitivo deles ao homem.

Finalizando a análise dos genes em mamífero, podemos agora afirmar que o número de genes no genoma humano deve estar em torno de 25.000, o que é pouco mais de 3 vezes o número de genes de uma lombriga (veja link). Com este número de genes em 3.038 Mb de genoma haplóide a densidade de genes está bem entre aquela vista no cromossomo 1 do cão e no mesmo cromossomo do ornitorrinco.

 

Pode ser chocante, à primeira vista, mas mostra que outros mecanismos estão envolvidos na produção de quase um milhão de diferentes proteínas e já comentamos o principal deles aqui: o splicing alternativo. Mas há outro ponto importante: a forma como os genes são regulados e orquestrados entre si pode ser tão ou mais importante do que seu número absoluto. Por fim, as regiões intergênicas estão se revelando importantes no controle da expressão gênica, e aí aparece talvez a razão pela qual o genoma humano está entre os maiores da natureza.

E como se distribuem os genes nos genomas de plantas? Vamos examinar uma planta monocotiledônea e outra dicotiledônea.

 

O primeiro exemplo é o arroz, Oryza sativa, cuja genoma de 466 Mb está dividido em 12 cromossomos. O tamanho mostra que ele é muito menor do que o de um mamífero e muito maior do que  de uma alga. Observemos o cromossomo 1, mostrado na figura abaixo:

 

Figura 12:

Há claramente uma distribuição bastante equilibrada de genes entre as das fitas nas 43 Mb do cromossomo. Aproximando 100 X (figura 13 abaixo) podemos observar que os genes possuem por vezes longos íntrons, mas que muitos outros genes parecem não tê-los. A análise de outras partes do mesmo cromossomo aponta para a preferência da existência de introns, embora eles sejam bem menores do que os de mamíferos (veja figura 14). A distância entre os genes também é muito menor do que em mamíferos.

Figura 13: Região do cromossomo 1 de Oryza sativa ampliado 100X (entre 21410 kb e 21850 kb). Observa-se a presença de dois genes com íntrons, na parte de cima da barra vertical representando os genes na região ampliada. Mas há também vários pequenos genes sem íntrons na parte de baixo (nem tudo o que está anotado é gene, atenção ao que diz a legenda à direita, na coluna Description).

 

Figura 14: Zoom de 1000X numa região do cromossomo 1 de O. sativa. mostrando que todos os genes ali têm introns, embora bem menores do que os de genes de mamíferos. Os íntrons aparecem como linhas pretas unindo os exons, representados como barras pretas.

Uma análise da densidade de genes no cromossomo 1 mostra que ela é de 1 gene a cada 10.000 bases, o que é bastante denso. Pode ocorrer que ela seja menor, quando todos os genes candidatos tiverem sido testados e descartados aqueles que não são verdadeiros. Assim, de uma forma geral, o genoma desta planta é um intermediário entre um gene muito simples e compacto, como o de uma alga verde, e o de um mamífero.

Por fim, observemos a distribuição dos genes em Arabidopsis thaliana, uma pequena planta dicotiledônea.O genoma tem 119 Mb distribuídos em 5 cromossomos. As plantas parecem preferir um número menor de cromossomos do que os mamíferos, mas apresentam frequentemente várias ploidias, o que aumenta a quantidade total de DNA no genoma e contribui para a variedade intragênica, com a presença de vários alelos num mesmo indivíduo. A densidade de genes no cromossoma 1 é muito semelhante à observada no cromossomo 1 de Arabidpsis  thaliana de arroz.

Concluímos, assim, de nossa visita a vários genomas eucariotos, em busca da forma como os genes se distribuem neles, que há uma correlação positiva entre o aumento da complexidade e o aumento dos genomas, embora haja exceções. Este aumento é devido tanto ao afastamento maior entre os genes como à presença de íntrons, que tendem a ser maiores nos organismos mais complexos, em especial nos mamíferos. Não investigamos em detalhes, mas os genomas eucariotos também costumam apresentar muitos pseudogenes, que podem ser fruto de inserções de cDNA retrotranscrito de mRNAs de organismos invasores ou do próprio organismo, ou genes duplicados que perderam a funcionalidade. Isso também ocorre em algumas bactérias, notavelmente em Mycobacterium leprae e essencialmente em todas as classes de seres vivos (exceto vírus, se os considerarmos como seres vivos). Um outro ponto que não comentamos, mas que fica claro de todos os nossos exemplos com genomas eucariotos, é que os cromossomos são lineares, ao contrário do que acontece com a maioria dos genomas procariotos, que são circulares.

 

Por fim, sugerimos a visita a outros genomas, como o  Plasmodium vivax (parasita unicelular), Neurospora crassa (fungo), Lotus japonicum (uma erva de jardim), e Pongo abelii (orangotango de Sumatra)

 

Bibliografia de apoio a esta parte da disciplina:

Biologia Vegetal

Editora Guanabara Koogan – 1992 – 5ª edição

Autor: Haven P. R.; Evert R. F.; Eichhorn S. E.

Capítulo 10 Página 162 (Haven, 1992)  

 

 Fundamentos de Genética

Editora Guanabara Koogan

2008 – 4ª edição

Autor: Snustad D. P. ; Simmos M. J.

Capítulo 16 Pagina 495 a 501