Projeto Genoma

Projeto Iniciado a partir de 1990, o projeto Genoma Humano constituí-se em um esforço de 13 anos coordenado pelo departamento americano de energia e o instituto nacional de saúde. O projeto originalmente, foi planejado para ter uma duração de 15 anos, mas os rápidos progressos tecnológicos aceleraram as previsões para o ano de 2003. Objetivo Os principais objetivos do projeto são: identificar todos os 100.000 genes humanos presentes no DNA; determinar as seqüências de 3 bilhões de pares de bases químicas, que constituem a base do DNA; armazenar estas informações em Banco de Dados; desenvolver ferramentas para analise do material obtido; discutir e normatizar questões legais advindas do processo de pesquisa.

Participantes

Vários países estão dando a sua contribuição a esta pesquisa, dentre as quais se destacam os maiores programas em países como: Austrália, Brasil, Canadá, China, Dinamarca, União Européia, França , Alemanha, Israel, Itália, Rússia, Suécia e EUA. Alguns dos países participantes possuem estudos de técnicas de biologia molecular para a pesquisa do Genoma e estudos de organismos com relevância em suas respectivas regiões geográficas. A "Human Genome Organization" (HUGO), ajuda a coordenar a colaboração internacional neste projeto. Organizações governamentais e privadas vem largamente investindo numa abordagem holística da biologia molecular e evolução realizando sequenciamento de um crescente número de genomas dos mais diferentes organismos. Essa nova e fascinante área da Biologia, a Genômica, tem aproximado o homem cada vez mais do momento em que poderá assumir o controle dos mecanismos da vida pelo acesso da maquinaria bioquímica que rege as interações entre moléculas de ácidos nucleícos e proteínas. A década de 90 é para muitos biologistas o marco da era dos genômicos. É cada vez maior o esforço dos cientistas para colocar à disposição um número crescente de genomas inteiros sequenciados dos mais diferentes organismos. Benefícios Essas informações trazem o potencial de solucionar os mistérios dos seres vivos possibilitando ao homem controlar a intimidade dos mecanismos da vida. Assim em futuro próximo a Genômica viabilizará o combate ao câncer e à muitas outras doenças bem como o bloqueio do tão temido processo do envelhecimento. E segundo alguns cientista, como Dr. Andrew Simpson, coordenador do sequenciamento do genoma da Xylella fastidiosa e do Genoma Câncer, em um futuro mais distante mesmo a imortalidade ou a criação de vida seria factível. Isso porque quando se tem acesso as seqüências dos genes que compõem o genoma de um organismo na realidade tem-se as portas abertas para o conhecimento de todas as proteínas necessárias e suficientes para a existência desse organismo. De posse desse conhecimento resta, é claro, o desafio maior de esclarecer como essas proteínas se inter-relacionam para executar as mais diferentes funções de um ser vivo desde a formação, diferenciação e manutenção de uma célula viva, até funções mais complicadas que levam ao conceito sobre consciência, memorização, sentimentos, etc.

Desenvolvimento

O seqüenciamento geralmente é realizado pela técnica desenvolvida pelo grupo de F. Sanger. O DNA fragmentado randomicamente em segmentos parcialmente sobrepostos são clonados e amplificados pela bactéria hospedeira. O DNA do vetor contendo o fragmento é isolado e utilizado como molde na reação de seqüenciamento, utilizando-se primeiros com seqüência complementar às regiões que flanqueiam o sítio de ligação do vetor, o fragmento é duplicado por uma polimerase na presença dos 4 nucleotídeos que compõem o DNA (dATP, dCTP, dGTP e dTTP). Em menor quantidade que os 4 nucleotídeos, participam da reação dideoxinucleotídeos responsáveis pelo bloqueio da reação de polimerização. Como esses nucleotídeos modificados estão em concentrações muito menores que os outros da mesma base, a sua inserção na cadeia em formação é menos freqüente que o nucleotídeo normal. O resultado é que o local de finalização da polimerização é randômico, garantindo a formação de tantos oligonucleotídeos quanto for o número de bases que compõem o fragmento a ser seqüenciado. E o tamanho desses oligonucleotídeos varia desde 1 base até o número total de bases. Esses dideoxinucleotídeos (ddATP, ddCTP, ddGTP e ddTTP) marcados com diferentes corantes possibilitam a identificação do oligonucleotídeo que os contém. Os oligonucletídeos são separados pelo tamanho, por eletroforese ou cromatografia em coluna capilar, em bandas individuais que são detectadas por raios laser. Através de um software, as bandas são traduzidas nas letras A, C, G e T que designam as bases adenina, citosina, guanina e timina. Assim se obtém a seqüência de bases de um fragmento do cromossomo. Resta unir os fragmentos na ordem em que eles se encontram no cromossomo, o que se faz com ajuda de um software. Nos diferentes grupos de organismos, o genoma difere muito quanto a tamanho e organização, exigindo do pesquisador estratégias que possibilitem seu seqüenciamento. Procariotos possuem o genoma contido em uma grande molécula de DNA de fita dupla e em forma de círculo, conhecido por DNA genômico, geralmente acompanhado de uma ou duas pequenas outras moléculas também circulares e de fita dupla, os plasmídeos. O tamanho do genoma fica na ordem de 5x105 a 5x106 pares de base. O genoma estendido em uma linha reta perfaz 1.500 µm, no caso da bactéria E. coli, enquanto que genomas de eucariotos chegam a centímetros (17 cm no milho) ou mesmo metros. Os eucariotos têm seu genoma confinado ao núcleo e são compostos de várias moléculas de DNA, fita dupla, e lineares - são os chamados cromossomos. O número de cromossomos é variável: 2 no fungo Ustilago maidis (agente causal do carvão do milho); 4 na mosca da fruta (Drosophila melanogaster); 5 na Arabdopsis thaliana (planta da família Crucíferas, usada como planta teste) 23 no homem ou mesmo 30, no boi, em suas células haplóides (gametas). Núcleos das células diplóides (células somáticas) possuem duas unidades de cada cromossomo. Organismos com células contendo três (triplóide), quatro (tetraplóide) ou mais cópias de cada cromossomo são relativamente freqüentes, principalmente no reino vegetal. A maçã é triplóide, a batatinha é tetraplóide) e a Triticale, hibrido de Triticum aestivum e Secale cereale, possui 8 cópias de cada cromossomo. Então, para eucariotos cada cromossomo é seqüenciado em separado. Há necessidade, portanto, de obter cada cromossoma isolado para poder fracioná-lo e proceder ao seqüenciamento como foi acima mencionado. Isso é possível utilizando-se um equipamento denominado FACS (Fluorescence Activated Cell Sorter). Colcemida, um inibidor da mitose na metafase é adicionado a células em meio de cultura. Assim se obtêm células com a membrana nuclear dissolvida e cromossomos, duplicados na profase, livres no citoplasma celular. Os cromossomos são liberados pela lise das células devido à ação de uma solução salina hipotônica. Coram-se os cromossomas com um corante específico, como a cromomicina A3. A preparação atravessa dois finos feixes de raio laser que excitam o corante a emitir luz fluorescente. Um software interpreta o tipo e intensidade dessa luz que é característica para cada cromossomo. O computador, programado para escolher um determinado cromossomo, ao reconhecê-lo vai emitir uma corrente que torna esse cromossomo eletricamente carregado. Pela ação de um ultra-som, a suspensão é transformada em minúsculas gotas, cada uma delas contendo um cromossomo. Quando a gota contendo o cromossomo eletricamente carregado passa por um campo magnético, é atraída e separada das outras gotas em um tubo a parte. Além da tarefa de separar os cromossomos, para seqüenciar genomas de eucariotos enfrenta-se outro grande obstáculo. Cromossomo de procarioto não tem seqüência supérflua. É composto de seqüências denominadas ORFs (open reads frames) correspondentes a genes, e seqüências 5'-3' que codificam elementos reguladores da transcrição gênica. Então, toda a seqüência do DNA do procarioto é traduzida em uma função do organismo. Já em eucariotos, apenas 3 a 5% do cromossomo são seqüências funcionais, o restante é conhecido como lixo genômico. As seqüências funcionais, como nos procariotos, são ORFs (open reads frames) e elementos reguladores. As seqüências não funcionais são introns que permeiam os genes e pequenas seqüências que se repetem centenas ou até milhares de vezes em um cromossomo. Essas seqüências repetitivas são muito utilizadas para detectar diversidade genética e relação filogenética inter e intra-espécies. Tendo-se obtido a seqüência do cromossomo pode-se, com o auxílio de um banco de dados, obter a estimativa dos genes que compõem esse cromossomo. Pode-se obter informações gerais sobre o organismo - por exemplo, saber quanto do material genômico está envolvido em um processo metabólico e como esses genes estão dispostos no genoma. Por exemplo, o Mycoplasma genitalium aloca 5% do seu genoma para codificar o gene da adesina e outras seqüências correlatas. Supõe-se que esse organismo utiliza essas seqüências para produzir variantes antigênicas de forma a contornar a resposta imunológica do hospedeiro. O que não se encontra em um genoma também é informativo. No genoma de Haemophilus infuenzae não foram detectadas 3 das enzimas do ciclo do ácido carboxílico, o que é totalmente inesperado. Provavelmente, deve se tratar de uma adaptação metabólica desses organismos fastidiosos, parasitos exclusivos do homem. Um primeiro passo para se comprovar a função de um gene é obter um organismo deficiente para esse gene, isto é, inativando-se esse gene. Consegue-se essa façanha interrompendo a seqüência desse gene com uma seqüência de DNA estranho, técnica conhecida como gene knockouts, ou por deleção de parte do gene . Dessa forma, detecta-se facilmente, os genes com funções vitais. Como já foi enfocado no início, a Genômica, através do seqüenciamento de genomas, constitui o início da rota para se conhecer todas as proteínas necessárias e suficientes para a existência de um organismo e obter subsídios para o esclarecimento de como essas proteínas se inter-relacionam e são capazes de executar todas as diferentes funções de um ser vivo. Dificuldades As dificuldades nesse conjunto de empreendimentos têm duas causas principais: o número relativamente restrito de genes com localização e função já conhecidas, e o fato de que os genes funcionais encontram-se dispostos entre uma quantidade considerável de DNA de função não identificada.