Sequenciamento Completo de Genoma (WGS) e Metagenômica
O que é uma Sequência Genética?
Toda a informação necessária para o crescimento, reprodução e amadurecimento de um ser vivo é codificada em sequências de 4 "bloquinhos de construção" (chamados nucleotídeos e normalmente abreviados como A, G, C, e T) dispostos em extensas cadeias contidas em uma estrutura de forma e função específicos denominada DNA. O DNA consiste em duas cadeias paralelas e os nucleotídeos ao longo das cadeias são frequentemente chamados de pares de base. As sequências de codificação dentro do DNA são chamadas genes e contêm informação para diferentes formas e funções biológicas, como enzimas ou outras proteínas. As sequências não codificantes atuam como reguladores da síntese, mas também contêm funções desconhecidas. Dentro da célula, os milhares de milhões de pares de bases de cadeias de nucletídeos estão organizados em cromossomos que compõem o genoma de um determinado organismo. Ao longo da vida, quando um organismo necessita de algo, como uma determinada proteína, a informação contida no gene correspondente é copiada para um modelo e móvel na forma de outro de ácido (ribonucleico, ou RNA), que as células, posteriormente leem e traduzem para transformar a informação em uma molécula específica.
Sem dúvidas, compreender a ligação entre o que está codificado no DNA de um organismo, como em uma cepa específica da bactéria Salmonella, e as consequências biológicas finais daquele código, como a susceptibilidade ou resistência aos antibióticos, possui um imenso valor. Do mesmo modo, como o DNA define os traços físicos específicos, verificou-se que o conhecimento da sequência de DNA pode, às vezes, ajudar a prever ou superar doenças genéticas, como fibrose cística, distrofia muscular, entre outras. No entanto, a obtenção desta informação é muitas vezes desafiadora, porque depende do sequenciamento de múltiplos "bloquinhos de construção" dentro do DNA.
O que é Sequenciamento Completo de Genoma (WGS)?
O sequenciamento completo de genoma envolve a elucidação da ordem e da sequência do conjunto completo de nucleotídeos A, G, C, e T na cadeia de DNA de um dado organismo de uma só vez. O primeiro genoma humano completo obtido (cerca de 3 bilhões de pares de bases de comprimento) foi sequenciado e documentado pela junção de muitos fragmentos separados de diferentes indivíduos. Sequenciar todo o genoma humano, incluindo enormes sequências não codificantes de DNA, é incomum, principalmente devido ao elevado custo e tempo necessários. No entanto, o sequenciamento mais direcionado das partes do DNA de um indivíduo, especificamente relacionadas ao risco de alguma doença ou à ancestralidade, é agora comum e constitui uma poderosa ferramenta para a personalização dos cuidados de saúde e dos produtos farmacêuticos. Em contrapartida, o sequenciamento do genoma completo é mais viável para organismos mais simples, como as bactérias. Além disso, a base de conhecimentos que liga a informação genética à expressão e à função biológica desenvolve-se continuamente, conferindo mais valor ao sequenciamento genético.
Em que consiste o Método Sanger de Sequenciamento Completo de Genoma?
O método Sanger de sequenciamento de DNA foi desenvolvido em 1977 e tem sido historicamente o mais amplamente utilizado. Continua a ser utilizado hoje em dia como método em projetos de sequenciamento menores e direcionados. A chave para o sequenciamento de Sanger baseia-se em dois princípios científicos. Um deles é que os fragmentos de DNA podem ser precisamente separados uns dos outros com base no seu peso (usando, por exemplo a separação em gel); é possível distinguir as diferenças de comprimento, portanto, de peso, de apenas alguns nucleotídeos sob certas condições. Portanto, quando se tem uma mistura de milhares de fragmentos de DNA de diferentes comprimentos numa "sopa", o comprimento de cada um desses fragmentos pode ser detectado separadamente. O segundo é que existem nucleotídeos A, G, C, e T modificados marcados por fluorescência que emitem cores diferentes e, que quando adicionados a uma cadeia de ADN, como terminadores de cadeia, impedem a incorporação de qualquer outro nucleotídeo
O processo de sequenciamento Sanger começa com a mistura entre uma amostra de DNA que deve ser sequenciada e todos os ingredientes necessários para que esse DNA se duplique; se fosse deixado sozinho, o ADN duplicaria completamente muitas vezes. Contudo, pequenas quantidades de nucleotídeos A, G, C, e T marcados por fluorescência são também adicionados à mistura, os quais são incorporados aleatoriamente a uma fita em desenvolvimento, fazendo com que as replicações de DNA parem a cada vez que um deles é adicionado. A "sopa" resultante é uma mistura de DNA de diferentes comprimentos e pesos, cada um com um nucleotídeo marcado por fluorescência no final. Então, quando a mistura é separada por cromatografia em gel, cada comprimento é detectado individualmente e a cor do nucleotídeo marcado por fluorescência é registrada numa sequência que pode ser lida e é correspondente à sequência do DNA original.
Usando o método de sequenciamento Sanger, fragmentos de DNA de até cerca de mil pares de bases podem ser sequenciados num único experimento. Embora este número possa parecer impressionante, genomas completos contêm muitos mais pares de base. Por exemplo, o genoma da mosca da fruta contém aproximadamente 137.000.000 pares de bases. Assim, com base no método Sanger, foram desenvolvidas novas técnicas que permitem um sequenciamento mais rápido e barato de segmentos de DNA mais longos e até mesmo do genoma completo.
Como funciona o Sequenciamento Completo do de Genoma?
Os cientistas nos centros modernos de sequenciamento de genoma completo baseiam-se em princípios semelhantes aos do método Sanger, mas utilizam as vantagens do campo de microfluidos e da bioinformática avançada para, quando confrontados com um problema de sequenciamento de um genoma grande, serem aptos a decomporem este genoma em milhares de sequências de DNA menores que podem ser remontadas no genoma completo ou quase completo, posteriormente.
O que é o Sequenciamento Shotgun?
Quando uma molécula de DNA é muito longa para ser sequenciada de uma só vez, ela deve ser "cortada em muitos pedaços", cada um deles replicado individualmente e sequenciado com regiões sobrepostas, e depois remontada para criar o painel genético global. Embora isso possa ser feito manualmente, cada passo de corte, replicação e sequenciamento de DNA é o equivalente voltar ao protocolo da primeira geração, tal como a utilização do método Sanger ou Maxam-Gilbert.
O Sequenciamento Shotgun da próxima geração oferece uma solução engenhosa para o processo.
Os detalhes do próprio processo de sequenciamento variam de acordo com a tecnologia comercial, mas o sequenciamento por síntese (SBS) é bastante comum. No SBS, chips microfluidicos são utilizados para ligar fragmentos de DNA; uma vez que um fragmento de DNA é ligado a um local específico no chip, apenas segmentos idênticos de DNA podem ligar-se a esse local. Então, forma-se um aglomerado nesse local, que é depois exposto aos ingredientes necessários para a replicação, mas apenas um nucleotídeo de cada vez. Por exemplo, se um aglomerado tiver uma sequência GACA e os nucleotideos (A, G, C, e T) forem derramados sobre o aglomerado, então na primeira rodada apenas o nucleotídeo G com a sua "etiqueta fluorescente" seria capaz de se ligar aos fragmentos de DNA no aglomerado. Nem todos os nucleótidos livres se ligariam a este aglomerado de DNA e seriam levados. Na segunda etapa, a "etiqueta" do nucleotídeo adicionado é lida utilizando-se, por exemplo, a cor emitida por sua fluorescência). A terceira etapa é a remoção da etiqueta no nucleotídeo adicionado (G neste exemplo) com o objetivo de permitir a incorporação de um outro núcleotídeo pela fita em formação. No segundo ciclo, o nucleotídeo A com a etiqueta é o único capaz de se ligar ao aglomerado, e depois é lido e perde a sua etiqueta na preparação para o terceiro passo. Cada ciclo é executado até que a sequência de todo o fragmento esteja concluída. As diferentes metodologias de SBS no mercado diferem muito e principalmente na "etiquetagem" e na forma como essas etiquetas são lidas.
O Sequenciamento Shotgun produz uma enorme quantidade de dados contendo as sequências de cada pequeno fragmento de DNA, aleatoriamente recortado. Estes dados devem então ser processados para melhor alinhar as sequências sobrepostas que aparecem em mais de um fragmento para reconstruir a molécula de DNA original. A própria reconstrução é complicada pelas imperfeições inerentes às medições analíticas, possíveis erros na síntese do DNA e padrões repetitivos em múltiplas regiões do DNA. Normalmente, para gerar uma reconstrução satisfatória e reduzir a taxa de erro, a mesma região de DNA pode ser sequenciada até 30 vezes no caso de genoma eucariótico ou até 100 vezes para um genoma procariótico.
Quais são as aplicações do Sequenciamento Genético?
O DNA contém toda a codificação para a função biológica de um organismo e é passado de uma geração a outra. Por esta razão, os testes de DNA podem ser utilizados até mesmo para estabelecer paternidade. Além disso, há material genético de padrão herdável específico, como o DNA mitocondrial, que é passado da mãe para os filhos. Ele pode ser usado para traçar a herança materna de muitas gerações para estabelecer ancestralidade comum entre as espécies na biologia evolutiva. A informação genética também revolucionou a ciência forense: como o DNA de uma pessoa é único e está presente em todas as suas células, deixamos um vestígio dele em todas as nossas atividades diárias. Portanto, se o DNA de uma dada pessoa for conhecido e uma amostra de seu DNA for encontrada no local de um crime, é evidente que a pessoa em questão esteve lá em algum momento. Este processo é também conhecido como "coleta de impressões digitais de DNA". Técnicas semelhantes podem ser usadas para rastrear cepas bacterianas. Estes métodos podem ajudar a avançar significativamente a segurança e qualidade da indústria de alimentos, detectando a dinâmica de transmissão de microrganismos numa fábricae, a partir daí prevenindo a contaminação do produto final por patógenos ou deteriorantes.
Portanto, os dados brutos do processo de sequenciamento serão então expostos a várias ferramentas de análise bioinformática para produzir desde um esboço do genoma, resultante da montagem deste gigantesco quebra-cabeças até um mapa de variação, comparando os milhões de fragmentos com um genoma conhecido para encontrar as regiões variáveis entre eles. Ambas as abordagens podem ser utilizadas para determinar as relações entre cepas bacterianas encontradas num determinado local de forma semelhante ao método de coleta de impressões digitais de DNA. Os genomas esboçados podem também ser utilizados para encontrar genes alvo ou mutações de interesse com possível expressão fenotípica significativa nos genomas bacterianos, tais como resistência a antibióticos ou biocidas .
O que é a Metagenômica?
Os microrganismos são onipresentes na vida e formam uma relação simbiótica benéfica com organismos maiores, não sendo apenas micróbios causadores de infeção e doença. O corpo humano contém um ecossistema incrivelmente complexo de diferentes micro-organismos e o estado deste microbioma demonstrou ter um impacto direto na saúde humana. Em outros organismos ou em sistemas ecológicos maiores, os microbiomas são também reconhecidos como agentes críticos. Compreender as identidades e o equilíbrio entre as diferentes espécies de um microbioma pode fornecer informações valiosas sobre o funcionamento da comunidade microbiana. No entanto, a medição de um microbioma utilizando métodos tradicionais de cultura de células é problemática uma vez que nem todos os micróbios crescem favoravelmente em condições normais de cultivo - alguns nem sequer crescem - tornando difícil ou impossível construir uma visão abrangente de toda a comunidade microbiana existente.
A metagenômica é o sequenciamento do ADN de uma comunidade inteira de microrganismos, em oposição ao sequenciamento de micróbios individuais. Utilizando métodos comuns ao sequenciamento do genoma completo, uma mistura de ADN de diferentes micróbios individuais pode ser sequenciada e esta informação pode ser utilizada para reconstruir o perfil da espécie de toda a população microbiana. Para além do perfil de espécie de uma população microbiana, a sequência genética de cada membro também pode ser conhecida e comparada com outros membros da mesma espécie de outros microbiomas para compreender como esses micróbios evoluíram ou se adaptaram aos seus próprios ambientes.
A metagenómica estabeleceu a relação entre microbiomas e sistemas maiores, tais como o solo de exploração agrícola, e o papel destes microbiomas no ciclo de nutrientes, na supressão de doenças e na fixação de nitrogênio. Nos seres humanos, a relação entre o microbioma intestinal e a saúde é clara, embora os próprios mecanismos que estabelecem essa relação ainda permaneçam em pesquisa.