Wissenschaftliche Bibliothek

Whole Genome Sequencing (WGS, Vollständige Genomsequenzierung) und Metagenomik

Joao Andre Carriço.png
by Joao Andre CARRIÇO
Whole Genome Sequencing WGS.jpg

Ein umfassender Überblick über vollständige Genomsequenzierung, Metagenomik, Sequenziermethoden und Anwendungen

 

Was ist eine genetische Sequenz?

Alle Informationen, die ein Lebewesen benötigt, um zu wachsen, zu reproduzieren und zu reifen, sind in Sequenzen von 4 Bausteinen kodiert, die Nukleotide genannt werden (allgemein abgekürzt als C, G, A und T), die zu langen Ketten polymerisiert sind, die in den Zellen enthalten sind und Desoxyribonukleinsäure (DNS) genannt werden. Die DNS besteht aus zwei parallelen Ketten und die Nukleotide entlang der Länge der Ketten werden oft als Basenpaare bezeichnet. Kodierende Sequenzen innerhalb der DNS werden als Gene bezeichnet. Sie enthalten Informationen für verschiedene biologische Funktionen, wie Enzyme oder andere Proteine. Nicht-kodierende Sequenzen wirken als Regulatoren für die Synthese, enthalten aber auch unbekannte Funktionen, die noch entdeckt werden müssen. Im Inneren der Zelle sind die Milliarden von Basenpaaren der Nukleotidketten in Chromosomen angeordnet, die das Genom eines bestimmten Organismus ausmachen. Wenn ein Organismus während des Lebens etwas benötigt, wie z. B. ein bestimmtes Protein, wird die Information des entsprechenden Gens in Form einer Ribonukleinsäure (RNS) in einen einzelnen und mobilen Bauplan kopiert, den die Zellen ablesen, um das herzustellen, was benötigt wird.

Es ist eindeutig von unschätzbarem Wert, wenn man den Zusammenhang zwischen dem, was in der DNS eines Organismus kodiert ist, wie z. B. ein bestimmter Stamm von Salmonellenbakterien, und den letztendlichen biologischen Konsequenzen, wie z. B. Widerstandsfähigkeit oder Resistenz gegen Antibiotika, kennt. In ähnlicher Weise, da die DNS die spezifischen körperlichen Merkmale definiert, wurde erkannt, dass die Kenntnis der DNS-Sequenz manchmal bei der Vorhersage oder Überwindung von genetischen Störungen, wie Mukoviszidose, Muskeldystrophie usw. helfen kann. Der Prozess, diese Informationen zu erhalten, ist jedoch oft schwierig, da er auf der Sequenzierung der Bausteine in der DNA beruht.

 

Was ist eine vollständige Genomsequenzierung (WGS)?

Die vollständige Genomsequenzierung ist die Messung der Anordnung des gesamten Satzes von C-, G-, A- und T-Nukleotiden eines bestimmten Organismus innerhalb seiner DNS zu einem bestimmten Zeitpunkt. Das erste vollständig erhaltene menschliche Genom (mit einer Länge von rund 3 Milliarden Basenpaaren) wurde gemessen und ausgewiesen, indem viele separate Messungen von verschiedenen Individuen zusammengesetzt wurden. Die vollständige Genomsequenzierung beim Menschen, einschließlich großer Abschnitte mit nicht-kodierender DNS, kommt meistens aufgrund der hohen Kosten und der nötigen Zeit nur selten vor. Eine gezieltere Sequenzierung spezifischer Teile der individuellen DNA, die für das Krankheitsrisiko oder die Abstammung relevant sind, ist heute jedoch gang und gäbe und ein leistungsstarkes Werkzeug, das in der personalisierten Gesundheitsversorgung und Pharmazie eingesetzt wird. Die vollständige Genomsequenzierung wird aber bei einfacheren Organismen, wie z. B. Bakterien, einfacher erreicht, und die Wissensdatenbank, die genetische Informationen zu Ausprägung und biologischer Funktion verbindet, wächst ständig, was den Wert der genetischen Sequenzierung weiter erhöht.

 

 

Die vollständige Genomsequenzierung nach der Sanger-Methode

Die Sanger-Methode zur DNS-Sequenzierung wurde 1977 entwickelt und ist historisch gesehen diejenige, die am meisten eingesetzt wurde. Sie wird auch heute noch für kleinere, gezielte Sequenzierprojekte eingesetzt. Der Schlüssel zur Sequenzierung nach Sanger beruht auf zwei wissenschaftlichen Prinzipien. Zum einen lassen sich DNS-Fragmente anhand ihrer Länge präzise voneinander trennen (z. B. durch Geltrennung). Unter bestimmten Bedingungen sind Unterschiede in der Länge von nur wenigen Nukleotiden möglich. Wenn Sie also eine Mischung aus tausenden von DNS-Fragmenten unterschiedlicher Länge in einer „Suppe“ haben, kann die Länge jedes einzelnen dieser Fragmente einzeln nachgewiesen werden. Zum anderen gibt es modifizierte "Marker"-Nukleotide C, G, A und T, die in unterschiedlichen Farben leuchten. Sobald sie einer DNS-Kette hinzugefügt wurden, verhindern sie, dass sich andere Nukleotide weiter verbinden.

Der Sequenzierprozess nach Sanger beginnt damit, dass eine Probe der zu sequenzierenden DNS mit allen Wirkstoffen gemischt wird, die diese DNS benötigt, um sich zu duplizieren. Allein gelassen würde die DNS sich mehrere Male vervielfältigen. Allerdings werden der Mischung auch kleine Mengen an Marker-Nukleotiden C, G, A und T hinzugefügt, die zufällig verwendet werden und die DNS-Replikationen stoppen, sobald einer hinzugefügt wird. Die „Suppe“, die sich daraus ergibt, ist eine Mischung von DNS verschiedener Länge, jede mit einem hell leuchtenden Marker-Nukleotid am Ende. Bei der Auftrennung des Gemischs mittels Gelchromatographie wird jede Länge einzeln erfasst, und die Farbe des Marker-Nukleotids wird in einer Sequenz aufgezeichnet, die gelesen werden kann und mit der Sequenz der ursprünglichen DNS übereinstimmt.

Mit der Sequenzierung nach der Sanger-Methode können DNA-Fragmente bis zu etwa tausend Basenpaaren in einem einzigen Experiment sequenziert werden. Obwohl diese Zahl beeindruckend erscheinen mag, enthalten vollständige Genome viele Mega- oder sogar Giga-Basenpaare. Das Genom der Fruchtfliege beispielsweise enthält 137.000.000 Basenpaare. Daher wurden, aufbauend auf der Sanger-Methode, neuere Techniken entwickelt, die eine zeit- und kosteneffizientere Sequenzierung längerer DNA-Abschnitte bis hin zum vollständigen Genom ermöglichen.

 

Wie funktioniert eine vollständige Genomsequenzierung?

Wissenschaftler in modernen Zentren für vollständige Genomsequenzierung stützen sich auf ähnliche Prinzipien der Sanger-Methode, nutzen jedoch die Vorteile modernster Mikrofluidik und Bioinformatik, um bei einem Problem mit der Sequenzierung eines großen Genoms dieses in Tausende kleinerer DNS-Sequenzen zu zerlegen, die später wieder zum vollständigen oder fast vollständigen Genom zusammengesetzt werden können.

 

Was ist Shotgun Sequencing (Schrotschuss-Sequenzierung)?

Wenn ein DNS-Molekül zu lang ist, um in einem einzigen Durchgang sequenziert zu werden, muss es in viele handlichere kleinere Teile geschnitten werden, die jeweils einzeln repliziert und mit überlappenden Bereichen sequenziert und dann wieder zum genetischen Gesamtbild zusammengesetzt werden.

Obwohl dies manuell möglich ist, entspricht jeder Schritt des Schneidens, Replizierens und Sequenzierens der DNS einer ganzen Studie der ersten Generation, z. B. mit der Sanger- oder Maxam-Gilbert-Methode.

Die Schrotschuss-Sequenzierung der nächsten Generation bietet für den Prozess durch Herstellung und Verwaltung eine elegante Lösung.

Die Details des Sequenzierungsprozesses variieren je nach kommerzieller Technologie, aber Sequenzierung durch Synthese (SBS) ist ein gemeinsames Thema. Bei der SBS werden Mikrofluidchips verwendet, die DNS-Fragmente binden. Sobald ein DNS-Fragment an eine bestimmte Stelle auf dem Chip gebunden ist, können nur identische DNS-Segmente an diese Stelle anbinden und dort einen Cluster bilden. Danach wird das DNS-Cluster mit den Wirkstoffen behandelt, die zur Replikation benötigt werden, aber immer nur ein Nukleotid nach dem anderen. Wenn ein Cluster z. B. die Sequenz GACA hat und die Nukleotide (G, A, T und C) über das Cluster geleert werden, dann würde in der ersten Runde nur das Nukleotid G mit seiner Markierung an die DNS-Fragmente im Cluster anbinden können. Alle ungebundenen Nukleotide würden nicht an dieses DNS-Cluster binden und würden weggewaschen werden. Im zweiten Schritt wird die Markierung des hinzugefügten Nukleotids z. B. anhand der Farbe des von der Markierung emittierten Lichts (mittels Fluoreszenzmikroskopie) ausgelesen. Ein dritter Schritt ist die Entfernung der Markierung auf dem hinzugefügten Nukleotid (G im Beispiel) und eine effektive Vorbereitung des Strangs für den nächsten Syntheseschritt. Der Prozess wird wiederholt. Im zweiten Zyklus kann das A-Nukleotid als einziges an das Cluster anbinden. Es wird dann ausgelesen und die Markierung gelöscht, um auf den dritten Schritt vorzubereiten. Jeder Zyklus wird ausgeführt, bis die Sequenzierung des gesamten Fragments abgeschlossen ist. Wichtige Unterschiede zwischen den verschiedenen kommerziellen SBS-Methoden finden sich vor allem in der unterschiedlichen Markierung und der Art und Weise, wie diese Markierungen ausgelesen werden.

Das Ergebnis der Schrotschuss-Sequenzierung ist eine riesige Datenmenge, die die Sequenzen jedes kleinen DNS-Fragments enthält, das zufällig geschnitten wurde. Diese Daten müssen dann verarbeitet werden, um die überlappenden Sequenzen, die in mehr als einem Fragment vorkommen, bestmöglich auszurichten, um das übergeordnete DNS-Molekül wiederherzustellen. Der Rekonstruktionsprozess wird durch mangelhafte analytische Messungen, Fehler, die bei der DNS-Synthese auftreten können, und großen DNS-Abschnitten mit sich wiederholenden Mustern erschwert. Um eine zufriedenstellende Rekonstruktion zu erzielen, wird derselbe Bereich der DNS in einem eukaryotischen Genom in der Regel bis zu 30-mal und in einem prokaryotischen Genom bis zu 100-mal sequenziert, um die Fehlerrate zu senken.

 

Welche Anwendungen für die genetische Sequenzierung gibt es?

Die DNS enthält die gesamte Kodierung für die biologische Funktion eines Organismus und wird von einer Generation zur nächsten weitergegeben. Daher kann ein DNS-Test zur Feststellung der Vaterschaft eingesetzt werden. Darüber hinaus wird geschlechtsspezifisches genetisches Material, wie Mitochondrien-DNS, von der Mutter an die Nachkommen weitergegeben. Sie kann verwendet werden, um das mütterliche Erbe viele Generationen zurückzuverfolgen, um in der Evolutionsbiologie die gemeinsame Abstammung über Arten hinweg zu ermitteln. Genetische Informationen haben auch die forensische Wissenschaft revolutioniert, da die DNS einer Person einzigartig und in all ihren Zellen enthalten ist. deshalb hinterlassen wir bei all unseren täglichen Aktivitäten eine DNS-Spur. Wenn also die DNS einer Person bekannt ist und eine übereinstimmende DNS-Probe am Tatort gefunden wird, ist es eindeutig, dass die betreffende Person irgendwann dort war. Dieser Prozess ist auch als DNS-Fingerabdruckmethode bekannt. Ähnliche Techniken können zur Verfolgung von Bakterienstämmen eingesetzt werden. Diese Methoden können dazu beitragen, die Lebensmittelsicherheit und -qualität in der Industrie erheblich zu verbessern, indem die Übertragung von Mikroorganismen in einer Fabrik nachgewiesen wird. Dieses Wissen kann auch eingesetzt werden, damit das Endprodukt nicht mit Krankheitserregern oder Keimen verunreinigt wird.

Daher werden die Rohdaten aus dem Sequenzierprozess anschließend verschiedenen bioinformatischen Analysetools unterzogen, um entweder einen Genomentwurf zu erstellen, der sich aus der Zusammenfügung dieses gigantischen Puzzles ergibt, oder eine Variationskarte, indem die Millionen von Fragmenten mit einem bekannten Genom verglichen werden, um die variablen Abschnitte zu finden. Beide Ansätze können verwendet werden, um die Beziehungen zwischen Bakterienstämmen, die an einem bestimmten Ort gefunden wurden, auf ähnliche Weise abzuleiten wie bei der DNS-Fingerabdruckmethode. Der Entwurf der Genome kann auch verwendet werden, um interessante Zielgene oder Mutationen zu finden, die eine interessante phänotypische Ausprägung haben können, wie z. B. Antibiotika- oder Biozid-Resistenz in Genomen von Bakterien.

 

Was ist Metagenomik?

Mikroorganismen sind im Leben allgegenwärtig und gehen eine nützliche symbiotische Beziehung mit größeren Organismen ein, zusätzlich zu den spezifischen Mikroorganismen, die eine Quelle für Infektionen und Krankheiten darstellen. Im menschlichen Körper existiert ein unglaublich komplexes Netzwerk verschiedener Mikroorganismen als Mikrobiom, und der Zustand dieses Bioms hat nachweislich einen direkten Einfluss auf die menschliche Gesundheit. Auch bei anderen Organismen oder größeren ökologischen Netzwerken werden Mikrobiome als wichtige Akteure anerkannt. Die Kenntnis über Identitäten und Gleichgewicht zwischen verschiedenen Spezies in einem Mikrobiom kann wertvolle Informationen über die Wirkung der Gemeinschaft der Mikroorganismen liefern. Die Messung eines Mikrobioms mit herkömmlichen Zellkulturmethoden ist jedoch problematisch, da nicht alle Mikroben unter Standard-Zellkulturbedingungen gut wachsen - einige davon überhaupt nicht. Es ist daher schwierig oder unmöglich, einen umfassenden Überblick über die gesamte vorhandene Gemeinschaft der Mikroorganismen zu erhalten.

Metagenomik ist im Gegensatz zur Sequenzierung von nur einzelnen Mikroorganismen die Sequenzierung der DNS einer ganzen Gemeinschaft von Mikroorganismen. Mit Methoden, die bei der vollständigen Genomsequenzierung üblich sind, kann eine Mischung aus DNS von verschiedenen individuellen Mikroben sequenziert werden. Diese Informationen werden dann verwendet, um das Artenprofil der gesamten Mikroorganismen-Population zu rekonstruieren. Neben dem Artenprofil einer Mikroorganismen-Population kann auch die genetische Sequenz jedes Zugehörigen bekannt sein und mit anderen Zugehörigen der gleichen Spezies aus anderen Mikrobiomen verglichen werden, um Kenntnis darüber zu erhalten, wie sich diese Mikroorganismen entwickelt oder an ihre spezifische Umgebung angepasst haben.

Über Metagenomik können die Beziehung zwischen Mikrobiomen und größeren Systemen, wie z. B. dem Boden eines Bauernhofs, sowie die Rolle dieser Mikrobiome bei Nährstoffkreisläufen, Krankheitsunterdrückung und Stickstoffbindung beleuchtet werden. Beim Menschen ist der Zusammenhang zwischen dem Darmmikrobiom und der Gesundheit eindeutig, obwohl die Mechanismen selbst noch nicht erforscht sind.

 

Haben Sie Fragen? Unsere Experten für Mikrobiologie beraten Sie gerne!