DNA Sequenzierung - Gene

Coccinella_745d4d · 23. September 2009 um 21:43

Hallo Experten!

Meine Frage ist folgende: Wie wird beim Sequenzieren der DNA erkannt, ob es sich um Exons - also Gene - handelt oder Introns - also nicht codierende Abschnitte, so dass man zu der Erkenntnis kommt, dass der Mensch 25000 Gene besitzt. Wie kann man an sich die DNA sequenzieren?

Vielen Dank für die Antwort,

Coco

Jo1_a88223 · 24. September 2009 um 07:22

Hallo,

Meine Frage ist folgende: Wie wird beim Sequenzieren der DNA
erkannt, ob es sich um Exons - also Gene - handelt oder
Introns - also nicht codierende Abschnitte,

Zunächstmal sind Exons nicht dasselbe wie Gene. Exons sind Teile von Genen. Meist kodieren sie ein oder gleich mehrere funktionelle „Module“, die mit anderen zusammen dann im Protein landen. Es gibt einige wenige Gene, die nur ein Exon haben, aber die meisten Gene haben mehr (10-20). Introns nennt man die Sequenzabschnitte, die auf der DNA zwischen den Exons eines Gens liegen (also nicht die zwischen verschiedenen Genen!). Beim Ablesen der DNA wird zunächst eine Abschrift der gesamten Sequenz vom ersten bis zum letzten Exon gemacht, inklusive der dazwischenbefindlichen Introns. Letztere werden danach erst in einem als Spleißen bezeichneten Prozess wieder aus dem primären Transkript herausgeschnitten (es entsteht die mRNA, die dann zu den Ribosomen transportiert wird, wo die Information aus der Basensequenz zum Bau eines Proteins verwendet wird [„Translation“]).

Nebenbei: Ein Gen muss kein Protein kodieren. Ein Gen ist ein Sequenzabschnitt auf der DNA, von dem ein Transkript gebildet wird. Ist das Transkript eine „normale“ mRNA, so wird davon ein Protein gebildet. Die Zelle braucht aber noch eine Menge anderer RNA-Sorten, zB. als Bausteine für die Ribosomen (ribosomale RNA) und als Aminosäure-Transporter (tRNA), als post-transkriptionell regulative RNAs wie die mikro-RNAs (miRNA) und andere.

so dass man zu der
Erkenntnis kommt, dass der Mensch 25000 Gene besitzt.

Das macht man nicht nur an den Exons fest. Wie schon geschrieben, werden die Introns aus den Primärtranskripten herausgespleißt. Damit die entsprechenden Enzyme die korrekten Teile rausschneiden, müssen sie die Schnittstellen irgendwie erkennen. Sie erkennen sie anhand bestimmter kurzer Sequenzen. Wenn man eine Abfolge solcher Sequenzen in der DNA findet, kann man vermuten, dass diese Sequenz ein Gen kodiert. Das alleine ist aber sehr vage!

Gerade Protein-kodierende Gene werden nach der Abschrift außer durch das Spleißen noch weiter prozessiert. So bekommen sie zB. eine sog. „Kappe“ aufgesetzt und auch noch einen „Schwanz“ angehängt. Natürlich erledigen auch das spezielle Enzyme, und natürlich sagen ihnen wieder diedie Sequenzen der, ob und wo die Kappe und der Schwanz hin sollen.

Die Gene müssen ja auch abgelesen werden. Dazu müssen wieder viele Proteine an der Startposition des Gens binden („Promoter“). Diese Position erkennen die Enzyme auch wieder anhand spezieller Sequenzen bzw. Sequenz-Motiven.

Wo man also solche Motive in der DNA findet, dazu noch die Sequenzen für die „Kappe“ und den „Schwanz“, dazwischen vielleicht noch eine Abfolge der Speiß-Sequenzen und das alles in der richtigen Reihenfolge, dann handelt es sich bei dieser Seuqunez mit etwas Glück um ein Gen.

Wie kann
man an sich die DNA sequenzieren?

Beim Humanen Genomprojekt wurde das so gemacht:

Die DNA wird in kleinere Stücke zerteilt (enzymatisch).
Die Stücke werden in Plasmide eingebaut (enzymatisch).
Die Plasmide werden in Bakterien eingeschleust.
Die Bakterien werden vereinzelt, und die vereinzelten Bakterien werden zu Kolonien (bzw ganzen Kulturen) herangezogen (jedes Bakterium einer Kolonie enthält eine Kopie desselben Plasmids, was der Kolonie-Gründer mal aufgenommen hatte). Damit können die Plasmide mit den eingebauten DNA-Abschnitten sarkt vervielfältigt werden, damit man sie untersuchen kann.
Die Plasmide werden aus den Kolonien extrahiert.
Man kennt die Sequenz des Plasmids, so dass man eine PCR machen kann, um das eingebaute DNA-Stück unbekannter Sequenz zu amplifizieren.
Bei dieser PCR verwendet man ein Gemisch von Nukleotiden, von denen ein Teil fluoreszenzmarkiert ist. Jede der vier Basen bekommt dabei eine andere, für die Base spezifische Farbe. Andenin zB. ist Rot markiert, Thymin zB. Blau usw. Die markierten Nukleotide sind außerdem am Zucker verändert, so dass sie in der PCR nicht verlängert werden können.
Wenn man nun eine PCR macht, entsteht ein Gemisch von Abbruchprodukten, wobei am Ende jedes Produkts eines der markierten Nukleotide sitzt. Trennt man das Gemisch der Längen nach in einer Elektrophorese auf, bekommt man eine „bunter Leiter“ von Fragmenten. Jetzt kann man am Farbcode ablesen, welche Sequenz das im Plasmid eingebaute Stück hatte.

http://de.wikipedia.org/wiki/DNA-Sequenzierung

Durchlesen und dann nochmal konkret fragen.

LG
Jochen

mopedhexle · 24. September 2009 um 10:29

Tolle Antwort
Hallo Jo,

Kurz, verständlich, richtig, nett.

Ich finde solche Antworten sollten den Sternenregen bekommen den es sonst nur für Meinungsthreats in E&S oder E,K&F Brettern gibt!

Grüsse
M.

PS: das hier muss natürlich nicht archiviert werden.

Jo1_a88223 · 24. September 2009 um 10:36

Kurz, verständlich, richtig, nett.

Danke für die nette Rückmeldung! Sowas motiviert

Obwohl ich immer glaube, meine Antworten sind zu lang…

LG
Jochen

PS: das hier muss natürlich nicht archiviert werden.

dito.

Jo1_a88223 · 24. September 2009 um 11:03

Kleiner Nachtrag
Zur Frage, wie man erkennt, ob es sich bei einem DNA-Abschnitt um ein Gen handeln könnte:

Neben den bereits genannten Kriterien (Promoter-, Spleiß-, Capping- und Tailing-Sequenzen) kommt noch hinzu, dass die so gefundene Sequenz eines möglichen Gens noch auf Homologien (Sequenzähnlichkeiten) zu bekannten Genen untersucht werden. Für bestimmte Aufgaben eines Proteins gibt es in der Regel bestimmte „Module“ and Sequenzen, die immer wieder verwendet werden. Rezeptoren in der Zellmembran haben zB. ein „Modul“ (Domäne), welche das Protein in der Zellmembran verankert. Proteine, welche DNA binden, haben DNA-Binde-Domänen, usw.(*)

Wenn eine Sequenz solche Domänen besitzt, steigt die Wahrscheinlichkeit, dass es sich um ein Gen handelt. Mit etwas Glück kann man dann auch schon eine Vermutung anstellen, welche (ungefähre) Aufgabe das (mögliche) Genprodukt hat (Rezeptor, Transkriptionsfaktor, Strukturprotein, Enzym,…).

Will man dann experimentell prüfen, ob es wirklich ein (aktives)Gen ist, kann man die mRNA nachweisen. Das geht speziellen, meist radioaktiv markierten Sonden oder wieder mit der PCR.

Dann gibt es noch einen Hinweis durch die Sequenzierung von mRNAs:

Man kann aus Zellen ganz gezielt die mRNA extrahieren. Das geht, weil die nach der Prozessierung alle einen Schwanz haben, dessen Sequenz immer gleich ist (er besteht ganz simpel aus einer Serie von Adeninen). Diese RNAs kann man mit einem Enzym aus Retroviren wieder in DNA „zurückschreiben“. Mit dieser copy-DNA (cDNA) kann man dann wieder so weiter verfahren wie mit der genomischen DNA (Plasmide -> PCR -> Sequenzieren). So erhält man Bibliotheken von Sequenzen, die als mRNA in der Zelle vorlagen. Die (oft nur kurzen) sequenzierten Fragmente nennen sich expressed sequence tags (ESTs). Jetzt kann man wieder suchen, wo in der genomischen DNA man diese ESTs findet.

Komplett ist das wohl immer noch nicht, aber das musste ich noch nachtragen

LG
Jochen

(*) Off-topic: Diese modulare Bauweise von Genen ist übrigens ein gutes Argument für die Evolution. Man muss nicht jedes von 9 Milliraden Basenpaaren einer DNA mutieren und selektieren, um zur menschlichen DNA-Sequenz zu kommen. Die Natur hat einmal einen Satz an Modulen entwickelt, die dann als Ganzes kopiert und in andere Gene eingefügt wurden. Sogar ganze Gene wurden in mehreren Kopien ins Genom eingebaut. So hat man eine Spielwiese mit redundanter Information und kann eine Version verändern, ohne die Funktion der anderen Version zu beeinträchtigen. Die Intron-Exon-Struktur von Genen ist ganz ähnliches System, weil ganze Exons zwischen Genen ausgetauscht werden können, ohne an den Schnittstellen die Sequenzen zu zerstören. Auch erlauben sie sog. differentielles Spleißen, womit aus einem Gen verschiedene Genprodukte hergestellt werden können (zB. kann ein Gen sowohl einen zytoplasmatischen als auch einen membranständigen Rezeptor bilden, einfach indem das Exon mit der Membran-Integrations-Domäne herausgespleißt wird oder eben nicht). So können kleine Mutationen im Genom funktionale Veränderungen hervorrufen. Durch den lokalen Schutz von DNA durch DNA-bindende Proteine und die räumliche Organisation der DNA im Kern (die liegt da nicht zufällig drin!) kann auch noch gesteuert werden, in welchem Bereich der DNA Mutationen häufiger vorkommen (wo sie also besser toleriert werden können). All diese Mechanismen (und wohl noch viele andere, die wir heute noch nichtmal vermuten können!) werden leider von den Gegnern der Evolutionstheorie vollkommen unterschlagen (wohl auch nicht verstanden).

Coccinella_745d4d · 28. September 2009 um 18:53

Danke
Vielen Dank, Jochen,
für die ausführliche und verständliche Antwort. Du hast auch ganz nett geschrieben, ich kann mich nur meinem Vorredner anschließen!

Danke schön!

Coco