Hallo,
Meine Frage ist folgende: Wie wird beim Sequenzieren der DNA
erkannt, ob es sich um Exons - also Gene - handelt oder
Introns - also nicht codierende Abschnitte,
Zunächstmal sind Exons nicht dasselbe wie Gene. Exons sind Teile von Genen. Meist kodieren sie ein oder gleich mehrere funktionelle „Module“, die mit anderen zusammen dann im Protein landen. Es gibt einige wenige Gene, die nur ein Exon haben, aber die meisten Gene haben mehr (10-20). Introns nennt man die Sequenzabschnitte, die auf der DNA zwischen den Exons eines Gens liegen (also nicht die zwischen verschiedenen Genen!). Beim Ablesen der DNA wird zunächst eine Abschrift der gesamten Sequenz vom ersten bis zum letzten Exon gemacht, inklusive der dazwischenbefindlichen Introns. Letztere werden danach erst in einem als Spleißen bezeichneten Prozess wieder aus dem primären Transkript herausgeschnitten (es entsteht die mRNA, die dann zu den Ribosomen transportiert wird, wo die Information aus der Basensequenz zum Bau eines Proteins verwendet wird [„Translation“]).
Nebenbei: Ein Gen muss kein Protein kodieren. Ein Gen ist ein Sequenzabschnitt auf der DNA, von dem ein Transkript gebildet wird. Ist das Transkript eine „normale“ mRNA, so wird davon ein Protein gebildet. Die Zelle braucht aber noch eine Menge anderer RNA-Sorten, zB. als Bausteine für die Ribosomen (ribosomale RNA) und als Aminosäure-Transporter (tRNA), als post-transkriptionell regulative RNAs wie die mikro-RNAs (miRNA) und andere.
so dass man zu der
Erkenntnis kommt, dass der Mensch 25000 Gene besitzt.
Das macht man nicht nur an den Exons fest. Wie schon geschrieben, werden die Introns aus den Primärtranskripten herausgespleißt. Damit die entsprechenden Enzyme die korrekten Teile rausschneiden, müssen sie die Schnittstellen irgendwie erkennen. Sie erkennen sie anhand bestimmter kurzer Sequenzen. Wenn man eine Abfolge solcher Sequenzen in der DNA findet, kann man vermuten, dass diese Sequenz ein Gen kodiert. Das alleine ist aber sehr vage!
Gerade Protein-kodierende Gene werden nach der Abschrift außer durch das Spleißen noch weiter prozessiert. So bekommen sie zB. eine sog. „Kappe“ aufgesetzt und auch noch einen „Schwanz“ angehängt. Natürlich erledigen auch das spezielle Enzyme, und natürlich sagen ihnen wieder diedie Sequenzen der, ob und wo die Kappe und der Schwanz hin sollen.
Die Gene müssen ja auch abgelesen werden. Dazu müssen wieder viele Proteine an der Startposition des Gens binden („Promoter“). Diese Position erkennen die Enzyme auch wieder anhand spezieller Sequenzen bzw. Sequenz-Motiven.
Wo man also solche Motive in der DNA findet, dazu noch die Sequenzen für die „Kappe“ und den „Schwanz“, dazwischen vielleicht noch eine Abfolge der Speiß-Sequenzen und das alles in der richtigen Reihenfolge, dann handelt es sich bei dieser Seuqunez mit etwas Glück um ein Gen.
Wie kann
man an sich die DNA sequenzieren?
Beim Humanen Genomprojekt wurde das so gemacht:
Die DNA wird in kleinere Stücke zerteilt (enzymatisch).
Die Stücke werden in Plasmide eingebaut (enzymatisch).
Die Plasmide werden in Bakterien eingeschleust.
Die Bakterien werden vereinzelt, und die vereinzelten Bakterien werden zu Kolonien (bzw ganzen Kulturen) herangezogen (jedes Bakterium einer Kolonie enthält eine Kopie desselben Plasmids, was der Kolonie-Gründer mal aufgenommen hatte). Damit können die Plasmide mit den eingebauten DNA-Abschnitten sarkt vervielfältigt werden, damit man sie untersuchen kann.
Die Plasmide werden aus den Kolonien extrahiert.
Man kennt die Sequenz des Plasmids, so dass man eine PCR machen kann, um das eingebaute DNA-Stück unbekannter Sequenz zu amplifizieren.
Bei dieser PCR verwendet man ein Gemisch von Nukleotiden, von denen ein Teil fluoreszenzmarkiert ist. Jede der vier Basen bekommt dabei eine andere, für die Base spezifische Farbe. Andenin zB. ist Rot markiert, Thymin zB. Blau usw. Die markierten Nukleotide sind außerdem am Zucker verändert, so dass sie in der PCR nicht verlängert werden können.
Wenn man nun eine PCR macht, entsteht ein Gemisch von Abbruchprodukten, wobei am Ende jedes Produkts eines der markierten Nukleotide sitzt. Trennt man das Gemisch der Längen nach in einer Elektrophorese auf, bekommt man eine „bunter Leiter“ von Fragmenten. Jetzt kann man am Farbcode ablesen, welche Sequenz das im Plasmid eingebaute Stück hatte.
http://de.wikipedia.org/wiki/DNA-Sequenzierung
Durchlesen und dann nochmal konkret fragen.
LG
Jochen