130 likes | 265 Views
Analyse von. DNA-Sequenzen. Daniela Sellmann. Gliederung. 1. Identifizierung von Genen in einer Genomsequenz Suche nach offenen Leserastern Unterscheidung zwischen echten Genen und zufälligen ORFs. 2. Aufklärung der Funktion eines unbekannten Gens Homologien „Waisen“ Gen-Knockout.
E N D
Analyse von DNA-Sequenzen Daniela Sellmann
Gliederung • 1. Identifizierung von Genen in einer Genomsequenz • Suche nach offenen Leserastern • Unterscheidung zwischen echten Genen und zufälligen ORFs • 2. Aufklärung der Funktion eines unbekannten Gens • Homologien • „Waisen“ • Gen-Knockout
Identifizierung von Genen in einer Genomsequenz Vorhersage der Nucleotidsequenz möglich • bei bekannter Aminosäuresequenz des Proteinprodukts • bei vorheriger Sequenzierung der cDNA • bei vorheriger Sequenzierung eines ESTs (expressed sequence tag oder exprimiertes Sequenzanhängsel)
Suche nach offenen Leserastern • DNA-Sequenz eines Gens = offenes Leseraster ( open reading frame, ORF) • Durchmusterung aller 6 Leseraster
Suche nach offenen Leserastern Im Bakteriengenom: • lange ORFs höchstwahrscheinlich Gene • kürzere ORFs innerhalb von Genen meist zufällig, zwischen zwei Genen selten
Suche nach offenen Leserastern Im Eukaryotengenom: • viele kurze ORFs • Problem: Gene in Exons und Introns aufgeteilt
Unterscheidung zwischen echten Genen und zufälligen ORFs Nützliche Anhaltspunkte in Mensch- und Wirbeltiergenomen: CpG-Inseln: • charakteristische GC-reiche Sequenzen von bis zu 1000 bp • deuten auf den Anfang eines Gens hin • begleiten 50 – 60% der Gene
Unterscheidung zwischen echten Genen und zufälligen ORFs Codonbevorzugung: • alle AS (außer Methionin und Tryptophan) durch mind. zwei Codons festgelegt • meistensnicht alle Codons mit gleicher Häufigkeit genutzt • ORF mit vielen seltenen Codons vermutlich kein Gen
Unterscheidung zwischen echten Genen und zufälligen ORFs Suche nach Homologien per Computer: • Abgleich der zu untersuchenden Sequenz mit Gen-Sequenzen aller anderen biologischen Arten in Datenbanken • Umwandlung der Nucleotidsequenz in Aminosäuresequenz vermindert die Wahrscheinlichkeit zufälliger Ähnlichkeiten • Analyse mit Hilfe von Suchprogrammen (z. B. BLAST) der DNA-Datenbanken im Internet
Homologie relativ sicher,wenn untersuchte Sequenz länger als 200 AS lang ist und mind. 30% Übereinstimmung mit der Datenbank aufweist Transkriptanalyse kann zeigen, ob das Gen in RNA transkribiert wird. Unterscheidung zwischen echten Genen und zufälligen ORFs Suche nach Homologien per Computer:
Aufklärung der Funktion eines unbekannten Gens • Homologie lässt Rückschlüsse auf Funktion zu Funktion des homologen Gens muss bekannt sein! • „Waisen“ (orphans): nicht zugeordnete Gene • anhand der Nucleotidsequenz Voraussage über -Helices und -Faltblätter im Protein möglich • Struktur lässt manchmal Schlüsse auf die Funktion zu
Aufklärung der Funktion eines unbekannten Gens Gen-Knockout: