590 likes | 793 Views
DNA - Computing. Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig. Überblick. Historische Entwicklung Biologische Grundlagen Hamilton Path Problem (HPP) Kombinatorische DNA – Lösung des HPP Modelle von DNA-Computing Nanostrukturen der DNA Ausblick. Einführung.
E N D
DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig
Überblick • Historische Entwicklung • Biologische Grundlagen • Hamilton Path Problem (HPP) • Kombinatorische DNA – Lösung des HPP • Modelle von DNA-Computing • Nanostrukturen der DNA • Ausblick
Einführung • 1993 Adleman lernt die Grundlagen der Molekularbiologie • 1994 Adleman löst das HPP mit Hilfe von DNA • 1994 Publizierung seiner Ergebnisse • 1995 Formalisierung des ersten Modells durch Lipton • Heute Breite Forschung mit weltweiten Konferenzen
Biologische Grundlagen • DNA als Informationsspeicher des DNA-Computers • Operationen eines DNA-Computer • Informationen kodieren • schreiben • lesen • manipulieren
D N A • 1944 von Avery entdeckt • Gundbaustein der Natur • besteht aus einzelnen Nukleotiden (Oligonukleotide) • Zucker (desoxyribose) • Phosphatgruppe • Base
D N A 5‘ 3‘ • Modell der DNA • -Doppelhelix • strickleiterartiger Doppelstrang aus gleichlangen Polynukliotidketten 3‘ 5‘
DNA als Informationsträger • herkömmliche Computer haben Alphabet X = {0, 1} • DNA besitzt Alphabet X‘ = {A, T, G, C} Die DNA eines Menschen umfasst 6 Milliarden Basenpaarewas einer Information von ca. 500 Büchern mit 1500 Seiten entspricht.
Annealing / Melting Melting(erhitzen) Annealing(abkühlen)
Detecting / Reading • Verwendung von PCR / Gelelektophorese • Einsatz von Blockmitteln bei der PCR • daraus resultieren kleinere Einzelstränge, die mit dem Hauptstrang zusammenhängen • durch veränderte Gelelektrophorese werden Positionen bestimmt Neuere Methoden verwenden Leuchtstofffärbungen statt der PCR, die bei der Gelelektrophorese erkannt werden.
...weitere Operationen • Mixing (Crossover) • Ligating (Konkatenation) • Marking / Unmarking • Destroying (Exonuclease Enzyme)
„Ein DNA-Programm“ • Gefäß mit in DNA kodierter Eingabe • ...Synthesizing... • ...Marking... • ...Ligating... • ...Reading... • ... • Ausgabe durch Detection als true / false oder wieder durch DNA kodiert
5 6 3 1 7 2 4 Hamilton Path Problem Gegeben: Ein gerichteter Graph, ein Start- und ein Endknoten Gesucht: Ein Pfad vom Start- bis zum Endknoten, wobei jeder Knoten genau einmal besucht werden muß. Richtiger Weg:1326547
Lösen des HPP • Erzeuge eine Menge von zufällig bestimmten Pfaden durch den Graphen • Für alle Pfade in dieser Menge: • Beginnt der Pfad mit dem Startknoten und endet mit dem Endknoten ? • Enthält der Pfad genau |V| Knoten ? • Sind alle Knoten im Pfad vorhanden? • Alle Pfade in der verbleibenden Menge sind Lösungswege, ist die Menge leer gibt es keine Lösung.
Umsetzung des Algorithmus mit DNA - Sequenzen • Kodierung der Knoten und Kanten als DNA-Sequenzen durch Synthetisierung • Länge der Sequenzen jeweils 20 Basen • Jeder Knoten und jede Kante eindeutig
Knoten und Kanten Knoten B Knoten A TCAGGTCGAG TCAGGTCGAG GCCTACGTAG GCCTACGTAG Komplement AGTCCAGCTC CGGATGCATC Kante A B
Erzeugung aller Pfade 100 Mikroliter Kochsalzlösung 1014 Moleküle TGAACTGGGATCTAGCTAGC 0,9 % NaCL TGAATCGACTTCCGATAGCT = TT-100
Erzeugung aller Pfade II • Hybridisierung von Knoten und Kanten • Ligation, zur Verstärkung des Rückrats der DNA
Ausfilterung der Pfade ohne richtigen Start- und Endknoten • Melting Trennung der Doppelhelix • Hinzugabe von Sequenzen der Start- und Endknoten als Primer • DNA-Polymerase vermehrt die DNA-Sequenzen unterschiedlich: • Mit Start- und Endknoten exponentiell • Mit Start- oder Endknoten verdoppelt • Mit keiner Entsprechung gar nicht • Nach mehren Zyklen des Erwärmens, Abkühlens und Vermehrens wird eine Probe entnommen, die jetzt fast nur noch Pfade einen richtigen Start- und Zielknoten enthält.
Kontrolle der Länge • Ein richtiger Pfad muß genau 140 bp (=Basenpaare) lang sein 7 Knoten a‘ 20 Basenpaaren • DNA-Sequenzen laufen elektrophoretisch über ein Agarose-Gel
Überprüfung der Existenz jeden Knotens • Wiederholung für alle Knoten mit entsprechenden Sonden • Melting, damit DNA-Einzelstränge vorliegen • Einbringung von Eisensonden mit Komplementstrang eines Knoten • Durch Anbringung eines Magneten bleiben alle Moleküle haften, die diesen Knoten enthalten • Abgießen der Lösung und neue Lösung ansetzen • Melting trennt Stränge von Sonden • Abgießen der Lösung in ein neues Reagenzglas Falls noch DNA vorhanden ist, muß das die Lösung des Problems sein.
Eisensonden mit DNA-Sequenzen Eisenkugel Sonden-DNA Enthaltener Knoten Nicht passende DNA
Rückblick Alle Pfade Alle Pfade mit vS und vE Alle Pfade mit der Länge |V| Knoten 1 enthalten Knoten 2 enthalten Knoten n enthalten = Lösungsmenge
Fehler beim DNA-Computing • Pfad wird nicht erzeugt • Operationen arbeiten nicht fehlerfrei Falsche Lösungen bleiben erhalten • Fehlerursache Größe, Menge und Masse der DNA Nur statistisch wahrscheinliche Lösung !
Beschränktes Modell • DNA-Menge nimmt in der Berechnungsphase nicht mehr zu • DNA-Menge ist in der Initialisierungsphasebeschränkt • Anwendung von PCR wird ausgeschlossen
Beschränktes Modell Bitvektoren kodierende Sequenzen werden erzeugt. X0=1 X1=1 Xn-1=1 A0 .... An A1 A2 An-1 X0=0 X1=0 Xn-1=0 Vorteil: Wiederverwendung der Bitstrings für andere Probleme
Beschränktes ModellOperationen • ExtractionSequenzen werden getrennt, abhängig obSubsequenz vorhanden • MergeVereinigung zweier Mengen von DNA • DetectionTest, ob DNA überhaupt noch vorhanden
Unbeschränktes Modell • Erweiterung des beschränkten Modellesdurch Adleman • Menge der DNA darf zunehmen • Erweiterte Operation: Amplify (PCR)
Generator-Modell • Initialisierungsmenge effizienter nutzen • Suchraum einschränken
Generator-ModellOperationen • Split Zufällige Aufteilung der DNA-Menge in zwei Mengen • Append Verlängerung der Sequenzen um Sequenzteile • Merge Vereinigung von zwei DNA-Mengen Iteratives Anwenden von Split - Append - Merge erzeugt zufällige Bitvektoren. Wenn Split - Merge an bestimmten Positionen wegge-lassen wird, haben alle Sequenzen an der Stelle die gleiche Bitbelegung.Der Suchraum hat eine Dimension weniger.
Surface-Modell • DNA-Sequenzen fixiert auf einer Oberfläche • Bessere Kontrolle • Einengung des Suchraums • Modell wird verwendet, um Erkenntnisse überOperationen und deren Fehler zu gewinnen
Nanostrukturen von DNA DNA-Cube
Nanostrukturen von DNA • Watson-Crick komplementär bildet Doppelhelix • eine Zelle bildet verschiedene geometrische Gebilde • Verhalten der Kreuzung ist vorhersagbar • Oligonukleotide bis hin zu Superstrukturen können zur Realisierung verschiedener Rechenmodelle benutzt werden
Nanostrukturen von DNA • „self-assembly“ DNA • kleine Anzahl von Oligonukleotiden bildet self-assembled DNA-Stränge • self-assembly entspricht gewissen Regeln
„self-assembly“ - Einsatz • Durch die Definition verschiedene Operationen auf den verschiedenen Strukturen kann folgender Einsatz erreicht werden • linear doppelte DNA-Sequenz entspricht regulärer Sprache • self-assembled verzweigte DNA kann kontextfreie Sprachen erzeugen • doppelte Crossover-Moleküle sind geeignet für universelle Berechnungen
T A E Triple Doppelhelix mit anti-parallelen Überkreuzungen und einer geraden Anzahl von Halbdrehungen
T A O Geeignet für Xor - Funktion / Integer - Addition
Im folgenden Gebrauch schematisch dargestellt als: W Y X Z D A E Geeignet für Integer - Addition / Lösen des HPP
3 2 4 1 7 5 6 „Adleman Graph“
Ablauf des Algorithmus • Erzeugen aller Pfade von Knotenpunkt 1 zu Knotenpunkt N. • Sortieren der Knoten in jedem Pfad in ansteigender Ordnung. • Kontrolle für jeden Pfad, dass das Resultat genau “1,2, 3,...N” ist. • Ausgabe jedes Weges, der den Test erfüllt, wenn es einen gibt.
Sortieren Sortieren der einzelnen „Reihen“ durch „Odd-Even-Transposition Sort“