740 likes | 865 Views
Lehrveranstaltung Sommersemester 2006. W. Kurth, G. H. Buck-Sorlin, O. Kniemeyer. Datenanalyse und Visualisierung in der Bioinformatik. Praktikum, ca. 1 SWS Präsenzveranstaltung + ca. 4 SWS praktische Tätigkeit (betreutes Arbeiten). Was ist Bioinformatik?.
E N D
Lehrveranstaltung Sommersemester 2006 W. Kurth, G. H. Buck-Sorlin, O. Kniemeyer Datenanalyse und Visualisierung in der Bioinformatik Praktikum, ca. 1 SWS Präsenzveranstaltung + ca. 4 SWS praktische Tätigkeit (betreutes Arbeiten)
“Bioinformatik ist die Entwicklung und Anwendung von Computeranwendungen für die Analyse, Interpretation, Simulation und Vorhersage von biologischen Systemen und korrespondierenden experimentellen Methoden in den Naturwissenschaften”. Steffen Schulze-Kremer (RZPD Dt. Ressourcenzentrum für Genomforschung GmbH) "Bioinformatik ist die computerunterstützte Analyse biologischer Systeme." Thomas Dandekar (EMBL Heidelberg) "Bioinformatik besteht darin, biologische Gesetzmäßigkeiten der Entwicklung neuer Algorithmen zugrunde zu legen und auf diese Weise zu synergistischen Effekten zu kommen, die weder in der Biologie noch in der Informatik alleine möglich wären." Thomas Werner (CEO Genomatix Software GmbH München) Was ist Bioinformatik? aus Hofestädt & Schnee (2002)
Feinunterscheidung (nach Michael Waterman): a.Schwerpunkt auf biologischer Fragestellung, Informatikwerkzeuge nach Bedarf eingesetzt b. Schwerpunkt auf Informatikmethoden, Biologie nur entfernte Motivation für untersuchte Probleme c. wirklich interdisziplinärer Ansatz: untersuchte Fragestellung und verwendete Informatikmethoden werden in ständigem Prozess adaptiert. Notwendig, da die Problemformalisierung nur eine Abstraktion des ursprünglichen Problems sein kann. Rolf Backofen (Institut für Informatik, LMU München) aus Hofestädt & Schnee (2002) Was ist Bioinformatik? 1. Bio-Informatik = Probleme aus der Biologie + Methoden aus der Informatik; 2. Bio-Informatik = Probleme aus der Informatik + Methoden aus der Biologie.
Quelle: DKFZ Abteilung Bioinformatik und Funktionelle Genomik
Organismus Mathematische Theorie System Organ Physiko-chemische erste Prinzipien funktional Gewebe Vorhersagende Modellierung Netzwerk Wachs- tum regulatorisch Metabolik elektrisch mechanisch Transport System- analyse Zelle Statistische Modellierung Organelle Ontologien Makromolekularer Komplex Empirische Daten strukturell Protein zwischen Daten und Theorie Gen Drei Integrationsachsen in der Computerbiologie nach McCULLOCH & HUBER (2002), verändert
funktional Herausforderungen: Systembiologie nach McCULLOCH & HUBER (2002), verändert
funktional Herausforderungen: • Zentrales Ziel der Systembiologie: • Funktional integrierte biologische Modellierung • datenbezogen datenintensiv nach McCULLOCH & HUBER (2002), verändert
funktional strukturell Herausforderungen: Systembiologie Computational Biology nach McCULLOCH & HUBER (2002), verändert
funktional strukturell Herausforderungen: Systembiologie • Computational Biology: • strukturell integriert • (z.B. Molekulare Dynamik, • Vorhersage der Proteinstruktur) • gesteuert durch physiko- • chemische 1. Prinzipien • berechnungsintensiv - Ziel: Skalenintegration nach McCULLOCH & HUBER (2002), verändert
Physiko-chemische Erste Prinzipien: z.B. Massenerhaltung, Minimierung mechanischer Spannungen • Problem der Proteinfaltung • Massengleichgewicht bei Analysen metabolischer Flüsse • (auch bei sink-source-Modellen) nach McCULLOCH & HUBER (2002), verändert
Beispiele für Schnittstellen zwischen strukturell und funktionell integrierter Computational Biology: • Kopplung zwischen biochemischen Netzwerken und räumlich • gekoppelten Netzwerken • Nutzung physiko-chemischer Beschränkungen zur Optimierung • genomischer Systemmodelle des Zellmetabolismus • Entwicklung kinetischer Modelle der Zellsignalübertragung in • Verbindung mit physiologischen Targets wie z.B. Energiestoff- • wechsel, Ionenflüsse oder Zellmotilität • Nutzung empirischer Beschränkungen zur Optimierung von • Vorhersagen der Proteinfaltung • Integration von Systemmodellen der Zelldynamik in Kontinuum- • modelle der Gewebe- und Organphysiologie nach McCULLOCH & HUBER (2002), verändert
Grundvorstellung: Bauplan und Funktionsmöglichkeiten des Organismus gespeichert in DNA-Molekülen, diese werden repliziert DNA als Träger der genetischen Information (Erbinformation; Genom) (DNA = desoxyribonucleic acid = Desoxyribonukleinsäure = DNS)
Zum Begriff des Gens: Unterscheidung zwischen Funktionsgen und Mendel-Gen
Das Zentrale Dogma „The central dogma states that once 'information' has passed into a protein it cannot get out again. The transfer of information from nucleic acid to nucleic acid, or from nucleic acid to protein, may be possible, but transfer from protein to protein, or from protein to nucleic acid, is impossible. Information here means the precise determination of sequence, either of bases in the nucleic acid or of amino acid residues in the protein" Francis Crick (1958). aus Waterman (1995)
Bioinformatik-Probleme Probleme, die mit dem zentralen Dogma assoziiert sind: Alle Probleme, die direkt mit einem spezifischen Level von Information (Sequenz, Struktur, Funktion) assoziiert sind oder aber mehrere Levels umfassen. Beispiele: Alignierungsverfahren (sequence alignment, structural alignment); Proteinstrukturvorhersage Probleme der Datenhaltung: Fragestellungen der Speicherung, Wiedergewinnung und Analyse der Daten. Beispiele: Aufbau von biologischen Datenbanken; data mining (Gewinnung neuen Wissens aus der Ansammlung der Daten) Simulation biologischer Systeme: Vorhersage des dynamischen Verhaltens eines biologischen Systems auf der Basis seiner Komponenten. Beispiel: Untersuchung metabolischer Netzwerke. Rolf Backofen (Institut für Informatik, LMU München) aus Hofestädt & Schnee (2002)
Die nächsthöhere Ebene: "Metabolomik" Metabolische Netzwerke Leben: beruht auf sehr vielen Stoffwechselprozessen, vernetzt(menschl. Zelle: ca. 100 000 Molekülarten) "autokatalytisch": das Netzwerk produziert seine eigenen Katalysatoren Datenbanken (Selkov et al.; Karp et al. ...) zu den Netzwerken