370 likes | 524 Views
Informatischer Workflow für biomedizinische Experimente mit großem Durchsatz an Material und Daten (Handlungsebene). wissenschaftliche Hypothesenbildung. Hypothesen. • Festlegung Datenhaltung • Festlegung statistische Methodik. Experiment-Entwurf. Experimentbeschreibung.
E N D
Informatischer Workflow für biomedizinische Experimente mit großem Durchsatz an Material und Daten (Handlungsebene) wissenschaftliche Hypothesenbildung Hypothesen • Festlegung Datenhaltung • Festlegung statistische Methodik Experiment-Entwurf Experimentbeschreibung • SOPs Probenentnahme • SOPs Probenaufbereitung Vorbereitung Experimente Proben, Daten • Experimentidentifikation u. -beschreibung • GLP • Geräte • Datenerzeugung Biomedizinische Experimente Daten Qualitätssicherung • Plausibilität Daten • Transparente Methoden der Vergleichbarkeit • Datenhaltung Standardisierung, Normierung von Ergebnissen vergleichbare Experimentdaten • Hypothesenevaluierung Bewertung Evaluierungsergebnis, nicht-formal
Qualitätssicherung Die vorhergehende Instanz muss über die Güte ihrer Proben informiert werden (Eingangskontrolle). Bei jeder Untersuchung muss auf Vergleichsdaten zurückgegriffen werden, um einen Test der Daten zu machen (Plausibilitätstest). Bei jeder Untersuchung muss auf Vergleichsdaten zurückgegriffen werden, um einen Test der Proben zu machen (Plausibilitätstest).
Pathways to autoimmune disease Environment Genetic susceptibility Altered immunoreactivity Effects on antigen presentation/ recognition Antigen-specific crossreactivity Tissue-restricted effects Changes in response of the tissue Antigen-specific autoimmune disease (systematic or organ-specific)
Klinik Grobstruktur Leitprojektmit Bioinformatik Probenvorbereitung Proteinseparation DNA-Chip Konventionelle 2-DE 2-DE Chip Picking Robot MALDI-TOF Massenspektrometer mit Kryodetektoren Q-TOF Bio- informatik Auswertung Rheumatoide Arthritis Multiple Sklerose Pankreatitis HLA- Differenzierung Histologie in vitro Pannus Modell- Spezies Immunantwort Analyse-Systeme Gen-Netze RNA/Protein-Vergleichen Evaluierung z.B. Southern-Blot
Material und Informationsfluss (Strukturebene) molekulare/ zellulare Medizin klinische Daten aus KIS SOPs: Probenentnahme Probenaufbereitung Kliniken SOPs: Übertragung Probeneingang Wissen über Gene, Proteine, metabolische Pfade usw. Gen/ Mutations-lokalisation in-situ PCR FISH Expressionsexperi-mente 2 D-Gel Elektroph., Microarray Proteinlokalisation Immunofluoreszenz usw. Dynamik bildlich Zelldynamik, Metabolismus SOPs Laborgeräte DV- Systeme Analytik Schnittstellen Gen-Expressionsdaten Normierung Microarray-Daten Normierung 2D-Gel-Daten Klinische Diagnostik Evaluierung durch Southern-, Western-, Northern- Blot (Forschung)
Proteobase - Nutzung Probeneingang- Proben nach SOP- Eintrag von Daten durch den einreichenden Experimentator in der Proteobase zur Erläuterung und Identifizierung der Proben. Standard definiert Microarray-Rohdaten aus Experiment-Standard definiert 3. 2 D -Gel Daten standardisiert 4. Zusätzliche Dateneingabe zur Charakterisierung der Experimente. Standard definiert 5. Import von Microarray / 2 D Gel -Ergebnissen in Proteobase 6. Zugriffsmöglichkeiten auf Proteobase-Daten. Gestuftes Sicherheitskonzept 7. Dienste zur Funktionsidentifikation von Genen und zur Referenzierung mit Proteindatenbanken (Analyse-Dienste)
Datenfluss bei 2D-Gel-Protein-Expressions-Experimenten im Leitprojekt Microarray TP 08 DNA-Chip TP 01 Picking-Robot TP 04 Massen- spektrometrie TP06 Phoretix TP 10 Proteobase Daten- haltung TP12 Kliniken Wissen- schaftler Genesys TP11
Methoden des Datenfluss im Verbundprojekt Proteomanalyse Gerät i Gerät j Nutzer XML XML . Microarray Daten (Affymetrix) . 2-D-Gel-Daten (Phoretix) + Bilder . Massenspektrometer CD-ROM Proteobase Verbund- partner k Internet Verbund- partner l . Text . formatierte Daten (auch als Web-Seiten) . Web-Seiten
Massenspektrometrie 2 D - Gele Gel - Bilder in die Datenhaltung Gel - Daten Picking Roboter Verdau - Roboter Maldi TOF Protein - Datenbank Q - TOF Protein - Datenbank LC (liquid chromotography)
Detaildatenfluss Picker Massenspektrometer Spot 1 n Pick-Position 1 1 Well Plate Position 1 n Verdau mit Parametern 1 n Präparationen 1 n Massenspektrometrie-Runs 1 n Peptid-Identifikation
Stellung der Proteobase als Speicher für genotypische Expressionsdaten 2 1 standardisierte Microarray-Daten Probeneingang 3 2 D - Gel Daten standardisiert + TIFF-Bilder Proteobase 4 Massenspektometriedaten 6 7 5 Zugriff der Experimentatoren bzw. Kliniker auf Daten Analyse-Dienste Daten zur Charakterisierung der Experimente
Proteobase - Nutzung • Probeneingang- Proben nach SOP- Eintrag von Daten durch den einreichenden Experimentator in der Proteobase zur Erläuterung und Identifizierung der Proben. Standard definiert. 2. Microarray-Rohdaten aus Experiment-Standard definiert 3. 2 D -Gel Daten standardisiert + TIFF 4. Proteinidentifikation von Massenspektrometriedaten 5. Zusätzliche Dateneingabe zur Charakterisierung der Experimente. Standard definiert 6. Dienste zur Funktionsidentifikation von Genen und zur Referenzierung mit Proteindatenbanken (Analyse-Dienste) • Zugriffsmöglichkeiten auf Proteobase-Daten. Gestuftes Sicherheitskonzept
Replikationen von Versuchen postexperimentelle Informationsver-arbeitung Normierung, Standardisierung 2D-Gele z.B. Verzerrung mittels Passpunkten Microarray - Daten z.B. Regressionsanalyse „best-fit-Steigung“ oder Median-normierte Expr. = Element-Expr./Median Expr. Probleme: Biologische Variablität (d.h. Statistik) und Polymorphismus Analyse: Struktur -Funktion
Heraufregulierte Pankreatitis- vs Gesund-Microarray-Daten bei Fold Change > +3 (Prof. Löhr, TP19) Polarkoordinatendar- stellung: Winkel -> Gene (Nr. in Ausgangs- Tabelle) Polarstrahl -> Fold Change
Herunterregulierte Pankreatitis- vs Gesund-Microarray-Daten bei Fold Change < -3 (Prof. Löhr, TP19) Polarkoordinatendar- stellung: Winkel -> Gene (Nr. in Ausgangs- Tabelle) Polarstrahl -> Fold Change
Klinisch-genomische Ähnlichkeit von AutoimmunkrankheitenMerkmale sind Proteine, Befunde, Symptome usw.
Gen-Netz als gerichteter Graph gerichteter Graph GR = E K Ecke E = {Gen, Expression, Kontext, Eigenschaften} Kante K = {kausale Beziehung, Regulation } Kontext: z.B. physikalischer Locus Eigenschaften: z.B. Konnektivitätsfaktor im Gen-Netz oder Funktion
Biologische Variabilität der Gen-Expression „In 30% aller Fälle hat TNF keine Bedeutung für Rheumatoide Arthritis.“ Also hat eine andere Kombination von Genen Bedeutung d.h. unerschiedliche Gen-Netze ---> Liste von Gemeinsamkeiten reicht nicht ---> Kausale Beziehungen von Genen beschreiben Krankheit
Fall Autoimmun-Fall::= <Identifikation> <Krankheit> <Patient> <Krankheitsstadium> <klinische Symptome> <Untersuchungen> <charakterisierende Proteine> <Gen-Netz> <Histologie> <Serologie> <Immunantwort> <Polymorphismus>
Klinische Symptome <klinische Symptome>::= <{'Fieber'|'Bauchschmerzen'|'Lymphknotenschwellung'|'Gelenkschmerzen' .... >
Was ist bedeutsam? Metawissen: Kausale Beziehungen zwischen Genen Genetische Zusammenhänge Funktion von Proteinen Ort-Zeit-Beziehungen Erkenntnis und klinische Anwendung Ausgangsdaten: Normierte und standardisierte Expressionsdaten
Workflow informatischer Methoden Sammeln mittels Datenaustausch und Identifizieren genomischer Daten Standardisierung und Normierung Methoden zur vergleichenden Analyse Schlussfolgerungen mit automatischer Wissensaquisation aus dem Internet
Informatischer WorkflowImplementierungsebenePilotprojekt „Proteomanalyse“
Datenverarbeitungs-Dienste im Leitprojekt • zentrale Datenquelle für Experimentdaten Proteobase: 2D-Gele einschl. Tiff-Bilder, Affimetrix-daten, Identifikation von Proteinen nach Massenspektrometer (TP12) • - Schnittstelle für Daten der Experimentatoren (TP12) • Datenübertragung Picking Robot/Proteobase/Massenspektrometer (TP04) • Normierung 2D-Gele (TP04) • Standardisierung 2D-Gele (TP10) • 2D-Gel-Vergleich (TP10) • Exktraktion kausaler Relationen von Genen aus dem Internet (TP11) • Gen-Netze (TP11) • Klassifikation differenzierender genomischer Merkmale mit ANN und gemeinsamer Merkmale (TP11) • - 2DE-Chip-Daten in Proteobase (TP01)
Was haben wir bisher bzgl. informatischer Plattform gelernt? • Standardmethoden (SQL, XML, Graphen, Visualisierung, Kommunikation usw.) haben sich bewährt. •Planung der bioinformatischen Infrastruktur am Anfang eines Projektes. • Vergleichbarkeit von Experimenten unumgänglich, aber methodisch und organisatorisch schwer herstellbar. Standards unverzichtbar. • Informatische Methoden zur Analyse noch komplexes Forschungsfeld. Nutzen/Kosten kommerzieller Produkte unklar. • Auch international wissenschaftlicher Workflow nicht standardisiert, daher erhebliche informatische Probleme. • Fortschritte bei der Integration technischer, informatischer und klinischer Projekte.