260 likes | 402 Views
Einführung in die Genexpressionsplattform des IVM. 1. Prinzip und wichtige Termini 2. RNA Präparation und Qualitätskontrolle 3. Datenauswertung 4. Kosten 5. Protokolle 6. Informationen für Kooperationspartner 7. Downloads. 1.Prinzip und wichtige Termini. 1. Prinzip und wichtige Termini.
E N D
Einführung in die Genexpressionsplattform des IVM 1. Prinzip und wichtige Termini 2. RNA Präparation und Qualitätskontrolle 3. Datenauswertung 4. Kosten 5. Protokolle 6. Informationen für Kooperationspartner 7. Downloads
1.Prinzip und wichtige Termini 1. Prinzip und wichtige Termini Die humanen, murinen u.a. Genomprojekte und die Verfügbarkeit robuster Hardware- und Software-Plattformen zur Herstellung und Auswertung von Microarrays ermöglichen genomweite Genexpressionanalysen, d.h. die Quantifizierung aller mRNAs (> 30 000) eines RNA Extrakts relativ zu einem zweiten RNA Extrakt, in 48 Stunden. Die Plattform des IVM (Firma Affymetrix) ist mit einem Hybridisierungsofen, einer Waschstation, einem Scanner und Software ausgerüstet. Letztere erlaubt die mathematischen, statistischen und informationstechnologischen Auswertungen der Arrays.
1. Prinzip und wichtige Termini Verschiedene Spezies können untersucht werden Affymetrix bietet für mehrere Organismen Expressionsarrays an. Diese werden in verschiedenen Formaten angeboten. Je nach Format und Protokoll werden 0,5 - 5 µg RNA für einen Array benötigt.
1. Prinzip und wichtige Termini Die Herstellung der Arrays Grundlage der Arraytechnologie sind die Sequenzinformationen der verschiedenen Genomprojekte. Mittels Photolithographiewerden auf einer Glasoberfläche 25mer - sogenannte „Perfect Match“ Oligonukleotide (ON) synthetisiert. Neben jedem Perfect Match ON wird ein sogenanntes „Miss Match“ ON, das gegenüber dem Perfect Match ON einen Nukleotidaustausch in Position 13 enthält, synthetisiert. Daraus ergeben sich Perfect Match - Miss Match ON Paare, die sogenannten „Probe Pairs“. Die Signale des Miss Match ONs werden vom Perfect Match ON abgezogen. Hierdurch werden Sensitivität und Spezifität erhöht. Jede RNA Sequenz ist durch ein „Probe Set“, bestehend aus 11 solcher Probe Pairs, repräsentiert. Dies ermöglicht eine statistische Aussage über die Qualität des Messwertes.
1. Prinzip und wichtige Termini Das Prinzip „Probe Set“ Miss Match (MM) Perfect Match (PM) Probe Pair Feature Nucleotidaustausch an Pos. 13 Probe Set
1. Prinzip und wichtige Termini Synthese der Sonden oder „Proben“
1. Das Prinzip und wichtige Termini Der Waschvorgang und das Scannen Fluidics Station
1. Das Prinzip und wichtige Termini • Background und Noise • Percent present • Spiked oligo controls • poly(A)-RNA spikes Scanner Elektrik und Hybridisierung Probenqualität und Reproduzierbarkeit Hybridisierung, Färbung (Effizienz und Linearität) Qualität der cRNA Synthese • 3‘ - 5‘ Verhältnis verschiedener Housekeeping Gene Qualität der cRNA insgesamt Interne Kontrollen derArrays
2. RNA Präparation und Qualitätskontrolle Wichtigste Voraussetzung für einen Array hoher Qualität ist eine hochwertige RNA. Degradation und Verunreinigungen müssen vermieden werden. Wir empfehlen den Qiagen RNeasy Lipid Tissue Mini Kit. Zusätzlich kommt bei Geweben der Probengewinnung, Lagerung und Homogenisation eine besondere Bedeutung zu. Dies muß für jedes Gewebe gesondert evaluiert werden.
2. RNA Präparation und Qualitätskontrolle Schema der RNA Präparation
2. RNA Präparation und Qualitätskontrolle RNA Integrität mit dem Agilent System Es sollten keine kurzen RNA Fragmente sichtbar werden 28s - 18s ratio >1.8 Die Stadien der RNA Degradation
3. Datenauswertung Es gibt eine unüberschaubare Anzahl an Ansätzen. Welche man wählt, hängt von der experimentellen Fragestellung ab. Grundsätzlich unterteilt sich die Auswertung in 3 Stufen: Rohdatenauswertung mit Report zur Qualitätskontrolle Die statistische Auswertung und Filterung Die Annotation und funktionelle Auswertung.
3. Datenauswertung Datenauswertung und verfügbare Tools Qualitäts-kontrolle GCOS (Report) Rohdatenanalyse GCOS Datenbank GCOS Manager Statistik Excel, GeneSpring Funktionelle Bewertung GeneSpring, NetAffx, Gene Ontology, GenMapp, RefSeq, Unigene Clustering GeneSpring, Bezug zu den Rohdaten herstellen Access, GeneSpring, Excel Ergebnisdarstellung GeneSpring, Excel, Fatigo
3. Datenauswertung Die Rohdatenanalyse mit der GCOS 7 x 7 Pixel pro Feature DAT-File CEL-File Eine Zahl pro Feature Ein Signal Wert mit Detection p-Wert pro Probeset CHP-File Zusätzlich wird ein Report erstellt, der alle relevanten Qualitätsparameter enthält
3. Datenauswertung Der „Call“ Die Analyse der Probe Pairs eines Probe Sets, d.h. eines Gens oder mRNA, führt durch die GCOS Software zum „Call“. „Absent“ Call (nicht exprimiert): Detection p-Wert > 0,065 „Marginal“ Call (eventuell exprimiert): Detection p-Wert 0,065 - 0,05 „Present“ Call (exprimiert): Detection p-Wert < 0,05. Absent, present und marginal „Calls“ ergeben sich aus Signalintensitäten von Hybridisierungssignalen, die mit Fehlern behaftet sein können. Calls sind deshalb nur vorläufige Beurteilungen, insbesondere müssen die „marginal“ und „absent“ Calls mit Vorsicht interpretiert werden und, bei Bedarf, durch RT-PCR überprüft werden.
3. Datenauswertung Die „Normalisierung“ Um die Daten verschiedener Arrays vergleichbar zu machen, müssen die Daten normalisiert werden. Hierzu gibt es viele verschiedene Möglichkeiten. Wir benutzen: Standard: Skalierung auf einen Zielwert von 500 am Mittelwert Bei Sättigung: Skalierung auf einen Zielwert 500 am Median Für Tests allgemein: Logarithmierung und Skalierung per Gen an der 50ten Perzentile
3. Datenauswertung Der Scatter Plot Die einfachste Auswertung eines 2 Array Experiments (Kontrolle gegen Probe) ist der Scatter Plot, bei dem die Ergebnisse der beiden Arrays logarithmisch gegeneinander aufgetragen werden. Rot: Present - Present; Gelb: Absent - Absent; Blau: Absent - Present Mehr als 30 fach differentiell exprimiertes Gen FoldChange Linien, 2x, 3x, 10x und 30x
3. Datenauswertung Statistische Auswertung und Filterung Eine statistische Auswertung setzt wenigstens 3, besser 5, Wiederholungsmessungen voraus. Sie liefert ein zusätzliches Filterkriterium in Form des p-Wertes. Die Filterung reduziert die Datenflut. Die Schwellenwerte sind willkürlich. . Filter: 1. Signalwert 2. Detection p-Wert 3. Fold Change 4. p-Wert des Tests . Das Ergebnis ist eine Liste von Kandidatengenen, die mit erhöhter Wahrscheinlichkeit tatsächlich differentiell exprimiert sind. Durch die Stringenz der Schwellenwerte kann die Qualität der Kandidatenliste erhöht werden.
3. Datenauswertung Reduzierte Streuung durch Mittelwertbildung
3. Datenauswertung Filter
3. Datenauswertung Kombination der Filter: Ergebnisliste
3. Datenauswertung Die Annotation • Problem: Der Experimentator erhält eine Genliste, die unbekannte Gene enthält und ungeordnet ist: • Ein schnelles Verfahren zur Informationsbeschaffung wird nötig. • Datenbanken können weitere Informationen bereitstellen: Liste mit Affymetrix Nummern via Access, GeneSpring, NetAffx Bezug zu Datenbank Termini - Pubmed - UniGene - LocusLink / Entrez Gene - OMIM - Ensembl - ...
4. Die Kosten Die Kosten pro Array betragen 800.- € bis 1250.- €. Die exakten Kosten hängen vom Leistungsumfang und dem Arraytyp ab.
5. Die verschiedenen Protokolle Es kommen 6 verschiedene Protokolle zum Einsatz. Standard (S), Midi (M) und Small Scale (X), jeweils für die Arrayformate Standard (1) und Midi (2). Nachfolgende Übersicht zeigt, worin sich die Protokolle im wesentlichen unterscheiden:
6. Information für Kooperationspartner • Vorgehen: • Kontaktaufnahme per Mail: andreas.habenicht@mti.uni-jena.de • Besprechung und Beratung • Übergabe der Proben mit Projektblatt (Vordruck aus IVM) • Durchführung der Microarrays • Übergabe der Daten als Rohdatenfiles und als Excelfiles • (Eine Excel Vorlage zur Auswertung wird bereitgestellt)
7. Downloads • Vertrag • Excelvorlage zur Auswertung • Manual zur Excelvorlage • Vordruck „Projektblatt“