160 likes | 711 Views
A naliza danych pochodzących z mikromacierzy DNA. Agnieszka Ludwików Jan Sadowski Uniwersytet im. Adama Mickiewicza ludwika@amu.edu.pl. Etapy eksperymentu microarray. Dlaczego ?. Planowanie eksperymentu microarray. Eksperyment. Analiza danych. Interpretacja danych. Weryfikacja danych.
E N D
Analiza danych pochodzących z mikromacierzy DNA Agnieszka Ludwików Jan Sadowski Uniwersytet im. Adama Mickiewicza ludwika@amu.edu.pl
Etapy eksperymentu microarray Dlaczego? Planowanie eksperymentu microarray Eksperyment Analiza danych Interpretacja danych Weryfikacja danych
ZastosowaniemikromacierzyDNA • Profilowanie ekspresji genów • Wykrywanie mutacji (SNP) • Genotypowanie • Szacowanie liczby kopii (CGH) • Mapowanie genów i klonów
Problemy? Opis genów – bazy danych Krzyżowa hybrydyzacja (rodziny genowe) Niepowtarzalność warunków eksperymentu (warunki hodowli, wyposażenie użyte do eksperymentu) Materiał biologiczny (ilość, jakość)
Planowanie eksperymentu • Mikromacierze • GeneChip Affymetrix • cDNA, oligo na szkiełkach • Makromacierze - cDNA nylony
GeneChip Affymetrix • każdy gen reprezentowany jest przez 11- 20 par 25-merów. • Pary PM i MM (pomiar tła i niespecyficznej hybrydyzacji)
Procedura (izolacja RNA, znakowanie, hybrydyzacja, skanowanie) Replikacje: techniczne i biologiczne (zmienność biologiczna) Eksperyment microarray Źródło zmienności
Replikacje techniczne 1 2 3 1 2 3
Replikacje biologiczne Zyskujemy zmienność biologiczna, która reprezentuje populację ! ALE Tracimy zmienność osobniczą Ile replikacji? Peng X. i inni, 2003, BMC Bioinformatics 2003, 4:26 Bakay M. i inni, 2002, BMC Bioinformatics 2002, 3:4
Analiza danych • Analizy jakościowe: dCHIP detekcja chipów poza normą (outlier detection) oraz PCA (Analiza komponentów głównych)
Analiza danych • Normalizacja • ‘To minimize non-biological variation and focus on real biological changes’ • dCHIP http://www.dchip.org/ • Li Ch.& Wong W.H., 2001, Proc. Natl. Acad. Sci. Vol. 98, 31-36. • ZhongS., 2003, Nucleic Acids Research. Vol. 31, 3483-3486. • RMAExpress http://www.bioconductor.org/ • Bolstad B.M. i inni, 2003, Bioinformatics 19(2):185-193 • Irizarry R.A., i inni, 2003, Nucleic Acids Research 31(4):e15 • Genespringhttp://www.silicongenetix.com
Analizadanych • Otrzymujemy listę genów, których poziom transkrypcji spada lub rośnie Czy i na ile wykryta zmiana jest rzeczywista?
Analiza danych • Użyj metod statystycznych do oszacowania istotności uzyskanych zmian. • UWAGA: 2 typy błędów: tzw. False positives & False negatives • Użyj parametru krotności zmian (Fold change)by oszacować zróżnicowanie profili. 2 krotna represja lub indukcja jest powtarzalna przez analizy ilościowe • UWAGA: Zazwyczaj wyższe krotności zmian wykazują geny o niskim poziomie transkrypcji • Geny, które zmieniają poziom transkrypcji z zadanym statystycznym prawdopodobieństwem (P-VALUE) i z zadaną krotnościa zmian!!!
Analiza danych Poszukiwanie związku miedzy poziomem transkryptu a sekwencją genu, jego funkcją, szlakiem sygnałowym, szlakiem metabolicznym etc. Geny kodujące białka uczestniczące w tym samym procesie lub są częścią tego sameo kompleksu najczęściej są koregulowane. Klastery genów spełniających podobne funkcje często wykazują skorelowany profil transkrypcji w warunkach różnych stresów, warunków srodowiska etc. Typy klusterów: Hierarchiczne, Self Organizing Maps (SOM), K-mean Poszukiwanie cis-sekwencji u koregulujących się genów: AGRIS http://arabidopsis.med.ohio-state.edu/ PlantProm DB http://www.softberry.com/berry.phtml PlantCare http://oberon.fvms.ugent.be:8080/PlantCARE/index.html Place http://www.dna.affrc.go.jp/PLACE/ Transfac http://www.gene-regulation.com/pub/databases.html#transfac MEME http://meme.sdsc.edu/meme/website/intro.html MotifSampler http://www.esat.kuleuven.ac.be/~thijs/Work/MotifSampler.html
Weryfikacja danych Microarray nie jest techniką ilościową Poziom intensywności sygnału względnie świadczy o poziomie transkryptu. Northern Taniguchi M. i inni, 2001, Genomics. Jan 1;71(1):34-9. ilościowy Real time RT-PCR Tricarico C. i inni, 2002, Analytical Biochemistry 309 (2002) 293–300 Jenson S.D. i inni, 2003, J Clin Pathol: Mol Pathol;56:307–312 http://info.med.yale.edu/wmkeck/affymetrix/rtpcr/ Analizy ilościowe: relative quantification - gen referencyjny np. aktyna2, 18S rRNA
Roślinne bazy danych microarray • The Nottingham Arabidopsis Stock Centre's (NASC) http://arabidopsis.info/ • Stress Genomics Consortiumhttp://www.osmid.org/ http://www.stress-genomics.org • The Arabidopsis Functional Genomics Consortium (AFGC) & Stanford Microarray Database (SMD)http://www.arabidopsis.org • Soybean genomics and microarray database (SGMD)http://psi081.ba.ars.usda.gov • Complete Arabidopsis Transcriptome MicroArray database (CATMA) http://www.catma.org/ • Tomato Expression Database (TED)http://ted.bti.cornell.edu/ http://sgn.cornell.edu/ Plant-Arrays: database http://www.univ-montp2.fr/~plant_arrays/databases.html