1 / 16

A naliza danych pochodzących z mikromacierzy DNA

A naliza danych pochodzących z mikromacierzy DNA. Agnieszka Ludwików Jan Sadowski Uniwersytet im. Adama Mickiewicza ludwika@amu.edu.pl. Etapy eksperymentu microarray. Dlaczego ?. Planowanie eksperymentu microarray. Eksperyment. Analiza danych. Interpretacja danych. Weryfikacja danych.

philippa
Download Presentation

A naliza danych pochodzących z mikromacierzy DNA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analiza danych pochodzących z mikromacierzy DNA Agnieszka Ludwików Jan Sadowski Uniwersytet im. Adama Mickiewicza ludwika@amu.edu.pl

  2. Etapy eksperymentu microarray Dlaczego? Planowanie eksperymentu microarray Eksperyment Analiza danych Interpretacja danych Weryfikacja danych

  3. ZastosowaniemikromacierzyDNA • Profilowanie ekspresji genów • Wykrywanie mutacji (SNP) • Genotypowanie • Szacowanie liczby kopii (CGH) • Mapowanie genów i klonów

  4. Problemy? Opis genów – bazy danych Krzyżowa hybrydyzacja (rodziny genowe) Niepowtarzalność warunków eksperymentu (warunki hodowli, wyposażenie użyte do eksperymentu) Materiał biologiczny (ilość, jakość)

  5. Planowanie eksperymentu • Mikromacierze • GeneChip Affymetrix • cDNA, oligo na szkiełkach • Makromacierze - cDNA nylony

  6. GeneChip Affymetrix • każdy gen reprezentowany jest przez 11- 20 par 25-merów. • Pary PM i MM (pomiar tła i niespecyficznej hybrydyzacji)

  7. Procedura (izolacja RNA, znakowanie, hybrydyzacja, skanowanie) Replikacje: techniczne i biologiczne (zmienność biologiczna) Eksperyment microarray Źródło zmienności

  8. Replikacje techniczne 1 2 3 1 2 3

  9. Replikacje biologiczne Zyskujemy zmienność biologiczna, która reprezentuje populację ! ALE Tracimy zmienność osobniczą Ile replikacji? Peng X. i inni, 2003, BMC Bioinformatics 2003, 4:26 Bakay M. i inni, 2002, BMC Bioinformatics 2002, 3:4

  10. Analiza danych • Analizy jakościowe: dCHIP detekcja chipów poza normą (outlier detection) oraz PCA (Analiza komponentów głównych)

  11. Analiza danych • Normalizacja • ‘To minimize non-biological variation and focus on real biological changes’ • dCHIP http://www.dchip.org/ • Li Ch.& Wong W.H., 2001, Proc. Natl. Acad. Sci. Vol. 98, 31-36. • ZhongS., 2003, Nucleic Acids Research. Vol. 31, 3483-3486. • RMAExpress http://www.bioconductor.org/ • Bolstad B.M. i inni, 2003, Bioinformatics 19(2):185-193 • Irizarry R.A., i inni, 2003, Nucleic Acids Research 31(4):e15 • Genespringhttp://www.silicongenetix.com

  12. Analizadanych • Otrzymujemy listę genów, których poziom transkrypcji spada lub rośnie Czy i na ile wykryta zmiana jest rzeczywista?

  13. Analiza danych • Użyj metod statystycznych do oszacowania istotności uzyskanych zmian. • UWAGA: 2 typy błędów: tzw. False positives & False negatives • Użyj parametru krotności zmian (Fold change)by oszacować zróżnicowanie profili. 2 krotna represja lub indukcja jest powtarzalna przez analizy ilościowe • UWAGA: Zazwyczaj wyższe krotności zmian wykazują geny o niskim poziomie transkrypcji • Geny, które zmieniają poziom transkrypcji z zadanym statystycznym prawdopodobieństwem (P-VALUE) i z zadaną krotnościa zmian!!!

  14. Analiza danych Poszukiwanie związku miedzy poziomem transkryptu a sekwencją genu, jego funkcją, szlakiem sygnałowym, szlakiem metabolicznym etc. Geny kodujące białka uczestniczące w tym samym procesie lub są częścią tego sameo kompleksu najczęściej są koregulowane. Klastery genów spełniających podobne funkcje często wykazują skorelowany profil transkrypcji w warunkach różnych stresów, warunków srodowiska etc. Typy klusterów: Hierarchiczne, Self Organizing Maps (SOM), K-mean Poszukiwanie cis-sekwencji u koregulujących się genów: AGRIS http://arabidopsis.med.ohio-state.edu/ PlantProm DB http://www.softberry.com/berry.phtml PlantCare http://oberon.fvms.ugent.be:8080/PlantCARE/index.html Place http://www.dna.affrc.go.jp/PLACE/ Transfac http://www.gene-regulation.com/pub/databases.html#transfac MEME http://meme.sdsc.edu/meme/website/intro.html MotifSampler http://www.esat.kuleuven.ac.be/~thijs/Work/MotifSampler.html

  15. Weryfikacja danych Microarray nie jest techniką ilościową Poziom intensywności sygnału względnie świadczy o poziomie transkryptu. Northern Taniguchi M. i inni, 2001, Genomics. Jan 1;71(1):34-9. ilościowy Real time RT-PCR Tricarico C. i inni, 2002, Analytical Biochemistry 309 (2002) 293–300 Jenson S.D. i inni, 2003, J Clin Pathol: Mol Pathol;56:307–312 http://info.med.yale.edu/wmkeck/affymetrix/rtpcr/ Analizy ilościowe: relative quantification - gen referencyjny np. aktyna2, 18S rRNA

  16. Roślinne bazy danych microarray • The Nottingham Arabidopsis Stock Centre's (NASC) http://arabidopsis.info/ • Stress Genomics Consortiumhttp://www.osmid.org/ http://www.stress-genomics.org • The Arabidopsis Functional Genomics Consortium (AFGC) & Stanford Microarray Database (SMD)http://www.arabidopsis.org • Soybean genomics and microarray database (SGMD)http://psi081.ba.ars.usda.gov • Complete Arabidopsis Transcriptome MicroArray database (CATMA) http://www.catma.org/ • Tomato Expression Database (TED)http://ted.bti.cornell.edu/ http://sgn.cornell.edu/ Plant-Arrays: database http://www.univ-montp2.fr/~plant_arrays/databases.html

More Related