300 likes | 660 Views
Gene Set Enrichment Analysis (GSEA). Mehmet Emre Tuncer Refference : Daniel Gusenleitner gusef@jimmy.harvard.edu. Gen Hastalık İlişkisi. Genler bize hastalıklarla ilgili ip uçları verebilmektedir.
E N D
Gene Set Enrichment Analysis (GSEA) Mehmet Emre Tuncer Refference:Daniel Gusenleitner gusef@jimmy.harvard.edu
Gen Hastalık İlişkisi • Genler bize hastalıklarla ilgili ip uçları verebilmektedir. • Bu bilgiler tek bir genden belirgin olarak elde edilebileceği gibi bir çok genin birbirleriyle olan ilişkileriyle de belirlenebilir • Bir çok hastalık ya da fenetopik rahatsızlık sadece bir genle ifade edilemeyebilir.
Gen Hastalık İlişkisi • Çoğu hastalık karmaşıktır ve birden çok geni kapsar. • Genler genel olarak bağımsız çalışmazlar, bir bütünün fonksiyonel bir parça olarak çalışırlar.
Gen Setlerinin Tanımı • Gen kümeleri kendi başlarına biyolojik mekanizmaları ya da karakteristikleri tanımlamada yeterli olmazlar • Saf biyolojik bilgiyi temsil ederler, teorik ve deneysel araştırmalarda yardımcı olurlar
Gen Kümeleri • Data-driven Veri Kümeleri • Knowledge-driven Veri Kümeleri
Gen Kümeleri • Data-driven Veri Kümeleri Genellikle yüksek verimli araştırmalarda ilişkili genleri tanımlamada ve türetmede kullanılırlar
Gen Kümeleri • Knowledge-driven Veri Kümeleri Gen kümelerini oluşturmak için uzman gerekir. Bunlar genellikle araştırmanın konusuna özeldir. GSEA KnowledgeDriven bir yaklaşımı destekler.
Gene Set Analysis (GSA) • Analizleri bioloji odaklı yaklaşımlara kaydırır. • Gen ifadesi data setlerini analiz etmek için fonksiyon ilişkili gen gruplarını kullanır. • Tek bir genin analizinden daha güçlü(robust)
Gene Set Analysis (GSA) • GSEA 3 adımdan oluşur: • Enrichment skorunun hesaplanması • Significanceın tahmin edilmesi • Çoklu hipotez testi için düzenlemeler
Gene Set Enrichment Analysis (GSEA) Yapılan Çalışmalar Mootha et al. PGC-1α-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes, Nature Genetics, 2003, 34-3 Subramanian et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles, PNAS, 2005, 102-43 Oron et al. Gene set enrichment analysis using linear models and diagnostics, Bioinformatics, 2008, 24-22 Bioconductor Package: GSEAlm - Linear Model Toolset for Gene Set Enrichment Analysis
GSEA’ nın Amaçları • Test edilen iki sınıf içinde aşağı ya da yukarı düzenlenmiş gen kümelerine bakmak. • Araştırılan gen kümesinin test edilmiş iki fenotipten farklı ya da aynı olma durumunu test etmektir.
Değişik Fenotiplerin Testi Clinical Data Gene Expression Data Pair-wise Tests: Normal versus Low grade Normal versus High grade Low grade versus High grade Combined Tests: Normal versus Low/High grade Normal/low grade versus High grade
Gene Set Enrichment Analysis (GSEA) I.)Genler t-test ya da lineer model kullanarak sıralanıyor.
Gene Set Enrichment Analysis (GSEA) II.) Gen kümesine üye bilgisi dahil ediliyor
Enrichment Score (ES) • Sıralanmış Liste (L) nin sınırlarında yoğunlaşan sıralamaları yansıtır • Skor L listesinde gezinirken hesaplanır • Zenginleştirme skoru random gezinme sırasında sıfırdan en fazla sapmanın olduğu skor olarak belirlenir.
Permütasyon Testi • ES ninsignificence(önem) ı tahmin edilmelidir. • Önem tahmini için Sınıf etiketli permütasyon işlemi yapılır • ES için null dağıtım üreten permütasyon yapılır • Gözlemlenmiş ES nin deneysel, nominal P değeri bu null dağıtıma göre hesaplanır • Bu P değeri gerçek ES yi verir.
Çoklu hipotez testi için düzenlemeler • Öncelikle ES değeri normalize edilir. Bunun sonucunda NES oluşur. Daha sonra Falsepositiveler kullanılarak FDR(FalseDiscovery Rate) hesaplanır.