1 / 19

2008.10

단백질 기능 흐름 모델 구성 및 평가 기법. 장우혁 , 정석훈 , 한동수 (ICU). 2008.10. I.S.I. Lab. Information and Communications University. 1. 2. 3. 4. Introduction. Functional Flow. Evaluation. Discussion. Contents. Introduction - Motivation. Introduction - Motivation.

nysa
Download Presentation

2008.10

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 단백질 기능 흐름 모델 구성 및 평가 기법 장우혁, 정석훈, 한동수 (ICU) 2008.10 I.S.I. Lab Information and Communications University

  2. 1 2 3 4 Introduction Functional Flow Evaluation Discussion • Contents

  3. Introduction - Motivation

  4. Introduction - Motivation

  5. 최근 다양한 물리화학적 기법을 이용한 고화질(High-resolution)의 단백질 상호작용(PPI) 실험 및 예측 결과들이 축적되고 있음 기존의 PPI 네트워크만으로는 신호 전달 경로 및 대사 경로 예측과 같은 응용 분야로의 직접 활용에 한계가 있음 PPI 네트워크는 단백질간의 물리적 결합만을 단순히 표현한 것으로 생물학적 의미를 가지는 서브 네트워크의 추출을 위해서는 추가적 정보가 필요 관심 있는 특정 기능 위주의 PPI 네트워크 탐색을 위한 룰 혹은 참조 모델이 요구됨 Introduction – Motivation

  6. PPI 네트워크에서 단백질 쌍들은 일반적 기능의 선후 관계 혹은 패턴을 보여줌 Tong, et al., “Global mapping of the yeast genetic interaction network”, Science, 2004. Correlated interacting genes with GO annotations (~12% of interacting genes had exact annotations; 27% had very similar annotations). Mehmet E Turanalp and Tolga Can, “Discovering functional interaction patterns in protein-protein interaction networks”, BMC Bioinformatics, 2008. Found functional patterns from PPI network, and compared them to random patterns respect to MIPS and KEGG respectively. Introduction – Related Work

  7. 효소 기능 추상화를 통한 기능 템플릿 구축 시도 Ali Cakmak and Gultekin Ozsoyoglu(CS, USA), “Mining biological networks for unknown pathways”, BIOINFORMATICS, 2007, 23:20. Pathway Functionality Template Introduction – Related Work

  8. Functional Flow - Concept A4D1K5, Q99835 Q68DJ6, Q9ULC3 Q13635, Q9Y6C5 Q14623, Q43323, … (4) P98164 LRP2 SHH (HPE3, HLP3) PTCH2 RAB23 SMO (SMOH) GO:0015485, GO:0005113, GO:0043237 GO:0005515, GO:0004872, GO:0004888 GO:0005515, GO:0005515, GO:0004872 Unknown activation binding/association inhibition dissociation GO:0005515, protein binding GO:0004872, receptor activity GO:0004888, transmembrane receptor activity GO:0015485, cholesterol binding GO:0005113, patched binding GO:0043237, laminin-1 binding dissociation dissociation dissociation

  9. 신호 전달 경로와 같은 의미 있는 단백질 상호작용 경로에는 단백질 기능 사이에 특징적인 흐름이 존재함 특징적인 단백질 기능 흐름을 보이는 단백질 사이의 관계(예: activation)는 동일한 기능 흐름을 보이는 또 다른 단백질 쌍에도 동일하게 적용됨 단백질의 여러 일반적 기능 중, 특정 상황에서 나타나는 기능은 선택적으로 결정되며 이는 이전 단계의 단백질 기능에 따름 A B Functional Flow - Concept C B D

  10. Functional Flow – Configuration (DB)

  11. KGML로 제공되는 12개의 reference model에서 H. sapiens 종을 포함하는 11개의 functional flow model을 생성 (특정 기능을 중심으로 방사형으로 뻗어있는 형태) Functional Flow - Configuration Hedgehog Ko04340 ErbB Ko04012

  12. Functional Flow –KEGG Signal Transduction Pathway Case tC: 신호전달경로상의총정점수 tR: 신호전달경로상의총 간선수 aK: 정점당KEGG ID의평균개수 aU: 정점당UniProt ID의평균개수 aF: 정점 당 Gene Ontology의 molecular function 개수 aFC: 기능 흐름 모델의 총 정점 수 tFR: 기능 흐름 모델의 총 간선 수 aFR: 기능 흐름 모델의 정점당 간선 평균 04010 MAPK signaling pathway 04012 ErbB signaling pathway 04310 Wnt signaling pathway 04330 Notch signaling pathway 04340 Hedgehog signaling pathway 04350 TGF-beta signaling pathway 04370 VEGF signaling pathway 04630 Jak-STAT signaling pathway 04020 Calcium signaling pathway 04070 Phosphatidylinositol signaling system 04150 mTOR signaling pathway

  13. Functional Flow –KEGG Signal Transduction Pathway Case Top 10 F. F. Protein binding(GO:0005515) 과 같은 추상적인 기능이 상위를 차지하고 있음 Top 10 F. F. (excluding GO:0005515) GO:0005515를 제외한 결과 상위의 중복횟수는 5회 정도로 나타남

  14. Chronbach’s alpha 계수는 한 개념을 많은 항목으로 측정했을 때, 각 항목들에 대한 일관성이나 동질성 평가 Alpha 계수가 높을 수록 항목들 간의 내적 일관성이 높음 (0.8-8.9: 높은 신뢰도, 0.7-0.8: 적당한 신뢰도, 0.6-0.7: 수용 가능한 신뢰도) where N is the number of components (items or test lets),        is the variance of the observed total test scores, and        is the variance of component i. Evaluation – Chronbach’s Alpha N : 해당 신호 전달 경로에서 추출된 단백질 기능 흐름의 총 개수 : 해당 신호 전달 경로내의 총 단백질 기능 흐름의 총 분산 : 특정 단백질 기능 흐름의 총 11개 신호 전달 경로에 대한 분산

  15. Evaluation – Result • 평균 0.67의 신뢰도 측정됨, 전체 기능 흐름 1023개 중 0.6이상 765개 검출 • Protein binding과 같은 추상적인 기능이 많이 포함 될 수록 기능 흐름의 conflict가 많이 발생한다는 가정하에 GO term의 root로부터의 평균거리를 측정한 결과 alpha 계수와 비슷한 양상을 보임 • Distance가 클 수록 GO term의 의미는 specific함

  16. Chronbach’s alpha 계수가 높게 나타난다는 것은 해당 신호 전달 경로내의 기능 흐름이 다른 신호 전달 경로에서도 동일하게 나타날 확률이 높음을 뜻함 각각의 신호 전달 경로에 따른 기능 흐름 모델의 양상이 다르게 나타날 수 있으나, 현재는 global한 하나의 기능 흐름 모델만을 작성함 GO term의 추상화 레벨을 동일하게 정리해야 할 필요 성이 있음 (현재 Hierarchical 하게 비교) Protein binding과 같은 추상적인 기능들에 대한 filtering이 필요함 Discussion

  17. PPI 네트워크 상의 단백질 상호작용은 단순 물리적 링크만을 표현하여, 향후 전개될 단백질 기능 관련 응용 분야에 직접적으로 적용되기에 한계가 있음 최근의 연구에 따르면 PPI 네트워크 상의 단백질 쌍들은 기능상 일정한 패턴을 보여주고 있음 본 논문에서 제안하는 단백질 기능 흐름 모델은 PPI 네트워크에서 특정 기능에 대한 경로 탐색의 참조 모델로 활용가치가 있음 향후, 신호 전달 경로에 대하여 제시된 모델의 유효성 연구를 수행할 예정임 Conclusion

  18. Conclusion Warehousing Sig. Trans. Pathway PPI network Strategies Reference Model Integration Biological DB WWW Sub-Network As a constraints New Sig. Trans. Pathway

  19. 본 연구는 교육과학기술부와 한국과학재단의 특정기초연구지원사업(학제간)과 교육과학기술부와 한국산업기술재단의 지역혁신인력양성사업으로 수행된 연구결과임 Acknowledgement Thank You !

More Related