240 likes | 433 Views
Bayesian Joint Prediction of Associated Transcription Factors in Bacillus subtilis. 96325101 陳冠廷 96325105 陳靜儀 96325111 謝仁傑 96325116 林敬恆. Motivation. 在推斷 gene 的時候,管理機制的問題。 實驗的準確性,很難可靠的預測出 TF(transcription factor) 調控基因。 監督式學習是可性度較高的預測管理。
E N D
Bayesian Joint Prediction of Associated Transcription Factors in Bacillus subtilis 96325101 陳冠廷 96325105 陳靜儀96325111 謝仁傑 96325116 林敬恆
Motivation • 在推斷gene的時候,管理機制的問題。 • 實驗的準確性,很難可靠的預測出TF(transcription factor)調控基因。 • 監督式學習是可性度較高的預測管理。 • 在最佳的預測,細菌B.subtilis中,只有知道20%的TF有超過10個已知的建構序列(Binding Sequences) 。
Sigma factor • Sigma factor 是結合在RNA上的聚合酵素複合體,可以識別出特殊的DNA motifs開始轉錄的位置。 • sigA - 主要調控多數基因的因子。 • sigB - 複雜的反應因子。 • sigD - 和基因活動性及趨藥性有關。 • Other - sigZ、sigF、sigG、sigK、sigH - 和形成孢子有關
B.subtilis實驗 • 本論文之前 – 使用174個microarray資料來做實驗,從實驗中知道sigma factor建構motifs,預測出某個調控B.subtilis各個基因的sigma factor。 • 本論文中 – 針對基因調控網路來預測sigma factor的建構位置與生物資訊來連結TFs的調控關聯性,並且找出TF建構位置附近的sigma factor建構位置。
2. Method • 藉由貝氏機率和統計方式利用 Sigma factor 來預測他會和哪個TF共同作用,並預測他們作用的轉錄起始位置。 • 利用Position Specific Score Matrix (PSSM) 來尋找序列模組
2.1 Sigma factor prediction • 表示基因被 調控的機率。
2.2 Combining sigma factor and transcription factor • 利用上頁圖表來估計基因被TF( )和Sigma factor( )所共同調控的機率
2.2 Combining sigma factor and transcription factor • 但因為還有些Sigma factor還未被實驗所找到。所以,加入pseudocount來估計 • 分子 (K:被考慮的TF數量) • 分母 (i=0:K,0為目前未知的TF)
2.3 Motif search • 利用PSSM來尋找Motif • PSSM陣列是用來找到一個在TF的binding sequence motif上的核甘酸b在位置r上面的分數 • (R: Motif 的長度)
2.4 Relative distance from transcription start site to TF binding site • : probability density distribution • : Transcription factor “Ti”轉錄開始端-接合端的距離 • 利用Gaussian kernels來描述鹼基對的分佈
2.4 Relative distance from transcription start site to TF binding site • 藍色: 正向調控 • 紅色: 負向調控 • 綠色: 均有
2.5 Combining sigma factor and transcription factor prediction • 定義: 基因被TF和Sigma factor所共同調控的條件機率 - • (U: sigma factor 的總和) • =
S S/Si S\Si Si 2.5 Combining sigma factor and transcription factor prediction • 我們將其拆成三部份 • S代表upstream sequence, 其中包含binding site Si,和剩下的S\Si • Si 是從轉錄起始位置距離Di的地方產生
2.5 Combining sigma factor and transcription factor prediction • (Mi是指upstream “S” 中,transcription factor “Ti”的 PSSM分數最大值)
2.5 Combining sigma factor and transcription factor prediction • 根據以上推倒,原式會變成 • 而其中
3.1 The sigma factor prediction aids in TF prediction • 為了能夠驗證預測的正確性,我們比較了 和
3.2 The TF prediction aids in the sigma factor prediction • “事後機率”比“事前機率”準
Result • The joint prediction of TFs is a powerful way. • to confirm the sigma prediction • to predict new members of the TF regulon • The joint prediction of sigma factors and TFs can make better use of known biological facts than unsupervised methods. • This method can also detect genes regulated by two or more different sigma factors.