1 / 36

RNA 二次構造予測 (3)

RNA 二次構造予測 (3). 生命情報解析 2007年1 1 月 1 日. RNA の二次構造の解析. RNA は一本鎖なので、折れ曲がって自分自身と結合を作りやすい 二次構造が機能と大きく関わっているため、機能を知る手がかりに?. 5’. 3’. RNA 二次構造による 塩基間相互作用. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. C. AT TA CG GC AT TA. AT TA AT GC AT TA. AT TA GC

lilike
Download Presentation

RNA 二次構造予測 (3)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RNA二次構造予測(3) 生命情報解析 2007年11月1日

  2. RNAの二次構造の解析 • RNAは一本鎖なので、折れ曲がって自分自身と結合を作りやすい • 二次構造が機能と大きく関わっているため、機能を知る手がかりに? 5’ 3’

  3. RNA二次構造による塩基間相互作用 C C C C C C C C C C C C C C C C C C C C AT TA CG GC AT TA AT TA AT GC AT TA AT TA GC GC AT TA AT TA A G GC AT TA AT TA TA GC AT TA (e) (c) (d) (b) (a) (a) ATGCTACCCCTAGCTA (b) TAGATACCCCTATCTA (c) TAGGTACCCCTACCTA (d) TAGTTACCCCTAACTA (e) TAGATACCCCTAGCTA

  4. 相互情報量の定義 列UとVの塩基間の関連性の強さを定量的にとらえている

  5. 相互情報量の性質 • I(U // V) = I(V // U) • I(U // V) ≧ 0 • I(U // V) = H(U) + H(V) – H(U, V)

  6. 相互情報量の計算 U V U V U V A C A C A G A G C G C G C T C T G T G T G A G A T A T A T C T C A A A C A G A T C A C C C G C T G A G C G G G T T A T C T G T T A C A C A C A C C G C G C G C G G T G T G T G T T A T A T A T A (a)のケースでは、 H(U)=2, H(V)=2, H(U,V)=4 従って、 I(U//V) = H(U)+H(V)-H(U,V) = 0 (a) (b) (c)

  7. 演習問題 U V A A A A A G A T C C C C C G C T 列U,Vにおける塩基間の相互情報量を求めよ。

  8. tRNAの二次構造 GC GC AU GU CG GCGC 3’ A C C 5’ G A H G G A U U B UGCCC GCGGG G G U A A C C CUUG GAAU G U U C F G U A U A G U C CG CG UA GC CG G G D E C C U A C G U

  9. C A B E F D G H 1 2 3 4 5 6 7 0123456789012345678901234567890123456789012345678901234567890123456789012345678 aspU -GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspV -GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspT -GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA ileV -AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileU -AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileT -AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA valV -GCGTTCATAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGTTGGTTCGAGTCCAATTGAACGCACCA valW -GCGTCCGTAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGGTGGTTCGAGTCCACTCGGACGCACCA alaU -GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaT -GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaV -GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaX -GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA alaW -GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA hisR GGTGGCTATAGCTCAG-TTGGT-AGAGCCCTGGATTGTGATTCCAGTTGTCGTGGGTTCGAATCCCATTAGCCACCCCA pheV -GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA pheU -GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA thrW -GCCGATATAGCTCAG-TTGGT-AGAGCAGCGCATTCGTAATGCGAAGGTCGTAGGTTCGACTCCTATTATCGGCACCA asnT -TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnW -TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnU -TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnV -TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA glyW TGCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyV -GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyX -GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyY -GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA thrV -GCTGATATGGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCCCCAGTTCGACTCTGGGTATCAGCACCA thrT -GCTGATATAGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCGGCAGTTCGAATCTGCCTATCAGCACCA thrU -GCCGACTTAGCTCAG-TAGGT-AGAGCAACTGACTTGTAATCAGTAGGTCACCAGTTCGATTCCGGTAGTCGGCACCA metU -GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA metT -GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA lysT -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysW -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysY -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysZ -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysQ -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysV -GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA ileY -GGCCCTTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAAGGGCCACCA ileX -GGCCCCTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAGGGGCCACCA valT -GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valZ -GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valU -GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA

  10. C E G H A B D F

  11. RNAの二次構造予測 • 複数のRNA配列がある場合は相互情報量を使用して二次構造の推定が可能 • 単一の配列の場合はどうする?

  12. tRNAの二次構造予測の例 GenBank tRNA配列 http://www.genome.ad.jp/dbget-bin/www_bget?gb:ECOCPTGG http://www.genome.ad.jp/dbget-bin/www_bget?gb:ECOPHER Zukerのmfold http://www.bioinfo.rpi.edu/applications/mfold/old/rna/form1.cgi

  13. RNA二次構造はグラフで表現できる A A A A A A A A A A T A A A G C A C G T T G C A C G A T C T A A A T C A

  14. RNA二次構造は行列Cで表現できる A A A A A A T A G C C G A T C T A A 行列C

  15. 良い二次構造予測とは • 二次構造の安定性を表すスコア体系を構築 • 与えられたスコア体系(評価基準)の中で、最適のスコアになるもの • 最適なスコアを出す行列Cを求める

  16. スコア体系はどうする? • 塩基b1とb2が対合していたら、 α(b1,b2)のスコア (ex. α(“a”,“t”) = -2, α(“c”,“g”) = -3) • RNAの塩基配列をr1r2,…,rnとして、i番目の塩基riとj番目の塩基rjが対合していたら、α(ri,rj)のスコア • 各部分のスコアは別の部分のスコアに影響されない

  17. ギブスの自由エネルギー • 等温・定圧における状態量 • 自然に起こる過程では自由エネルギーは減少してゆく (ΔG ≦ 0 ) • 自由エネルギーが低いほど安定 G ギブスの自由エネルギー G = U+PV-TS U:内部エネルギー、P:圧力、V:体積、T:温度、S:エントロピー

  18. 自由エネルギーとRNAの構造 △G < 0 自由エネルギーが低いほど安定な構造

  19. 最適二次構造を求める • 自由エネルギーが最も低い構造を探索 • スコアが最も低い構造を探索 • 全通りの構造を探索 … 多大な時間がかかる

  20. 扱うRNA構造を制限 • edgeが交差 …. pseudoknot構造を含む • 平面グラフ ….効率の良いアルゴリズムが存在

  21. 平面グラフなら… • 構造を分割して考えることが可能 • スコア体系によっては、各分割部分に対してスコアが定義される k k-1 j i

  22. 3つの指標の定義 • E(Si,j) … 部分配列ri, ri+1, … rjの構造Si,jの最適スコア • D(Si,j) …部分配列ri, ri+1, … rjの構造Si,jの最適の分割位置 • C(Si,j) … 部分配列ri, ri+1, … rjの末端riとrjを結合させた方がよい場合は1、そうでなければ、0

  23. E(Si,j)、 D(Si,j)、C(Si,j)の例 • E(Si,j)=-10 • D(Si,j)=15 • C(Si,j)=0 C A A G C A G 14 15 C T C T 10 20

  24. 塩基riとrjの考えうる3つの状態 k j j j i i i

  25. 塩基riとrjが結合 j-1 i+1 j i E(Si,j) = α(ri,rj)+E(Si+1,j-1) 但し、E(Si,j)は部分配列ri,ri+1,…,rjの最小自由エネルギー

  26. riもrjも結合しない j i E(Si,j) = E(Si+1,j-1)

  27. riもしくはrjが他の塩基と結合:分割 k k-1 j i E(Si,j) = E(Si,k-1)+E(Sk,j) 但しkはどの位置か、実際には分からないため、i<k≦jなるkを全て調べる

  28. 統合しないケースを分割で表現 k k-1 k j-1 j j,k i j i i,i+1で分割 j-1,jで分割

  29. RNA二次構造予測の定式化 … 1塩基以下 … 塩基riと rj の結合 … 構造を i~ k-1 と k~ j に分割 E(Si,j)は部分配列ri,ri+1,…,rjの最小自由エネルギー

  30. gttataacacの二次構造予測(行列E) a-tマッチを-2、c-gマッチを-3として計算

  31. 途中経過の記録 l • E(Si,j)の記録 • 分割位置D(Si,j)の記録 l k k j j i i 効率の良い計算が可能になる 計算過程をたどれる

  32. 結合も分割もDに記録 k k-1 j i j i 分割 D(i,j)にk(i<k≦j)を記録 結合 D(i,j)に”XX”などを記録 数値なら、k=iなどを記録

  33. gttataacacの二次構造予測(行列D) XXは結合位置

  34. Dから二次構造Cを求める • D→C(i, j) : 行列Dを参照し、区間(i,j)の二次構造Cを求める • i ≧ jなら処理なし • D(i,j)がXXなら、C(i,j)を1にして、D→C(i + 1, j - 1)を呼ぶ • そうでなければ、 • D→C(i, D(i,j) - 1)を呼んだ後、D→C(D(i,j), j)を呼ぶ

  35. gttataacacの二次構造予測(行列C) t a a t a t c c g a

  36. 演習問題 a-tの対合を-2点、c-gの対合を-3点として、 ggagtcc の最適二次構造Cを求めよ。 • E(Si,j)の行列に最大スコア、 • D(Si,j)の行列に分割位置(or 結合) を記録していくこと ※複数解がある場合は結合よりも分割を優先し、なるべく左側分割部分を小さくすること

More Related