80 likes | 261 Views
Dynamic Programming for Sequence Alignment - OPDB への適用. 2003/9/12 才野. バイオインフォマティクス研究. 創薬 オーダーメイド医療 個人差 ・・・ SNPS 遺伝病の 立体構造予測 遺伝子、タンパク質機能予測 生命現象の理解. Sequence Alignment. Dynamic Programming FASTA BLAST. Dynamic Programming による配列アラインメント. Needelman-Wunsch アルゴリズム グローバルアラインメント.
E N D
Dynamic Programming for Sequence Alignment-OPDBへの適用 2003/9/12 才野
バイオインフォマティクス研究 • 創薬 • オーダーメイド医療 • 個人差 ・・・ SNPS • 遺伝病の • 立体構造予測 • 遺伝子、タンパク質機能予測 • 生命現象の理解
Sequence Alignment • Dynamic Programming • FASTA • BLAST
Dynamic Programmingによる配列アラインメント • Needelman-Wunschアルゴリズム • グローバルアラインメント ・一致:+1、不一致:-1、ギャップ:-1
Dynamic Programmingによる配列アラインメント • Smith-Watermanアルゴリズム • ローカルアラインメント ・一致:+1、不一致:-1、ギャップ:-1
ギャップペナルティ • リニアギャップペナルティ 「g(L)=dL」 • g(L):リニアギャップペナルティ • d:ギャップペナルティ • L:ギャップ長 • アフィンギャップペナルティ 「g(L)=α+β(L-1)」 • g(L):アフィンギャップペナルティ • α:ギャップ開始ペナルティ • β:ギャップ伸張ペナルティ • L:ギャップ長
スコア行列 • PAM matrix • 現在最も進化の原理に基づいたスコア行列 • タンパク質中の各アミノ酸はいつでも20アミノ酸のどれにでも、PAM行列で与えられる確率で変化しうる • それぞれの位置で起こる変化はその位置における現在のアミノ酸にのみ依存 • BLOSUM matrix • タンパク質配列アラインメントを評価するのに広く利用されている • 類縁のある配列中で最もよく似た共通の領域を表現するブロック中の置換と保存された位置に基づく
OPDBへの適用 • 配列クラスの作成 • 配列を調べるためにそれぞれのタンパク質から配列を取り出すのは時間がかかる • アミノ酸3文字表記を1文字表記へ変換 • アミノ酸比較が容易 • Dynamic Programming を作成 • アルゴリズムを参考にCで作成してみる • ODQLと組み合わせてOPDBで実行できるようにする