240 likes | 328 Views
9 / 1 (1 日目 ). 生物情報科学実験2 プロテインチップ. 森下研究室 佐々木 伸 ( ssksn@cb.k.u-tokyo.ac.jp ). レポート提出先・データおよび配付資料. この実験のレポート提出先は、 http://mlab.cb.k.u-tokyo.ac.jp/~sesejun/upbsb/jikken/2005/report/protein/ となります。提出方法はこれまでの実験と同様です。 「レポート1」から提出してください。 実験1でとった質量波形データおよび、この実験の資料やソフトウェアなどは、
E N D
9 / 1 (1日目) 生物情報科学実験2プロテインチップ 森下研究室 佐々木 伸 (ssksn@cb.k.u-tokyo.ac.jp)
レポート提出先・データおよび配付資料 • この実験のレポート提出先は、 http://mlab.cb.k.u-tokyo.ac.jp/~sesejun/upbsb/jikken/2005/report/protein/ となります。提出方法はこれまでの実験と同様です。 • 「レポート1」から提出してください。 • 実験1でとった質量波形データおよび、この実験の資料やソフトウェアなどは、 http://mlab.cb.k.u-tokyo.ac.jp/~ssksn/upbsb/ にありますので、適宜ダウンロードしてください。 • ソースコードは、印刷物では配布しません。上記のホームページ上にあるものをダウンロードしてください。 • キーボードをタイプして入力するにはコード量が多いので、ダウンロードしたファイルからコピーするなどしてください
今日の内容 • PMFの原理説明 (山田) • PeakPickerを使って、実験1の実データからサンプルタンパクのペプチド質量ピークを拾う • 拾い出した質量ピークデータで、ProFoundを使ってデータベースを検索してサンプルを同定する
この実験の日程(目安) • 1日目、2日目 • 生データからピークを拾う • ProFoundを使って試料を同定してみる • データ補正プログラムを作成する • 3日目~5日目 • ProFoundのような簡易ペプチド同定プログラムを作成する
PeakPickerの使い方 • Webページ(http://mlab.cb.k.u-tokyo.ac.jp/~ssksn/upbsb/)からダウンロードして下さい。 • データファイル4種類(calibrants.csv, sample_and_calibrants.csv, trypsin.csv,sample.csv)もダウンロードして下さい。 • 配布されているノートPCの設定では、ダウンロードしたJARファイル(PeakPicker.jar)をダブルクリックすれば起動します。 • 個人のPCなどでダブルクリックでは起動しない場合は、コマンドプロンプトなどから java -jar PeakPicker.jar などとしてください。(分からない人はTAへ質問して下さい)
PeakPickerの使い方 • 操作方法の説明 ファイル出力ボタン 現在位置表示エリア ピークグラフ表示エリア 選択ピーク値表示エリア ピーク選択リセットボタン データロードボタン ズーム(上がズームイン) 画面縦移動バー データ補正ボタン 画面横移動バー データ補正器作成ボタン
PeakPickerの使い方 • データの説明 • calibrants.csv • データ補正(Calibration(後述))のための既知の質量の試料のピークデータ • sample_and_calibrants.csv • 同定したいサンプル試料に、上記のcalibration用の試料を加えたもののピークデータ • trypsin.csv • トリプシンの自己消化ピークを検出するための、トリプシンだけのピークデータ • sample.csv • 同定したいサンプル試料のピークデータ
PeakPickerの使い方 左上の「Load」ボタンで4段 それぞれにファイルから データをロードする • データをロード
PeakPickerの使い方 左側のグラフ画面で 左クリックするとマウス位置に 最も近い点が選択され、 そのピークの値が右側の リスト画面に表示される 選択を外す時は、同じようにして 右クリック • ピークを選択
右側のリスト画面の ピーク値をダブルクリックすると 対応させる補正値の候補が 表示されるので、それから選ぶ。 基準点を選び終えたら、 「Make Calibrator」ボタンで 4段に共通なCalibratorが 作成される PeakPickerの使い方 • 補正基準点を設定 → 補正器(Calibrator)を作成
PeakPickerの使い方 右上の「Calibration」ボタンを 押すと、現在のCalibratorを 使って、その段のデータが補正される ※2度押し注意!! • データ補正(Calibration)
PeakPickerの使い方 • データ補正(Calibration) • 内部補正(Internal Calibration) • そのデータ中に含まれる基準点を使った補正関数による補正 • 外部補正(External Calibration) • 同じような条件下の、他のデータによる基準点を使った補正関数による補正 • 補正用の試料を、測定したい試料に混ぜなければならないのでなるべくなら外部補正で済ませたい。しかし、今回の実験のチップは1つごとに、ズレ方が異なるので内部補正でなければ正確な補正が行えない
PeakPickerの使い方 • データ補正(Calibration) • 今回の手順 • calibrants.csvから補正器を作成 • calibrants.csv(内部補正)、 trypsin.csv(外部補正)、 sample.csv(外部補正)に1で作成した補正器による補正を行う • sample_and_calibrants.csvから、もう一つ補正器を作成 • 3で作成した補正器でsample_and_calibrants.csvのデータを内部補正する • 以降、実際に質量ピークとして拾ってくる数値データは補正されたsample_and_calibrants.csvのデータである
PeakPickerの使い方 補正点の選択と同様にして ピークをピックアップし、 右の「Print」ボタンで ファイルに書き出される • データのピックアップ
PeakPickerの使い方 • データのピックアップ • 4段目(sample.csv)と2段目(sample_and_calibrants.csv)にあるピークで、かつ1段目(calibrants.csv)と3段目(trypsin.csv)のどちらにも無いピークを選択する • 1段目に強く出ているピークは、補正用の試料のピークなので、それらは除いて2段目のピークを選択しなければならない • 3段目に強く出ているピークは、トリプシンが自己消化したもののピークなので、測定すべきサンプルのピークではないので、それらも除いて2段目のピークを選択しなければならない • 選択結果を出力 • 選択したピークのある段の「Print」ボタンを押すと、それまで選択されたピークの値が、ファイルに出力されます
ProFoundの使い方 • PeakPickerで拾った質量データを使ってProFound (http://129.85.19.192/profound_bin/WebProFound.exe) で試料タンパクを同定します
ProFoundの使い方 • ProFoundの設定項目 • Sample ID : 空欄 • Database : NCBI nr • Taxonomic Category : Mammalia • Search for : single protein only • Protein Mass : 0 – 3000 kDa • Protein pI : 0 – 14 • Report Top : 30 • Allow Maximum : 2 missed cleavages • Enzyme : Trypsin • Complete Modification(s) : Unmodified • Mass tolerance for average data : +/- 1 • Tolerance unit : Da
ProFoundの使い方 • Average Massesの項目に、PeakPickerで拾った質量データを入力 • 設定が完了したら、「Identify Protein」ボタンを押す
ProFoundの使い方 配列被覆率 • 検索結果 ランキング 正規化確率 同定されたタンパクの情報
ProFoundの使い方 • 検索結果 入力ペプチド数 部分配列の位置 検索でマッチしたペプチド数 Miss cut数 配列被覆率 ペプチド配列 入力質量値 理想質量値 誤差
ProFoundの使い方 • 目的のタンパクが同定できるかやってみましょう • 設定項目を変えて、検索結果や検索にかかる時間などがどう変化するか、いろいろ試してみましょう • 変えない設定項目 • Single protein only • Enzyme • Unmodified modification
レポート1(page.1) • 論理記号 and(~かつ~)、or(~あるいは~)、not(~ではない)を用いて、PeakPicker で使った4種のデータには • Calibrants.csv = “Calibrant のピーク” or “ノイズのピークA” • sample_and_calibrants.csv = “Caribrants のピーク” or “sample のピーク” or “trypsin のピーク” or “ノイズのピークB” • Trypsin.csv = “trypsin のピーク” or “ノイズのピークC” • sample.csv = “sample のピーク” or “trypsin のピーク” or “ノイズのピークD” が含まれていたとし、PeakPicker で行った作業に即する形で、 sample_and_calibrants.csv から “sample のピーク”を導き出す式を書け。 • 記入形式例 (XXX.csv and YYY.csv) or (not ZZZ.csv) …
レポート1(page.2) • 問題1の表記において、実際のPeakPickerでの作業とは関係なく(sample_and_calibrants.csvにこだわらず)、純粋に記号理論として見た場合に、最も少ない論理記号の使用回数で”sampleのピーク”を導ける式を書け。 • 実際において、問題2の式で示された方法ではいけない点は何か?次の用語を全て含めて説明せよ。 • 内部補正 • 外部補正 • 正確さ
レポート1(page.3) • PeakPicker でピックアップしたピーク値をファイルに出力し、提出せよ。また、そのデータでProFoundを検索した結果、表示されたページをPCにファイルとして保存し、そのHTMLファイルも提出せよ。 • ProFound での検索で、 • Taxonomic Category • Maximum missed cleavages • Mass tolerance for average data の設定を変更すると、検索結果、検索時間(体感でよい)などがどのようになるか実験し、考察せよ。 • レポート提出期限 9月2日24時(3日0時)