1 / 16

BioJava

BioJava. バイオインフォマティクスのためのオープンソースライブラリ オープンバイオ BOF @ GIW2004 2004/12/13 篠山 健. BioJava とは?. Java のコード( Java2 が必要 – JDK1.2 以上 ) オープンソース プログラム全体ではなく、ライブラリ集 シークエンス操作中心 Open Bioinformatics Foundation (OBF) の一部. Java 言語の特徴. オブジェクト指向言語 クロスプラットフォーム C, C ++ に代わる主流言語 大規模開発にも対応

swann
Download Presentation

BioJava

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. BioJava バイオインフォマティクスのためのオープンソースライブラリ オープンバイオ BOF @ GIW2004 2004/12/13 篠山 健

  2. BioJavaとは? • Javaのコード(Java2が必要 – JDK1.2以上) • オープンソース • プログラム全体ではなく、ライブラリ集 • シークエンス操作中心 • Open Bioinformatics Foundation (OBF)の一部

  3. Java言語の特徴 • オブジェクト指向言語 • クロスプラットフォーム • C, C++に代わる主流言語 • 大規模開発にも対応 • 一般的にスクリプト言語よりも高速に動作 • いろいろなライブラリが使える(XML, Webサービス, JDBCなど). • GUIアプリケーション、統合開発環境(IDE)利用可

  4. どんなものがあるの? • シークエンスとFeature • シークエンスデータベース • シークエンス入出力 • いろいろなフォーマット (EMBL, GenBank, GFF, SwissProt…)に対応 • Blastパーサ、Hmmerパーサなど • ダイナミックプログラミング、SVMなど

  5. BioJavaのライブラリ org.biojava.bio.seqorg.biojava.bio.seq.dborg.biojava.bio.seq.db.biosqlorg.biojava.bio.seq.db.emblcdorg.biojava.bio.seq.genomicorg.biojava.bio.seq.homolorg.biojava.bio.seq.implorg.biojava.bio.seq.ioorg.biojava.bio.seq.io.agaveorg.biojava.bio.seq.io.gameorg.biojava.bio.seq.projectionorg.biojava.bio.seq.ragbagorg.biojava.bio.symbolorg.biojava.stats.svmorg.biojava.stats.svm.toolsorg.biojava.utilsorg.biojava.utils.cacheorg.biojava.utils.ioorg.biojava.utils.staxorg.biojava.utils.xml • org.biojava.bioorg.biojava.bio.distorg.biojava.bio.dporg.biojava.bio.dp.oneheadorg.biojava.bio.dp.twoheadorg.biojava.bio.guiorg.biojava.bio.gui.sequenceorg.biojava.bio.programorg.biojava.bio.program.blast2htmlorg.biojava.bio.program.dasorg.biojava.bio.program.gfforg.biojava.bio.program.phredorg.biojava.bio.program.saxorg.biojava.bio.program.searchorg.biojava.bio.program.ssbindorg.biojava.bio.program.xfforg.biojava.bio.program.xmlorg.biojava.bio.proteomicsorg.biojava.bio.search

  6. BioJavaの情報源 • ホームページhttp://www.biojava.org/ ダウンロード、Getting Started、JavaDoc APIなど • メーリングリストmailto:biojava-l@biojava.org BioJava開発メンバーが質問に答えてくれます。 • BioJava In Angerhttp://www.biojava.org/docs/bj_in_anger/index.htm 「どうすれば・・・できますか?」形式のクックブック

  7. BioJavaホームページ

  8. BioJava In Anger

  9. BioJava In Anger日本語版

  10. 使用例 • GenBank形式ファイルからシークエンスをFASTA形式で出力 (1) BioJavaのインストール (2)ソースファイル作成 (テキストエディタなど) (3)コンパイル ( javacコマンド) (4)実行 ( javaコマンド)

  11. BioJavaのインストール • JDKのダウンロード http://java.sun.com/からダウンロード、インストール • BioJavaのダウンロード BioJavaホームページ→右側の「DOWNLOAD」 • 4ファイルをダウンロード(バイナリ) (1)biojava-1.30-jdk14.jar (2)jakarta-regexp.jar (3)bytecode.jar (4)xerces.jar • CLASSPATHの通ったところに置く JDKをインストールしたディレクトリのjre/lib/extなど

  12. ソースファイル作成 import java.io.*; import org.biojava.bio.*; import org.biojava.bio.seq.*; import org.biojava.bio.seq.io.*; public class GeneralReader { public static void main(String[] args) { try { BufferedReader br = new BufferedReader(new FileReader(args[0])); String format = args[1]; String alpha = args[2]; SequenceIterator iter = (SequenceIterator)SeqIOTools.fileToBiojava(format, alpha, br); SeqIOTools.writeFasta(System.out, iter); } catch (Exception ex) { ex.printStackTrace(); } } } ライブラリのインポート クラスを作る mainメソッドから開始 入力ファイル指定 引数(GENBANK、DNA)のセット ファイル読込 FASTA形式で標準出力 エラー処理

  13. LOCUS BF794506 521 bp mRNA linear EST 12-JAN-2001 DEFINITION 602255758F1 NIH_MGC_85 Homo sapiens cDNA clone IMAGE:4339142 5', mRNA sequence. ACCESSION BF794506 VERSION BF794506.1 GI:12099560 KEYWORDS EST. SOURCE Homo sapiens (human) ORGANISM Homo sapiens Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. REFERENCE 1 (bases 1 to 521) AUTHORS NIH-MGC http://mgc.nci.nih.gov/. TITLE National Institutes of Health, Mammalian Gene Collection (MGC) JOURNAL Unpublished (1999) COMMENT Contact: Robert Strausberg, Ph.D. Email: cgapbs-r@mail.nih.gov Tissue Procurement: Louis Staudt, M.D., Ph.D. cDNA Library Preparation: Life Technologies, Inc. cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) DNA Sequencing by: Incyte Genomics, Inc. Clone distribution: MGC clone distribution information can be found through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov Plate: LLAM9949 row: c column: 15 High quality sequence stop: 519. FEATURES Location/Qualifiers source 1..521 /organism="Homo sapiens" /mol_type="mRNA" /db_xref="taxon:9606" /clone="IMAGE:4339142" /tissue_type="lymphoma, cell line" /lab_host="DH10B (phage-resistant)" /clone_lib="NIH_MGC_85" /note="Organ: lymph; Vector: pCMV-SPORT6; Site_1: NotI; Site_2: SalI; Cloned unidirectionally; oligo-dT primed. Average insert size 1.867 kb. Library enriched for full-length clones and constructed by Life Technologies. Note: this is a NIH_MGC Library." ORIGIN 1 ctcaagactg gcgctaaaag ttttgagctt ctcaaaagtc tagagccacc gtccaggagc 61 aggtagctgc tgggctccgg ggacactttg cgttcgggct gggagcgtgc tttccacgac 121 ggtgacacgc ttccctggat tggcagccag actgccttcc gggtcactgc catggaggag 181 ccgcagtcag atcctagcgt cgagccccct ctgagtcagg aaacattttc agacctatgg 241 aaactacttc ctgaaaacaa cgttctgtcc cccttgccgt cccaagcaat ggatgatttg 301 atgctgtccc cggacgatat tgaacaatgg ttcactgaag acccaggtcc agatgaagct 361 cccagaatgc cagaggctgc tccccgcgtg gcccctgcac cgagcagctc ctacaccggc 421 ggcccctgca ccagccccct cctggcccct gtcatcttct gtcccttccc agaaaaccta 481 ccagggcagc tacggtttcc gtctgggctt cttgcattct g // 入力ファイル (infile.txt)

  14. コンパイル・実行 • コンパイル $ javac GeneralReader.java →GeneralReader.classファイルが作成される。 • 実行 $ java GeneralReader infile.txt GENBANK DNA コンパイラ ソースファイル 入力ファイル クラス名 入力フォーマット 種類 Java実行

  15. 実行結果 $ java GeneralReader infile.txt GENBANK DNA >BF794506 ctcaagactggcgctaaaagttttgagcttctcaaaagtctagagccaccgtccaggagc aggtagctgctgggctccggggacactttgcgttcgggctgggagcgtgctttccacgac ggtgacacgcttccctggattggcagccagactgccttccgggtcactgccatggaggag ccgcagtcagatcctagcgtcgagccccctctgagtcaggaaacattttcagacctatgg aaactacttcctgaaaacaacgttctgtcccccttgccgtcccaagcaatggatgatttg atgctgtccccggacgatattgaacaatggttcactgaagacccaggtccagatgaagct cccagaatgccagaggctgctccccgcgtggcccctgcaccgagcagctcctacaccggc ggcccctgcaccagccccctcctggcccctgtcatcttctgtcccttcccagaaaaccta ccagggcagctacggtttccgtctgggcttcttgcattctg

  16. ありがとうございました。

More Related