620 likes | 1.17k Views
Review Bioinformatik. 2 Desember 2009. Data & Website Bioinformatika. J.Craig Venter TIGR. Sel. Program /Tool. NCBI. Genome. Primer (Primer3) Alignment ( Clustal , Muscle) Filogenetik (PAUP,MEGA). EMBL. Transcrip - tome. DDBJ. Expasy. PDB. Proteome. UNIPROT.
E N D
Review Bioinformatik 2 Desember 2009
Data & Website Bioinformatika J.Craig Venter TIGR Sel Program /Tool NCBI Genome Primer (Primer3) Alignment (Clustal, Muscle) Filogenetik (PAUP,MEGA) EMBL Transcrip- tome DDBJ Expasy PDB Proteome UNIPROT
GENOME_TRANSCRIPTOME • INSDC (International Nucleotide Sequence Database Collaboration): • GenBank-NCBI (National Center Biotechnology Information-USA), • EMBL-EBI(European Molecular Biology Laboratory - Europe Bioinformatic Institute-Inggris) • DDBJ-CIB(DNA Data Bank of Japan - Center for Information Biology - Jepang).
Entrez NIH NCBI EMBL GenBank • Submissions • Updates • Submissions • Updates EMBL DDBJ EBI CIB NIG • Submissions • Updates SRS getentry The International Sequence Database Collaboration
Sequencing Result Analysis BLAST Phylogenetic Analysis DNA Isolation Polymerase Chain Reaction Cloning Sequencing Data Retrieval MSA Primer Design
BLAST • Basic Local Alignment Search Tool • Tool paling populer untuk mengetahui homologi suatu sekuen • Tersedia di NCBI, EMBL dan DDBJ • Jika sekarang Anda sudah mendapat hasil sekuensing konfirmasi apakah gen yang disekuensing adalah yang diinginkan
Alamat BLAST pada NCBI : http://blast.ncbi.nlm.nih.gov/ Pilih BLAST “flavour” yang sesuai untuk query protein
Blastp : protein Copy dan paste sekuen protein anda disini Pastikan pilihan databasenya adalah Non-redundant Lalu klik tombol BLAST untuk memulai analisis
Hasil BLAST : Merah bagus hitam jelek Panjang grafik menunjukkan kecocokan sekuen kita, semakin panjang semakin bagus Bit score : semakin besar semakin bagus E-value semakinmendekati0 semakinbagus semakin homolog
Parameter hasil BLAST : Identity dan Gaps Hasil alignment menunjukkan seberapa cocok sekuen kita (Query) dengan database (Subject) Tanda + menunjukkan kesamaan sifat dari asam amino
Paste sekuen anda disini Ganti pilihan database menjadi non-redundant Klk tombol BLAST untuk memulai pencarian
Klik disini untuk mendapatkan sekuen yang telah dipilih Klik disini untuk menandai sekuen yang akan dipilih Perhatikan hasil alignment dan parameter hasil BLAST
Format FASTA ditandai dengan tanda > dan nama sekuen Sekuen protein atau DNA berada dibawah
Aplikasi • Mencari kesamaan dan perbedaan dari beberapa sekuen • Mencari daerah lestari (Conserve region) yang bisa digunakan untuk mendesain primer untuk proses PCR • Mencari daerah fungsional dari suatu sekuen, melalui analisis komparatif • Mencari domain fungsional dari suatu sekuen • Mencari motif tertentu dari sekuen • Mencari kesamaan (homologi) struktur, pola hidrofobik dan hidrofilik yang bisa mengantarkan pada prediksi struktur sekuender dan tersier • Mencari hubungan kekerabatan/kesamaan (phylogenetic relationship) dari beberapa sekuen. Bisa dilakukan dengan membuat pohon kekerabatan berdasarkan penjajaran (alignment) yang telah dibuat.
Hasil Multiple Alignment Residu hasil penjajaran • Perbedaan residu menunjukkan adanya subtitusi • Gap “-” adanya insersi atau delesi residu • Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ” • Tanda “ : ” berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang sama Posisi setiap residu Gap Subtitusi Sekuen Input Non Conserve Conserve
Syarat Primer • Panjang sekitar 17 hingga 30 nukleotida • Persen GC sekitar 50 % • Temperatur annealing antara primer forward dan Reverse diusahakan serupa (tidak jauh berbeda) • Diusahakan tidak mengandung basa berulang lebih dari tiga basa, terutama basa G (seperti GGGG) • Diusahakan primer tidak saling komplemen baik antara ujung-ujung dalam satu primer atau antara primer forward dan reverse. • Diusahakan tidak menempatkan lebih dari dua basa G atau C pada 5 basa terakhir • Hindari nilai ΔG Hairpin yang lebih rendah dari -0,5 Kcal / mol • Hindari nilai ΔG Dimer yang lebih rendah dari -4,0 Kcal / mol
Design Primer PCR Standard Website : //frodo.wi.mit.edu Input DNA sequence
copy/pasta DNA sequence Sequence Id, Target (guna simbol [ dan ] atau Excluded regions (gunakan simbol < dan >. Klik warna biru utk ket. Lebih detail
Setting Kondisi Primer Rubah setting kondisi primer atau default setting Klik untuk mendapatkan penjelasan/manual
Output design primer PCR 1 2 Urutan oligo DNA- Forward Urutan oligo DNA- reversed
Design Primer PCR Standard (www.bioinformatics.nl/cgi-bin/primer3plus/primer3plus.cgi 1 copy/pasta DNA sequence copy/pasta DNA sequence 3 2 Rubah setting kondisi primer atau default setting Gunakan simbol [ dan ] untuk target
Output design primer PCR Urutan oligo DNA- Forward Urutan oligo DNA- reversed
1 Klik Check dan BLAST 2 Klik primer Manager - Hasil ditunjukan point 2
CHECK 1 2
1 2 Gunakan simbol { dan }untuk included
Output design primer PCR ( PERHATIKAN HASIL YG DIPEROLEH DARI SEBELUMNYA
Primer Degenerate (single protein – multiple protein/nucleotides) www.changbioscience.com/primo/index.html 1 Klik primo degenerate 2 Input data : copy/pasta single protein sequence or multiple protein/DNA (output clustal)
Gunakan data hasil output file clustal : multiple protein (output clustal), tampilkan/save dalam bentuk/ text Hasil Multiple alignment DNA sequence
Input data : copy/pasta protein sequence or multiple protein/DNA (output clustal) Output primer degenerate Pilih sesuai dengan input data Klik Go
Primer Design • biotools.umassmed.edu/ Primer Selection tool
Primer size Panjang primer yang ingin didapatkan (umumnya sekitar 17 – 30 bp). Primer 3 memberi batasan untuk nilai min ≥ 1 bp dan nilai mak ≤ 36 bp. • Primer Tm Melting temperature dari primer (Celcius) • Max Tm Difference Perbedaan melting temp. yang diterima antara primer forward (left primer) dengan primer reverse (right primer). • Product Tm Melting temp. yang diinginkan dari hasil amplifikasi (amplicon). • Primer GC% Persen jumlah nukleotida G dan C yang terkandung dalam primer. Semakin tinggi %GC akan meningkatkan melting temp. • Max Self Complementary Nilai maksimum local alignment (penjajaran) yang dapat diterima antara sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya. Penilaian mengacu pada peraturan berikut: basa yang saling komplemen diberi nilai 1 ; basa yang komplemen dengan N diberi nilai -0,25 ; sedangkan yang tidak komplemen diberi nilai -1 ; dan setiap penambahan gap diberi nilai -2 ( hanya 1 panjang gap yang diperbolehkan dalam setiap penambahannya). • Max 3’ Self Complementary Nilai maksimum global alignment (penjajaran) yang dapat diterima antara ujung 3’ sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya pada ujung 3’ sehingga membentuk primer dimer. • Max Poly-X Nilai maksimum basa berulang yang masih diterima, contoh: nilai (4) untuk GGGG
start (Start Position) Posisi awal mula primer. Posisi ini menunjukkan letak basa pertama pada ujung 5’ primer. • len (Oligo Length) Panjang primer yang merupakan jumlah seluruh nukleotida dari primer tersebut. • tm (Melting Temperature) Suhu melting primer. Suhu yang menjadi ukuran primer untuk melakukan proses annealing (penempelan) ketika amplifikasi PCR berlangsung. • gc% Persen GC pada primer yang menunjukkan jumlah GC yang terkandung pada primer • any (Self Complementarity) Nilai Self-Complementary dari Primer ( merupakan ukuran kemungkinan bagian primer untuk menempel dengan bagian primer lain dalam satu primer, sehingga membentuk struktur sekunder ). • 3' (Self Complementarity) Nilai 3' self-complementarity dari primer ( merupakan ukuran kemungkinan bagian 3’ dari satu primer untuk menempel dengan bagian 3’ dari primer itu sendiri , sehingga membentuk primer-dimer antara primer itu sendiri). • rep (Mispriming or Mishyb Library Similarity) Kemngkinan kesamaan sekuen primer dengan daerah lain pada template (diluar daerah yang diinginkan), sehingga memungkinkan terjadinya mispriming atau kesalahan penempelan. • seq (Primer Sequence, 5'3') Sekuen primer yang dipilih. Sekuen selalu ditulis dari ujung 5’ ke 3’. Sehingga primer reverse (Right primer) ditulis terbalik dengan rancangan pada sekuen template.
Product size Ukuran daerah dari template yang akan teramplifikasi pada saat proses PCR • Target (start, len)* Daerah target yang diinginkan. Ditunjukkan dengan letak awal nukleotida dan panjangnya. Pada peta ditunjukkan dengan tanda bintang (*) • PAIR ANY COMPL Nilai Self-Complementary dari sepasang primer ( merupakan ukuran kemungkinan bagian primer forward (left primer) untuk menempel dengan bagian primer reverse (right primer). • PAIR 3’ COMPL Nilai 3' self-complementarity dari sepasang primer ( merupakan ukuran kemungkinan bagian 3’ dari primer forward untuk menempel dengan bagian 3’ dari primer reverse, sehingga membentuk primer-dimer antara dua primer tersebut). • >>>>>>>>>>>>>>>> Menunjukkan letak primer forward (Left primer) pada template • <<<<<<<<<<<<<<<< Menunjukkan letak primer reverse (Right primer) pada template
What is Phylogeny? • Pengelompokan organisme berdaarkan kemiripan ciri-ciri morfologisnya • What is Phylogenetic? • Pengelompokan organisme berdasarkan kemiripan sekuen DNA atau protein ari organisme tersebut
Filogenetik cenderung tidak bias karena informasi yang digunakan adalah sekuen DNA atau protein • Reason to do phylogenetic : • menentukan kekerabatan organisme, pada bateri dengan sekuen 16s rRNA • menentukan fungsi suatu gen • menetukan asal usul gen • melihat persebaran organisme (filogeografi)
DNA vs Protein, the hard choice? • jika organisme/gen berkerabat dekat atau homologi > 70% DNA • Jika organisme/gen berkerabat jauh atau homologi < 70% Protein • Dari mana Anda tahu nilai homologinya? BLAST • Pilihan Anda akan berpengaruh pada hasil Multiple Sequence Alignment
Kunci dari filogenetik yang baik Multiple Sequence Alignment (MSA) yang baik. • Jika MSA Anda tidak cukup baik pohon filogenetik tidak dapat dipertanggungjawabkan • Jika MSA Anda baik pohon filogenetik dapat dipertanggungjawabkan.
Metode rekonstruksi pohon filogenetik : • Distance based method : Mengukur perbedaan basa/asam amino antara dua sekuen. Semakin kecil perbedaan berkerabat dekat. Contoh : Neighbor Joining (NJ) • Sequence based method : rekonstruksi filogenetik berdasarkan perbedaan yang ada padaosisis tertentu dari sekuen DNA/protein. Contoh : Maximum Parsimony, Maximum Likelihood & Bayesian • Semua metode dapat dipertanggungjawabkan
Bagaimana membaca pohon filogenetik? • Clade adalah pengelompokan utama pada pohon filogenetik • Jarak antar Clade dilihat dengan membandingkan garis horizontal antar dua cabang dengan skala Pohon filogenetik dengan metode NJ
Lebih lanjut tentang membaca pohon filogenetik ketika workshop, sorry
Bagaimana membaca pohon filogenetik ? • Spesies akan memiliki jarak genetik yang kecil • Genus bakteri dengan beberapa spesies dicirikan dengan jarak genetik yang cukup jauh Pohon filogenetik 16s rRNA dengan metode NJ
Jarak antar genus dicirikan dengan jarak genetik yang jauh Pohon filogenetik 16s rRNA dengan metode NJ
Bootstraping adalah pengujian terhadap kestabilan pengelompokan pada pohon filogenetik kita • Semakin tinggi nilai bootstraping semakin stabil pengelompokan dalam pohon filogenetik kita Bootstraping pohon filogenetik 16s rRNA
Tugas • Protein • Modultambahan d Dikumpulkanselasa, 8 desember 2009