Review Bioinformatik

Review Bioinformatik 2 Desember 2009

Data & Website Bioinformatika J.Craig Venter TIGR Sel Program /Tool NCBI Genome Primer (Primer3) Alignment (Clustal, Muscle) Filogenetik (PAUP,MEGA) EMBL Transcrip- tome DDBJ Expasy PDB Proteome UNIPROT

GENOME_TRANSCRIPTOME • INSDC (International Nucleotide Sequence Database Collaboration): • GenBank-NCBI (National Center Biotechnology Information-USA), • EMBL-EBI(European Molecular Biology Laboratory - Europe Bioinformatic Institute-Inggris) • DDBJ-CIB(DNA Data Bank of Japan - Center for Information Biology - Jepang).

Entrez NIH NCBI EMBL GenBank • Submissions • Updates • Submissions • Updates EMBL DDBJ EBI CIB NIG • Submissions • Updates SRS getentry The International Sequence Database Collaboration

Sequencing Result Analysis BLAST Phylogenetic Analysis DNA Isolation Polymerase Chain Reaction Cloning Sequencing Data Retrieval MSA Primer Design

BLAST • Basic Local Alignment Search Tool • Tool paling populer untuk mengetahui homologi suatu sekuen • Tersedia di NCBI, EMBL dan DDBJ • Jika sekarang Anda sudah mendapat hasil sekuensing  konfirmasi apakah gen yang disekuensing adalah yang diinginkan

Alamat BLAST pada NCBI : http://blast.ncbi.nlm.nih.gov/ Pilih BLAST “flavour” yang sesuai untuk query protein

Blastp : protein Copy dan paste sekuen protein anda disini Pastikan pilihan databasenya adalah Non-redundant Lalu klik tombol BLAST untuk memulai analisis

Hasil BLAST : Merah  bagus hitam  jelek Panjang grafik menunjukkan kecocokan sekuen kita, semakin panjang  semakin bagus Bit score : semakin besar  semakin bagus E-value semakinmendekati0  semakinbagus  semakin homolog

Parameter hasil BLAST : Identity dan Gaps Hasil alignment menunjukkan seberapa cocok sekuen kita (Query) dengan database (Subject) Tanda + menunjukkan kesamaan sifat dari asam amino

Pilih BLAST “flavour” untuk sekuen DNA

Paste sekuen anda disini Ganti pilihan database menjadi non-redundant Klk tombol BLAST untuk memulai pencarian

Klik disini untuk mendapatkan sekuen yang telah dipilih Klik disini untuk menandai sekuen yang akan dipilih Perhatikan hasil alignment dan parameter hasil BLAST

Format FASTA ditandai dengan tanda > dan nama sekuen Sekuen protein atau DNA berada dibawah

Multiple Sequence Alignment

Aplikasi • Mencari kesamaan dan perbedaan dari beberapa sekuen • Mencari daerah lestari (Conserve region) yang bisa digunakan untuk mendesain primer untuk proses PCR • Mencari daerah fungsional dari suatu sekuen, melalui analisis komparatif • Mencari domain fungsional dari suatu sekuen • Mencari motif tertentu dari sekuen • Mencari kesamaan (homologi) struktur, pola hidrofobik dan hidrofilik yang bisa mengantarkan pada prediksi struktur sekuender dan tersier • Mencari hubungan kekerabatan/kesamaan (phylogenetic relationship) dari beberapa sekuen. Bisa dilakukan dengan membuat pohon kekerabatan berdasarkan penjajaran (alignment) yang telah dibuat.

Hasil Multiple Alignment Residu hasil penjajaran • Perbedaan residu menunjukkan adanya subtitusi • Gap “-”  adanya insersi atau delesi residu • Residu yang muncul di setiap sekuen ditandai dengan tanda bintang “ * ” • Tanda “ : ”  berbeda residu, namun memiliki sifat fisikokimia (hydropathy) yang sama Posisi setiap residu Gap Subtitusi Sekuen Input Non Conserve Conserve

Primer Design

Syarat Primer • Panjang sekitar 17 hingga 30 nukleotida • Persen GC sekitar 50 % • Temperatur annealing antara primer forward dan Reverse diusahakan serupa (tidak jauh berbeda) • Diusahakan tidak mengandung basa berulang lebih dari tiga basa, terutama basa G (seperti GGGG) • Diusahakan primer tidak saling komplemen baik antara ujung-ujung dalam satu primer atau antara primer forward dan reverse. • Diusahakan tidak menempatkan lebih dari dua basa G atau C pada 5 basa terakhir • Hindari nilai ΔG Hairpin yang lebih rendah dari -0,5 Kcal / mol • Hindari nilai ΔG Dimer yang lebih rendah dari -4,0 Kcal / mol

Design Primer PCR Standard Website : //frodo.wi.mit.edu Input DNA sequence

copy/pasta DNA sequence Sequence Id, Target (guna simbol [ dan ] atau Excluded regions (gunakan simbol < dan >. Klik warna biru utk ket. Lebih detail

Setting Kondisi Primer Rubah setting kondisi primer atau default setting Klik untuk mendapatkan penjelasan/manual

Output design primer PCR 1 2 Urutan oligo DNA- Forward Urutan oligo DNA- reversed

Design Primer PCR Standard (www.bioinformatics.nl/cgi-bin/primer3plus/primer3plus.cgi 1 copy/pasta DNA sequence copy/pasta DNA sequence 3 2 Rubah setting kondisi primer atau default setting Gunakan simbol [ dan ] untuk target

Output design primer PCR Urutan oligo DNA- Forward Urutan oligo DNA- reversed

1 Klik Check dan BLAST 2 Klik primer Manager - Hasil ditunjukan point 2

CHECK 1 2

BLAST

1 2 Gunakan simbol { dan }untuk included

Output design primer PCR ( PERHATIKAN HASIL YG DIPEROLEH DARI SEBELUMNYA

Primer Degenerate (single protein – multiple protein/nucleotides) www.changbioscience.com/primo/index.html 1 Klik primo degenerate 2 Input data : copy/pasta single protein sequence or multiple protein/DNA (output clustal)

Gunakan data hasil output file clustal : multiple protein (output clustal), tampilkan/save dalam bentuk/ text Hasil Multiple alignment DNA sequence

Input data : copy/pasta protein sequence or multiple protein/DNA (output clustal) Output primer degenerate Pilih sesuai dengan input data Klik Go

Primer Design • biotools.umassmed.edu/ Primer Selection tool

General Parameter

Primer size Panjang primer yang ingin didapatkan (umumnya sekitar 17 – 30 bp). Primer 3 memberi batasan untuk nilai min ≥ 1 bp dan nilai mak ≤ 36 bp. • Primer Tm Melting temperature dari primer (Celcius) • Max Tm Difference Perbedaan melting temp. yang diterima antara primer forward (left primer) dengan primer reverse (right primer). • Product Tm Melting temp. yang diinginkan dari hasil amplifikasi (amplicon). • Primer GC% Persen jumlah nukleotida G dan C yang terkandung dalam primer. Semakin tinggi %GC akan meningkatkan melting temp. • Max Self Complementary Nilai maksimum local alignment (penjajaran) yang dapat diterima antara sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya. Penilaian mengacu pada peraturan berikut: basa yang saling komplemen diberi nilai 1 ; basa yang komplemen dengan N diberi nilai -0,25 ; sedangkan yang tidak komplemen diberi nilai -1 ; dan setiap penambahan gap diberi nilai -2 ( hanya 1 panjang gap yang diperbolehkan dalam setiap penambahannya). • Max 3’ Self Complementary Nilai maksimum global alignment (penjajaran) yang dapat diterima antara ujung 3’ sesama primer atau antara primer forward (left primer) dengan reverse (right primer). Parameter ini digunakan untuk memprediksi kemungkinan primer menempel dengan sesamanya atau dengan pasangannya pada ujung 3’ sehingga membentuk primer dimer. • Max Poly-X Nilai maksimum basa berulang yang masih diterima, contoh: nilai (4) untuk GGGG

start (Start Position) Posisi awal mula primer. Posisi ini menunjukkan letak basa pertama pada ujung 5’ primer. • len (Oligo Length) Panjang primer yang merupakan jumlah seluruh nukleotida dari primer tersebut. • tm (Melting Temperature) Suhu melting primer. Suhu yang menjadi ukuran primer untuk melakukan proses annealing (penempelan) ketika amplifikasi PCR berlangsung. • gc% Persen GC pada primer yang menunjukkan jumlah GC yang terkandung pada primer • any (Self Complementarity) Nilai Self-Complementary dari Primer ( merupakan ukuran kemungkinan bagian primer untuk menempel dengan bagian primer lain dalam satu primer, sehingga membentuk struktur sekunder ). • 3' (Self Complementarity) Nilai 3' self-complementarity dari primer ( merupakan ukuran kemungkinan bagian 3’ dari satu primer untuk menempel dengan bagian 3’ dari primer itu sendiri , sehingga membentuk primer-dimer antara primer itu sendiri). • rep (Mispriming or Mishyb Library Similarity) Kemngkinan kesamaan sekuen primer dengan daerah lain pada template (diluar daerah yang diinginkan), sehingga memungkinkan terjadinya mispriming atau kesalahan penempelan. • seq (Primer Sequence, 5'3') Sekuen primer yang dipilih. Sekuen selalu ditulis dari ujung 5’ ke 3’. Sehingga primer reverse (Right primer) ditulis terbalik dengan rancangan pada sekuen template.

Product size Ukuran daerah dari template yang akan teramplifikasi pada saat proses PCR • Target (start, len)* Daerah target yang diinginkan. Ditunjukkan dengan letak awal nukleotida dan panjangnya. Pada peta ditunjukkan dengan tanda bintang (*) • PAIR ANY COMPL Nilai Self-Complementary dari sepasang primer ( merupakan ukuran kemungkinan bagian primer forward (left primer) untuk menempel dengan bagian primer reverse (right primer). • PAIR 3’ COMPL Nilai 3' self-complementarity dari sepasang primer ( merupakan ukuran kemungkinan bagian 3’ dari primer forward untuk menempel dengan bagian 3’ dari primer reverse, sehingga membentuk primer-dimer antara dua primer tersebut). • >>>>>>>>>>>>>>>> Menunjukkan letak primer forward (Left primer) pada template • <<<<<<<<<<<<<<<< Menunjukkan letak primer reverse (Right primer) pada template

FILOGENETIK

What is Phylogeny? • Pengelompokan organisme berdaarkan kemiripan ciri-ciri morfologisnya • What is Phylogenetic? • Pengelompokan organisme berdasarkan kemiripan sekuen DNA atau protein ari organisme tersebut

Filogenetik cenderung tidak bias karena informasi yang digunakan adalah sekuen DNA atau protein • Reason to do phylogenetic : • menentukan kekerabatan organisme, pada bateri dengan sekuen 16s rRNA • menentukan fungsi suatu gen • menetukan asal usul gen • melihat persebaran organisme (filogeografi)

DNA vs Protein, the hard choice? • jika organisme/gen berkerabat dekat atau homologi > 70%  DNA • Jika organisme/gen berkerabat jauh atau homologi < 70%  Protein • Dari mana Anda tahu nilai homologinya? BLAST • Pilihan Anda akan berpengaruh pada hasil Multiple Sequence Alignment

Kunci dari filogenetik yang baik  Multiple Sequence Alignment (MSA) yang baik. • Jika MSA Anda tidak cukup baik  pohon filogenetik tidak dapat dipertanggungjawabkan • Jika MSA Anda baik  pohon filogenetik dapat dipertanggungjawabkan.

Metode rekonstruksi pohon filogenetik : • Distance based method : Mengukur perbedaan basa/asam amino antara dua sekuen. Semakin kecil perbedaan  berkerabat dekat. Contoh : Neighbor Joining (NJ) • Sequence based method : rekonstruksi filogenetik berdasarkan perbedaan yang ada padaosisis tertentu dari sekuen DNA/protein. Contoh : Maximum Parsimony, Maximum Likelihood & Bayesian • Semua metode dapat dipertanggungjawabkan

Bagaimana membaca pohon filogenetik? • Clade adalah pengelompokan utama pada pohon filogenetik • Jarak antar Clade dilihat dengan membandingkan garis horizontal antar dua cabang dengan skala Pohon filogenetik dengan metode NJ

Lebih lanjut tentang membaca pohon filogenetik ketika workshop, sorry 

Bagaimana membaca pohon filogenetik ? • Spesies akan memiliki jarak genetik yang kecil • Genus bakteri dengan beberapa spesies dicirikan dengan jarak genetik yang cukup jauh Pohon filogenetik 16s rRNA dengan metode NJ

Jarak antar genus dicirikan dengan jarak genetik yang jauh Pohon filogenetik 16s rRNA dengan metode NJ

Bootstraping adalah pengujian terhadap kestabilan pengelompokan pada pohon filogenetik kita • Semakin tinggi nilai bootstraping semakin stabil pengelompokan dalam pohon filogenetik kita Bootstraping pohon filogenetik 16s rRNA

Tugas • Protein • Modultambahan d Dikumpulkanselasa, 8 desember 2009

Review Bioinformatik

Review Bioinformatik

Presentation Transcript

Bioinformatik ?

Bioinformatik hvorfor hvad hvordan

Vorlesung Bioinformatik Teil II

Databasteknik Databaser och bioinformatik Data structures and Indexing (I)

Databasteknik Databaser och bioinformatik Transaction

Databasteknik Databaser och bioinformatik SQL

Vorlesung Grundlagen der Bioinformatik gobics.de/lectures/ss07/grundlagen

Datenbanken in der Bioinformatik Thorsten Denhard

BIOINFORMATIK I ÜBUNG 3

Softwarewerkzeuge der Bioinformatik

Seminar Fortgeschrittene Algorithmische Bioinformatik Oligodesignprobleme von

Bioinformatik

V12 Bioinformatik-Tools für HT Proteinanalyse

Proteinquantifizierung Standardisierung Bioinformatik

Bioinformatik-Seminar 12.5.04 Multiples Sequenz-Alignment Phylogenie

Aktuelle Themen der Bioinformatik

Softwarewerkzeuge der Bioinformatik

Proseminar Bioinformatik: Theoretical Analysis of Protein-Protein-Interactions

Burkhard Morgenstern Grundlagen der Bioinformatik Subsitutionsmatrizen SS 07

Einführungsveranstaltung Bioinformatik WS2006/07

Vorlesung Grundlagen der Bioinformatik gobics.de/lectures/ss07/grundlagen

Introduktion til Bioinformatik