190 likes | 412 Views
HANDLING DATA DNA & CLUSTAL X. Adi Pancoro (adi@sith.itb.ac.id). 1. Melakukan sekuensing DNA (hasil PCR - amplifikasi DNA template dengan spesifik primer- i.e ITS etc), Cloning produk PCR dalam plasmid dan melakukan sekuensing DNA dengan mesin sekuenser). Dari Mana Data DNA Diperoleh ?.
E N D
HANDLING DATA DNA & CLUSTAL X Adi Pancoro (adi@sith.itb.ac.id)
1. Melakukan sekuensing DNA (hasil PCR - amplifikasi DNA template dengan spesifik primer- i.e ITS etc), Cloning produk PCR dalam plasmid dan melakukan sekuensing DNA dengan mesin sekuenser) Dari Mana Data DNA Diperoleh ? 2. Mendapatkan sekuensing DNA lain yang mirip/dekat (related sequences) dengan sekuensing DNA yang dimiliki & Mendapatkan related sequences melalui NCBI gen bank (Go to BLAST site) Pilih BLASTN (nucleotide-nucleotide BLAST) http://www.ncbi.nlm.nih.gov/ BLAST
HASIL BLAST Urutan DNA/protein yg ingin dicari kemiripannya Score (Bits) = nilai tertinggi & E (expectation) value = mendekati 0.0 (nol)
DISPLAY FASTA FORMAT Contoh format FASTA, diawali dengan tanda bracket (>)
HASIL ENTREZ (ALL DATABASES) Output ditampilkan dalam bentuk format FASTA Input keyword gen Output jumlah gen linamarase yg terdapat pada gen bank Pilih file TXT
SEQUENCE ALIGNMENT • Is the process of aligning two sequences and its the basis of database similarity searching • Evolutionary Basis : DNA and proteins are products of evolution • Molecules (DNA & protein) can be considered molecular fossils that encode the history of millions if years of evolution • Comparing sequences through alignment, patterns of conservation and variation can be identified. • The degree of sequence conservation in the alignment reveals evolutionary relatedness of different sequences. • The variation between sequences reflects the changes that have occurred during evolution in the form of substitutions, insertions, and deletions
Bagaimana membangun pohon filogenetika ? • Data2 sekuensing yang diperoleh dilakukan align the sequences ( penjajaran urutan DNA) – pairwise/multiple alignment, mengunakan program CLUSTAL X. Hasil multiple alignment kadang-kadang masih diperlukan eyes correction (Fine-Tuning alignment) • Hasil alignment di pakai untuk membangun pohon filogenetika dengan PAUP, Phylip or MrBayes program • Visualisasi pohon filogenetika dengan TreeView program
Bagaimana Membangun Multiple Alignment ? • Dua atau lebih sekuensing DNA dilakukan alignmnent • Di dalam melakukan multiple alignment akan memunculkan gap (spaces). • Adanya gap (spaces) diasumsikan adanya insersi or delesi pada urutan DNA tsb • Banyak dan sedikitnya gap dalam alignment menentukan kualitas dari hasil alignmnet • Gap penalty =scoring system yang dipakai (jika match diberi scoring positif dan tidak match diberi scoring negatif (match residue =1 dan mismatch residue =0). • Program ClustalX salah satu tools terbaik/direkomendasi untuk membangun multiple alignment
Clustal X membutuhkan data memiliki format data (file input) yang dikenali. File input harus memiliki urutan2 DNA yang akan dilakukan alignment Clustal akan mengenali beberapa format urutan DNA (contoh FASTA format). Fasta format mudah dikenali karena pada baris pertama dimulai dengan “>” karakter (> species ACTGTGTGTGTGTGTCC) File input harus di save sebagai plain text (TXT)or ASCII format. Clustal X tidak mengenali microsoft word format Bagaimana membangun file input Plain Text dgn Notepad (window) File input yang memiliki format FASTA
Clustal X membutuhkan pengaturan penalti gap (Gap Opening dan Gap Extension). Gap opening penalti =10 dan gap extension penalti =0.10. Decreasing the gap penalties will allow the introduction of more gaps and will thus produce fewer mismatches in the alignment Increasing the gap penalties will have the opposite effect Perubahan alignment parameters diperlukan untuk meningkatkan hasil alignment Setting the Alignment Parameters
Terdiri dari Protein or DNA Weight Matrix DNA weight matrix = maximize score untuk matching residue (A,C,TG); low or zero scores untuk mismatching residues. IUB DNA Weight matrix : score matches =1.9 dan mismatches =0 Protein weight matrix lebih kompleks karena asam amino memiliki propertis physicochemical yang berbeda untuk setiap residue. Amino acids scoring matrices : PAM, BLOSUM, Gonnet matrices. Weight Matrix Parameters Protein WM DNA WM
Format File output dari ClustalX dapat dibaca oleh Phylip, PAUP, MrBayes. Pilihan format tergantung dari program apa yang akan untuk analisis lebih lanjut (Methode untuk konstruksi pohon antara lain Distance/Neighbor Joining, Maximum Parsimony, Max Likelihood, Bayesian Output Format Klik Nexus Format untuk penggunaan program PAUP & MrBayes
Dimulai dengan load sequences dari file input yang dapat dikenali oleh Clustalx (farmat FASTA or TXT) Membangun Alignment
Refining & Improving the Alignment • No matter how unrelated the sequencess are ClustalX will always generate an alignment • Fine Tuning Alignment : • Eliminate truncated sequences (N terminal & c terminus region) • Delete nonhomologous region from the sequences • Change the gap penalties
Quality of sequence alignment is important ClustalX menawarkan beberapa tool untuk membantu refine dan peningkatan alignment ClustalX tools : is the histogram displayed below the alignment. (tinggi setiap bar menunjukkan similarity karakter residues Fine-Tuning Alignment