220 likes | 393 Views
UNIVERSITATEA POLITEHNICA TIMIŞOARA. MASTER SIIS Sisteme Informatice în Îngrijirea Sănătății. www.medinfo.umft.ro/dim / bioinformatica.htm. BIOINFORMATICA. Prof Dr George I Mihala ş UMF Victor Babeş. CURSUL 6. ANALIZA SECVENŢIALĂ. Analiza unei secvenţe Compararea a două secvenţe
E N D
UNIVERSITATEAPOLITEHNICA TIMIŞOARA MASTER SIIS Sisteme Informatice în Îngrijirea Sănătății
BIOINFORMATICA Prof Dr George I Mihalaş UMF Victor Babeş
ANALIZA SECVENŢIALĂ • Analiza unei secvenţe • Compararea a două secvenţe • Metode simple: Dot Plots și Distanțe • Programare dinamică • Aliniere globală • Aliniere locală • Modele complexe • Matrici de substituție • Pentru Proteine • Pentru Acizi nucleici • Alinierea multiplă
Analizasecvenţelor individuale • AA au proprietăţi diferite: • Reziduu (catena laterală) hidrofil / hidrofob • Sarcina electrică, dimensiune, felexibilitate • Relaţii între proprietăţi (Nishikawa) • Consecinţe (ex) • AA hidrofobi: • în interiorul proteinelor globulare • în proteine transmembranare • AA hidrofili – la suprafaţă • Periodicităţi – elice, Alternanţe – fâşii • Predicţie epitopi antigenici • Grafice: scări numerice, ferestre de mediere (9-15 AA)
Proprietăţi în 3D • Glu în alfa-helix • Pro şi Tyr în beta-strips • Elice amfipatice (coiled-coil) • O parte hidrofilă, una hidrofobă • Succesiune (3-6 grupe) de 7 AA • Heptade • Fermoare de leucină • “Leucine zipper” • Domenii ce se leagă de ADN în proteinele reglatoare (factori de transcriere)
COMPARAREA A DOUĂ SECVENȚE (I) “DotPlots” și Distanțe
Compararea a două secvenţe“Pairwise alignement” • Evenimente • Termeni • Scop şi mijloace • daca două secvenţe sunt corelate • ce fel de “aliniere” poate fi considerată • sisteme de scoruri pentru ierarhizarea alinierilor • algoritmi pentru alinierea “optimă” • metode statistice de evaluare a semnificaţiei scorului • Exemple
Evenimente • Substituţii • Inserţii şi Deleţii (InDel); “gaps” • Termeni – compararea a 2 secvenţe • HOMOLOG • 2 organisme diferite, ancestor comun • ORTOLOG • diferenţe datorită speciaţiei • se reţine funcţionalitatea în evoluţie • PARALOG • în 1 organism, evenimente la duplicare • XENOLOG • nu au aceeaşi origine prin evoluţie • apar prin evenimente “orizontale” (simbioză, viruşi etc) • SIMILARITATE ≠ HOMOLOGIE
Alinierea vizuală – DOT PLOTS (i) • Matrice – cele 2 secvenţe pe axe • Marcarea identităţilor • Obs – “zgomote”, introducere “ferestre” de 2, 3 etc
Alinierea vizuală – DOT PLOTS (ii) Cu “fereastră” de 2
Results for aligning ACCTGAGCTCACCTGAGTTAto itself using the Dot Matrix option of the AlignX feature of Informax’s Vector NTI program
Evidenţiere inserţii/deleţii, repetări, inversiuniObs: introni / exoni
Măsurarea similarităţii DH1 = 1 DH2 = 3, DL2 = 7x2 – 1x1 – 2x2 = 9 DL3 = 6 DL4 = 6 S3 = 5x2 – 4x1 – 2x2 = 2 S3 = 5x5 – 4x3 – 2x4 = 5 S4 = 6x2 – 2x1 – 4x2 = 2 S4 = 6x5 – 2x3 – 4x4 = 8 • Distanţe: D = nr.nepotriviri - Hamming - 2 secv.egale (n) - Levenshtein (‘edit’ distance) – incl. gaps = nr.’editări’… • Scheme de scor a) Potrivire = +2 Nepotrivire = -1 Gap (Indel) = -2 b) +5 / -3 / -4