200 likes | 328 Views
UNIVERSITATEA POLITEHNICA TIMIŞOARA. MASTER SIIS Sisteme Informatice în Îngrijirea Sănătății. www.medinfo.umft.ro/dim / bioinformatica.htm. BIOINFORMATICA. Prof Dr George I Mihala ş UMF Victor Babeş. CURSUL 7. ANALIZA SECVENŢIALĂ. Analiza unei secvenţe Compararea a două secvenţe
E N D
UNIVERSITATEAPOLITEHNICA TIMIŞOARA MASTER SIIS Sisteme Informatice în Îngrijirea Sănătății
BIOINFORMATICA Prof Dr George I Mihalaş UMF Victor Babeş
ANALIZA SECVENŢIALĂ • Analiza unei secvenţe • Compararea a două secvenţe • Metode simple: Dot Plots și Distanțe • Programare dinamică • Aliniere globală • Aliniere locală • Modele complexe • Matrici de substituție • Pentru Proteine • Pentru Acizi nucleici • Alinierea multiplă
COMPARAREA A DOUĂ SECVENȚE (II) Programare Dinamică
Compararea a două secvenţe“Pairwise alignement” • Măsurarea similarităţii, distanţe, substituţii, gap-uri • Programare dinamică • Aliniere globală: algoritmul Needleman Wunsch • Construcţia matricii • “traceback” • Aliniere locală: algoritmul Smith Waterman • Potriviri repetate, suprapuse, hibride, complexe • Matrici de substituţie • PAM • BLOSUM • Semnificaţia scorului de aliniere • Lanţuri Markov • Lanţuri Markov Ascunse (Hidden Markov Models HMM)
Programare dinamică • Compararea directă: 4m+n comparaţii • Aliniere: • Globală - Needleman-Wunsch (1970) • Locală • Smith-Waterman (1981) • Potriviri repetate • Potriviri suprapuse • Modele hibride • Paşi: • Iniţializare • Completare • Aliniere (traceback)
ALINIEREA GLOBALĂAlgoritmul Needleman-Wunsch • Aliniere globală • Matricea de programare dinamică • Cele două secvenţe pe axe • Calculul unui element diagonal F(i,j), i = indice prima secv (oriz)[i = coloană, j=linie]
Schema de scor • Potrivire = +5 • Nepotrivire = -3 • Indel (gap) = -4
ALINIEREA LOCALĂAlgoritmul Smith Waterman • Aplicaţii • Detecţie domenii comune în proteine • Secţiuni extinse de ADN • Foarte sensibil la detecţia similarităţii între secvenţe divergente(cu origine comună; doar o parte se păstrează) • Aspecte teoretice • Marginile sunt 0 • Conţine numai valori 0 sau pozitive • Alinierea se poate opri oriunde în matrice • La “traceback” pornim nu din colţul dreapta-jos ci de la cea mai mare valoare
Completareamatricii- initializare cu 0 - prima linie - prima coloană