620 likes | 757 Views
DiMI. SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE. Università degli Studi di Udine Istituto agrario San Michele all’Adige. Simone Scalabrin. Studente di dottorato in Informatica www.dimi.uniud.it/scalabri. MAPPA FISICA. Insieme di contig
E N D
DiMI SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE Università degli Studi di Udine Istituto agrario San Michele all’Adige Simone Scalabrin Studente di dottorato in Informaticawww.dimi.uniud.it/scalabri
MAPPA FISICA • Insieme di contig • Ogni contig è un insieme ordinato di frammenti di DNA parzialmente sovrapposti • Minimal tiling path
Librerie di cloni BAC, copertura del genoma pari a 7-30x, inserti sono prodotti con diversi insiemi di enzimi di restrizione A B Clone BAC C Digestione Comparazione a coppie Assemblaggio a stringenza alta Separazione Rilevamento Dimensionam 20,000 bp 10,000 bp 4,000 bp 2,000 bp 1,200 bp 800 bp E D Verifica & Allineamento Riassemblaggio manuale con stringenza bassa Meyers, Scalabrin, Morgante 2004 Nature Reviews Genetics
COME SI COSTRUISCE UNA MAPPA FISICA • Serie di cloni genomici parzialmente sovrapposti • Identificazione delle sovrapposizioni 1043_A23 1096_G08
Clone BAC B Digestione Separazione Rilevamento Dimensionamento 20,000 bp 10,000 bp 4,000 bp 2,000 bp 1,200 bp 800 bp
IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting EcoRI
IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting
IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting
IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting
Scelta degli enzimi • Numero di frammenti prodotti • Distribuzione delle bande prodotte • Composizione del genoma • Costo degli enzimi
ENZIMI A BLUNT END 5’AATGCATAGTACACATGTACTACAGATACGTACACAT 3’ 3’TTACGTATCATGTGTACATGATGTCTATGCATGTGTA 5’ Estremità piatte
TAGLIO BLUNT END 5’AATGCATAGT 3’ 5’ACACAT 3’ 3’TTACGTATCA 5’ 3’TGTGTA 5’ 5’ACACATGTACTACAGATACGT 3’ 3’TGTGTACATGATGTCTATGCA 5’
ENZIMI A STICKY END 5’ACTGAATGCATACTTAAGACATAGAGT 3’ 3’TGACTTACGTATGAATTCTGTATCTCA 5’ Estremità appiccicose
TAGLIO STICKY END 5’ACTGAATGCATACT 3’ 5’TAAGACATAGAGT 3’ 3’TGACTTACGTATGAAT 5’ 3’TCTGTATCTCA 5’
IL FINGERPRINTING FLUORESCENTE 5’ACTGAATGCATACTT 3’ 3’TGACTTACGTATGAAT 5’ Marcatura fluorescente Colori differenti
C Comparazione a coppie Assemblaggio a stringenza alta
LA LOGICA DEL FINGERPRINTING A B Frammenti di uguale dimensione nel pattern di digestione Possibile sovrapposizione
PROBLEMI NEL CONFRONTO TRA FINGERPRINT • Dimensionamentodei frammenti • Falsi positivi (caso, bande doppie) • Falsi negativi (eterozigosi, bande mancanti)
TECNICHE DI FINGERPRINTING • Gel d’agarosio • Dimensionamento poco preciso 1. Digestione semplice 2. Digestione e marca- tura radioattiva • Gel di poliacrilammide • Dimensionamento più preciso • Gel di poliacrilammide • Dimensionamento più preciso • Meno falsi positivi grazie ai colori 3. Digestione e marca- tura fluorescente
FALSO POSITIVO TECNICHE DI FINGERPRINTING A B A B Digestione e marcatura fluorescente Digestione semplice
IL FINGERPRINTING FLUORESCENTE • Un enzima frequent cutter che produce estremità piatte • 4 enzimi che producono estremità appiccicose • Reazioni di estensione della singola basecon ddNTP fluoresceinati • Elettroforesi su poliacrilammide
L’ANALISI DEI DATI SOFTWARE ATTIVITA’ Elettrocromatogrammi ABI Prism 3730 Individuazione dei picchi GeneMapper Rimozione background e bande vettore Script in PERL Genoprofiler Costruzione contig FPC
Picco elettroforetico ELETTROCROMATOGRAMMI (fsa)
INDIVIDUAZIONE DEI PICCHI Tabella in formato testo (GeneMapper)
ELETTROCROMATOGRAMMI Composizione per colore: • Almeno 200 picchi • 30 – 50 bande vere • Altezza minima (livello minimo di background)
Eletrocromatogrammi → testo • Dividere in colori • Massima sensibilità (FPC tratta 0-60000) • 4 colori → 4 zone 50 500 50 500 50 500 50 500 0 15000 30000 45000 60000
Eletrocromatogrammi → testo 1028_B10 14 1526,7 1739,1 5867,4 6664,5 7170,6 7319,1 16500,0 18532,8 20370,9 20919,6 21139,5 22703,7 24783,3 50414,1 BLU VERDE ROSSO
LA RIMOZIONE DEL BACKGROUND Bande vere Background
f(avg) LA RIMOZIONE DEL BACKGROUND 1
Genoprofiler 1.10 http://wheat.pw.usda.gov/PhysicalMapping/tools/genoprofiler/genoprofiler.html
f(ratio) LA RIMOZIONE DEL BACKGROUND 2 Scalabrin e Morgante
UA UA UL UL fine LL LL LA LA LA RIMOZIONE DEL BACKGROUND 3 IG = UA1 – LA1 UL = UA – 0,3 * IG LL = LA + 0,15 * IG Scalabrin e Morgante Script in Perl
FPC 8.1 http://www.agcol.arizona.edu/software/fpc/ - FingerPrinted Contigs - 2 passi per assemblare i cloni in contigs: 1) Clustering: basato sul numero delle bande condivise 2) Ordinamento: trova la soluzione migliore che massimizzi le sovrapposizioni Due parametri chiave Tolerance = scarto accettato Cutoff: probabilità che il match tra due cloni sia dovuto puramente al caso (e non sia una vera sovrapposizione) Cutoff più basso → maggior stringenza
Confronto tra due cloni • Sulston cutoff score Dove nL e nH sono il numero minimo e massimo di bande per i due cloni ed M è il numero minimo di bande condivise,p=(1-b)nH, b=2t/gellen, t è la tolleranza, gellen è la lunghezza del gel. t t 0 gellen b rappresenta la probabilità che una banda di un clone faccia il match con una banda dell’altro clone. p rappresenta la probabilità che nessuna delle nH bande del clone “più grande” facciano il match con una data banda del clone “più piccolo”.
CB Maps FPC prova a ordinare cloni basandosi su Consensus Bands Clone order Clone name Bands Extra bands + = shared band o = missing band x = 2 tolerance bin
Cloni Q • numero sufficiente di bande per entrare in un contig • molte bande extra • non bene nella mappa 4 Tipi di Qs 1) Fingerprint di scarsa qualità 2) Clone in posizione errata - sequenza ripetuta 3) Soluzione non ottimale 4) Diversità allelica
D Riassemblaggio semi-manuale a stringenza bassa
E Verifica e allineamento
Collegamento fra mappa fisica e genetica, considerazioni • Quanti contig ci aspettiamo di ottenere nella mappa fisica iniziale? • 1 per cromosoma!!! • Dipende dal genoma in questione • Ogni contig deve essere collegato alla mappa genetica • 1 marker per contig fornisce la posizione • 2 marker per contig forniscono anche l’orientamento
RINGRAZIAMENTI • Prof. Michele Morgante • Dott. Riccardo Velasco • Dott. Marco Moroldo • Prof. Alberto Policriti • Dott. Giacomo Prete • Dott.sa Raffaella Marconi • P.Ch. Nicoletta Felice • Dott. Massimo Pindo • Dott.sa Michela Troggio • Dott.sa Cinzia Segala • Dott. Paolo Fontana
LETTERATURA • Mapping and sequencing complex genomes: Let’s get physical!, Meyers, Scalabrin, Morgante, Nature Reviews Genetics, 2004 • FPC: a system for building contigs from restriction fingerprinted clones, Soderlund, Longden, Mott, 1997 • DNA markers in plant improvement: an overview, Kumar, 1999 • Nucleotide and aplotype diversity in wine cultivars of Grape, Prete, Cattonaro, Morgante, 2003
L’IMPATTO DELL’ETEROZIGOSI 1200 CBu 2200 CBu 50% frammenti condivisi 50% frammenti condivisi e 4 cloni di tipo B mancanti
Descrizione del processo A B B A C N. campioni 1600 1600 1600 1600 1600 • Giorno 1: precoltura cellulare • Giorno 2: coltura cellulare • Giorno 3: isolamento DNA • Giorno 4: frammentazione DNA • Giorno 5: marcatura DNA e separazione su sequenziatore Tutte 5 fasi avvengono simultaneamente 8000 campioni DNA diversi processati settimanalmente 3 persone