440 likes | 785 Views
I MARCATORI UNIPARENTALI: PERCHÉ E COME USARLI. ricostruire l’evoluzione umana individuare popolamenti ed eventi migratori antichi o recenti a livello globale, continentale, inter- ed intraregionale stimare il mescolamento tra due e più popolazioni. I MARCATORI MOLECOLARI CONSENTONO DI:.
E N D
ricostruire l’evoluzione umana • individuare popolamenti ed eventi migratori antichi o recenti a livello globale, continentale, inter- ed intraregionale • stimare il mescolamento tra due e più popolazioni I MARCATORI MOLECOLARI CONSENTONO DI:
AUTOSOMICI LOCI RICOMBINANTI (diploidi) MARCATORI DI LINEA • LOCI NON-RICOMBINANTI: • mtDNA - linea materna • Crom. Y - linea paterna • (aploidi)
Ancestor of Y chromosome Ancestor of mtDNA padre madre
DNA MITOCONDRIALE - Genoma aploide - Molecola circolare di 16.5 kb con sequenza interamente nota - Alta densità di geni - Tasso di sostituzione nucleotidica circa 10 volte maggiore di quello nucleare - Alta diversità nucleotidica all’interno della specie umana - Trasmissione solo per via materna CROMOSOMA Y - Genoma aploide - Molecola lineare di circa 60 kb - Bassa densità di geni - Scarsa diversità nucleotidica all’interno della specie umana - Costituito prevalentemente da sequenze altamente e moderatamente ripetute - Trasmissione solo per via paterna
16024 16365 73 340 OH PH 1100 bp PL D-LOOP 16569 bp DNA MITOCONDRIALE OL
Polimorfismi nei marcatori uniparentali mtDNA SNPs (Single Nucleotide Polymorphism) sequenza HVR RFLPs regione codificante cromosoma Y SNPs (Single Nucleotide Polymorphism) STRs (Short Tandem Repeats)
Tipo di marcatore Tipo di mutazione Proprietà Tasso di mutazione MARCATORI DEL DNA SNP Transizioni Trasversioni Stato ancestrale definito da confronto con outgroup Eventi unici o <10-9 INDEL Inserzione/Delezione di elementi ripetitivi del genoma Stato ancestrale noto Eventi unici evoluzione lenta MICROSATELLITI SEMPLICI (STR) Inserzione/Delezione di moduli omogenei ripetuti in tandem Ricorrenti Composti da blocchi di repeats di 2-5 bp 10-3 MINISATELLITI Inserzione/Delezione di moduli ripetuti in tandem Ricorrenti Composti da blocchi di repeats >10 bp 10-2 evoluzione rapida
SNP e STR hanno diversi pattern mutazionali Marcatori ad evoluzione lenta: SNP e ins/del per i quali si può escludere una produzione ricorrente di alleli (omoplasia) modello di mutazione a siti infiniti Marcatori ad evoluzione veloce: micro- e minisatelliti per i quali non si può escludere una produzione ricorrente di alleli modello di mutazione stepwise
Definizioni “utili” • aplotipo • aplogruppo • filogenia • filogeografia Aplotipo: combinazione di diversi stati allelici di un set di marcatori polimorfici che si trovano fisicamente associati sulla stessa molecola di DNA, per esempio un cromosoma o una regione cromosomica
Aplogruppo: gruppo di aplotipi di cui si ipotizza un’origine comune, grazie alla condivisione di mutazioni caratteristiche (generalmente ad evoluzione lenta)
Aplotipo Siti polimorfici Aplotipo mtDNA la somma dei siti delle variazioni della sequenza nucleotidica Aplotipo cromosoma Y la somma della variabilità di polimorfismi microsatelliti di lunghezza (Short Tandem Repeats) Loci STR
Aplogruppo Aplogruppo mtDNA Si definisce sulla base della condivisione di mutazioni specifiche in posizioni con un basso tasso di mutazione (stabili) Aplotipi non identici possono appartenere allo stesso aplogruppo L1b Aplogruppo Y Si definisce sulla base della condivisione di mutazioni specifiche per marcatori biallelici (SNPs), e non per i microsatelliti (tasso di mutazione troppo alto)
haplogroups sub-haplogroups haplotypes
♀ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♂ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♀ ♂ ♀ ♀ ♂ ♀ ♀ ♂
♀ ♂ ♂ ♀ ♀ ♀ ♀ ♂ ♀ ♀ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♀ ♂ ♂ ♀ ♂ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♂ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♂
♀ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♂ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♂ ♀ ♂
♀ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♂ ♀ ♀ ♀ ♀ ♀ ♂ ♂ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♀ ♀ ♀ ♂ ♀ ♂ ♂ ♀ ♂ ♀ ♀ ♀ ♂ ♀ ♂
16024 16365 73 340 OH PH 1100 bp PL D-LOOP 16569 bp DNA MITOCONDRIALE OL DOPPIA ELICA CIRCOLARE CONTENENTE 16569 COPPIE DI BASI -due filamenti che lo costituiscono sono denominati H (heavy) e L (light)per la differente costituzione nucleotidica: H contiene in prevalenza basi puriniche A e G (di peso molecolare maggiore) L basi pirimidiniche C e T (di peso molecolare minore).
In base alle FUNZIONI SVOLTE, la molecola di mtDNA può essere divisa in due regioni principali: la regione codificante e quella di controllo. • LA REGIONE CODIFICANTE • CONTIENE 37 GENI • ENTRAMBI I FILAMENTI SONO CODIFICANTI • Non tutti gli enzimi che intervengono nelle funzioni metaboliche del mitocondrio sono sintetizzati al suo interno; la maggior parte viene codificata da geni nucleari, sintetizzata nel citoplasma cellulare e quindi trasportata nel mitocondrio. Il mitocondrio è quindi un organulo che dipende per la sua formazione e funzione da due distinti genomi. • LA REGIONE DI CONTROLLO1100 bp • È LA PRINCIPALE REGIONE NON CODIFICANTE • TRE TRATTI DI SEQUENZA, ipervariabile 1 e 2 e 3 (HvrI e HvrII, HvrIII), di cui I e II caratterizzati da un elevato tasso di mutazione • FUNZIONE REGOLATRICE • La regione viene anche chiamata D-loop (displacement loop) per la presenza di un tratto di RNA quiescente che impedisce l’accoppiamento dei due filamenti complementari.
Ogni aplogruppo comprende più APLOTIPIdefiniti sulla base della presenza di posizioni mutanti nella regione d-loop; tali posizioni sono chiamate caratterizzantiquando rappresentano quelle tipiche dell’aplogruppo. Eteroplasmia= aplotipi multipli nello stesso individuo Omoplasmia= un solo tipo di mtDNA nello stesso individuo APLOGRUPPI- Vengono definiti in base alla presenza o all’assenza di siti di restrizione in determinate posizioni della porzione codificante del genoma mitocondriale
1981 Anderson e collaboratori presso il MRC Laboratory of Molecular Biology di Cambridge ottengono da un soggetto di nazionalità inglese la sequenza completa del DNA mitocondriale umano • • sequenza di riferimento (CRS - Cambridge Reference Sequence). • METODI di STUDIO • 1. Regione codificante: analisi di RFLPs (high resolution restriction fragment length polymorphism) Identificazione di linee monofiletiche (APLOGRUPPI) • Regione d-loop: sequenziamento diretto. • Solitamente limitato alla regione di controllo “ipervariabile” ed in particolare al segmento I (HVS I)
Gli SNPs rappresentano la maggior parte delle mutazioni presenti nel mtDNA dove hanno un tasso 10 volte maggiore rispetto al DNA nucleare, per questo il mtDNA presenta maggiore variabilità fra le popolazioni umane. La sua porzione codificante ha tassi relativamente bassi, mentre la regione di controllo (HVSI e HVSII) li ha così alti da poter essere osservati nei pedigree (è infatti la regione più utilizzata per gli studi popolazionistici) perché i mitocondri sono ricchi di radicali liberi, il loro DNA passa molto tempo come singolo filamento e quindi più vulnerabile, non è protetto da istoni, i sistemi di riparazione sono meno efficienti che nel nucleo. Nonostante questo alto tasso ci sono sequenze che sembrano mutare più lentamente, ma potrebbe essere che il tasso di mutazione è così alto che le reversioni oscurano il reale numero di mutazioni avvenute, così che l’analisi filogenetica opera una sottostima. Il tasso di mutazione è espresso come base subsitution x sito x milione di anni (0.025-0.26) oppure 5 x 10-7 x base x generazione, con un tempo di generazione di 20 anni. Eteroplasmia = più di una variante di mtDNA presente in una singola cellula, in realtà è sempre così, ma è rilevabile solo quando un particolare tipo di mutanti raggiunge % superiori all’1%. Omoplasmia = tutte le molecole di mtDNA in una cellula sono identiche. Omoplasia = mutazioni ricorrenti e ricombinazione possono avere effetti simili nel generare la variabilità a partire da patterns paralleli di evoluzione
CROMOSOMA Y L’unico cromosoma nucleare aploide Molecola lineare di 60 Mb Il 95% è costituito da una lunga regione non ricombinante NRPY con sequenze altamente ripetitive All’estremità ci sono due piccole regioni pseudosomiali PAR1 e PAR2 in cui avviene la ricombinazione col cromosoma X durante la meiosi L’assenza di ricombinazione lungo la NRPY fa si che l’unica fonte di cambiamento lungo le linee siano le mutazioni casuali che si accumulano sequenzialmente Bassa densità di geni: geni con funzioni simili a quelle degli omologhi legati al cromosoma X e geni o famiglie di geni specifici del sesso maschile come il gene SRY “Sex Determining Region Y” che determina la comparsa dei caratteri maschili
PRINCIPALI MARCATORI UTILIZZATI (NRY) • SNPs e INDELs: marcatori ad evoluzione “lenta” (eventi unici o tasso di mutazione < 10-9) • Il set di alleli per i diversi loci SNP lungo il cromosoma definisce un aplogruppo (alberi filogenetici) • 2. Microsatelliti (STR) e Minisatelliti: marcatori ad evoluzione “rapida” (tasso di mutazione 10-2-10-3) • Il set di alleli per i diversi loci STR lungo il cromosoma definisce un aplotipo (networks) NRY: Non ricombina e mantiene quindi inalterati gli effetti di eventi mutazionali avvenuti durante le meiosi maschili delle generazioni precedenti
Effective population size Ne(individui in età riproduttiva) Più basso Ne del cromosoma Y rispetto agli autosomi porta ad una più rapida divergenza tra le popolazioni ; tale divergenza può coincidere con eventi di collo di bottiglia associati con l’origine delle popolazioni. L’effetto della deriva genetica sarà maggiore dal momento che essa agisce in modo inversamente proporzionale alle dimensioni della popolazione, aumentandone la divergenza nel tempo e nello spazio Il grafico mostra come la distanza genetica aumenti in relazione alla distanza geografica in modo più marcato per il cromosoma Y: perché Ne del cromosoma Y è minore di quello di mtDNA per: • alta mortalità maschile prima della riproduzione • selezione locale sul cromosoma Y • pratica della poliginia • patrilocalità
Filogenia: Struttura ad albero che rappresenta le relazioni evolutive tra un insieme di taxa (dove per taxon si intende un’unità evolutiva, quindi dall’aplotipo… alla specie!)
Filogenia del DNA mitocondriale HVR-1 e HVR-2 (10.000 sequenze!) Regione altamente variabile Mutazioni parallele e ricorrenti SNPs selezionati (RFLPs) nella regione codificante meno variabile e più stabile Sequenze complete dell’intera molecola di mtDNA (3.4x10-7) lunga circa 16.500 bp (500 seq. complete pubblicate)
Aplotipo: combinazione di stati allelici Africani APLOGRUPPO (HG) combinazione allelica degli SNPs Filogenesi divisa in 18 HG principali indicati con lettere A-R, suddivisi da altre mutazioni in subcluster E3a (M2) • Microsatelliti: • per indagare una variabilità più recente. Le combinazioni degli stati allelici di STRs sono dette APLOTIPI • Per datare i nodi dell’albero: noti la durata di ogni generazione (25 anni) e il tasso di mutazione è possibile risalire all’età del Most Recent Common Ancestor dei cromosomi considerati Out of Africa Studi “gerarchici”: prima vengono individuati gli aplogruppi e dopo si analizza la variabilità al loro interno con gli aplotipi The Y Chromosome Consortium, 2002
Filogeografia: Analisi della distribuzione geografica di diversi cladi all’interno di una filogenia. La filogenia fornisce una dimensione temporale ed evolutiva che è combinata con la dimensione spaziale della geografia
PRO E CONTRO PRO CONTRO mtDNA Eredità uniparentale materna Assenza di ricombinazione SNPs: - HVR (evol veloce) - regione codificante (evol lenta) Piccole dimensioni Molte copie per cellula Strutturazione geografica Cromosoma Y Eredità uniparentale paterna NRY Diversi tipi di polimorfismi: -SNPs (evol lenta) -STRs (evol veloce) Forte strutturazione geografica Taglia effettiva bassa Soggetto a deriva Eredità uniparentale
DIFFERENZE TRA POPOLAZIONI MISURATE IN BASE ALLE DIVERSE PORZIONI GENOMICHE TG TP AUTOSOMI EP TG TP mtDNA EP TG Y TP EP
PRODUZIONE DI ALLELI SPECIFICI IN CONDIZIONI DI RADIAZIONE MOLECOLARE E SUDDIVISIONE DELLA POPOLAZIONE 3. Se il tasso dimutazione è intermedio, nelle popolazioni derivate si troveranno nuovi alleli, che difficilmente saranno uguali fra le due popolazioni (v. tonalita’ del rosso e del verde). 4. Se il tasso di mutazione è alto nelle popolazioni derivate si troverà un gran numero di nuovi alleli, alcuni uguali fra le due popolazioni (v. tonalita’ del rosso e del verde). 2. Se il tasso dimutazione è basso nelle popolazioni derivate si troveranno gli stessi alleli della popolazione parentale (v. colori) ma con frequenze diverse 1. Suddivisione di una popolazione nel corso del tempo
LA QUANTITA’ DI VARIAZIONE AI LOCI AD EVOLUZIONE RAPIDA PUO’ MISURARE L’ANTICHITA’ DELLE LINEE EVOLUTIVE DEFINITE DA SNP
METODI DI ANALISI DEI DATI Population-oriented: scopo di descrivere similarità e dissimilarità tra interi pool genici, es. per ricostruire l’etnogenesi Lineage-oriented: scopo di fare inferenza sulla diffusione e sui tempi dei singoli rami di un dato albero
PRINCIPALI CONTRIBUTO DELL’ANALISI DEGLI SNP DEL CROMOSOMA Y: 1. Conferma dell’ipotesi Out-of-Africa 2. Stima del TMRCA tra 50 e 120 kya 3. Linee evolutive continente-specifiche 4. Forte strutturamento delle popolazioni 5. Dati sul popolamento europeo principalmente da Oriente
La ricombinazione non riassortisce gli alleli ai loci del cromosoma Y • Aplogruppi ed aplotipi sono trasmessi come blocco unico da padre in figlio e possono essere cambiati solo dalle mutazioni. • Diversa utilizzazione per studi evolutivi secondo la scala temporale che interessa • A partire da un certo campionario di tipi molecolari osservati è possibile ricostruire differenti linee evolutive definite dai diversi eventi mutazionali che contribuiscono alla variabilità osservata (principio della coalescenza)
PRINCIPIO DELLA COALESCENZA- GENEALOGIA DI UN GENE • RISALIRE ALL'ANTENATO COMUNE PIÙ RECENTE (MRCA) • STIMARE IL NUMERO DI GENERAZIONI CHE SEPARA QUESTO INDIVIDUO ANCESTRALE DAL PRESENTE (TMRCA) T11= MRCA