870 likes | 1.07k Views
A Brief Introduction to Molecular Systematics. David S. Horner Dip. Scienze Biomolecolari e Biotecnologie david.horner@unimi.it. Letteratura consigliata. Phylogenetic analyses: a brief introduction to methods and their application David S Horner and Graziano Pesole †
E N D
A Brief Introduction to Molecular Systematics David S. Horner Dip. Scienze Biomolecolari e Biotecnologie david.horner@unimi.it
Letteraturaconsigliata Phylogenetic analyses: a brief introduction to methods and their application David S Horner and GrazianoPesole† Expert Rev. Mol. Diagn. 4(3), 339–350 (2004) Phylogeny for the faint of heart:a tutorial Sandra L. Baldauf TRENDS in Genetics Vol.19 No.6 June 2003
ATTENZIONE Computers are like air-conditioning … They stop working if you open Windows
“In Biologia Nulla Ha Senso Se Non è Visto da una Prospettiva Evolutiva” Theodosius Dobzhansky (1900-1975) (“senza questa prospettiva [la biologia] diventa semplicemente un cumulo di fatti scollegati: alcuni sono interessanti, ma non dipingono insieme un quadro coerente”)
Tassonomia evolutiva Questa scuola tradizionale era dominante fino agli anni ‘60. È basata sull’assunzione che il modo migliore di ricostruire le relazioni di un gruppo è di studiarlo per tutta la vita. Poi, lo specialista pubblica una filogenesi basata sulle sue impressioni Ha il vantaggio che genera esperti bravi. Ma ha anche lo svantaggio che non è per niente un approccio oggettivo I risultati sono poco riproducibili.
Molecole come documenti della storia evolutiva Emile Zuckerkandl – Linus Pauling • “Ci possiamo chiedere dove, nella vita, c’è la quantità più alta di informazione rispetto al passato, e come possiamo estrarla?” • “Forse nei vari tipi di macromolecole (sequenze) che portano l’informazione genetica”
Evoluzione Molecolare TUTTI le sequenze molecolari (naturali) sono prodotti di processi evolutivi Possiamo usare sequenze per inferire rapporti evolutivi tra sequenze (e tra organismi) Se riusciamo capire come costretti selettivi influenzano l’evoluzione di diversi tipi di sequenze (geni codificanti, regione promotrice, “junk DNA” etc), magari potremmo PREDIRE il ruolo svolto da sequenze sotto esame.
Perche ci interessa l’evoluzione molecolare? • Per capire la storia naturale di organismi e ambienti • Per identificare e classificare nuove specie • Per capire processi evolutivi • Per la predizione e modificazione di funzione/ specificità di geni/enzimi. • Studi basasti sull’evoluzione molecolare può aiutarci ad associare i cambiamenti funzionali con le sostituzioni responsabili. • Sviluppo di medicine/vaccini (selezione) • Biomonitoraggio (ecologia molecolare)
Quale è il più stretto parente dei “baci di dama” ? UFO Fragola vampira Space alien Gioiello metallaro
L’omologia è….. • Omologia: similarita risultando da eredita da un genitore stessa. L’identificazione e l’analisi di omologia sono fundamentale nella sistematica filogenetica. • 70% homology?
Ereditadeigeni • Geni vengono ereditati dai genitori • La loro sequenza puo cambiare con tempo (mutazione) • Cambiamementi possono essere ereditati • A volte, geni vengono DUPLICATI opure PERSI • Nel arco del tempo evolutivo, solo sequenze “importanti” vengono conservate • Possiamo applicare il concetto di omologia a geni
Mutations are random events: their occurrence is independent of their selective value - i.e., they do not occur when they are needed any more often than they would otherwise. Mutations at any single locus are rare events: mutation rates at a typical locus are about 1 in 106 gametes.
Some types of mutations. Substitution: one nucleotide is substituted for another, frequently this causes no change in the resulting organism, sometimes the change can be dramatic. Insertion: DNA is inserted into a gene, either one nucleotide or many. Sometimes, entire genes are inserted by viruses and transposable elements. Deletion: DNA bases are removed. Small insertions and deletions can inactivate large stretches of a gene, by causing a frame shift that renders a gene meaningless. Duplication: an entire gene is duplicated. Transposition: DNA is moved to a new place in the genome, frequently this happens because of errors in meiosis or transposable elements.
Meccanismi dell’evoluzione A T G C sostituzioni puntiformi Transizioni Transizioni Transversioni Pirimidine Purine
Meccanismi dell’evoluzione TransizionivsTransversioni Le transizioni sono più frequenti delle trasversioni. La frequenza delle mutazioni puntiformi (1 per 10-9 - 10-10 bases incorporate) è molto inferiore di quanto atteso (circa 10-6) a causa dei sistemi di riparazione.
Soppressione di “CpG” Modificazione “epigenetica” (metilazione) di residui “C” nella dinucleotide “CG” e diffusa in tanti organismi Il C metilato e sensibile a un processo di “diaminazione” che cambia C>T (U). Dopo replicazione, se l’errore no e messo a posto da proofreading, succede una transizione in una delle eliche prodotte.
Mutazioni PUNTIFORMI: conseguenze Dipendono da: • Regione del gene che viene colpita (promotore, regioni trascritte non tradotte, regione codificante…) • natura della mutazione • Selezione Naturale
Meccanismi dell’evoluzione Mutazione e Fissazione Per essere geneticamente rilevante una mutazione deve essere ereditata, cioè deve avvenire nella linea germinale e diffondersi in una proporzione significativa della popolazione (fissazione). Nella filogenesi molecolare studiamo mutazioni fissi.
Indel nella seq. codificante per una proteina Mutazione frameshift
La teoria neutrale di Kimura (1968) Geni sono stati, in qualche senso, gia “ottimizzati” dal processo evolutivo La maggior parte delle nuove mutazioni sono deleterie o neutrale. La maggior parte della variazione osservata è neutrale, poichè le mutazioni deleterie vengono rapidamente eliminate. Orologio molecolare
Tomoko Ohta 1973: ha introdotto il concetto di “nearly neutral evolution” (evoluzione quasi neutrale) (mutazioni poco deleterie possono essere fissate nella popolazione). • Saul G. Needleman – Christian D. Wunsch 1970 Allineamento ottimale di due sequenze omologhe. • Anni ‘70 - Biologia molecolare “moderna” • Clonaggio di DNA • Sequenziamento di DNA • Anni ‘80 • PCR • micro computer • Primi “Tree of life”
DNA vs Proteins … Ser Gly Arg His Lys … UCU GGU CGU CAU AAA UCC GGC CGC CAC AAG UCG GGG CGG UCA GGA CGA AGU AGC Tante sequenze nucleotidiche diverse possono codificare la stessa sequenza proteica
Selezione al livello di DNA. Una stima semplice per sequenze codificante Per 2 sequenze: Ka è la proporzione di siti non-sinonimi dove c’e’ stato un sostituzione. Ks è la proporzione di siti sinonimi dove c’e’ stato un sostituzione. Se: Ks / Ka >1 ci sono costretti che preventano sostituzioni aminoacidici Ks / Ka =1 non c’e’ selezione Ks / Ka <1 c’e’ slezione positiva (cambiamenti vengono seletti)
DNA vs Proteins Protein : 2 cambiamenti DNA : 52 cambiamenti
Protein sequence vs structure Spinach and Azotobacterferredoxins
DNA vs Proteine Il grado di conservazione segua l’ordine: DNA < Sequenze Proteiche < Struttura Secondaria Proteica < Struttura Tridimensionale Proteica
Esiste un orologio molecolare? L’idea di orologio molecolare fu inizialmente suggerita da Zuckerkandl e Pauling nel 1962 Era basata sull’osservazione che i tassi di sostituzione aminoacidica nelle emoglobine animali erano approssimativamente proporzionali alle distanze temporali - stimate dai reperti fossili
*Stolen from a great site nitro.biosci.arizona.edu/.../Lecture47.html Although its importance, relative to Darwininan evolution, is debated, this theory is farily well supported by now. Rates of molecular evolution vary among proteins, and among organisms. Some proteins allow much less neutral variation, and evolve more slowly. Interestingly, population size is not that important for rates of molecular evolution (it cancels out in the math, small populations drift faster, but have fewer mutants per generation)
Non esiste un orologio molecolare universale • La proposta iniziale vedeva l’orologio come un processo di tipo Poisson con un tasso costante • Ora si sa che è più complesso. Differenze nel tasso di sostituzione esistono per: • Differenti siti di una stessa molecola • Differenti geni • Differenti regioni dei genomi • Differenti genomi entro una stessa cellula • Differenti gruppi tassonomici analizzati per lo stesso gene • Non esiste un orologio molecolare universale
Multi-gene families: Evolution by gene duplication • Gene duplication is the most important mechanism for generating new genes and new biochemical processes. • This mechanism has facilitated the evolution of complex organisms: • In the genomes of eukaryotes, internal duplications of gene segments have occurred frequently. Many complex genes might have evolved from small primordial genes through internal duplication and subsequent modification. • Vertebrate genomes contain many gene families absent in invertebrates. • Many gene duplications have occurred in the early evolution of animals (“Biology’s Big Bang”, “Cambrian explosion”, ~570-505 million year ago).
Types of duplication events • A duplication may involve • a single gene (complete gene duplication) • part of a gene (internal or partial gene duplication) • part of a chromosome (partial polysomy) • an entire chromosome (aneuploidy or polysomy) • the whole genome (polyploidy)
Duplicazioni Geniche Subito dopo una duplicazione genica, c’e’ una coppia di geni identici…. Cosa può succedere?
Destini dei geni duplicati Possono mantenere la stessa funzione e pattern di espressione Possono accumulare mutazioni (nella regione codificante o nel promotore) e diventare pseudogeni
Origine di pseudogeni • Tanti geni duplicati diventano PSEUDOGENI e a volte vengono persi dal genoma. • PSEUDOGENE : una sequenza di DNA non-funzionale, derivata da un gene funzionale. • Alcuni pseudogeni hanno una funzione e altri vengono riabilitate.
Origine di subfunzioni: • I geni derivati dalla duplicazione assumono diversi aspetti della funzione del gene ancestrale • Tali cambiamenti succedono spesso rapidamente dopo la duplicazione.
Origine di neofunzioni Cambiamenti funzionali della proteina risultano da sostituzioni nella regione codificante Pattern diversi dell‘esspresione (diversi tissuti/tempi durante lo sviluppo) risultano da sostituzioni nelle regioni regulatrici.
Ortologhi e paraloghi paraloghi ortologhi ortologhi c C B A a b Duplicazionecida 2 copie = paraloghinellostessogenoma Gene ancestrale
Ortologia vs Paralogia hanno entrambe l’implicazione di omologia Sequenze derivate da un gene ancestrale comune dopo un evento di SPECIAZIONE Ortologia Sequenze derivate da un gene ancestrale comune dopo un evento di DUPLICAZIONE GENICA Paralogia