940 likes | 1.06k Views
Banche dati e software per l’identificazione di interazioni fra geni. cellule trattate con un composto esogeno a confronto con cellule non trattate un tessuto tumorale a confronto con uno sano. Composto esogeno.
E N D
Banche dati e software per l’identificazione di interazioni fra geni
cellule trattate con un composto esogeno a confronto con cellule non trattateun tessuto tumorale a confronto con uno sano Composto esogeno Supponiamo di voler studiare le differenze nell’espressione genica fra due trascrittomi. Per esempio: realizziamo un esperimento microarray
Estrazione mRNA • Retrotrascrizione e Marcatura • Ibridazione • Scansione • Analisi dei dati Fasi di un esperimento microarray
Output dell’esperimento: lista di geni differenzialmente espressi
Obiettivo: ricostruire la rete di interazioni fra geni per comprendere quale sia l’effetto a livello molecolare del fenomeno biologico indagato Esempi di reti di interazione…
…ma le interazioni? Vorremmo vedere simultaneamentese e come interagiscono i geni di interesse
Per sapere qualcosa in più sulle interazioni fra geni: Banche dati di pathway e ontologie • Kegg http://www.genome.jp/kegg/ - Kegg GenesInfo sui geni e sui trascritti - Kegg PathwayInfo sulle reti di trasduzione del segnale genico (pathway) • Gene Ontology http://www.geneontology.org/ Informazioni sulla classificazione ontologica dei geni\prodotti genici
KEGG: Kyoto EncyclopediaofGenes and Genomes Contenuti:
Rappresentazione dei dati in KEGG • Entity: una molecola o un gene - identificata, eccetto che per GENE and ENZYME, con 3 lettere + 5 numeri: • Binary relation: una relazione fra due entity • Network: un grafo formato da un set di entity collegate • Pathway: una rete di co-regolazione; un network o un insieme di network
KEGG PATHWAY • E’ una collezione di diagrammi o mappe ciascuna corrispondente a una rete di co-regolazione biologica con significato funzionale. • Ogni pathway è identificato da: • 3 lettere -> specifiche per ciascun organismo • 5 numeri -> identificativi della mappa • Essi possono essere: • Creati e curati manualmente • Generati attraverso simulazioni computazionali • Ci sono: • Pathway di riferimento: generati dall’unione di evidenze sperimentali tratte da organismi differenti • Pathway specifici: che raccolgono le informazioni provenienti da un determinato organismo • Pathway globali: che collegano più pathway insieme
Sezioni di KEGG Pathway Pathway metabolici • Global Map • MetabolismCarbohydrateEnergyLipidNucleotideAmino acidOther amino acidGlycanCofactor/vitaminTerpenoid/PKOthersecondarymetaboliteXenobioticsReactionmoduleChemicalstructure • Genetic Information Processing • Environmental Information Processing • CellularProcesses • OrganismalSystems • Human Diseases • DrugDevelopment Pathway regolatori
Nei pathway metabolici le entity sono quasi esclusivamente enzimi • Nei pathway regolatori le entity rappresentano quasi sempre prodotti genici, ma troviamo anche composti chimici, DNA e altre molecole
Pathway di riferimentoStandard view • generato dall’unione di evidenze sperimentali provenienti da organismi multipli • individuato dal prefisso map
Pathway di riferimentoKEGG ORTHOLOGY (KO) view I geni assegnati ad un KO group sono evidenziati in viola
Pathway di riferimentoEnzyme (EC) view I geni assegnati ad un KO group sono evidenziati in viola
Pathway di riferimentoReaction (RN) view I geni assegnati ad un KO group sono evidenziati in viola
Pathway organismo-specifico generato da informazioni provenienti da un unico organismo o informazioni da KEGG ORTHOLOGY I geni specifici dell’organismo coinvolto nel pathway sono colorati in verde
Pathway organismo-specifico + drug info I geni coinvolti in malattie sono evidenziati in rosa I geni target di farmaci sono evidenziati in celeste
KEGG DRUG Contiene informazioni su: • Farmaci approvati in Giappone, USA ed Europa che riguardano la loro struttura chimica • Target dei farmaci ed enzimi che li metabolizzano • Storia della trasformazione della struttura chimica delle molecole rappresentate attraverso mappe I farmaci sono identificati con la lettera D + 5 numeri ES: Gleevec D01441
Pathway globale Homo Sapiens + ArabidopsisThaliana
Disease Pathway Mapsono visti come perturbazioni di processi di regime Stadi della malattia
Vogliamo sapere se ci sono gruppi di geni differenzialmente espressi mappati nei pathway e in quali pathway Pathway-Express
Pathway-Express :http://vortex.cs.wayne.edu/projects.htm Impact Analysis: mappatura dei geni differenzialmente espressi nei pathway molecolari e valutazione della propagazione della perturbazione della trasduzione del segnale genico provocata dalla variazione di espressione genica
L’Impact Factor è formato da tre contributi: • Numero di geni differenzialmente espressi mappati in un pathway rispetto al numero di geni che formano il pathwaylivello di rappresentatività della lista dei geni DE nel pathway • Fold-change dei geni differenzialmente espressi mappatientità della perturbazione del pathway provocata dai geni differenzialmente espressi • Posizione dei geni differenzialmente espressi all’interno del pathwayun gene posizionato a monte (p.es. sulla membrana cellulare o su un nodo cui fa capo una sottorete) di una cascata di segnale è “più importante” di un gene posizionato a valle
Cos’è un’ontologia? An ontology is a specification of a conceptualization that is designed for reuse across multiple applications and implementations. …a specification of a conceptualization is a written, formal description of a set of concepts and relationships in a domain of interest. Peter Karp (2000) Bioinformatics 16:269 … un insieme di definizioni
Cos’è un’ontologia genica? Ontologia genica: un vocabolario di definizioni, indipendente dall’organismo, da utilizzare per descrivere i geni attraverso i loro prodotti genici (proteine) • “trasferimento” delle informazioni funzionali fra organismi differenti a parità di complessità del genoma • “trasferimento” delle informazioni funzionali da organismi “meno complessi” ad organismi “più complessi” • univocità nella descrizione delle caratteristiche di un gene
Gene Ontology http://www.geneontology.org/ Consorzio che si occupa della definizione delle ontologie geniche per la classificazione dei geni attraverso i loro prodotti genici
Che tipo di informazione è rilevante per descrivere un prodotto genico? • Che cosa codifica il gene? • Dove e quando il prodotto agisce? • In che cosa è coinvolto? • Funzionemolecolare • Componentecellulare • Processobiologico
Tre ontologie • Funzione molecolare -> definizioni che riguardano la funzione biochimica di un prodotto genico • - enzima, lega gli ioni calcio, lega i nucleotidi, etc • Processo biologico -> definizioni che riguardano il processo di co-regolazione all’interno del quale il prodotto genico può essere inserito • - metabolismo di una molecola, glicolisi, ciclo della cellula, apoptosi • Componente cellulare-> definizioni che riguardano il “luogo” della cellula nel quale un determinato prodotto genico può agire • - membrana cellulare, reticolo endoplasmatico
Componente cellulare • Dove agisce un prodotto
Funzione molecolare • Attività o compito del prodotto genico glucose-6-phosphate isomerase activity
Funzione molecolare insulin binding insulin receptor activity
cell division Processo biologico -una serie di eventi a cui prende parte il prodotto
Processo biologico transcription
Processo biologico regulation of gluconeogenesis