280 likes | 439 Views
WP 5 – Attività 1 Il portale Web www.hrbc-genomics.net. Paolo Romano Istituto Nazionale per la Ricerca sul Cancro (paolo.romano@istge.it). Sommario. Motivazioni e obiettivi del portale Panoramica dei contenuti Qualche parola in più su: SRS questionari databases. Motivazioni.
E N D
WP 5 – Attività 1Il portale Webwww.hrbc-genomics.net Paolo Romano Istituto Nazionale per la Ricerca sul Cancro (paolo.romano@istge.it) Romano, Portale Web
Sommario • Motivazioni e obiettivi del portale • Panoramica dei contenuti • Qualche parola in più su: • SRS • questionari • databases Romano, Portale Web
Motivazioni • strumenti bioinformatici distribuiti su siti diversi: • difficoltà nella ricerca e nella scelta degli strumenti, • interfacce, metodi di ricerca, strutture dati eterogenei: • difficoltà nell’utilizzo degli strumenti disponibili • post-genomica in continua evoluzione: • strumenti bioinformatici poco numerosi e interfacce primitive, • elevata partecipazione nel progetto: • difficoltà di coordinamento e messa in comune dei dati • sinergie e ottimizzazione risorse Romano, Portale Web
Obiettivi Realizzare un portale che: • ospiti servizi e strumenti di tipo bioinformatico, utili ai ricercatori coinvolti nel progetto e non, • dia visibilità al progetto e ai partner (parte accessibile a tutti) • serva come strumento di lavoro e coordinamento per le unità di ricerca (parte ad accesso riservato) • rimanga un riferimento alla fine del progetto Romano, Portale Web
Organizzazione • non solo portale, contenuti propri • gestione comune • siti mirror per garantire servizio e prestazioni • software “ingombranti” non replicati Romano, Portale Web
Risultati attesi • Disponibilità di strumenti di tipo generale (banche dati, sistemi di ricerca, programmi per analisi delle sequenze, strumenti bioinformatici di uso comune) • SRS per interrogazione di banche dati di pubblico dominio (GenBank, LocusLink, OMIM, SwissProt, ecc.) e strumenti di analisi di pubblico dominio (BLAST, FASTA, ecc.) • Disponibilità di strumenti di analisi e banche dati di specifico interesse ai fini del progetto HRBC • Nuovi strumenti specificamente sviluppati da questa unità Romano, Portale Web
Riferimenti • Lingua:inglese (e italiano nella parte riservata) • Nome:Hormone Responsive Breast Cancer (HRBC) Genomics Network • Dominio: hrbc-genomics.net(e hrbc-genomics.org e hrbc-genomics.info) • Indirizzo:www.hrbc-genomics.net • Logo:da definire Romano, Portale Web
Logo attuale Romano, Portale Web
Contenuti (area pubblica) Presentazione del progetto • sintesi del progetto di ricerca • responsabili unità operative e altri contatti • elenco articoli/documenti vari prodotti nell’ambito del progetto Romano, Portale Web
Contenuti (area pubblica) • sito SRS (con accesso a software d’analisi, se collegato a SRS) • elenco database da definire • possibile inserimento di nuovi database • elenco software a definire • limitazione d’accesso (per progetto, per utente) • riferimento iniziale SRS @ ISA/CNR Romano, Portale Web
Contenuti (area pubblica) • link a siti unità operative e partner • link a siti di interesse scientifico affine al progetto • link a corsi di formazione on-line (free) selezionati tra quelli esistenti per la loro attinenza al progetto e agli strumenti del progetto • elenchi da definire Romano, Portale Web
Contenuti (area pubblica) • Materiale didattico corsi organizzati dal progetto • Sull’accesso e utilizzo degli strumenti • Sulle tecnologie (microarray) • Materiale didattico corsi organizzati dai partner • Biology for dummies • Perl • Mirror di corsi creati da altri ricercatori • BioComputing Division VSNS Romano, Portale Web
Contenuti (area pubblica) • analisi dei risultati dei questionari • Quali tools installare e perché • Quali tools sviluppare e perché • dati estratti dinamicamente da db Romano, Portale Web
Contenuti (area riservata) • progetto di ricerca dettagliato, • elenco dettagliato partner, • documenti prodotti nell’ambito del progetto: • presentazioni a meetings (questo!) • relazioni annuali Romano, Portale Web
Contenuti (area riservata) • archivio mailing list di progetto • coordinamento • annunci interni • annunci pubblici (?) • unità operative Romano, Portale Web
Contenuti (area riservata) • Database dati sperimentali del progetto • Database microarray • Database overall del progetto • Interfacce per accesso a software di analisi dei dati di espressione genica e proteomica • Sviluppati nel progetto • Sottoposti a licenza • Computazionalmente onerosi Romano, Portale Web
Contenuti (area riservata) Questionari • Esempi: • Quali software esistenti si desiderano sul sito • Quali analisi sarebbe utile implementare • Implementazione: • Compilazione tramite form • Inserimento dati in db • Estrazione dati riassuntivi Romano, Portale Web
Contenuti (area riservata) Sviluppo cooperativo di documenti • Esempi: • Preparazione materiale corsi • Redazione relazioni/articoli • Strumenti • Wiki? Romano, Portale Web
SRS - Sequence Retrieval Software • SRS è un esempio di integrazione locale di banche dati eterogenee in maniera semplice ed efficiente • L’approccio originale di SRS consiste in • Banche dati disponibili localmente come “flat file” • Definizione di sintassi specifiche per l’estrazione dei dati • Utilizzo di link interni espliciti e impliciti tra banche dati • L’integrazione trasparente con applicazioni • L’integrazione esterna tramite link HTML Romano, Portale Web
SRS – I links • I collegamenti (links) tra banche dati possono essere definiti in maniera • Esplicita, quando un termine è appositamente inserito in un field come riferimento a una entry di un’altra banca dati • Implicita, cercando termini comuni all’interno di fields predefiniti di banche dati diverse Romano, Portale Web
SRS – I links espliciti • Esplicito riferimento a un’altra banca dati Other_collection_numbers CCUG 34964; NCIB 12128 Literature DSM ref.no. 72; DSM ref.no. 1300 EMBL: X52289 Romano, Portale Web
SRS – I links impliciti • Termini comuni in banche dati diverse TargetGene: APOE Constructed_from pMB1, pSC101 and Tn3 Name Gluconacetobacter xylinus subsp. xylinus, (Brown 1886) Yamada, Hoshino and Ishikawa 1998 VL Literature Nucleic Acids Res 1990;18:4967 [PMID: 2395673] Romano, Portale Web
SRS – Possibili estensioni • SRS è facilmente estendibile • Nuove banche dati possono essere aggiunte dando una descrizione della loro sintassi nel linguaggio Icarus o fornendo il DTD • È possibile stabilire nuovi collegamenti tra banche dati inserendo xrefs o lasciando che siano identificati da SRS, specificando i fields • Molte banche dati sono distribuite in formato “flat file” e con relative sintassi Icarus (qualche DTD) Romano, Portale Web
SRS: operatori link • SRS consente di utilizzare i link esistenti per le ricerche tramite un apposito operatore: < • swissprot < EMBL • EMBL < swissprot • swissprot < [EMBL-id: X52289] • [EMBL-organism:human] < [medline-pmid:3137981] Romano, Portale Web
Gestione di un sito SRS • Aggiornamento del software • Nuove releases (3-4 / anno) • Modifiche software / nuove funzioni • Aggiornamento banche dati • Nuove releases (3-4 / anno) • Modifica contenuto / struttura file • Controllo processi • Directory temporanee • Problemi memoria/disco • Analisi degli accessi Romano, Portale Web
Nuove banche dati • Definizione delle informazioni e analisi delle sorgenti • Analisi dei link con banche dati esistenti • Definizione di una struttura dati e di un formato “flat file” o DTD • Creazione di un’analizzatore di sintassi • Indicizzazione Romano, Portale Web
Con la collaborazione di….. Idee raccolte e discusse con: • Assunta Manniello, Istituto Nazionale per la Ricerca sul Cancro, Genova • Elda Rossi e Francesco Falciano, CINECA, Bologna • Angelo Facchiano, ISA/CNR, Avellino Romano, Portale Web
Stato del sito prototipo http://www.hrbc-genomics.net/ http://www.hrbc-genomics.net/internal/ (user: hrbc, password: testpwd) Contenuti: • Struttura definita, pagine riservate protette • Link a vari strumenti su siti dei partner (ISA/CNR, CINECA) • Corso Biocomputing Division (BCD) della Virtual School of Natural Sciences (VSNS) Romano, Portale Web