1 / 28

WP 5 – Attività 1 Il portale Web hrbc-genomics

WP 5 – Attività 1 Il portale Web www.hrbc-genomics.net. Paolo Romano Istituto Nazionale per la Ricerca sul Cancro (paolo.romano@istge.it). Sommario. Motivazioni e obiettivi del portale Panoramica dei contenuti Qualche parola in più su: SRS questionari databases. Motivazioni.

adem
Download Presentation

WP 5 – Attività 1 Il portale Web hrbc-genomics

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. WP 5 – Attività 1Il portale Webwww.hrbc-genomics.net Paolo Romano Istituto Nazionale per la Ricerca sul Cancro (paolo.romano@istge.it) Romano, Portale Web

  2. Sommario • Motivazioni e obiettivi del portale • Panoramica dei contenuti • Qualche parola in più su: • SRS • questionari • databases Romano, Portale Web

  3. Motivazioni • strumenti bioinformatici distribuiti su siti diversi: • difficoltà nella ricerca e nella scelta degli strumenti, • interfacce, metodi di ricerca, strutture dati eterogenei: • difficoltà nell’utilizzo degli strumenti disponibili • post-genomica in continua evoluzione: • strumenti bioinformatici poco numerosi e interfacce primitive, • elevata partecipazione nel progetto: • difficoltà di coordinamento e messa in comune dei dati • sinergie e ottimizzazione risorse Romano, Portale Web

  4. Obiettivi Realizzare un portale che: • ospiti servizi e strumenti di tipo bioinformatico, utili ai ricercatori coinvolti nel progetto e non, • dia visibilità al progetto e ai partner (parte accessibile a tutti) • serva come strumento di lavoro e coordinamento per le unità di ricerca (parte ad accesso riservato) • rimanga un riferimento alla fine del progetto Romano, Portale Web

  5. Organizzazione • non solo portale, contenuti propri • gestione comune • siti mirror per garantire servizio e prestazioni • software “ingombranti” non replicati Romano, Portale Web

  6. Risultati attesi • Disponibilità di strumenti di tipo generale (banche dati, sistemi di ricerca, programmi per analisi delle sequenze, strumenti bioinformatici di uso comune) • SRS per interrogazione di banche dati di pubblico dominio (GenBank, LocusLink, OMIM, SwissProt, ecc.) e strumenti di analisi di pubblico dominio (BLAST, FASTA, ecc.) • Disponibilità di strumenti di analisi e banche dati di specifico interesse ai fini del progetto HRBC • Nuovi strumenti specificamente sviluppati da questa unità Romano, Portale Web

  7. Riferimenti • Lingua:inglese (e italiano nella parte riservata) • Nome:Hormone Responsive Breast Cancer (HRBC) Genomics Network • Dominio: hrbc-genomics.net(e hrbc-genomics.org e hrbc-genomics.info) • Indirizzo:www.hrbc-genomics.net • Logo:da definire Romano, Portale Web

  8. Logo attuale Romano, Portale Web

  9. Contenuti (area pubblica) Presentazione del progetto • sintesi del progetto di ricerca • responsabili unità operative e altri contatti • elenco articoli/documenti vari prodotti nell’ambito del progetto Romano, Portale Web

  10. Contenuti (area pubblica) • sito SRS (con accesso a software d’analisi, se collegato a SRS) • elenco database da definire • possibile inserimento di nuovi database • elenco software a definire • limitazione d’accesso (per progetto, per utente) • riferimento iniziale SRS @ ISA/CNR Romano, Portale Web

  11. Contenuti (area pubblica) • link a siti unità operative e partner • link a siti di interesse scientifico affine al progetto • link a corsi di formazione on-line (free) selezionati tra quelli esistenti per la loro attinenza al progetto e agli strumenti del progetto • elenchi da definire Romano, Portale Web

  12. Contenuti (area pubblica) • Materiale didattico corsi organizzati dal progetto • Sull’accesso e utilizzo degli strumenti • Sulle tecnologie (microarray) • Materiale didattico corsi organizzati dai partner • Biology for dummies • Perl • Mirror di corsi creati da altri ricercatori • BioComputing Division VSNS Romano, Portale Web

  13. Contenuti (area pubblica) • analisi dei risultati dei questionari • Quali tools installare e perché • Quali tools sviluppare e perché • dati estratti dinamicamente da db Romano, Portale Web

  14. Contenuti (area riservata) • progetto di ricerca dettagliato, • elenco dettagliato partner, • documenti prodotti nell’ambito del progetto: • presentazioni a meetings (questo!) • relazioni annuali Romano, Portale Web

  15. Contenuti (area riservata) • archivio mailing list di progetto • coordinamento • annunci interni • annunci pubblici (?) • unità operative Romano, Portale Web

  16. Contenuti (area riservata) • Database dati sperimentali del progetto • Database microarray • Database overall del progetto • Interfacce per accesso a software di analisi dei dati di espressione genica e proteomica • Sviluppati nel progetto • Sottoposti a licenza • Computazionalmente onerosi Romano, Portale Web

  17. Contenuti (area riservata) Questionari • Esempi: • Quali software esistenti si desiderano sul sito • Quali analisi sarebbe utile implementare • Implementazione: • Compilazione tramite form • Inserimento dati in db • Estrazione dati riassuntivi Romano, Portale Web

  18. Contenuti (area riservata) Sviluppo cooperativo di documenti • Esempi: • Preparazione materiale corsi • Redazione relazioni/articoli • Strumenti • Wiki? Romano, Portale Web

  19. SRS - Sequence Retrieval Software • SRS è un esempio di integrazione locale di banche dati eterogenee in maniera semplice ed efficiente • L’approccio originale di SRS consiste in • Banche dati disponibili localmente come “flat file” • Definizione di sintassi specifiche per l’estrazione dei dati • Utilizzo di link interni espliciti e impliciti tra banche dati • L’integrazione trasparente con applicazioni • L’integrazione esterna tramite link HTML Romano, Portale Web

  20. SRS – I links • I collegamenti (links) tra banche dati possono essere definiti in maniera • Esplicita, quando un termine è appositamente inserito in un field come riferimento a una entry di un’altra banca dati • Implicita, cercando termini comuni all’interno di fields predefiniti di banche dati diverse Romano, Portale Web

  21. SRS – I links espliciti • Esplicito riferimento a un’altra banca dati Other_collection_numbers CCUG 34964; NCIB 12128 Literature DSM ref.no. 72; DSM ref.no. 1300 EMBL: X52289 Romano, Portale Web

  22. SRS – I links impliciti • Termini comuni in banche dati diverse TargetGene: APOE Constructed_from pMB1, pSC101 and Tn3 Name Gluconacetobacter xylinus subsp. xylinus, (Brown 1886) Yamada, Hoshino and Ishikawa 1998 VL Literature Nucleic Acids Res 1990;18:4967 [PMID: 2395673] Romano, Portale Web

  23. SRS – Possibili estensioni • SRS è facilmente estendibile • Nuove banche dati possono essere aggiunte dando una descrizione della loro sintassi nel linguaggio Icarus o fornendo il DTD • È possibile stabilire nuovi collegamenti tra banche dati inserendo xrefs o lasciando che siano identificati da SRS, specificando i fields • Molte banche dati sono distribuite in formato “flat file” e con relative sintassi Icarus (qualche DTD) Romano, Portale Web

  24. SRS: operatori link • SRS consente di utilizzare i link esistenti per le ricerche tramite un apposito operatore: < • swissprot < EMBL • EMBL < swissprot • swissprot < [EMBL-id: X52289] • [EMBL-organism:human] < [medline-pmid:3137981] Romano, Portale Web

  25. Gestione di un sito SRS • Aggiornamento del software • Nuove releases (3-4 / anno) • Modifiche software / nuove funzioni • Aggiornamento banche dati • Nuove releases (3-4 / anno) • Modifica contenuto / struttura file • Controllo processi • Directory temporanee • Problemi memoria/disco • Analisi degli accessi Romano, Portale Web

  26. Nuove banche dati • Definizione delle informazioni e analisi delle sorgenti • Analisi dei link con banche dati esistenti • Definizione di una struttura dati e di un formato “flat file” o DTD • Creazione di un’analizzatore di sintassi • Indicizzazione Romano, Portale Web

  27. Con la collaborazione di….. Idee raccolte e discusse con: • Assunta Manniello, Istituto Nazionale per la Ricerca sul Cancro, Genova • Elda Rossi e Francesco Falciano, CINECA, Bologna • Angelo Facchiano, ISA/CNR, Avellino Romano, Portale Web

  28. Stato del sito prototipo http://www.hrbc-genomics.net/ http://www.hrbc-genomics.net/internal/ (user: hrbc, password: testpwd) Contenuti: • Struttura definita, pagine riservate protette • Link a vari strumenti su siti dei partner (ISA/CNR, CINECA) • Corso Biocomputing Division (BCD) della Virtual School of Natural Sciences (VSNS) Romano, Portale Web

More Related