200 likes | 323 Views
Oncology over Internet (O2I). Paolo Romano, Istituto Nazionale per la Ricerca sul Cancro, Genova paolo.romano@istge.it.
E N D
Oncology over Internet (O2I) Paolo Romano, Istituto Nazionale per la Ricerca sul Cancro, Genova paolo.romano@istge.it Certosa di Pontignano
Oncology over Internet (O2I)Sviluppo e implementazione di softwareper la ricerca, il filtraggio e il reperimento dalla rete Internetdi informazioni in formato standardizzatoin supporto alla ricerca oncologica e di interesse pubblico Progetto Strategico MIUR Settore: Società dell’informazione Tema: Metodologie, modelli, tecniche e strumenti per indicizzazione, ricerca, filtraggio e reperimento delle informazioni Certosa di Pontignano
Razionale: il problema • Enorme quantità di dati di interesse biomedico disponibili in rete e gestiti con software disparati • Accesso Web tramite interfacce utente specifiche • Complesso lavoro di ricerca, filtraggio e recupero delle informazioni: • accesso separato ai siti • analisi dati in parte manuale • trasferimento dati tramite HTTP/FTP • “cut and paste” • integrazione dei risultati Certosa di Pontignano
Razionale: l’esigenza • È necessario progettare e allestire un’interfaccia utente: • Unica (evita la navigazione all’utente) • Autonoma (sa dove andare, cosa prelevare) • Intelligente (si aggiorna) • Efficace (trova i dati) • Efficiente (rapida) • Specializzata (settoriale) Certosa di Pontignano
Obiettivo generale • Lo sviluppo di un prototipo in grado di: • consentire la formulazione di interrogazioni complesse su un insieme eterogeneo di banche dati e siti web, sulla base di un insieme predefinito di percorsi logici e ricerche tipo, • accedere alle banche dati e ai siti coinvolti ed effettuare le necessarie ricerche, • filtrare i risultati ottenuti, • presentare i risultati in forma integrata all’utente finale. Certosa di Pontignano
Risultato atteso • Disponibilità di un prototipo: • dedicato all’oncologia (clinica e ricerca), • testato e convalidato da ricercatori oncologi, • configurabile, • aggiornabile, • pubblicamente accessibile tramite Internet, • esportabile, • adattabile ad altri settori. Certosa di Pontignano
Moduli del sistema • Interfaccia utente • Base di conoscenza • Base dati supporto • Motore di ricerca Certosa di Pontignano
Interfaccia utente • Accessibile via Internet • Seleziona la ricerca desiderata • Acquisisce informazioni necessarie • Attiva il motore di ricerca • Visualizza i risultati Certosa di Pontignano
Base di conoscenza (meta db) • Le ricerche predefinite • Per ogni ricerca tipo definita: • l’elenco delle banche dati da interrogare, • l’elenco delle informazioni da recuperare, • le modalità di accesso e interrogazione, • le modalità di estrazione delle informazioni, • le modalità di integrazione dei risultati. Certosa di Pontignano
Base dati di supporto • Non contiene le banche dati • Contiene i risultati delle interrogazioni remote e tutte le informazioni estratte • Conserva i dati per la durata della ricerca Certosa di Pontignano
Motore di ricerca • Modulo di controllo • Modulo di recupero dell’informazione • Modulo di estrazione dell’informazione • Modulo di integrazione • Può appoggiarsi a software esterni • Può includere moduli addizionali Certosa di Pontignano
Schema funzionale Modulo recupero Interfaccia utente Modulo controllo Modulo estrazione Modulo integrazione Base conoscenza Base dati supporto Siti remoti Certosa di Pontignano
Strumenti di sviluppo • Open source | public domain | academic free • UML (Unified Modeling Language) • Java • Apache + Tomcat + JSP + Jboss • PostgreSQL, MySQL • Jess, Lucene • XML | CORBA/SOAP | Ontologie | Agenti SW Certosa di Pontignano
Strumenti rete: XML • XML (eXtensible Markup Language) • Vari ML • BioML, CML, GAME (Genome Annotation Markup Elements), BSML • AGAVE (Architecture for Genomic Annotation, Visualization and Exchange) • XEMBL, SP-ML • MAGE-ML • RDF (Resource Description Framework) • WSDL (Web Services Description Language) Certosa di Pontignano
<Bsml> <Definitions> <Sequences> <Sequence id="MIVN83300" ic-acckey="U83300" title="MIVN83300" comment="Veniliornis nigriceps strain LSU1305 cytochrome b gene, mitochondrial gene encoding mitochondrial protein, partial cds. " length="946" topology="linear" molecule="dna"> <Attribute name="version" content="U83300.1" /> <Attribute name="organism-species" content="Veniliornis nigriceps (bar-bellied woodpecker)" /> <Attribute name="organism-classification" content="Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Piciformes; Picidae; Veniliornis" /> <Attribute name="source" content="Veniliornis nigriceps LSU1305" /> <Attribute name="date-created" content="14-MAY-1997" /> <Attribute name="date-last-updated" content="4-MAR-2000" /> <Attribute name="database-xref" content="SPTREMBL:O03345" />
Strumenti rete: CORBA/SOAP • CORBA (Common Object Request Broker Architecture) • Life Sciences Research (LSR/DTF) • EBI CORBA servers • BSA, BSANE, BQS • bioCORBA • SOAP (Simple Object Access Protocol) Certosa di Pontignano
Strumenti di rete: Ontologie • Razionalizzazione di un insieme di concetti di un’ambito specifico: include vocabolario, definizioni, relazioni tra termini • Base del Web Semantico • Ontologie in biologia: • Gene Ontology • DAML-S (DARPA Agent Markup Language Web service ontology) • MGED OWG Certosa di Pontignano
Strumenti rete: XEWA & WAX • XEWA (XML Enabled Wide Area Bioinformatics Initiative):utilizza DAML-S per uniformare l’accesso alle fonti bioinformatiche • WAX (Wide Area XML System):utilizza RDF come base per descrivere le applicazioni basate su XML e accedere a esse Certosa di Pontignano
Gruppo di lavoro • Istituto Nazionale per la Ricerca sul Cancro, Genova (P. Romano) • Dipartimento Informatica, Sistemistica e Comunicazione, Università di Milano Bicocca, Milano (G. Mauri) • Dipartimento di Matematica e Informatica, Università di Camerino, Camerino (MC) (E. Merelli) • Laboratorio di Informatica, Sistemistica e Telematica per le Biotecnologie, Centro Biotecnologie Avanzate, Genova (F. Beltrame) • Istituto Tecnologie Biomediche CNR, Milano (L. Milanesi) • Istituto Circuiti Elettronici, CNR, Genova (P. Arrigo) • Centro Interuniversitario Nazionale per la Ricerca Oncologica, Genova (L. Santi) • Intrasoft SpA, Milano (M. Bisoffi) Certosa di Pontignano
Contatti • Sito web (in allestimento) • http://www.o2i.org/ • Email coordinatore • paolo.romano@istge.it Certosa di Pontignano