160 likes | 240 Views
P2P e Semantic Web. Argomenti avanzati di Sistemi Informativi 2005. Alessio Gambi Andrea Gaschi. Agenda. Peer-to-peer Ontologie Soluzioni Architettura Joining the network Query processing Clustering dei nodi Sintesi Esempi di applicazioni. Bob. Bob. Alice. Alice. Carol. Carol.
E N D
P2P e Semantic Web Argomenti avanzati di Sistemi Informativi 2005 Alessio Gambi Andrea Gaschi
Agenda • Peer-to-peer • Ontologie • Soluzioni • Architettura • Joining the network • Query processing • Clustering dei nodi • Sintesi • Esempi di applicazioni P2P e Semantic Web
Bob Bob Alice Alice Carol Carol Ted Ted Peer-to-peer: stato dell’arte • Definizione di Peer-to-Peer: Un sistema di P2P si può definire come un sistema distribuito i cui nodi, o peer, hanno capacità e ruoli equivalenti nello scambio di informazioni e servizi tra loro. • Panoramica dei modelli P2P: Super Peer Network Direct P2P Model Broker mediated Model Super Peer Super Peer Copying “Star Wars ep. III” Where is “Star Wars ep. III”? Alice has it Where is “Star Wars ep. III”? Broker Alice has it P2P e Semantic Web
Ontologie • Definizione di ontologia Una specifica formale esplicita di una concettualizzazione condivisa • Le applicazioni delle ontologie nei sistemi P2P: • P2P tradizionali • DHT • Reti P2P basate su schemi • Reti di super-peer per repository distribuiti • Strategie di routing basate su schemi e ontologie • Migliore scalabilità • Descrizione del contenuto tramite schemi espliciti • Metadati per descrivere le risorse dei nodi e per garantire interoperabilità semantica • Uso limitato dei metadati • Indici centralizzati • Indici distribuiti • Costruzione di una topologia della rete • Routing più efficace P2P basati su schemi Super-peer e repository distributi Sistemi P2P tradizionali DHT P2P e Semantic Web
Problema Book • Esempio di scenario in una rete P2P: quali problemi ci sono. Book Publication Journal Novel Peer B Novel Peer A Volume Peer C Peer D Peer Peer X Peer Y Detective Novel Mistery Novel Peer W Peer Z P2P e Semantic Web
Soluzioni tecnologiche: introduzione al nostro lavoro • Il nostro lavoro si è concentrato sull’analisi delle principali soluzioni tecnologiche disponibili, che integrino Semantic Web e P2P. • L’analisi si è concentrata su: • Architettura concettuale e moduli software • Metodologie utilizzate, in particolare: • Rappresentazione della conoscenza • Query processing • Propagazione delle query • Soluzioni tecnologiche analizzate: • SWAP (AIFB Institute, University of Karlsruhe) • Edutella • EDAMOK (Itc-Irst e Università di Trento) • PSearch • H3 P2P e Semantic Web
Architettura dei nodi • Definizione di peer: Ogni nodo è una risorsa che si autogestisce e che può compiere molteplici azioni, indipendentemente da tutti i suoi “pari”. Un peer, può accedere anche a sorgenti di conoscenza esterne. Detective Novel • Diverse implementazioni: • Proprietarie vs. Standard • Architettura multilivello vs. Wrapping Peer D ? P2P e Semantic Web
Detective Novel Mistery Novel Joining the network • Nel momento in cui un nodo vuole partecipare ad una rete P2P deve notificare la sua presenza (per ricevere le richieste), fornendo informazioni su se stesso alla rete, e deve recuperare informazioni sulla rete stessa o sui suoi partecipanti (per poter inviare le query). Peer D • Politiche di notifica: • Import vs. Export vs. Passive • Evoluzione della conoscenza del nodo: • Esplicita vs. Implicita Peer Mistery Novel P2P e Semantic Web Detective Novel
Query Processing: routing • Peer D: “Vorrei trovare altre Detective Novel” (esempio di query “ricca”…) • Creazione della richiesta contenente le informazioni semantiche del concetto target • La richiesta viene inviata ai nodi collegati • Ogni nodo che riceve la richiesta, in base alle proprie conoscenze, la inoltra verso i nodi in grado di rispondere Volume • Formulazione delle query • Scelta obbligata per il linguaggio vs. Libertà di scelta • Potere espressivo • Sistemi P2P puri vs. Sistemi con Hub Novel Peer B Book Semantic Overlay Network Detective Novel Detective Novel Novel Peer C Peer X Peer Y Detective Novel Peer D Detective Novel Peer W Peer Z Detective Novel Mistery Novel P2P e Semantic Web
Book Novel Detective Novel Book Novel Query Processing: matching • Il matching si basa sul concetto di confronto tra il soggetto della query e la rappresentazione delle risorse del nodo. • Se il peer B adottasse un algoritmo di matching esatto, la query non otterrebbe alcuna risposta. • Invece si abbandona il concetto di matching esatto tipico dei tradizionali sistemi di Information Retrieval, a favore di concetti più “laschi” come l'equivalenza e la corrispondenza semantica. Detective Novel Peer B • Algoritmi di matching • Vettori di termini vs. Schemi • Formato delle risposte P2P e Semantic Web
Query Processing: reply • Le risposte vengono costruite ed inviate direttamente al nodo che ne aveva fatto richiesta. • Il peer D raccoglie le risposte e le presenta all’utente. • Nel caso di assenza di risultati, la politica scelta è non creare nessuna risposta. Volume Reply Novel Peer B Book Novel Reply Peer C Peer X Peer Y Peer D Reply Peer W Peer Z Detective Novel Mistery Novel P2P e Semantic Web
Peer B Peer Y Peer W Clustering dei nodi • I nodi che condividono gli stessi interessi o che possiedono informazioni relative a concetti correlati vengono messi logicamente vicini, per aumentare contemporaneamente l'efficienza e l'efficacia delle ricerche di informazioni nella rete. • Gli altri nodi, secondo il principio di località, vedono come vicini i nodi correlati. • Federazioni esplicite vs. Clustering Volume Novel Book Novel Peer C Peer X Peer D Novel Peer Z Detective Novel Mistery Novel P2P e Semantic Web
Sintesi • Dal punto di vista prestazionale, le tecnologie di Semantic P2P rappresentano un effettivo miglioramento rispetto ai sistemi P2P tradizionali: • Aumento del recall • Aumento della precisione • Riduzione del numero di messaggi scambiati • Limiti ancora da superare: • “Qualità” del servizio • Allineamento automatico di schemi diversi • Gestione di query complesse • Performance non ancora ottimali di meccanismi di matching e di routing P2P e Semantic Web
Esempi e applicazioni – problemi tradizionali • Bibster: un sistema realizzato in Java e basato sulle tecnologie di SWAP che assiste i ricercatori nella gestione, nella ricerca e nella condivisione di metadati bibliografici in una rete P2P. • Molti ricercatori mantengono manualmente liste di dati bibliografici: • Senza una semplice visione generale • Qualità dei dati variabile. • Molti ricercatori desiderano condividere queste risorse senza dover investire tempo nel farlo. • Una soluzione centralizzata non esiste, Bibster realizza un ambiente di condivisione della conoscenza che permetta ai ricercatori di: • condividere facilmente i dati bibliografici; • risparmiare sforzi nella ricerca di questi dati; • evitare di dover riscrivere questi dati a mano. • PADLR: una infrastruttura web per l’apprendimento che permetta una maggiore flessibilità e funzionalità a tutti i livelli dell’insegnamento universitario. • PADLR fa in modo che la conoscenza e i materiali didattici siano costantemente ristrutturati e rimodellati e che possano essere acceduti individualmente e soprattutto quando sono necessari. • L’implementazione del sistema P2P per lo scambio di risorse didattiche è basata su nodi Edutella. P2P e Semantic Web
Catalogo Standardizzato Dessert e Frutta Prodottiortofrutticoli Torte Frutta Coltivazioni Verdura Frutta Nostrana Esotica Estive Invernali Ciliege Mele Pere Mele Uva Mele Azienda X Azienda Y BUYER SELLER Un’applicazione originale • Distribuited Knowledge Management in B2B: applicazione delle tecnologie P2P e del Semantic Web al B2B, in particolare ai Marketplace (e in genere all’eProcurement). • Marketplace: un luogo “concettuale” in cui si incontrano diversi soggetti per scambiare beni e servizi. • I problemi di comunicazioni (sinonimie e omonimie) vengono affrontati attraverso la standardizzazione dei cataloghi: • Il gestore del marketplace fornisce un catalogo comune sul quale si “mappano” gli utilizzatori • Nel caso eProcurement, sul catalogo di sistema devono essere mappati • I cataloghi fisici dei fornitori • I cataloghi “mentali” dei compratori • Ma i cataloghi sono difficili da standardizzare! • Soluzione: approccio distribuito • Gestione distribuita dei cataloghi • Aggregazione virtuale di gruppi d’acquisto e vendita P2P e Semantic Web
Grazie per l’attenzione. P2P e Semantic Web