170 likes | 329 Views
Nascita di XML. I limiti del Web I limiti di HTML. HTML nasce come linguaggio di presentazione di dati ipertestuali, adatto dunque a gestire:. testo immagini audio filmati animazioni. In principio era HTML. Ma gli scenari evolvono velocemente.
E N D
Nascita di XML I limiti del Web I limiti di HTML
HTML nasce come linguaggio di presentazione di dati ipertestuali, adatto dunque a gestire: • testo • immagini • audio • filmati • animazioni In principio era HTML...
Ma gli scenari evolvono velocemente... • Dati sempre più complessicominciano ad essere scambiati attraverso la rete (ad esempio per l’e-commerce). • Per via dell’importanza economica di alcuni di questi dati, si sente la necessità di strumenti di validazione. • Sempre più spesso i dati vengono scambiati e processati automaticamenteda agenti software. Devono quindi essere “comprensibili” anche per le applicazioni software.
Il successo del WEB Il World Wide Web rappresenta oggi il più grande contenitore di informazione mai assemblata dall’uomo. Contiene infatti documenti e risorse multimediali riguardanti qualsiasi dominio immaginabile e tutta questa informazione è disponibile istantaneamente a qualsiasi utente provvisto di una connessione Internet. Il successo del Web è dovuto al suo essere decentralizzato e universale: le pagine web risiedono su computer sparsi in tutto il mondo e ogni documento può puntare a qualsiasi altro documento. Un utente, in qualsiasi parte del mondo, può aggiungere informazione al Web contribuendo così alla sua crescita, che in pochi anni è diventata esponenziale.
I limiti del WEB Ricerca di un documento Questa crescita incontrollata del Web ha determinato una reale difficoltà a trovare informazione utile. Sebbene le directories (ad es. quelle di Yahoo) e i motori di ricerca (ad es. Google e Altavista) possono aiutare a reperire informazione, questi meccanismi hanno ancora molti limiti. Il più delle volte trovare il documento giusto è come cercare un ago in un pagliaio.
I limiti del WEB Altri servizi web “più complessi” I limiti del Web sono ancora più evidenti quando un utente vuole eseguire qualche operazione più complessa della ricerca di un documento. Esempio: un utente potrebbe voler pianificare e prenotare una vacanza o riservare posti in un ristorante o in un cinema. Per ottenere questi servizi l’utente è spesso costretto a visitare molte pagine, analizzarne il contenuto e ragionarci sopra in qualche modo. Attualmente tali capacità sono sconosciute a qualsiasi motore di ricerca o assistente virtuale.
IlLimite del WEB Il principale ostacolo e limite del Web consiste nel fatto che non è stato progettato per essere processato da computer, ma solo dall’uomo. Il Web si presenta oggi come una grande rete di informazione, ma poiché l’informazione diventi conoscenza o informazione utile deve essere analizzata semanticamente. Purtroppo la tecnologia attuale non permette alcun tipo di analisi semantica. Quest’ultima è affidata unicamente all’utente che, dopo essere stato parzialmente aiutato da qualche motore di ricerca o agente software, deve distinguere l’informazione utile da quella inutile.
IlLimite del WEB: HTML Tale limite è dovuto al fatto che l’informazione sul Web non è strutturata, ma viene espressa ad un unico livello tramite l’HTML. L’HTML non è altro che un linguaggio di formattazione e visualizzazione di testo che, partendo da un testo qualsiasi, definisce per ogni elemento la sua dimensione, forma, colore, posizione, ecc…. In questo modo una pagina Web non ha alcuna informazione che possa aiutare un’entità software a determinare il significato del testo e quindi non può essere processata intelligentemente da essa.
I limiti di HTML • Descrive come presentare dati, non l’informazione in essi contenuta. • Non è estensibile, ma rigido: non possono essere definiti nuovi tag e attributi. • Non è prevista alcuna validazione (semantica) dei dati. • L’informazione non è strutturata, ma viene espressa ad un unico livello.
Un semplice esempio <html> <table border=“1pt”><tr> <th>Inter</th> <th>Juventus</th> <th>3-0</th> </tr> <tr> <th>Milan</th> <th>Roma</th> <th>1-1</th> </tr></table> </html> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <tr> ritorna i primi due <th> Inter Juventus Milan Roma
Un semplice esempio (cont.) <html> <table border=“1pt”><tr> <th>Trefoloni</th> <th>Milano</th> <th>Inter</th> <th>Juventus</th> <th>0-3</th> </tr></table> </html> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <tr> ritorna i primi due <th> Trefoloni Milano
Quale soluzione adottare per risolvere i limiti del Web? Serve qualcosa di nuovo! Una nuova tecnologia per il Web!
Il Web Semantico Recentemente Tim Berners-Lee, l’inventore del Web, ha proposto di aumentare il Web attuale con linguaggi che possano rendere esplicita l’informazione contenuta nelle pagine, rendendo così il Web “semantico”. Non si tratta di definire un nuovo Web, ma di estendere quello già presente facendo in modo che l’informazione sia processabile dalle macchine come dall’uomo.
Nuove tecnologie per il Web Attualmente la comunità scientifica sta studiando nuove tecnologie per poter realizzare il Web Semantico. Sostanzialmente l’architettura del nuovo Web si baserà su tre livelli fondamentali, ben distinti tra loro: XML
Il semplice esempio risolto <giornata> <partita> <arbitro>Trefoloni</arbitro> <luogo>Milano</luogo> <altra_informazione/> <squadra>Inter</squadra> <squadra>Juventus</squadra> </partita> </giornata> Query: seleziona l’elenco delle partite. Algoritmo: Per ogni tag <partita> ritorna i primi due <squadra> Inter Juventus
Prossima lezione: Fondamenti di XML