1 / 38

Lezione 4a - 22 ottobre 2009

Lezione 4a - 22 ottobre 2009.

layne
Download Presentation

Lezione 4a - 22 ottobre 2009

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Lezione 4a - 22 ottobre 2009 Il materiale didattico usato in questo corso è stato mutuato da quello utilizzato da Paolo Veronesi per il corso di Griglie Computazionali per la Laurea Specialistica in Informatica tenutonell’anno accademico 2008/09 presso l’Università degli Studi di Ferrara. Paolo Veronesi paolo.veronesi@cnaf.infn.it, pveronesi@unife.it http://www.cnaf.infn.it/~pveronesi/unife/ Università degli Studi di Bari – Corso di Laurea Specialistica in Informatica “Tecnologia dei Servizi “Grid e cloud computing” A.A. 2009/2010 Giorgio Pietro Maggigiorgio.maggi@ba.infn.it, http://www.ba.infn.it/~maggi

  2. Outline XML Namespace XML Schema From SOA to WBA Web Service WSDL SOAP UDDI Web Service Resource Framework Richiesta account GILDA

  3. XML Namespace Qui esaminiamo: L’esigenza e il funzionamento dei Namespace in XML

  4. L'identificazione dei vocabolari In molti casi, le applicazioni XML si aspettano una varietà di tipi di documento diversi, e si vorrebbe indovinare il tipo esatto caso per caso da un meccanismo univoco, senza eccezioni e ambiguità. Un meccanismo che semplicemente esaminando qualcosa del documento sia in grado senza esitazione di associare ai vari elementi meccanismi procedurali precisi. Questo richiede identificabilità universale del tipo senza ricorrere a meccanismi esterni (content-type, estensioni, ecc.) o interni non obbligatori (ad es. doctype).

  5. Il mix di tag Nella visione XML, i tipi di documenti si mescolano e si fondono tra loro in maniera complessa. Lo stesso documento potrebbe avere alcuni elementi definiti in un vocabolario ed altri in un altro. Un esempio comune è un documento XML di valori di borsa che adopera i tag di HTML per definire gli elementi di testo, ed un insieme di tag specifico per gli elementi di borsa. Oppure anche un documento che contiene elementi strutturali di un vocabolario principale, e un payload che è a sua volta un documento XML totalmente diverso (XSLT ed HTML, SOAP, ecc.) I problemi sono identificare esattamente l'ambito di ciascun elemento, conciliare la presenza di elementi definiti in uno di più vocabolari, e soprattutto conciliare la presenza di elementi definiti con lo stesso nome in più vocabolari diversi. I namespace in XML si propongono per risolvere questi problemi. XML-Namespaces è una recommendation di W3C del 1999.

  6. Un esempio di namespace Supponiamo che Amazon Italia voglia mettere il proprio database su Web: <h:html xmlns:ama="http://www.amazon.it/books”xmlns:h="http://www.w3.org/HTML/1998/html4"> <h:head><h:title>Book Review</h:title></h:head> <h:body> <ama:bookreview> <ama:title>3 Uomini in barca</ama:title> <h:table> <h:tr><h:td>Author</h:td> <h:td>Price</h:td> <h:td>Pages</h:td> <h:td>Date</h:td> </h:tr> <h:tr> <h:td><ama:author>Jerome K. Jerome</ama:author></h:td> <h:td><ama:price>25.000</ama:price></h:td> <h:td><ama:pages>352</ama:pages></h:td> <h:td><ama:publisher>Mondadori</ama:publisher></h:td> </h:tr> </h:table> </ama:bookreview> </h:body> </h:html>

  7. Uso dei namespace Ogni nome di elemento o attributo del documento XML è preceduto da un prefisso che ne specifica l'ambito. Il prefisso è separato da il carattere ‘:’ dal nome dell’elemento o dell’attributo. L’attributo predefinito “xmlns” serve per introdurre i prefissi usati dai namespace del documento. Il valore dell’attributo è un URI che non ha nessun valore dichiarativo, ma solo informativo. Si usa un URI perché si sa già che è unico su Internet. Poiché ogni namespace userà un prefisso diverso,è possibile capire quali elementi appartengono all’uno e all’altro, e di evitare qualunque problema di collisione. Un nome (di elemento o di attributo) che contiene prefisso di namespace e nome locale viene detto “nome qualificato”. Ovviamente la natura specifica del prefisso è irrilevante. Conta solo che sia associato ad un URI ben preciso.

  8. Namespace di default Nella dichiarazione xmlns si pone il nome del prefisso che si intende usare nel corso del documento per gli elementi definiti in quel namespace. L’assenza di tale prefisso in xmlns indica la presenza di un namespace di default, per cui tutti i nomi privi di prefisso si debbono intendere appartenenti a quel namespace. I namespace di default non si applicano agli attributi

  9. Un esempio di namespace Supponiamo che Amazon Italia voglia mettere il proprio database su Web: <h:html xmlns:ama="http://www.amazon.it/books”xmlns:h="http://www.w3.org/HTML/1998/html4"> <h:head><h:title>Book Review</h:title></h:head> <h:body> <ama:bookreview> <ama:title>3 Uomini in barca</ama:title> <h:table> <h:tr><h:td>Author</h:td> <h:td>Price</h:td> <h:td>Pages</h:td> <h:td>Date</h:td> </h:tr> <h:tr> <h:td><ama:author>Jerome K. Jerome</ama:author></h:td> <h:td><ama:price>25.000</ama:price></h:td> <h:td><ama:pages>352</ama:pages></h:td> <h:td><ama:publisher>Mondadori</ama:publisher></h:td> </h:tr> </h:table> </ama:bookreview> </h:body> </h:html>

  10. Un esempio (2) Mettendo HTML come namespace di default, è tutto un po’ più leggibile. <html xmlns:ama=“http://www.amazon.it/books”xmlns=“http://www.w3.org/HTML/1998/html4”> <head><title>Book Review</title></head> <body> <ama:bookreview style=“rilegato”> <ama:title>3 Uomini in barca</ama:title> <table> <tr><td>Author</td> <td>Price</td> <td>Pages</td> <td>Date</td> </tr> <tr> <td><ama:author>Jerome K. Jerome</ama:author></td> <td><ama:price>25.000</ama:price></td> <td><ama:pages>352</ama:pages></td> <td><ama:publisher>Mondadori</ama:publisher></td> </tr> </table> </ama:bookreview> </body> </html>

  11. Default NS: precisazioni La dichiarazione di namespace può essere fatta ovunque, e ha scope solo all’interno dell’elemento in cui è stata fatta. Possono essere fatte più definizioni di namespace di default, quella interna ha ovviamente precedenza: <?xml version="1.0"?> <!-- il default namespace e’ "books" --> <book xmlns='urn:loc.gov:books' xmlns:isbn='urn:ISBN:0-395-36341-6'> <title>Cheaper by the Dozen</title> <isbn:number>1568491379</isbn:number> <notes> <!-- Adesso diventa HTML --> <p xmlns='urn:w3-org-ns:HTML'> This is a <i>funny</i> book! </p> </notes> </book>

  12. Altri punti sottili L'URL di un namespace Cos'è l'etichetta di un namespace? A cosa corrisponde? A NIENTE! E' solo un nome. Il namespace non è un vocabolario esplicito, raccontato in qualche forma, ma solo un modo per differenziare nomi dello stesso documento. Namespace relativi Gli URI dei namespace vengono usati come identificatori. Ovviamente un URI relativo viola il concetto di identificatore assoluto. La raccomandazione W3C non dice niente, per questo è meglio evitare di usare URN relativi come etichette di namespace.

  13. Riferimenti T. Bray, D. Hollander, A. Layman, Namespaces in XML, W3C Recommendation, 14 January 1999, http://www.w3.org/TR/REC-xml-names T. Bray, XML Namespaces by Example, http://www.xml.com/xml/pub/1999/01/namespaces.html J. Clark, XML Namespaces, http://www.jclark.com/xml/xmlns.htm

  14. XML Schema Esaminaimo in breve XML Schema Perché non bastano i DTD Tipi ed elementi Definizione di elementi ed attributi Altri aspetti rilevanti di XML Schema

  15. Motivazione (1) Inizialmente si pensava che XML servisse solo per i documenti XML è più semplice di SGML, è più generale ed aperto di HTML, è lo strumento ideale per esprimere documenti di testo, siano essi libri, manuali o pagine Web. Quindi l’enfasi iniziale era su internazionalizzazione, strutturazione, facilità di conversione, ecc. Raccoglieva in pieno l’eredità di SGML. Lo sviluppo di XML era difatti condotto da membri della comunità SGML.

  16. Motivazione (2) Nasce poi l’idea che XML possa servire per qualcosa di più: XML è (anche) un linguaggio di markup per trasferire dati: un meccanismo per convertire dati dal formato interno dell’applicazione ad un formato di trasporto, facile da convertire in altri formati interni. Non pensato per la visione umana, ma per essere prodotto ed usato da programmi. XML è un’interfaccia (Adam Bosworth): Un’interfaccia tra autore e lettore, attraverso XSL e XLink, per portare significato tra creatore ed utente Un’interfaccia tra applicazione ed applicazione, attraverso XML Schema, per esprimere contratti sui formati, e verificarne il rispetto.

  17. Motivazione (3) Tutta la faccenda del trasferimento dei dati si semplifica: i documenti strutturati e gerarchici sono un formato ragionevole di sintassi praticamente per qualunque cosa: documenti di testo, record di database, ecc. Nella W3C Note di Agosto 1999 (http://www.w3.org/TR/schema-arch) "Many data-oriented applications are being defined which build their own data structures on top of an XML document layer, effectively using XML documents as a transfer mechanism for structured data; ”

  18. Validazione e buona forma La buona forma di un documento XML è una proprietà puramente sintattica. La validazione, viceversa, è la verifica di un impegno preso sopra al formato, ad un livello già semantico: Mi impegno a scrivere dei documenti che siano formati da capitoli, ciascuno con un titolo e vari paragrafi, e ogni immagine con la sua didascalia. Per esprimere documenti di testo, i DTD probabilmente bastano, ma per esprimere blocchi di dati strutturati, è necessario un meccanismo di verifica più raffinato. XML Schema è stato pensato per fornire quel supporto di validazione che i DTD permettono solo parzialmente, in particolare sul contenuto degli elementi e degli attributi del documenti XML.

  19. XML Schema e DTD (1) Modularità I DTD offrono le entità parametriche per tutto: content model ripetuti, frammenti di DTD riusabili, modularizzazione delle specifiche. XML Schema offre: Un meccanismo di inclusionie di file(differenziato e sofisticato) Un sistema di tipi gerarchico e complesso Un sistema di specifica di frammenti riutilizzabili di content model e attributi. Gestione dei namespace I DTD ignorano i namespace. E' molto complesso far convivere DTD e qualifica degli elementi. XML Schema permette esplicitamente di qualificare gli elementi e gli attributi, e fornisce molte funzionalità di estensione o limitazione dei vincoli sugli elementi a seconda del loro namespace.

  20. XML Schema e DTD (2) Vincoli su elementi e attributi I DTD permettono un ragionevole controllo degli elementi strutturati, ma poca flessibilità sui content model misti. Inoltre non permettono vincoli sugli elementi di testo (#PCDATA e CDATA) a parte le liste di valori negli attributi XML Schema amplia il set di vincoli per gli elementi strutturati, ed è molto più flessibile negli elementi con CM misto. Inoltre permette di definire tipi semplici, ovvero di esprimere vincoli su dati di tipo stringa, in maniera completa e sofisticata. Documentazione esplicita Allegare documentazione per esseri umani in un DTD significa inserire commenti XML dentro al DTD. Questo è limitante e fragile (i parser eliminano i commenti). XML Schema permette di inserire annotazioni in maniera esplicita e controllata, in maniera che sopravviva al parser.

  21. XML Schema e DTD (3) Sintassi XML I DTD usano una sintassi propria e particolare, che richiede parser appositi e strumenti di generazione e verifica appositi. XML Schema usa XML come sintassi. Tutti gli strumenti che si usano per XML sono immediatamente utili: parser, visualizzatori, verificatori, ecc. Per contro, XML Schema è estremamente più verboso, tre o quattro volte più lungo del corrispondente DTD, e molto spesso meno chiaro da leggere. Ci sono state molte obiezioni su questo specifico aspetto, ma si è specificamente insistito per ricondurre tutto ad XML (altrimenti, che meta-sintassi sarebbe?)

  22. XML Schema E’ una delle attività del working group su XML. Ha prodotto 7 generazioni di working draft, per poi divenire recommendation nel maggio del 2001. E’ diviso in tre parti: XML Schema Part 0: Primer (un’introduzione) XML Schema Part 1: Structures (struttura del documento XML Schema) XML Schema Part 2: Datatypes (modello dei dati e meccanismi di estensione dei tipi)

  23. Formato di un XML Schema Un documento di XML Schema è racchiuso in un elemento <schema>, e può contenere, in varia forma ed ordine, i seguenti elementi: <import> ed <include> per inserire, in varia forma, altri frammenti di schema da altri documenti <simpleType> e <complexType> per la definizione di tipi denominati usabili in seguito <element> ed <attribute> per la definizione di elementi ed attributi globali del documento. <attributeGroup> e <group> per definire serie di attributi e gruppi di content model complessi e denominati. <notation> per definire notazioni non XML all’interno di un documento XML <annotation> per esprimere commenti per esseri umani o per applicazioni diverse dal parser di XML Schema.

  24. I tipi in XML Schema XML Schema usa i tipi per esprimere vincoli sul contenuto di elementi ed attributi. Un tipo semplice è un tipo di dati che non può contenere markup e non può avere attributi. In pratica è una sequenza di caratteri. E' una specificazione (e restrizione) di CDATA o #PCDATA. Un tipo complesso è un tipo di dati che può contenere markup e avere attributi. E' l'equivalente di un tipo strutturato o misto. XML predefinisce un grande numero di tipi semplici: string, decimal, float, boolean, uriReference, date, time, ecc. Ogni tipo semplice è caratterizzato da alcune proprietà, dette facets, che ne descrivono vincoli e formati (permessi ed obblighi). E’ data possibilità di derivare nuovi tipi, sia per restrizione che per estensione di permessi ed obblighi.

  25. Tipi semplici Gli elementi e gli attributi sono istanze di un tipo. I tipi semplici sono tipi stringa non ulteriormente strutturati, e possono essere usati per entrambi. XML Schema non fa nessuna distinzione tra attributi ed elementi con content model testo. <xsd:element name="price" type="xsd:decimal"/> <xsd:attribute name="code" type="xsd:ID"/> Sono predefiniti molti tipi semplici, che possono essere usati liberamente nelle definizioni. Il nome di un tipo semplice predefinito appartiene allo stesso namespace di XML Schema. E' possibile derivare i tipi semplici per restrizione, unione o lista.

  26. Una lista parziale di tipi semplici string: una stringa di caratteri. boolean: i valori 'true ' e 'false'. decimal: una stringa di numeri (con segno e punto): '-34.15 ' float: un reale in notazione scientifica: '12.78E-12 '. duration : una stringa per una durata temporale nel formato PnYnMnDTnHnMnS. Ad esempio 'P1Y2M3DT10H30M ' è la durata di 1 anno, 2 mesi, 3 giorni, 10 ore, e 30 minuti. date : una data nel formato CCYY-MM-DD: '2001-04-25 '. time : un valore di orario nel formato hh:mm:ss con una appendice opzionale per l'indicazione del fuso orario. Es.: '13:20:00+01:00 ' significa 1:20 PM in Middle European Time (+01:00). hexBinary: dati binari arbitrari in formato esadecimale: '0FB7'. anyURI: la stringa di un URI, come "http://www.w3.org/ ". Accetta sia URI relativi che assoluti. ID , IDREF: Una stringa senza whitespace con le stesse proprietà e vincoli di ID e IDREF nei DTD.

  27. Derivazione per restrizione Si parte da un tipo già definito e ne si restringe il set di valori leciti attraverso l'uso di facet: <xsd:element name="editore" type="Teditore"/> <xsd:simpleType name="Teditore"> <xsd:restriction base="xsd:string"> <xsd:enumeration value="Addison Wesley"/> <xsd:enumeration value="Academic Press"/> <xsd:enumeration value="Morgan Kaufmann"/> </xsd:restriction> </xsd:simpleType> <xsd:element name="data" type="Tdatarecente"/> <xsd:simpleType name=" Tdatarecente"> <xsd:restriction base="xsd:date"> <xsd:minInclusive value="2002-01-01"/> </xsd:restriction> </xsd:simpleType>

  28. Facets Per ogni tipo io posso precisare dei facets, delle caratteristiche indipendenti tra di loro che specificano aspetti del tipo: length, minLength, maxLength: numero richiesto, minimo e massimo di caratteri minExclusive, minInclusive, maxExclusive, maxInclusive: valore massimo e minimo, inclusivo ed esclusivo precision, scale: numero di cifre significative e di decimali significativi pattern: espressione regolare che il valore deve soddisfare enumeration: lista all’interno dei quali scegliere il valore (simile alla lista di valori leciti degli attributi nei DTD). period, duration, encoding, ecc.

  29. Derivazione per unione L'insieme dei valori leciti è data dall'unione dei valori leciti di due tipi semplici. <xsd:element name="prezzo" type="Tprezzo"> <xsd:simpleType name="Tprezzo"> <xsd:union> <xsd:simpleType> <xsd:restriction base="xsd:decimal"> <xsd:minExclusive value="0.0"/> </xsd:restriction> </xsd:simpleType> <xsd:simpleType> <xsd:restriction base="xsd:string"> <xsd:enumeration value="gratis"/> </xsd:restriction> </xsd:simpleType> </xsd:union> </xsd:simpleType>

  30. Derivazione per lista Sono valori leciti una lista separata da virgole di valori del tipo semplice specificato. <xsd:simpleType name="TListaDiNumeri"> <xsd:list itemType='xsd:decimal'/> </xsd:simpleType> <xsd:attribute name="coord" type="TListaDiNumeri"/> <area coord="25,30,75,90"/>

  31. Tipi complessi Sono tipi complessi: Content model ANY ed EMPTY Content model strutturati Content model misti Content model di qualunque tipo ma con attributi Non esistono tipi complessi predefiniti (o quasi). La derivazione può avvenire per restrizione o estensione.

  32. Derivare tipi complessi Ci sono due modi per derivare tipi complessi: Per restrizione: si limitano ulteriormente i vincoli espressi: modificando minOccurs e maxOccurs, fissando dei valori per certi elementi o attributi, o imponendo ad un elemento un sottotipo del tipo originario. Per estensione: aggiungendo al content model nuovi elementi o nuovi attributi. Attenzione: i nuovi elementi sono posti necessariamente alla fine degli altri.

  33. Definire elementi ed attributi Si usano gli elementi <element> e <attribute>. Se sono posti all’interno del tag schema sono elementi ed attributi globali (possono essere root di documenti). Altrimenti sono usabili solo all’interno di elementi che li prevedono come tipo. Questi hanno vari attributi importanti: Name: il nome del tag o dell’attributo (definizione locale) Ref: il nome di un elemento o attributo definito altrove (definizione globale) Type: il nome del tipo, se non esplicitato come content maxOccurs, minOccurs: il numero minimo e massimo di occorrenze Fixed, default, nullable, ecc.: specificano valori fissi, di default e determinano la possibilità di elementi nulli.

  34. Definizioni locali o globali Una definizione si dice globale se è posta all'interno del tag <schema>. In questo caso l'elemento o l'attributo è definito in maniera assoluta. L'elemento può essere un elemento radice del documento. Una definizione si dice locale se è inserita all'interno di un tag <complexType>. In questo caso l'elemento o l'attributo esiste solo se esiste un'istanza di quel tipo, e l'elemento non può essere un elemento radice del documento.

  35. Annotazioni Nei DTD l’unico posto dove mettere note e istruzioni di compilazione sono i commenti. Però i commenti sono a perdere: possono essere mangiati in qualunque fase dell’elaborazione. In XML Schema, invece, esiste un posto specifico dove mettere note ed istruzioni, l’elemento <annotation>. L’elemento <annotation> può contenere elementi <documentation> (pensati per essere letti da esseri umani) oppure elementi <appInfo>, pensati per essere digeriti da applicazioni specifiche <xsd:element name=’pippo'> <annotation> <documentation>elemento pippo</documentation> </annotation> ... Il resto della definizione</xsd:element>

  36. Inclusioni e importazioni In XML Schema, esistono meccanismi per dividere lo schema in più file, o per importare definizioni appartenenti ad altri namespace Include: Le nuove definizioni appartengono allo stesso namespace, ed è come se venissero inserite direttamente nel documento. Redefine: come include, le definizioni appartengono allo stesso namespace, ma possono venire ridefiniti tipi, elementi, gruppi, ecc. Import: le nuove definizioni appartengono ad un altro namespace, ed è l'unico modo per fare schemi che riguardino namespace multipli. <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.w1.org" xmlns="http://www.w1.org" xmlns:cd="http://www.w2.org"> <import namespace="http://www.w2.org" schemaLocation="http://www.w2.org/s1.xsd"/>

  37. Conclusioni Abbiamo parlato di XML Schema: Motivazioni e status Organizzazione dei tipi Definizione di elementi ed attributi Content model, gruppi ed altri aspetti

  38. Riferimenti P. V. Biron, A. Malhotra,XML Schema Part 2: Datatypes, W3C Recommendation 02 May 2001, http://www.w3.org/TR/xmlschema-2/ D. C. Fallside, XML Schema Part 0: Primer, W3C Recommendation, 2 May 2001,http://www.w3.org/TR/xmlschema-0/ A. Malhotra, M. Maloney, XML Schema Requirements, W3C Note 15 February 1999, http://www.w3.org/TR/NOTE-xml-schema-req H. S. Thompson, D. Beech, M. Maloney, N. Mendelsohn, XML Schema Part 1: Structures, W3C Recommendation 2 May 2001,http://www.w3.org/TR/xmlschema-1/

More Related