180 likes | 276 Views
XML a datový standard. 2.11.2000 Zden ě k Jirkovec Softwarové Aplikace a systémy. XML. Principy XML Kontrola správnosti dokumentů Nástroje pro XML Datové rozhraní v XML Zdroje informací. Principy XML. Značkovací jazyky, původně pro texty ; SGML, HTML, TEX …
E N D
XML a datový standard 2.11.2000 Zdeněk Jirkovec Softwarové Aplikace a systémy
XML • Principy XML • Kontrola správnosti dokumentů • Nástroje pro XML • Datové rozhraní v XML • Zdroje informací
Principy XML • Značkovací jazyky, původně pro texty; SGML, HTML, TEX … • XML – definujeme vlastní struktury dokumentů, názvy značek, atributů a jejich vazby • Máme nástroje pro jejich popis a kontrolu • Základní formalismy XML Značky (tagy) <nadpis>Zámek</nadpis> Elementy – vyznačují strukturu dokumentu a význam jednotlivých částí - obsahují data nebo jiné elementy počáteční koncová Obsah elementu nadpis
Název atributu Hodnota atributu Attributy – určují, parametrizují význam elementů <cenamena = “USD”>899.50</cena> XML deklarace: <?xml version="1.0" encoding="cp852" ?> Kořenový element: <std_lab verze="10"> <!–- ohraničuje celý XML dokument --> </std_lab > Kódování dokumentu
Následuje příklad… • <ip> • <rodne_cislo>476105459</rodne_cislo> • <jmeno>Anna</jmeno> • <prijmeni>KOZLOVA</prijmeni> • <titul_p>Ing.</titul_p> • <d_nar>05</d_nar> • <m_nar>11</m_nar> • <r_nar>1947</r_nar> • <pohlavi>F</pohlavi> • <rodne_prijmeni>NOVAKOVA</rodne_prijmeni> • </ip>
Přehled vlastností • Univerzální a otevřený formát, není vázán licencí • Specifikace XML je jednoduchá a je volně k dispozici (W3C) • Textový formát přenositelný mezi platformami • Formát srozumitelný pro člověka i počítač • Opakované využití informací, snadná konverze do dalších formátů • Uživatelské i programátorské nástroje jsou běžně k dispozici • Specifikace definuje i kontrolu správnosti dokumentů
Kontrola správnosti dokumentů • Well formed – formální správnost • Validace – kontrola struktury a obsahu • Parsery • Definiční soubory DTD • definuje názvy elementů a atributů • definuje obsah elementů (tím i strukturu dokumentu) • definuje typ a obsah atributů • definuje povinnost výskytu prvků struktury
Fragment DTD… Výskyt prvku <!-- kody pro pojistovnu --> <!ELEMENT au (auz+, datum)> <!-- vykony pro pojistovnu --> <!ELEMENT auz (datum, diag, kodvyk, mnozstvi?, cetnost?)> <!ATTLIST auz typ_d NMTOKEN #IMPLIED typ_p (V | 1 | 2 | 3 | 4 | 5) #REQUIRED > Výskyt atributu Výčet hodnot
…a dokumentu <au> -<auz typ_d="90" typ_p="V"> <datum typ="I">12041999</datum> <diag poradi="1">I10</diag> <kodvyk>81471</kodvyk> <cetnost>1</cetnost> </auz> <datum typ="I">12041999</datum> </au>
Další upřesnění • DTD • slabá typová kontrola • určeno původně hlavně pro texty • DT4DTD (Data Types for DTD). • doplňuje kontrolu typů, kompatibilní • XML Schema (W3C, Bizz Talk) • přesnější typová definice, rozsahy hodnot • má syntax XML dokumentu
Nástroje pro XML • Editory • Parsery • CSS, CSSS • XSL, XSLT • XPATH
Parsery • Kontrola správnosti dokumentů • Kontrola proti DTD, schema atd… • SAX - Simple API for XML • řízení pomocí událostí • DOM – Document Object Model • objektové API
XSL • XSL (eXtensible Stylesheet Language). • XSLT (XSL Transformation) • Výsledek bude XML, TXT, HTML… XSLT Procesor XML HTML XSL
Datové rozhraní v XML • Původně hlavně B2B aplikace • Nahrazuje nestrukturované textové formy • Definováno pomocí DTD nebo schema • Kontrola formální správnosti při vstupu a výstupu dat z informačního systému • Nezávislé na platformě HW, OS, SW
Datový standard MZ v XML • Vychází z platného standardu • Změna formy, ne obsahu • Přesné označení dat zabrání záměně významu dat • Žádné „výplňové znaky“ • Internetové technologie • Otevřené pro další změny
Co máme • Definované bloky @PM, @IP … • Definovaná formální a logická struktura • Odpovídá elementům <pm> </pm> <ip> </ip> • Číselníky • Součástí standardu (kód, typ položky…) • Externí (VZP, MKN-10, NCLP…)
Co potřebujeme • Kořenový element • Ostatní data - elementy nebo atributy ? • základní problém návrhu struktury XML • opakované využití struktur (adresa, …) • v atributech budou data mající charakter parametrů a příznaků • Jak je nazvat ? • délka vypovídací schopnost • DTD • Definuje strukturu, názvy a obsah elementů a atributů • Nedefinuje jejich význam – poznámky a externí definice
Zdroje informací • http://www.w3.org/TR/REC-xml • http://www.jclark.com/ • http://www.oasis-open.org • http://www.kosek.cz/clanky/swn-xml/index.html • http://www.zvon.org/