1 / 27

XML i nowoczesne technologie zarządzania treścią

XML i nowoczesne technologie zarządzania treścią. Michał Kuciapski m.kuciapski@univ.gda.pl. Tematyka. Rozwój technik znakowania tekstu Koncepcja XML-a. Markup – znakowanie. Markup Languages: SGML – Standard Generalized Markup Language HTML – Hypertext Markup Language

trish
Download Presentation

XML i nowoczesne technologie zarządzania treścią

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. XML i nowoczesne technologiezarządzania treścią Michał Kuciapski m.kuciapski@univ.gda.pl

  2. Tematyka • Rozwój technik znakowania tekstu • Koncepcja XML-a

  3. Markup – znakowanie • Markup Languages: • SGML – Standard Generalized Markup Language • HTML – Hypertext Markup Language • XML – Extensible Markup Language • Markup:the process of marking manuscript copy for typesetting with directions for use of type fonts and sizes, spacing, indentation, etc.(The Chicago Manual Of Style).

  4. Początki znakowania tekstu Nie lubię chodzić na wybory. Za to na imprezy jak najbardziej.

  5. Znakowanie tekstu w epoce komputerów Nie lubię chodzić na wybory. Za to na imprezy jak najbardziej. Treść + {pogróbienie} {wyłącz_pogrubienie} {nowy_wiersz} {wcięcie} Formatowanie = {pogróbienie} Nie lubię {wyłącz_pogrubienie} lubię chodzić na wybory {nowy_wiersz} {wcięcie} Za to na imprezy jak najbardziej Dokument | Nie lubię chodzić na wybory. Za to na imprezy jak najbardziej. Wynik

  6. Przykłady języków znakowania • Frame (MIF) <Font <FTag ‘Jan’>> <String ‘Jan’> • RTF {\b\f5\cf1 Jan} • PostScript /Times-BoldR 900 ff (Jan)W • TeX/LaTeX \textbf{Jan} • Ventura <B>Jan<D> • HTML <B> Jan </B>

  7. Korzenie • Lata 60-te XX wieku: • 1967 – William Tunnicliffe, prezes Graphic Communications Association prezentuje ideę oddzielenia zawartości merytorycznej dokumentów od formatu • Stanley Rice proponuje użycie uniwersalnych znaczników do znakowania struktury tekstu,

  8. Formaty aplikacji • Większość aplikacji wprowadza własny wewnętrzny format. • Nowe wersje aplikacji często w raz z rozbudową funkcjonalności wprowadzają zmiany do używanego formatu: • wsteczna kompatybilność • brak możliwości zapisu do formatu poprzednich wersji • Konwertery: • tylko do najpopularniejszych formatów, • możliwość utraty danych podczas konwersji.

  9. Standardy • Brak uznanych standardów • Istnieją pesudostandardy w różnych dziedzinach: • biurowe: Microsoft Word, • naukowe: Postscript, TeX, • Internetowe: HTML, GIF, JPG, • wymiany danych: EDIFACT. • Standard musi być: • własnością publiczną, • otwarty i jawny, • niezależny od producenta oprogramowania.

  10. Potrzeby w zakresie standardów • Wiele informacji elektronicznych powoduje potrzebę struktury: • Trudność dopasowania jednego formatu dokumentu do wszystkiego • Problemy z niekompatybilnymi formatami

  11. Ewolucja Internetu aplikacja | aplikacja aplikacja | człowiek człowiek | aplikacja czas początek sytuacja obecna

  12. Historia języków uogólnionego znakowania tekstu • 1969: GML – Generalized Markup Language • 1986: SGML – Standard Generalized Markup Language • 1991: powstaje World Wide Web. • 1994: HTML 2.0 zdefiniowany jako zastosowanie SGML-a. • 1998: XML – Extensible Markup Language, World Wide Web Consortium.

  13. SGML • Pierwsze szerzej znane zastosowania SGML: • Electronic Manuscript Project, Association of American Publishers, 1987 • CALS – Computer-Aided Acquisition and Logistic Support, US Department of Defense, MIL-M-28001, February 1988. • Standardy pokrewne: • DSSSL – Document Style Semantics and Specification Language, • HyTime: • meta-notacja dla linków, • opis struktur multimedialnych, rozciągniętych w czasie.

  14. World Wide Web Consortium (W3C) • Wiele standardów internetowych: • HTML – Hyper Text Markup Language • HTTP – Hyper Text Transfer Protocol • CSS – Cascading StyleSheets • XML – Extensible Markup Language

  15. World Wide Web Consortium (W3C) - XML • Najważniejsza rekomendacja ostatnich lat • Twórcy: Tim Bray (Netscape), Jean Paoli (Microsoft), C.M. Sperberg-McQueen (University of Illinois) • Obecne dominują prace nad standardami związanymi XML-em

  16. SGML / XML Cel - Oddzielenie znaczenia tekstuod sposobu prezentacji <POLITYK>Andrzej Lepper</POLITYK> <WYPOWIEDŹ>I tak jeszcze wrócę do władzy</WYPOWIEDŹ>

  17. POLITYK nowy akapit do lewej pobrubienie WYPOWIEDŹ nowy wiersz wcięcie 1,5 cm Wyrównanie do lewej Prezentacja – przykład 1 Lepper I tak jeszcze wrócę do władzy

  18. POLITYK na marginesie tekst pionowo kolor niebieski hiperlink do biografi WYPOWIEDŹ nowy wiersz kursywa Prezentacja – przykład 2 I tak jeszcze wrócę do władzy LEPPER

  19. Modele • Przykłady: • encyklopedia: <nazwisko>, <imie>, <ur> <zm> <dane> • ubezpieczenie: <dataPolisy>, <wartośćPolisy> • atrykuł: <tytuł>, <autor>, <treść>, <obrazek>, <podpis> • samochód: <marka>, <model>, <rocznik>, <kolor>

  20. Koncepcja metajęzyku • Stan wyjściowy: • Brak wspólnego języka • Pytanie czy jest możliwe jego opracowanie • Wspólny metajęzyk: • znana gramatyka, • jednolita metodologia • identyczne narzędzia • Tworzenie języków pochodnych dla specyficznych zastosowań.

  21. VRML HTML SVG RDF CDF ... ... Genealogia XML XML SGML GML

  22. Czym jest XML • XML nie jest językiem programowania • XML jest sposobem zapamiętywania danych wraz ze strukturą: • otwarty • elastyczny • bezpłatny • niezależny od platformy sprzętowej • XML ma format tekstowy • XML jest podstawą do tworzenia języków specyficznych dla zastosowań.

  23. Struktura XML Deklaracja XML Element główny Atrybut Element Znacznik początkowy Zawartość tekstowa Znacznik końcowy

  24. SGML vs XML • Koncepcja: wiele małych komunikujących się ze sobą modułów. • Opcjonalne definiowanie struktury. • Uproszczona składnia. • Łatwość tworzenia parserów. • Darmowe narzędzia. • Koncepcja: jeden duży system zarządzania treścią. • Konieczność definiowania struktury. • Skomplikowana składnia, wiele opcji. • Trudność tworzenia parserów. • Bardzo drogie narzędzia.

  25. HTML vs XML • Znaczenie elementów i ich atrybutów określa użytkownik lub aplikacja. • Znaczenie elementów i ich atrybutów z góry określone. • Interpretację elementów określa standard, a w praktyce przeglądarki internetowe. • <p> może w jednym dokumencie oznaczać paragraf, w drugim pomoc, a w trzecim pismo odręczne. • To, co jest poprawne również określają przeglądarki internetowe. • Poprawność XML-a jest ściśle określona przez specyfikację.

  26. Zastosowania XML Elektroniczna wymiana danych i integracja aplikacji: Zarządzanie dokumentami, przechowywanie danych: • Pierwotne zastosowanie SGML • Nowa klasa zastosowań • Dokumenty tworzone przez człowieka i przeznaczone dla człowieka • Dokumenty tworzone i przetwarzane automatycznie • Długi czas życia dokumentów • Dokumenty tworzone tylko na czas komunikacji – serwisy XML • Typowy model mieszany zawartości • Konieczność dokładnego kontrolowania struktury i zawartości - SOAP

  27. Dwie twarze XML-a Baza danych: Dokument tekstowy: <zamowienie> <pozycja> <nazwa>Laptop</nazwa> <jednostka>szt </jednostka> <ilosc>3</ilosc> </pozycja> <zamawiajacy id=”123456”> <imie>Anna</imie> <nazwisko>Płocka </nazwisko> <firma>UG </firma> </zamawiajacy> </zamowienie>

More Related