160 likes | 244 Views
Souborové formáty v OS. Informatika pro ekonomy II přednáška 5. Souborový formát. Pojem odvozený z pojmu „datový formát“. definuje způsob uložení dat v souboru. Místo popisu dat se používají jména formátů:. PDF, JPG, TXT, PNG, HTML, DOC, XLS, CSV.
E N D
Souborové formáty v OS Informatika pro ekonomy II přednáška 5
Souborový formát • Pojem odvozený z pojmu „datový formát“ • definuje způsob uložení dat v souboru. • Místo popisu dat se používají jména formátů: PDF, JPG, TXT, PNG, HTML, DOC, XLS, CSV... • Formáty lze rozdělit na textové a binární. 2
Textové formáty • Obsahuje textová data — jen zobrazitelné znaky, konce řádků a případný konec souboru. • V různých operačních systémech jsou řídicí znaky různé: 3
Textové formáty • Kódování zobrazitelných znaků je různé. • ASCII (pozice 0–127) — jednotné • Textový soubor jen s ASCII: plain text • Národní znaky, speciální znaky — rozdílné • Textový soubor s národ. znaky: extended text 4
Kódování národních znaků • Znakový kód na 1 B, starší. Příklady: Kameničtí, PC Latin 2, ISO 8859, Win CP 1250, KOI8čs (ukázky, rozdíl ISO a 1250). • Znakový kód na větším prostoru: ISO 10646 4 B — velmi neúsporné, stručnější kódování: 2 B Unicode, 1—2 B UTF-8, 2 B UTF 16 5
Významné textové formáty • CSV — Comma Separated Values (cut, grep, Excel...) • Zdrojové texty programů • Řada datových formátů: RTF, PS, SVG, XML 6
Dokument • Soubor obsahující — vlastní text, — formátovací značky. • Podle tvaru značek: textový/binární soubor • textový: HTML, XML, PostScript, TeX, RTF... • binární: DOC, SAM, INDD, Text602... 7
Binární formáty • Alespoň část informací vyjádřena jinak než čitelnou posloupností zobrazitelných znaků. • Výhodné pro okamžité zpracování (formát dat shodný s tvarem v operační paměti) • Někdy velmi náchylné k chybám, v případě poškození prakticky neopravitelné. • Možnost utajení formátu, nutnost použití určitého programu, viry... 8
Otevřené a uzavřené formáty • Souborový formát, jehož specifikace je volně dostupná, je otevřený. Formátyuzavřenéjsou utajovány. • Uzavřenost formátu umožňuje získat monopol pro jeho zpracování a zároveň silně omezuje možnosti využití uložených dat (DOC, XLS, PPT, CDR...). • Otevřené formáty jsou prostředkem pro výměnu informací, efektivní využití a zpracování dat (JPG, PDF, PNG, text...). 9
Přenositelnost formátu • Lze ji pracovně definovat jako množství programů schopných zpracovat tento formát. • Důležitý faktor — zpracování v různých OS. • Přenositelnost je úzce svázána s otevřeností formátu, ale závisí také na majiteli formátu (srov. DOC, PDF). • Přenositelnost textových formátu je obecně daleko větší. Binární otevřené formáty rovněž přenositelné. 10
Rozpoznání formátu • První krok — roztřídění na textový/binární. • Využití běžných programů (type, more) • Druhý krok — u rozšířeného textového formátu rozpoznat kódování textu a operační systém, kde soubor vznikl (postup!). • U binárních formátů je nutné použít rozpoznávací programy: • Unix: file, od; MS: není nástroj (zkusmo?) 11
Asociace formátů a aplikací • Usnadňuje zpracování dat laikům v OS MS • Princip — tabulka s řádky: formát -> aplikace(Tento počítač; Nástroje/Možnosti složky) • Spouštění aplikace v případě aktivace souboru příslušného formátu (stažení přes IE, dvojklik v manažeru, výběr v dokumentech...) • Orientace jen podle rozšíření (přípony) jména souboru, může vést ke zmatkům. 12
Asociace formátů a aplikací • Ideální stav: 1 formát — 1 aplikace(platí pro speciální případy, např. CDR) • Případ 1: více formátů — 1 aplikace(časté, ale neproblematické) • Případ 2: 1 formát — více aplikací(problém nejednoznačnosti, aktivuje se buď posledně instalovaná aplikace, nebo podle výběru z nabídky. Nepříjemné řešení.) 13
Asociace formátů a aplikací • Případ 3: 1 formát — žádná aplikace(chybové hlášení s nabídkou instalovaných aplikací, z nichž uživatel může vybrat — to ovšem prakticky nikdy nevede k úspěchu. XP: rozšíření nabídky programů z Internetu.) • Případ 4: žádný formát — 1 aplikace(buď aplikace žádné formáty nepotřebuje, nebo se jedná o aplikaci DOS nebo o chybnou instalaci.) 14
Konverze formátů • Změna formátu bez změny informačního obsahu. • V praxi — vzácné ideální případy. Často konverze vede ke ztrátě, ale i k nabytí informací. • Příklady: doc -> txt; csv -> xls • Provedení konverze:— speciálním programem— službami Open a Save (As) běžných programů 15
Konverze formátů — příklady • konverze čísel mezi textovou a binární podobou (algoritmus!) • Unix: convert — konverze obrazových formátů • cstocs — konverze kódování národních znaků • Open/Save — úprava dokumentních formátů (např. DOC -> RTF, XLS -> CSV...) 16