150 likes | 248 Views
Uložení dat v počítači. Informatika pro ekonomy II přednáška 4. Data v počítači. Data — formálně vyjádřená skutečnost (symbolicky vyjádřené údaje a hodnoty). v počítači — vše vyjádřeno dvojkovými hodnotami (důvod: technologie výroby počítačů). stanovení kódu — nekonečně mnoho možností.
E N D
Uložení dat v počítači Informatika pro ekonomy II přednáška 4
Data v počítači • Data — formálně vyjádřená skutečnost (symbolicky vyjádřené údaje a hodnoty). • v počítači — vše vyjádřeno dvojkovými hodnotami (důvod: technologie výroby počítačů) • stanovení kódu — nekonečně mnoho možností • údaje mají množinu povolených hodnota operací — datový typ
Výběr možností uložení • ze všech teoretických možností lze vybrat způsoby s vhodnými vlastnostmi • uložení čísel — dvojková soustava se zarovnáním na rozměr paměťových míst, přirozená, celá, racionální čísla (viz předmět VTA) • uložení textu — posloupnost znaků kódovaných podle znakového kódu, ASCII, národní znaky • ostatní datové typy — většinou lze reprezentovat čísly nebo znaky nebo kombinací
Znakový kód • Znaky — řídicí a zobrazitelné. • Řídicí znaky — jsou určeny pro ovládání přídavných zařízení (nebo programu). • Zobrazitelné znaky — jsou určeny pro zobrazení textu. • Národní znaky — jsou určeny pro zobrazení textů v jiných jazycích než v angličtině.
Kódování národních znaků • Žádný znakový kód nebyl původně navržen pro zobrazování národních znaků. • Znakový kód ASCII (ISO 646) — jen 128 hodnot, sedmý bit určen pro zabezpečení při přenosech. • Nejsnadnější varianta — využití zbylých 128 pozic; 1 znak = 1 byte • Způsob využití — zcela nejednotný. • Příklady: Kamenických, PC Latin 1 a 2 (CP 852), ISO 8859 (16 částí, CS=2), KOI, Windows CP 1250
Kódování národních znaků • 256 pozic je málo — hledají se další možnosti • ISO 10 646 — univerzální prostor 4 B, tj. přes 4 miliardy znaků; UCS — Universal character set • Univerzální způsob je zbytečně neúsporný, UTF — UCS Transformation Format • UTF-8, UTF-16 — jedna z možností zmenšení potřebného prostoru (1—2 B) • Unicode — vždy 2 B
110010 110111 00110010 00110111 32 37 Vyjádření hodnot datového typu Definice způsobu uložení jednotlivých hodnot =datový formát Příklad 1: věk osoby — 27 let a) převod čísla do dvojkové soustavy 11011 00011011 1b b) zápis čísla pomocí znaků (znakový kód — ASCII?)
7 'C' 'i' 'm' 'r' 'm' 'a' 'n' 43 69 6d 72 6d 61 6e 00 07 43 69 6d 72 6d 61 6e 43 69 6d 72 6d 61 6e 20 20 20 43 69 6d 72 6d 61 6e 0d 0a 'C' 'i' 'm' 'r' 'm' 'a' 'n' ' ' ' ' ' ' Vyjádření hodnot datového typu Příklad 2: příjmení osoby — Cimrman a) s určením délky b) s oddělovači
43 69 6d 72 6d 61 6e 00 1b 43 'C' 'i' 69 'm' 6d 'r' 72 'm' 6d 61 'a' 6e 'n' 20 ' ' ' ' 20 ' ' 20 '2' 32 37 '7' Porovnání způsobů uložení a) tvar použitý v operační paměti b) tvar použitelný pro vstup nebo výstup
Formát dat • V operační paměti jsou obvykle data ve tvaru vhodném pro zpracování (výpočty, řazení...) • Viditelný tvar (tiskárna, displej, klávesnice...) musí být složen výhradně z čitelných (zobrazitelných) znaků • Formát dat = způsob (tvar) uložení dat v jakékoliv paměti počítače.
07 43 69 6d 72 6d 61 6e 1b 03 4b 6f e8 ed 21 10 4b 72 Popis formátu • Popis formátu, tj. přesný význam jednotlivých bitů (bytů) dat = formátová specifikace • Příklad formátové specifikace: • Jeden byte — délka L • 2. Řetězec ISO 8859-2 (příjmení), L bytů • 3. Jeden byte věk, bin. ... atd.
Druh formátu • Jsou-li všechny prvky formátu složeny výhradně ze zobrazitelných znaků, mezi nimiž jsou použity jako oddělovače nejvýše konce řádků (na konci dat nejvýše 1 znak konce souboru), pak se jedná o textový formát. • Jsou-li alespoň některé prvky formátu řešeny jiným způsobem (řídicími znaky), jedná seo formát netextový, tj. binární.
Vlastnosti formátů Textový formát: • data jsou přímo čitelná člověkem • pro zpracování obvykle nutná změna vyjádření • zpracovatelný velkým množstvím programů • odolnost vůči porušení (ztrátě) informací • nenapadnutelné virem • většinou nižší úspornost zobrazení
Vlastnosti formátů Binární formát: • data nejsou přímo čitelná člověkem • vhodný pro přímé zpracování • nízká přenositelnost, závisí na určitém programu • snadná ztráta všech informací při porušení • napadnutelné virem, lze ukrýt mnoho informací • někdy maximálně úsporný (ale i naopak!)
Souborový formát • Specifikace tvaru dat uložených v souboru • Podle druhu dat lze soubory rozdělit na textové a binární. • Datové soubory programů určitého zaměření mohou být v obojím formátu — mají rozdílné vlastnosti a možnosti použití. To má z hlediska využití daného vybavení zásadní význam.