110 likes | 337 Views
Informácie okolo nás. Kódovanie znakov. Informácie okolo nás. Od obrázkov k písmu. Od 9. tisícročia pred n.l. sa začali objavovať prvé viacfarebné kresby človeka a zvierat v pohybe Obrázkové písmo je prvý dôležitý krok ku vzniku hláskového písma
E N D
Informácie okolo nás Kódovanie znakov
Informácie okolo nás Od obrázkov k písmu • Od 9. tisícročia pred n.l. sa začali objavovať prvé viacfarebné kresby človeka a zvierat v pohybe • Obrázkové písmo je prvý dôležitý krok ku vzniku hláskového písma • Pred 5000 rokmi Féničania položili základy abecedy, v ktorej je základom zápis hlásky (s 22 znakmi s ľavosmerným spôsobom písania ), nie zápis celého slova • Neskôr hláskové písmo prevzali Gréci, a vznikla latinka a čiastočne aj cyrilika GMRŠ Košice
Informácie okolo nás Kód • V komunikácii je kód pravidlo pre prevod informácie (napríklad listu, slova alebo frázy) na inú formu alebo reprezentáciu, nie nevyhnutne rovnakého typu. • Vo všeobecnosti je kód zobrazenie, ktoré každému znaku alebo postupnosti znakov daného súboru znakov (vzorov) jednoznačne priradí znak alebo postupnosť znakov (obrazov) z iného súboru znakov. • Postup, pomocou ktorého sa preloží znak alebo postupnosť znakov z množiny vzorov do množiny obrazov, sa volá kódovanie (encoding); opačnému postupu hovoríme dekódovanie (decoding). • Digitálne počítače: všetky údaje (textové, zvukové aj obrazové) v počítači sú reprezentované pomocou kódov. GMRŠ Košice
Informácie okolo nás Kódovanie znakov • Na rozdiel od čísel, znaky textu nevieme previesť do dvojkovej sústavy, preto bolo potrebné vymyslieť iný spôsob ako jednoznačne priradiť určitému znaku práve jednu kombináciu núl a jednotiek, ktorá tento znak v počítači bude reprezentovať. • Okrem číslic 0,1..9 používame znaky A,B...Z a diakritiku • Okrem toho používame aj neviditeľné znaky (biele) : ENTER,TAB • Stredoeurópske jazyky takisto používajú diakritiku • Neexistuje žiadny univerzálny spôsob ako to urobiť, každý výrobca počítačov tento problém riešil iným spôsobom, preto existuje viacero znakových kódov. GMRŠ Košice
Informácie okolo nás Kódové tabuľky • Poriadok do tohto chaosu sa snažil zaviesť americký úrad pre normalizáciu ANSI (American National Standards Institute), ktorý vyhlásil jeden spôsob, ktorý by mali všetci používať – ASCII(American Standard Code for Information Interchange) • Kód ASCII obsahuje 128 platných znakov (ľavé tlačídlo Alt a na numerickej klávesnici vyťukáme príslušný kód) • Slovensko: druhú polovicu tabuľky stanovuje medzinárodná norma ISO 8859-2, ktorá sa tiež nazýva Latin 2. Firma Microsoft však tento štandard nepoužíva, používa štandard schválený americkým úradom ANSI označovaný tiež Windows-1250. GMRŠ Košice
Informácie okolo nás ASCII tabuľka GMRŠ Košice
Informácie okolo nás Windows 1250 GMRŠ Košice
Informácie okolo nás ISO/IEC8859-2 GMRŠ Košice
Informácie okolo nás UNICODE • Unicode je medzinárodný štandard, ktorého cieľom je definovať kódovaciu schému schopnú reprezentovať väčšinu znakov používaných v písaných jazykoch spolu s inými symbolmi. • Napriek technickým problémom, obmedzeniam a kritike sa zo štandardu Unicode stala dominantná kódovacia schéma používaná pri internacionalizácii softvéru a viacjazyčných prostredí. • Toto kódovanie používa 16 bitov na zakódovanie jedného znaku, čo umožňuje zakódovať 65536 možných znakov • Tento spôsob kódovania používa i kancelársky balík MS Office. Toto kódovanie zabezpečuje, že ten istý znak má rovnaký kód v každej krajine i na každom type počítača. Nevýhodou tohto kódovania je, že znaky, ktoré sme predtým vedeli zakódovať iba ôsmymi bitmi v kódovaní Unicode, sú kódované 16 bitmi, a teda zaberajú viac pamäte. GMRŠ Košice
Informácie okolo nás UTF-8 Unicode Transformation Format • Istým vylepšením tohto kódovania je kódovanie UTF-8. V tomto kódovaní je prvých 128 znakov tabuľky ASCII(tieto sú pre všetky krajiny rovnaké) zakódovaných pomocou 8 bitov a zvyšné znaky sú zakódované 16, 24, 32, 40 až 48 bitmi. • Toto kódovanie je výhodné pre americky hovoriace krajiny a krajiny, v ktorých väčšinu znakov textu tvorí prvých 128 znakov tabuľky ASCII. • Pre všetky znaky obsiahnuté v znakovej sade ASCII (t.j. číslice, písmená bez diakritiky, atď) vyžaduje iba 1 bajt a pre reprezentáciu slovenských znakov s diakritikou 2 bajty GMRŠ Košice
Informácie okolo nás Príklady • Š .... 13810 = 100010102 • 010011012 = 01002...16*4 = 64 ... stĺpec 11012 = 13 ... riadok ... M GMRŠ Košice