250 likes | 469 Views
Digitalizácia. Čo je to digitalizácia?. Je to prevod analógovej (spojitej) informácie (zvuk, svetlo, teplo) na informáciu digitálnu (číselnú, nespojitú) Je to teda priradenie číselných hodnôt (kombinácie bitov) k hodnotám spojitej veličiny
E N D
Čo je to digitalizácia? • Je to prevod analógovej (spojitej) informácie (zvuk, svetlo, teplo) na informáciu digitálnu (číselnú, nespojitú) • Je to teda priradenie číselných hodnôt (kombinácie bitov) k hodnotám spojitej veličiny • Prevod do digitálnej formy musí byť taký, aby bolo možné previesť informáciu späť na analógový tvar s dostatočnou presnosťou
Prečo digitalizujeme? • Digitalizáciou docielime: • Možnosť spracovania dát v počítačoch • Zmenšenie nárokov na objem (množstvo) prenášaných dát
Ako delíme digitalizáciu? • Primárna digitalizácia spočíva v priamom zbere analógovej veličiny snímaním a jej prevod na digitálnu (snímanie obrazu kamerou a pod.) • Sekundárna digitalizácia je proces, pri ktorom digitalizujeme už určitým spôsobom spracované informácie (napr. skenovanie máp)
Čo digitalizujeme najčastejšie? • Text – znaky rôznych abecied prevádzame z obrazovej formy do digitálnej formy • Grafiku – obrazy a symboly digitalizujeme do stacionárnych obrázkov alebo pohyblivých sekvencií • Zvuk – zvukové vlny spracúvame pomocou periférií do digitálnej formy vhodnej pre úpravu alebo výskum, prípadne prevod do textovej formy
Digitalizácia textu • Pre digitalizáciu tlačeného textu používame ručné, alebo stolné skenery, ktoré nepotrebujú snímať s veľkým rozlíšením a postačuje im čiernobiele snímanie obrazu • Po zosnímaní obrazu sa obraz použije ako vstup pre OCR softvér (optical character recognition), ktorý pomocou rôznych algoritmov rozpozná znaky a prevedie ich do textovej podoby
OCR • Softvér pre OCR rozpoznáva znaky buď automaticky, alebo sa pri prvých prevodoch musí naučiť, ktorý znak grafickej predlohy prislúcha znaku v danej kódovej tabuľke (ASCII, Unicode a pod.) • V súčasnosti sa pri rozpoznávaní znakov používajú prvky umelej inteligencie a to konkrétne neurónové siete • Rozpoznávať nemusíme len štandardné znaky ale niektoré OCR dokážu rozpoznávať napr. aj brailovo písmo
Vhodnosť použitia OCR • OCR má najlepšie výsledky pri práci s obrazom o rozlíšení aspoň 150dpi, z kvalitnej predlohy vytlačenej na laserovej, atramentovej alebo termosublimačnej tlačiarni, či z knižných predlôh • Horšie výsledky je možné očakávať pri rozpoznávaní predlôh vytlačených na menej kvalitných ihličkových tlačiarňach • Po každom prevode textu je však potrebné prekontrolovať správnosť prevodu a prípadné chyby vzniknuté pri rozpoznávaní dodatočne v texte opraviť
Kódovanie textu • Text sa kóduje pomocou rôznych znakových sád a abecied, ktoré určitým číselným kódom písmen priradzujú ich grafickú reprezentáciu • V minulosti sa používali kódové stránky ASCII (7bit), EASCII (8bit) a ich modifikácie • V súčasnosti sa vo veľkej miere využíva kódovanie Unicode, ktoré je schopné zakódovať viac ako milión znakov
Digitalizácia obrazu • Obrazy môžeme digitalizovať z grafických predlôh, napríklad skenovaním farebných obrázkov alebo priamym spracovaním napr. snímaním obrazu digitálnym fotoaparátom alebo kamerou • V súčasnosti už existuje možnosť snímať aj trojrozmerné predlohy prostredníctvom špeciálnych 3D skenerov
Čo sníma obraz? • Obraz je vo všetkých zariadeniach na to určených snímaný prostredníctvom CCD snímačov • CCD snímač je zložený z množstva fotocitlivých polovodičových súčastí, ktoré sú schopné snímať intenzitu a farbu svetla, ktoré na nich dopadá • Vyrábajú sa v lineárnom vyhotovení (snímajú čiarové kódy) alebo v plošnom vyhotovení (snímajú celé plochy – fotoaparáty, kamery)
Čo so zosnímaným obrazom? • CCD snímač zosníma obraz a jeho výstupom je potom tzv. surová forma obrazu (RAW) • Tento zosnímaný obraz sa potom prevádza buď ako rastrová grafika (bmp, jpg, gif) alebo ako vektorová grafika (cdr, svg) • Z obrazov sa môžu vytvárať aj sekvencie, teda animácie alebo filmy
Rastrová grafika • Rastrová grafika je v podstate obraz, rozdelený na malé grafické elementy – body (štvorčeky, pixely) usporiadané do matice • Každý bod má v matici určenú presnú polohu, farbu, prípadne priehľadnosť • Podľa počtu farieb používaných v obrázku je potom použité určité množstvo dát-bitov pre popísanie farby jedného pixelu • Typickým znakom rastrových obráz- kov je, že sa ich zväčšovaním (pribli- žovaním) zhoršuje kvalita zobrazenia
Vektorová grafika • Vektorová grafika popisuje jednotlivé časti obrazu ako geometrické útvary (bod, úsečka, kružnica, mnohouholník) pomocou vzťahov používaných v analytickej geometrii • Pre popísanie kruhu teda stačí popísať len súradnice jeho stredu, polomer, farbu okraja a farbu výplne, čím sa dramaticky zníži množstvo údajov potrebných pre popis celého obrázku • Pri zmene rozmerov vektorových obrázkov sa neprejavuje efekt zhoršenia kvality, pretože meníme len súradnice a nie celé „kusy“ obrazu
Farby • Farby sa v počítačovej grafike reprezentujú pomocou rôznych farebných modelov v závislosti od potrebného počtu použitých farieb • Najrozšírenejšie modely počítačovej grafiky sú aditívny model RGB a substraktívny model CMYK
RGB model • RGB model je aditívny model, teda založený na pridávaní RGB svetiel na tmavú (nesvietiacu) podložku (klasický monitor či televízor). • Pridaním všetkých svetiel naplno sa vytvorí biela.
CMYK model • CMYK model je substraktívny model, teda založený na odčítaní RGB farieb pri odraze bieleho svetla od atramentu • Pridaním všetkých atramentov naplno sa vytvorí čierna farba, resp. všetko svetlo bude pohltené.
Digitalizácia zvuku • Pri digitalizácii zvuku dochádza k snímaniu zvuku pomocou mikrofónu a jeho následný prevod do digitálnej formy prostredníctvom analógovo-digitálneho (A/D) prevodníka • Digitalizácia je proces zložený z troch častí a to: vzorkovanie, kvantovanie, kódovanie
Vzorkovanie • Vzorkovanie je proces, pri ktorom sa v určitých časových intervaloch (pri vzorkovacej frekvencii) snímajú hodnoty analógového vstupu • Je to teda rozdelenie spojitého signálu na malé časové úseky • Čím kratší je časový interval vzorkovania (vyššia frekvencia), tým kvalitnejšie bude zvuk zaznamenaný, ale nároky na pamäťový priestor sa zvyšujú
Kvantovanie • Kvantovanie je proces, pri ktorom sa hodnota snímanej veličiny „zaokrúhli“ na najbližšiu hodnotu digitálnej veličiny • Pri kvantovaní teda jednotlivým časovým úsekom, ktoré sme získali pri vzorkovaní, priradíme hodnotu amplitúdy • Aj tu platí, že čím viac kvánt (úrovní) máme, tým je signál kvalitnejší, no nároky na pamäť sa zvyšujú
Kódovanie • Kódovaním zabezpečíme uloženie spracovaných dát do podoby vhodnej pre počítač • Je to vlastne prepis kvantovaných úrovní do číselnej reprezentácie • Od toho, koľko bitov použijeme na reprezentáciu kvantovej úrovne, závisí kvalita zvuku
Kompresia • Pre zmenšenie veľkosti digitalizovanej informácie pri zachovaní určitej úrovne kvality sa používa kompresia • Kompresné algoritmy sú schopné odstrániť z digitalizovanej informácie nepotrebné časti (napr. nepočuteľné zvuky nad 20kHz alebo pod 20Hz) a zároveň môžu použiť princípy zmenšovania množstva údajov pomocou postupov známych pri „zipovaní“ bežných súborov