430 likes | 596 Views
Különböző médiaelemek feldolgozása. Összeállította : Kosztyán Zsolt Tibor e-mail : kzst@almos.vein.hu, kzst@vision.vein.hu, kzst@ond.vein.hu, honlap : http://vision.vein.hu/~kzst. Médiumok. Szöveg Kép Hang Videó Animáció. Szöveg bevitele. Hagyományos módon – begépeléssel
E N D
Különböző médiaelemek feldolgozása Összeállította: Kosztyán Zsolt Tibor e-mail: kzst@almos.vein.hu, kzst@vision.vein.hu, kzst@ond.vein.hu, honlap: http://vision.vein.hu/~kzst
Médiumok • Szöveg • Kép • Hang • Videó • Animáció
Szöveg bevitele • Hagyományos módon – begépeléssel • Már korábban elkészült szöveg beszerkesztése • OCR (karakterfelismerő program segítségével)
OCR karakterfelismerő algoritmusok • Összehasonlítás • Körvonalelemzés
Szövegfelismerés lépései • Feldolgozandó kép elérése • A kép előfeldolgozása • Felbontás, zónázás • Felismerés • Ellenőrzés, tanítás • Mentés
Szöveg elhelyezése a képernyőn • Legyen a szöveg megfelelően nagy méretű • Ne legyen túl sok betűtípus a képernyőn • Ne legyen túl sok szöveg egy képernyőn
Színmetrika - alapfogalmak • Az elektromágneses sugárzás 1 nm és 1 mm közé eső részét hívjuk optikai sugárzásnak, ennek része a látható sugárzás. • A színinger a látható színképtartományban sugárzott teljesítmény.
Színlátási rendellenességek • a protanópia, vagy vörös gyengeség. Ezen személyek a vörös színeket sötét árnyalatúnak látják „vörös” színészleletük nincs. Valószínű oka, hogy az L fotopigmensük hiányzik (vagy nincsenek L csapjaik, vagy az M csapokra jellemző fotopigmens van ezen csapokban is. • a deuteranópia, vagy zöld gyengeség. Deuteranopok a zöld színeket látják viszonylag sötéteknek, ez a leggyakoribb színtéveszési forma. Valószínű oka, hogy az M fotopigmensük hiányzik (vagy nincsenek M csapjaik, vagy az L csapokra jellemző fotopigmens van ezen csapokban is. • tritanópia, vagy kék-vakság: tritanopok a kék színeket nem látják (igen ritkán fordul elő, valószínű oka az S-csappigmens hiánya).
Színmetrika – Grasmann törvények • Szimmetria törvény: Ha Astimulus megfelelBstimulussal, akkor B stimulus is megfelel Astimulussal. • Transitivitás törvénye:Ha Amegfelel B-vel és B megfelel C-vel, akkor A is megfelel C-vel. • Proporcionalitás törvénye: Ha A megfelel B-vel, akkor aA megfelel aB-vel, ahol a tetszésszerinti pozitív tényező. • Additivitás törvénye: Ha A, B, C, D négy színinger, akkor ha bármely két egyenlőség az alábbiak közül fennállA B, C D, (A +C) (B + D) akkor fennáll a következő egyenlőség is (A +D) (B + C)
Színképi érzékenység L = 1,0000R + 4,5907G + 0,0601B.
CIE XYZ színingertér • olyan színingerösszetevő függvényekhez vezet, melyeknek csak pozitív értékei vannak, • melynél az egyik alapszíninger megegyezik a V()-függvénnyel (az ezzel meghatározott színingerösszetevő fotometriai adatot szolgáltat), • az equienergetikus színinger mindhárom színingerösszetevője azonos, és • a lehető legszorosabban veszi közre a valós színinger vektorok által meghatározott színtérrészt
CIE LUV • huv= arctg[(v' - v'n) / (u' - u'n)] = arctg (v* / u*) (színezeti szög) • suv = 13[(u' - u'n)2 + (v' - v'n)2]1/2 (telítettség)
További szín-koordinátarendszerek • YUV szín-koordinátarendszer (PAL-SECAM) • Y = 0,3 R +0,59G + 0,11 B (luminancia) • U = (B-Y) x 0,493 (krominancia) • V = (R-Y) x 0,877 (krominancia)
További szín-koordinátarendszerek • YIQ szín-koordinátarendszer (NTSC) • Y = 0,30 R + 0,59 G + 0,11 B • I = 0,60 R – 0,28 G – 0,32 B • Q = 0,21 R – 0,52 G + 0,31 B • HSB szín-koordinátarendszer • Brightness = Y • Hue = arctg((R-Y)/(B-Y)) • Saturation = 1 – min {R, G, B}/Y
Számítógépes grafika • Vektorgrafika • A program egy láthatatlan hálóra rajzolja ki a készülő grafikát • A grafikát utasítások halmazaként tárolja. (pl. pont, vonal, kör stb. helyét esetleg irányítását) • Megjelenítéskor ezek az utasítások hajtódnak végre • Előny: Kis méret (általában) • Hátrány: Bonyolult (foto-realisztikus) ábrákat nem, vagy nagyon nehezen lehet leírni vektorgrafikus állományként Alkalmazás: pl. CAD/CAM
Számítógépes grafika • Bittérképes grafika • Kép függőleges és vízszintes irányban pontokra (pixel) van felosztva • Megjelenítéskor a képernyő pontjaiban megjelennek az adott pontról tárolt színinformációk • Előnye: Foto-realisztikus képek egyszerű megjelenítése • Hátránya: Nagyobb méret. Nem vagy nehezen lehet műveleteket végezni a képeken lévő alakzatokkal Megjegyzés: Vektorgrafikus=>Bittérképes konverzió egyszerű, Bittérképes=>Vektorgrafikus konverzió nagyon bonyolult
Képek jellemzői - méret • A képállomány mértét meghatározza: • Vízszintes felbontás • Függőleges felbontás • Színmélység • Leggyakoribb monitorfelbontások (általában 4:3) • 320 x 200, 320 x 240 • 640 x 480 • 800 x 600 • 1024 x 768 • 1240 x 1024 • 1600 x 1240 Pl. 800 x 600 x 24 bit = 1440000 Byte
Képek digitalizálása • Lapolvasók fajtái: • Kézi szkenner • Asztali (lap) szkenner • A kép digitalizálás folyamata: • Analóg kép (pl. fénykép) • Kvantálás (dpi=dot per inch) • Digitális kép Pl. 3 inch (7,62 cm) x 300 dpi x 2 inch (5,08) x 300 dpi x 24 bit = 540 000 képpont x 3 Byte = 1 620 000 Byte
Képek digitalizálása - szempontok • Felbontás: • Kép esetén általában 100-300 dpi elég. Ha túl magas dpi-n mintavételezünk, akkor egyrészt túl nagy lesz a kép másrészt a képen túl sok zaj jelenhet meg. • Szövegfelismerés esetén kb. 400 dpi • Színmélység: • Lehető legmagasabb színmélységben mintavételezzünk, és ha szükséges a színek számát csak később a digitalizálás után redukáljuk.
Képek jellemzése - hisztogram • Hisztogram: Adott színből (gradációs fokozatból) mennyit tartalmaz
Képfeldolgozás – különböző digitalizálási hibák kijavítása • Leggyakrabban előforduló hibák • Nem megfelelő (relatív) világosság • Nem megfelelő kontraszt • Nem megfelelő élesség • Különböző zajok megjelenése a képen • Kicsinyítésből és nagyításból eredő hibák
Elmosás, élkiemelés, éldetektálás – Diszkrét konvolúció segítségével
Különböző zajok szűrése a képen Átlag (mean): Szórásnégyzet (variance): Mean Square Error (MSE) Jel-zaj arány (signal to noise ratio - SNR)
Nagyításból és kicsinyítésből eredő hibák kiküszöbölése • Kicsinyítésből eredő hibák • Elvesznek élek • Információ vesztés • Nagyításból eredő hibák • „pixelesség”
Színes képek manipulálása • A képfeldolgozó program esetében szükséges egy belső színtér, mely legyen: • Egyenlő közű • Legyen értelmezve rajta a: • Világosság • Színezet, vagy színezeti szög • Telítettség, vagy a króma
Irodalom • CSÁNKY LAJOS: Multimédia PC-s környezetben, LSI Oktatóközpont, Budapest, 1996. • RALF STEINMETZ: Multimédia Springer Hungarica Kiadó Kft., Budapest
Irodalom - Internet • http://www.adobe.com • http://www.matrox.com/mga • http://www.sysopt.com/reviews/matrox-g450 • http://www.fontolo.hu/magazin/digivideo/digivideo.html • http://www.mpeg.org/MPEG/audio.html • http://www.fraunhoffer.iis • http://www.intermedia.c3.hu/oktanyag/video/videotechgyak • http://www.movie-collage.de