1 / 24

畵像認識 / 理解 image recognition / understanding

畵像認識 / 理解 image recognition / understanding. 畵像處理 (image processing) 目的 • 對象이 多樣 接近方法의 相異하고 , 共通點 ( 方法論 ) 이 적음. • P.R 의 對象 : 2D image 가 主對象 動畵像 (motion image), 靜止畵像 (still image) • computer vision (AI) 의 硏究對象 : 3D image 入出力裝置에 크게 依存

barb
Download Presentation

畵像認識 / 理解 image recognition / understanding

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 畵像認識 / 理解 image recognition / understanding 畵像處理 (image processing) 目的 •對象이 多樣 接近方法의 相異하고, 共通點(方法論)이 적음 • P.R의 對象 : 2D image가 主對象 動畵像(motion image), 靜止畵像(still image) • computer vision (AI)의 硏究對象 : 3D image 入出力裝置에 크게 依存 相對的重要性!!!

  2. Image processing system image input device Image output device processor output image input image memory device analog digital I/Odevice [1] 入力裝置 optical system sensor A/D converter image to processor lenz, 거울 photo-electric prism, conversion optical (光電變換) fiber, (半導體의 境遇 統合)

  3. •入力裝置의 機能 1. 入力對象 : 2D 平面媒體(종이, film), 3D物體 / scene 2. 受光方式 反射式, 透過式 3. 照明光 自然光, 人工光 4. 走査方式 raster scan, vector scan 5. 走査 機構 電子式( 例 FSS) 機械式(入力 對象移動, sensor部 移動) 6. 入力畵像情報 •色 monochrome, color •量子化 level binary, gray scale(多値)

  4. 光導電面(出力) 信號轉換 SnO2 In2O3 (透明, 導電性) + electron gun - 光電子放出部 光導電面(出力) SiO2 n-si ※ 撮像裝置 (image device) + 撮像管(image tulle) ① 光導電 形 ② image 형 image intensifier 採用(高感度) ① vidicon, orthicon ② chalnicon, saticon newbicon, harpicon + solid device - CCD (charge coupled device) 1,000~4,000 bits 1D, 2D array - amorphous(非晶質) - photodiode ※ 畵像入力方式 - TV camera 方式 analog / digital color TV camera, monochrome camera + R.G.B filter - drum scanner 方式 - 300 ~ 600 rpm, 4 ~ 20 lines/mm resolution

  5. FSS(flying spot scanner) 方式 • FSS-CRT利用 • - CCD scanner • fax, OCR 등에 사용. • laser scanner • high revolution [2] 出力裝置 ① hard copy device ② display device (solf copy) - imaging engineering - image fixing technology (像固定技術) ① hard copy device hard copy 裝置의 機能要素 1. 記錄媒體 film, 用紙(普通紙(PP : plain paper), 特殊用紙(例 : thermal paper, 印畵紙) 2. 記錄色 monochrome, color

  6. 3. 記錄 level 二値, 多値 4. 記錄媒體裝着方式 圓筒型, 平面型 5. 記錄方式 直接記錄, 間接記錄 * impact printing (衝擊式) - serial printer : golf ball type / cylinder type - line printer - wire dot matrix printer * nonimpact printing(非衝擊式) - ink jet printer continuous jet type drop-on-demand(DOD)type bubble jet 長點 : 不均一平面이나 大畵面記錄可 無騷音(low noise)

  7. Xerography (電子寫眞, 電子複寫機) • LBP (laser beam printer) • NP process 基盤(Canon) • 銀鹽寫眞 • AgCl(Ag+VII族元素, F, Cl, Rr, I) • 乳劑 (特히color) * 明暗 / 色彩表現 ① 單色의 gray level 表現方法 i) 粒子의 半徑을 變化 網點(mesh)의 變化 ii)單位面積當 粒子數를 變化 (粒子 크기 一定) ink jet 式 ② color 色의 標準化(標準色表) color science : 色의 表現, 計測, 色彩心理, 눈(視覺), 材料, 物理, 數學 =>綜合科學 multidimensional scaling

  8. 0.4 i(入) E(入) g(入) 0.2 0.0 wavelength (入), nm 400 500 600 700 546.1nm 435.8nm 700.0nm colorimetry(色彩計測學) CIE colorimetric system Commission Internationale de l'Eclairage = International Lighting Commission •三元色 (trichromatic generalization) • color difference formulae •可視光線 ; 波長 入= 360~830 nm RGB system의 混色函數 trisitmulus value 主波長 : R = 630nm G = 542nm B =460nm 原刺戟 (fundamental stimuli)

  9. RGB color system = additive color system 加法混色 : 빛 : TV R : red G : green B : blue C : cyan M : magenta Y : yellow W : white Bl : black R G B Y M W C 補色 CMY color system = subtractive color system 減法混色 : 染料 : 印刷, 寫眞(印畵) ex) negative film C M Y B G BI R

  10. * ② DISPLAY DEVICE (表示裝置) 機能要素 1. 表示色 : monochrome, color 2. 表示level : 二値, 多値 3. 表示動作 : 靜止畵像, 動畵像 4. 表示方式 : random scan, raster scan 5. 表示畵像 : 線圖形, 面圖形 6. 表示device : CRT , 平面 device 性能評價 項目 •表示畵素數 •表示速度 •表示畵像의 크기 •輝度(intensity) • contrast •色再現의 充實度(fidelity) • flickering / 殘像特能 눈 : 1/36sec

  11. ① ② ③ storage tube panel display CRT ① 陰極線管 (CRT : cathode ray tube) 電子銃, 偏向 system, 螢光面 shadow mask, flat CRT - NTSC 525 lines * 50 fields 2 : 1(interlace scan) aspect ratio = 4 : 3 - PAL / SECAM 625 lins * 50 fields 2 : 1 aspect ratio = 4 : 3 - HDTV (high definition TV) 1.125 lines * 60 fields 2 : 1 aspect ratio = 16 : 9 ② 蓄積管 (storage tube) 表示內容이 持續的으로 蓄積됨(重疊表示) ③ panel display (平面display) - EL display - plasma display - LCD - 發光diode - 螢光表示管

  12. * * EL (electroluminescence) display 半導體材料(ZnS)에 電壓을 加하면 發光 固體, high resolution (10~20 lines/mm) 超薄形으로 面照明, 壁걸이 TV 배면전극 절연층 투명전극층 유리 N 發光層 液晶 display (LCD : liquid cystal display) 液晶分子의 配列을 電磁氣的 / 物理的으로 變化시킴 => 液晶層을 透過하는 빛의 量 또는 透過面을 變化시킴(光變調) •非發光 (back-lit), low contract, low power consumption (손목時計, calculator) • LCD monitor / TV 40” color 以上 ; 52”量産 • TFT-LCD •發光角, 밝기, 畵面크기 發光 diode (LED : light emitting diode) • PN junction에 順方向電壓을 加하면 發光 • GaP, GaAs •波長 550nm 이상(G~R)이 一般的

  13. * 螢光物質 • blue가 課題 解決됨! • resolution : 畵素間隔 1mm 前後 plasma display panel(PDP) 유리 •電極간의 放電發光利用 • Ne + Xe gas •表示面積이 넓음 • resolution : 5 lines/mm • > 70” color PDP TV(量産段階) 保護層 (Mgo) 誘電體層 放電gas 螢光表示管(vacuum fluerescent display) •低價 •簡單한 數字等表示 • dot matrix形態 0.4mm pitch

  14. 畵像處理의 入出力別 分類 變換(前處理) 傳送(壓縮) ① 入力 出力 畵像 畵像 ② 生成 記述 記述 ③ 計測(特徵抽出) 認識(識別) 畵像處理의 目的 1. 人間이 보기 쉽도록 改善하여 表示 ① 2. 畵像傳送을 위한 壓縮 ① 3. 畵像의 再構成(低次元 -> 高次元) ② 4. 畵像 識別 / 理解 ③

  15. * 1. 計測 / 觀測(measurement) 對象 : •靜止畵像(still image) •動畵像(motion image) • motion detection / analysis 內容 : •距離計側(range finder) •位置計測(GPS) <- 三角測定法 •單眼視(monocular vision) / 兩眼視(stereo vision) • remote sensing • thermography radiation energy 檢出(0.1度 resolution) 2. 標本化, 量子化(sampling & quantization) gray scaler 8 bits (image 256 levels) 256 dpi (0.1 mm pitch) 以上 color (image 10 bits(1,024 段階) : R, G, B 當

  16. 3. 畵像傳送, 帶域壓縮 image transmission image compression JPEG (joint photographer experts group) MPEG (Motion picture experts group) redundancy, 規則性, 視覺特性 等 利用 JPEG baseline standard 畵素當 1byte ; luminance Y 4畵素 block 當1byte ; chrominence CbCr (各4bit) =>4畵素 12 bytes 5 bytes (12 values) (6 values) MPEG 初期畵面 : JPEG baseline standard 以後畵面 : relative coding

  17. RGB color YCbCr system [8 bits] [256 levels] Y = 0.299R + 0.587G + 0.114B Cb = -0.1687R - 0.3313G + 0.5B +128 Cr = 0.5R - 0.4187G -0.0813B + 128 YCbCr system RGB color system R = Y + 1.402(Cr - 128) G = Y - 0.34414(Cb - 128) - 0.71414(Cr - 128) B = Y + 1.722 (Cb - 128)

  18. * * * 直交變換 서로 獨立인 特徵量抽出 -> 帶域壓縮 多變量解析(multivariate analysis) factor analysis, Kahrunen - Loeve transform, Fourier transform) binary : Hadamard, Walsh, Haar transform PCA (principal cromponent Analysis 主成分分析) ICA (independent component analysis 獨立成分分析) 非直交 變換 : multi channel data 必要 4. 畵像變換 (修正, 强調) spatial filtering(空間濾波) median / Kalman filter smoothing, prediction & estimation homomorphic filter granular noise 除去 blurred image restoration (復元) 幾何學的 變換(修正) 座標變換 •移動, 廻轉, 擴大 •縮小 位置補正 distortion compensation

  19. 畵像變換 / 加工 • 2値化, 細線化 •色彩變換(color filtering) 照明歪曲 畵像의 / 補正, 目的色彩로 • image subtraction • pseudo color(擬似色彩)transform color temperature(色溫度)等 考慮 •距離變換 : 遠近感 5. 畵像生成 / 再構成 (image generation / reconstruction) •畵像生成 CG (computer graphics) computer animation -> cell animation 脫皮 VR (virtual reality 假想現實) flight simulator, war game •畵像再構成 再構成理論 J.Radon(1917) computed tomography (CT) : 斷層撮影裝置

  20. * Cormack, A. M. (1963) CT 理論 Hounsfield, G. N. (1973) 實用化(英 EMI) 1979 Nobel 醫學賞 CT - X-ray - 超音波 - NMR (nuclear magnetic resonance) - ECT (emission CT), 放射線同位元素, r線 - PET (positron emission tomography) •腦室髓液과 血液의 吸收係數 / 共鳴特性의 差異로 腦卒中의 原因判定 腦出血 腦血栓 : 腦血管內血液의 凝固 腦塞栓 : 心臟凝固物에 依한 막힘 6. 畵像認識 畵像特徵量의 計測 幾何學的 / 色彩特徵 및 統計的 性質 計算

  21. 特徵抽出 및 表現(記述) •境界, 邊(테두리 : edge) 抽出 •畵像의 領域(region) 分割 •線의 追跡(line tracking) •線圖形의 chain coding •圖形의 構文的(syntactic) 表現 ① PDL(picture description langnage) primitive 選定 primitive 間의 幾何學的關係 構造의 表現 2次元的配置 + 各 primitive 間의 演算子(operator) ② Backus form nonterminal, terminal symbol의 recursive form <- metalanguage ③ 線畵記述 꼭지점(vertex)座標 - link - 隣接꼭지점

  22. * 畵像의 識別(classification) 一般的인 P.R. system 과 同一 認識으로 부터 理解로!!! P.R. system 出力 對象 觀測 特徵抽出 識別/分類 前處理 control model pattern understanding system 各 處理段階의 흐름이 汎用性, 柔軟性을 가짐 feedback, adaptation 機能을 積極的으로 活用함

  23. * * 一般化 되고 (generalized) 柔軟性 있고 (flexible) 適應的(adaptation)인 system으로!! 窮極的 目標(發展方向) ╔ 人間을 人間답게 해 주는데 寄與 ╝ 單純作業, 危險한 作業으로부터의 解放!!!

More Related