6.66k likes | 6.82k Views
ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας. Εισαγωγή. Κεφάλαιο 1. ΠΕΡΙΕΧΟΜΕΝΑ. Εισαγωγή Τύποι Εικόνων Γεωμετρία Απεικόνισης Όργανα Απεικόνισης Απόκτηση Εικόνας Αν απαράσταση Εικόνας. Σκοπός Του Μαθήματος (1/2).
E N D
ΕΠΛ 445 – Ψηφιακή Επεξεργασία Εικόνας Εισαγωγή Κεφάλαιο 1
ΠΕΡΙΕΧΟΜΕΝΑ Εισαγωγή Τύποι Εικόνων Γεωμετρία Απεικόνισης Όργανα Απεικόνισης Απόκτηση Εικόνας Αναπαράσταση Εικόνας
Σκοπός Του Μαθήματος (1/2) • Να μεταφέρει τις βασικές ιδέες της Ψηφιακής Επεξεργασίας Εικόνας (ΨΕΕ)από μια λειτουργική όψη με κάποια επαφή στην θεωρία. Οι βασικές αυτές ιδέες είναι: - Ανάληψη: κάμερες, διασύνδεση, και υπολογιστές. - Επεξεργασία, αλγόριθμοικαι θεωρία. - Πρακτικές εφαρμογές της ΨΕΕ. - Βασικοί αλγόριθμοι ανάλυσης εικόνας. • Κάνει προσιτή την ψηφιακή επεξεργασία εικόνας. • Παρουσιάζει το αντικείμενο με λογική μαθηματική ευκολία. • Παρουσιάζει τα αποτελέσματα πολλαπλών παραδειγμάτων οπτικών εικόνων στην μορφή της ακριβούς ΨΕΕ, όπως αυτά έχουν αναλυθεί στο Laboratory for Vision Systems στο University of Texas at Austin, και στο Τμήμα Πληροφορικής του Πανεπιστημίου Κύπρου.
Σκοπός Του Μαθήματος (2/2) • Να γίνονται ερωτήσεις όσον αφορά το αντικείμενο του μαθήματος • Να μη διστάζουν οι φοιτητές να δείξουν τη μη κατανόηση κάποιου θέματος • Να γίνονται σχόλια για την ταχύτητα διδαχής του μαθήματος • Να γίνονται σχόλια για το επίπεδο διδαχής
Σχόλια Για Το Βιβλίο Το βιβλίο που καλύπτει την ύλη του μαθήματος είναι το: Digital Image Processing, R.C. Gonzalez and R.E. Woods • Πολύ ευπρόσιτο βιβλίο – Φιλικό προς το χρήστη • Πολύ καλά εικονογραφημένο - με χρήσιμαπαραδείγματα εφαρμογών • Οι σημειώσεις της τάξης είναι αυτόνομες. Εντούτοις, το βιβλίο είναι καλό για διάβασμα.
Άλλα Προτεινόμενα Βιβλία • Digital Image Processing, W.K. Pratt, Wiley, 1992, Encyclopedic, somewhat dated. There is a new edition. • Digital Picture Processing, Rosenfeld & Kak, Academic1982, Encyclopedic but readable • Fundamentals of Digital Image Processing, Jain, Prentice 1989, Handbook-style, meant for advanced level. • Machine Vision, Jain, Kasturi, and Schunk, McGraw-Hill, 1995, Beginner’s book on computer vision. • Robot Vision, B.K.P. Horn, MIT Press, 1986, Advanced-level book on computer vision • Digital Video Processing, M. Tekalp, Prentice-Hall, 1995, Only book devoted to digital video; high-level; excellent.
Δημοσιεύσεις - Journals · IEEE Transactions on: - Image Processing - Pattern Analysis and Machine Intelligence - Medical Imaging - Remote Sensing · Computer Vision, Graphics, and Image Processing - Image Understanding - Graphics and Image Processing · Pattern Recognition · Journal of Visual Communication and Image Representation · Image and Vision Computing
Εφαρμογές της ΨΕΕ(1/2) • Υπάρχουν αμέτρητες περιοχές εφαρμογών της ΨΨΕ, οι οποίες εξελίσσσονται ραγδαία. Θα δώσουμε πιο κάτω μερικές από αυτές.
Που χρησιμοποιείται?(2/2) ΨΨΕ – Μια επιστήμη με πολλές εφαρμογές:
Εξέλιξη της ΨΨΕ • Είναι σημαντική στις περιοχές με στοιχεία πολλών διαστάσεων • Η απεικόνιση είναι ανεκτίμητο μέσο και μετάφραση δεδομένων • Η όραση είναι η πιο σημαντική αίσθηση μας και είναι πανταχού παρών • Εφαρμογές σε σταθμούς εργασίας και προσωπικούς υπολογιστές • Σημαντική πρόοδος σε αλγορίθμους και επιπρόσθετα στοιχεία του υλικού των υπολογιστών Πλεονεκτήματα της ΨΨΕ σε σταθμούς εργασίας • Χειρισμός – κόστος των προσωπικών σταθμών εργασίας είναι ιδανικό για εργαστηριακή δουλειά • Τεράστια ικανότητα μείωσης χρόνου • Μπορεί να επιβλέπει και να ελέγχει πολλαπλές διεργασίες • Ικανότητα εντολών των σταθμών εργασίας για την καλπάζουσα ΨΕΕ
Τι Είναι οι Ψηφιακές Εικόνες? • Υπάρχουν τόσων ειδών εικόνες όσοι και οι τύποι της ακτινοβολίας και οι τρόποι που δείχνουν πώς η ακτινοβολία αντιδρά με τα αντικείμενα.
Γενικοί τύποι εικόνων (1/2) • Μπορούμε να διακρίνουμε τρεις τύπους εικόνας, οι οποίοι δημιουργούν διαφορετικούς τύπους πληροφορίας εικόνας. • Απεικόνιση Αντανάκλασης: Η πληροφορία της εικόνας είναι η πληροφορία της επιφάνειας, δηλαδή πως ένα αντικείμενο αντανακλά/απορροφά ακτινοβολία - Οπτική (ορατή, φωτογραφική, με βάση ακτίνων laser) - Radar - Sonar, ultrasound (non-EM) Υπέρηχοι - Electron microscopy Ηλεκτρονικό Μικροσκόπιο
Γενικοί τύποι εικόνων (2/2) • Απεικόνιση εκπομπής: Η πληροφορία εικόνας είναι εσωτερική πληροφορία, δηλαδή πως ένα αντικείμενο δημιουργεί ακτινοβολία. - Θερμική, υπέρυθρη (γεωφυσική, ιατρική, στρατιωτική) - Αστρονομία (άστρα, γαλαξίες, κλπ.) - Πυρηνική (εκπομπή σωματιδίων • Απεικόνιση Απορρόφησης: Η πληροφορία της εικόνας είναι εσωτερική πληροφορία, δηλαδή πως ένα αντικείμενο αλλάζει / απορροφά ακτινοβολία που περνά διαμέσου του. - Ακτίνες Χ σε πολλές χρήσεις - Οπτική μικροσκοπίασε χρήσεις εργαστηρίου - Τομογραφία στην ιατρική - “Vibro-Seis” στην γεωφυσική έρευνα
Ηλεκτρομαγνητική Ακτινοβολία(1/2) • Το ηλεκτρομαγνητικό φάσμα καλύπτει πολλές χρήσιμες ακτινοβολίες που χρησιμοποιούνται στην απεικόνιση:
Ηλεκτρομαγνητική Ακτινοβολία (2/2) • Μερικοί κλάδοι της επιστήμης, π.χ. αστρονομία, περιέχουν εικόνες απο όλο το φάσμα. • Συνήθως θα χρησιμοποιήσουμε παραδείγματα εικόνων από το ορατό φάσμα. • Αυτό είναι ένα πολύ μικρό κομμάτι του φάσματος ακτινοβολίας!
Κλίμακες Απεικόνισης • Μεταβάλλονται ανάλογα με τις κλίμακες που υπάρχουν στην φύση:
Διαστάσεις Εικόνων • Οι εικόνες είναι πολύ-διαστατά σήματα ( 2 διαστάσεις) • Ο αριθμός των διαστάσεων μιας εικόνας είναι ο αριθμός των συντεταγμένων που χρειάζονται για ένα σημείο
Γεωμετρία οπτικής εικονοληψίας (1/2) Απλοποιημένη γεωμετρία φωτογραφικής απεικόνισης
Γεωμετρία Οπτικής Απεικόνισης(2/2) • ΟΠΤΙΚΗ ΑΠΕΙΚΟΝΙΣΗ 3-Δ ΣΕ 2-Δ Η απεικόνιση περιλαμβάνει μείωση διαστάσεων, έτσι κάποια 3-Δ πληροφορία χάνεται.
Σκηνογραφική προβολή • Προβολή: είναι η μείωση των διαστάσεων • Σκηνογραφική προβολή:είναι η μείωση διαστάσεων από 3-Δ σε 2-Δ • Συστήματα συντεταγμένων: • Συντεταγμένες πραγματικού χώρου • (Χ,Υ,Ζ) : δηλώνουν σημεία στο 3-Δ χώρο • Το σημείο αναφοράς (Χ,Υ,Ζ)=(0,0,0) χρησιμοποιείται σαν το κέντρο • του φακού • Συντεταγμένες εικόνας (x,y) : δηλώνουν σημεία σε 2-Δ εικόνα Το πεδίο x - y είναι παράλληλο του πεδίου Χ – Υ Ο οπτικός άξονας περνά και από τα δυο σημεία αναφοράς
Γεωμετρία προβολής οπής Ο φακός θεωρείται σαν μια οπή από την οποία περνούν όλες οι ακτίνες φωτός που κτυπούν το πεδίο εικόνας. Πρόβλημα: σε αυτό το μοντέλο, αλλά και στην πραγματικότητα η εικόνα είναι αντιστραμμένη. Έτσι, αλλάζουμε το μοντέλο.
Γεωμετρία αντεστραμμένης προβολής(1/3) Παρατήρηση: το διάγραμμα δεν είναι σε κλίμακα.
Γεωμετρία αντεστραμμένης προβολής (2/3) • Το πιο πάνω διάγραμμα δείχνει όλους τους άξονες συντεταγμένων
Γεωμετρία αντεστραμμένης προβολής (3/3) Το ισοδύναμο απλουστευμένο διάγραμμα περιέχει μόνο τα στοιχεία που σχετίζουν το (Χ,Υ,Ζ)=(A,B,C) με την προβολή (x,y) = (a,b).
Όμοια Τρίγωνα Δυο τρίγωνα είναι όμοια όταν οι αντίστοιχες γωνίες τους είναι ίσες Θεώρημα:τα όμοια τρίγωνα έχουν τις αντίστοιχες πλευρές τους ανάλογες D=d , E=e , F=f E e F f D d
Λύση σκηνογραφικής προβολής(1/2) • Χρησιμοποιώντας όμοια τρίγωνα μπορούμε να βρούμε τη σχέση • μεταξύ 3-Δ συντεταγμένων χώρου και 2-Δ συντεταγμένων εικόνας • Ξανασχεδιάζουμε τη γεωμετρική εικόνα φανερώνοντας δυο ζεύγη • από όμοια τρίγωνα
Λύση σκηνογραφικής προβολής (2/2) Από το θεώρημα των ομοίων τριγώνων συμπεραίνουμε: και ή (a,b) =f . (A,B) = (fA/C, fB/C) C
Εξίσωση Σκηνογραφικής Προβολής Έτσι, έχουμε την ακόλουθη σχέση: (x,y) =f . (X,Y) Z όπου f = εστιακή απόσταση Η αναλογίαfείναι ο συντελεστής μεγέθυνσης, ο οποίος μεταβάλλεται Ζ με την απόσταση Ζ από το κέντρο του φακού μέχρι το πεδίο του αντικειμένου
Παράδειγμα 1 Υπάρχει ένας άνθρωπος σε απόσταση 10 μέτρων μπροστά μας. Έχει 2 μέτρα ύψος. Η εστιακή απόσταση του ματιού μας είναι 17mm. Ερώτηση: ποιο είναι το ύψος Η της εικόνας που σχηματίζεται στη ρέτινα; Από τα όμοια τρίγωνα: 2 m= H 10 m 17mm H = 3.4 mm
Παράδειγμα 2(1/3) Γιατί οι ευθείες (ή τμήματα ευθειών) σε 3-Δ χώρο προβάλλονται σε ευθεία γραμμή στη 2-Δ εικόνα;
Παράδειγμα 2 (2/3) Παρατηρούμε ότι όλες οι γραμμές που περνούν από το κέντρο του φακού (σημείο αναφοράς) και την 3-Δ ευθεία πρέπει να είναι στο ίδιο επίπεδο (ένα σημείο και μια ευθεία προσδιορίζουν ένα επίπεδο). Η διασταύρωση αυτού του επιπέδου με το επίπεδο της εικόνας δίνει την προέκταση της ευθείας. Η διασταύρωση δυο οποιονδήποτε μη παράλληλων επιπέδων είναι μια ευθεία.
Παράδειγμα 2 (3/3) Έτσι, η προβολή μιας 3-Δ ευθείας είναι σε μια 2-Δ ευθεία.
Ψηφιοποίηση Εικόνας • Τι είναι; • Η μετατροπή μιας δυσδιάστατης φυσικής εικόνας (στην ουσία μιας κατανομής φωτεινοτήτων) σε ηλεκτρικό σήμα και έπειτα σε ψηφιακή πληροφορία • Αισθητήρες CCD (Charged Couple Devices) • Μετατρέπουν την φωτεινότητα σε ηλεκτρικό φορτίο • Οι πλείστες κάμερες αυτούς χρησιμοποιούν
Τα στοιχεία του CCD πίνακα φορτίζονται ανάλογα με την φωτεινότητα η οποία προσπίπτει επάνω τους Κάθε παλμός του Vertical Scan Generator αναγκάζει τα φορτία από κάθε γραμμή του πίνακα να μετακινηθούν σε ένα Shift Register Ο Shift Register μεταφέρει τα φορτία σε ένα ενισχυτή, γραμμή προς γραμμή. Για το παραπάνω παράδειγμα, ο Shift Register θα μεταφέρει στον ενισχυτή τα φορτία της πρώτης γραμμής, έπειτα της δεύτερης, της τρίτης κ.ο.κ Αισθητήρες Charged Couple Device (1/3)
Κάθε CCD συσκευή διαθέτει τρεις «πηγές δυναμικού» (potential wells). Η μεσαία παράγει φορτίο (ροή ηλεκτρονίων) ανάλογα με το πλήθος των φωτονίων (δηλαδή την ένταση του φωτός) τα οποία προσπίπτουν επάνω της Αισθητήρες Charged Couple Devices(2/3) Έπειτα το φορτίο της μεσαίας πηγής μεταπηδά στις άλλες δύο. Τέλος καταλήγει στον Shift Register από όπου θα οδηγηθεί στον ενισχυτή
Αισθητήρες Charged Couple Devices(3/3) Με τον ίδιο τρόπο, το φορτίο του Shift Register μεταβιβάζεται στον ενισχυτή, ο οποίος παράγει ηλεκτρικό ρεύμα ανάλογο με την τάση του αριθμού ηλεκτρονίων που λαμβάνει: • Η έξοδος του ενισχυτή είναι μια γραμμή – προς – γραμμή αναλογική κυματομορφή η οποία συνήθως έχει προκαθορισμένη μορφή (NTSC: 525 γραμμές/πλαίσιο , 30 πλαίσια/sec, RS-170). • Τα τηλεοπτικά σήματα συνήθως ακολουθούν την NTSC • Οι ψηφιακές εικόνες που δημιουργούνται από εργαστηριακές κάμερεςκαι κάμερες ασφαλείας είναι συνήθως της μορφής RS-170 • Για να μπορεί να τύχει επεξεργασίας από υπολογιστή, η αναλογική εικόνα πρέπει να μετατραπεί σε ψηφιακό σήμα από μια συσκευή ADC – Analog to Digital Converter
Μετατροπέας Αναλογικού σε Ψηφιακού(Analog to Digital Converter – ADC) • Διεξάγει Δειγματοληψία και Κβαντοποίηση για να μετατρέψει μια συνεχής κυματομορφή τάσης σε διακριτές τιμές σημαντική η Συχνότητα Δειγματοληψίας και το Διάστημα Κβαντοποίησης • Οι κάρτες ψηφιοποίησης βίντεο (video digitizer board) συνήθως μπορούν να ενωθούν με την βιντεοκάμερα • Οι νέες «εντελώς ψηφιακές» κάμερες περιλαμβάνουν ενσωματωμένο ADC
Εικόνα Από Δειγματοληψία (1/4) • Τα αποτελέσματα τα οποία προκύπτουν από τη δειγματοληψία αποθηκεύονται ως πίνακες από τιμές. Κάθε τιμή αντιπροσωπεύει τη φωτεινότητα της εικόνας στο συγκεκριμένο σημείο. Δίπλα απεικονίζεται ένας 10x10 πίνακας εικόνας • Κάθε ένα από τα κελιά του πίνακα ονομάζεται εικονοστοιχείο – (“pixel” από τις λέξεις «picture element») • Στην ΨΕΕ συνήθως χρησιμοποιούμε τετραγωνικούς πίνακες NxN με διαστάσεις δύναμη του 2 (N=2M) - είναι πιο εύκολοι στον χειρισμό και μερικοί αλγόριθμοι είναι αποδοτικότεροιγια τέτοιες διαστάσεις M=727 x27 = 128x128 σύνολο: 214 =16384pixels M=10210x210 = 1024x1024 σύνολο: 220 =1048576pixels
Εικόνα Από Δειγματοληψία (2/4) • Η δειγματοληψία πρέπει να είναι επαρκώς πυκνή αλλιώς: μεγάλη απώλεια πληροφορίας μεγάλη αλλοίωση της εικόνας • Παρακάτω απεικονίζονται οι προκύπτουσες ψηφιακές εικόνες με δειγματοληψία σε τρεις διαφορετικές συχνότητες – 600, 200 και 75 DPI) 600 DPI 200 DPI 75 DPI • Ποιά είναι κατάλληλη συχνότητα δειγματοληψίας; Θεώρημα Δειγματοληψίας του Nyquist (Nyquist Sampling Theorem) • Παρόμοια, το διάστημα κβαντοποίησης πρέπει να είναι αρκετά μικρό
Εικόνα Από Δειγματοληψία (3/4) • Κβαντοποίηση: η φωτεινότητα κάθε pixel παίρνει μια τιμή από ένα πεπερασμένο σύνολο K αριθμών (συνήθως ακεραίων, από 0 έως K-1) • Τυπικά, το πλήθος επιπέδων φωτεινότητας είναι δύναμη του 2: K=2Β • Άρα με Bbits μπορούμε να κρατάμε την φωτεινότητά σε κάθε pixel Στις εικόνες τόνων γκρίζου συνήθως B=8, άραέχουμε 256 πιθανά επίπεδα φωτεινότητας (τιμές 0 έως 255) με 8 bit ανά pixel • Όπως και με την συχνότητα δειγματοληψίας, οι τιμές φωτεινότητας της εικόνας θα πρέπει να κβαντοποιηθούν επαρκώς πυκνά (μικρό διάστημα κβαντοποίησης) ώστε να μην χαθεί σημαντική πληροφορία φωτεινότητας 8-Bit Κβαντοποίηση 5-Bit Κβαντοποίηση 3-Bit Κβαντοποίηση
Εικόνα Από Δειγματοληψία (4/4) • Αναπαράσταση εικόνας ως σύνολο επιπέδων bits =
Η Επανάσταση Της Ψηφιακής Εικόνας (1/4) • Χώρος που απαιτείται για αποθήκευση ψηφιακής εικόνας: • Ανάλυση εικόνας H x W pixels(Height, Width) • Bbits για αποθήκευση της φωτεινότητας σε κάθε pixel Χώρος = H x W x B (σε bits) • Για εικόνες τόνων γκρίζου, συνήθως: • Οι διαστάσεις είναι H = W = 2M, Μ = 9 (512 x 512 pixels) • B = 8 (256 επίπεδα φωτεινότητας γκρίζου) Χώρος = Bx 2M x 2M= 8 x 218= 2097152 bits = 0.4 Mbytes • Για βίντεο, συνήθως έχουμε 30 πλαίσια (καρέ εικόνας) να μεταδίδονται ανά δευτερόλεπτο. Χρησιμοποιώντας μια τεχνική για μείωση των αναγκών σε bandwidth (Πεπλεγμένη Σάρωση 2:1 - Interlaced Scanning 2:1), μια κινούμενη γκρι εικόνα με τις παραπάνω διαστάσεις και επίπεδαφωτεινότητας απαιτεί περίπου 7.5 Mbytes για 1 δευτερόλεπτο βίντεο • Για μια έγχρωμη ταινία 2 ωρών χρειάζονται περίπου 27000 Mbytes. Η ποσότητα αυτή είναι υπερβολική. Για αυτό χρειάζονται τεχνικές μείωσης των αναγκών σε αποθηκευτικό χώρο και bandwidth Συμπίεση (θα τη δούμε σε άλλα κεφάλαια)
Η Επανάσταση Της Ψηφιακής Εικόνας(2/4) • Τα συστήματα ΨΕΕ κατά κανόνα χρησιμοποιούν Καρτεσιανή (ορθογώνια) δειγματοληψία. Δηλαδή οι εικόνες αναπαριστούνται ως πίνακες με σειρές και στήλες. Τα pixels δεικτοδοτούνται με βάση τον αριθμό στήλης και γραμμής όπου βρίσκονται Γιατί; Για απλοποίηση των αλγορίθμων • Εντούτοις, η «δειγματοληψία» στον αμφιβληστροειδή χιτώνα του ανθρώπινου ματιού προσεγγίζεται περισσότερο από εξαγωνική δειγματοληψία, όπου τα pixels είναι πιο συμπαγή μεταξύ τους • Εξαγωνικές εικόνες μπορούν επίσης να αναπαρασταθούν ως πίνακες με σειρές και στήλες, αλλά οι άξονες δεν είναι ορθογώνιοι • Οι εξαγωνικές εικόνες έχουν πλεονεκτήματα: • Δεν υπάρχει αμφιλεγόμενη διασύνδεση (θα το δούμε στην επόμενη διαφάνεια) • Είναι ευκολότερη η υλοποίηση κυκλικά συμμετρικών τελεστών
Η Επανάσταση Της Ψηφιακής Εικόνας(3/4) • Παράδοξα Σύνδεσης (Connectivity Paradoxes) • Σύνδεση: αφορά τον τρόπο με τον οποίο αποφασίζουμε κατά πόσον ένα pixel είναι ενωμένο με κάποιο άλλο. • Τα Παράδοξα Σύνδεσης συχνά συγχύζουν αλγόριθμους οι οποίοι χρησιμοποιούν περιγράμματα. • Πως αποφασίζουμε αν ένα pixel είναι ενωμένο με κάποια άλλα;Δύο τρόποι: • 4 – Connectivity: το pixel συνδέεταιμόνο με τα 4 γειτονικά του pixelπάνω, κάτω, αριστερά και δεξιά. • 8 – Connectivity: το pixel συνδέεται με τα 8 γειτονικά pixel που τοπεριτριγυρίζουν.
Η Επανάσταση Της Ψηφιακής Εικόνας(4/4) • Προβλήματα που Δημιουργούνται: • Ας υποθέσουμε ότι θέλουμε να διεξάγουμεκάποια λειτουργία στον διπλανό κύκλοβασιζόμενοι στο περίγραμμά του. Χρησιμοποιώντας 4 – Connectivity: Η λειτουργία θα θεωρήσει τον κύκλο ως 4 ασύνδετα τμήματα Χρησιμοποιώντας 8 – Connectivity: Τα μπλε pixels θεωρούνται συνδεδεμένα, όμως το ίδιο και τα άσπρα: επικάλυψη μεταξύ συνδεδεμένων τμημάτων ! • Πιθανή λύση: 4-Connectivity στο φόντο, 8-Connectivity στον κύκλο Η εξαγωνική δειγματοληψία δενυποφέρει από τέτοιου είδους ασάφειες: 4-Connectivity 8-Connectivity
Μπλε Εικόνα + = Πράσινη Εικόνα + Έγχρωμη Εικόνα Κόκκινη Εικόνα Χρώμα • Μια έγχρωμη εικόνα αναπαρίσταται ως διάνυσμα τιμών. Σε κάθε pixel έχουμε τρεις τιμές φωτεινότητας: Κόκκινο, Πράσινο και Μπλε. • Αυτό συνήθως εκφράζεται ως τρεις διαφορετικές εικόνες: μια για το Κόκκινο, μια για το Πράσινο και μια για το Μπλε χρώμα. Η αναπαράσταση αυτή ονομάζεται RGB.Υπάρχουν και άλλες, όπως η HSL και η CMYK. (Στις παραπάνω τρεις εικόνες το λευκό χρώμα είναι ψηλή φωτεινότητα, και το μαύρο χαμηλή) • Συνήθως επεξεργαζόμαστε την εικόνα συνολικής φωτεινότητας (intensity image) I = R + G + B. • Οι περισσότεροι αλγόριθμοι οι οποίοι χρησιμοποιούν χρώμα, επεξεργάζονται τις RGB εικόνες ξεχωριστά ως εικόνες τόνων γκρίζου και έπειτα τις προσθέτουν για να πάρουν το τελικό αποτέλεσμα.
Κάρτες Συλλογής Πλαισίων(Frame Grab Boards) • Υπάρχουν κάρτες συλλογής πλαισίων για μικρούς και μεγάλους υπολογιστές και για διαφορετικά περιβάλλοντα εργασίας • Κάρτες με FIFO Buffers – συνήθως 1 μέχρι 8 Kb μνήμη • Με ενσωματωμένη μνήμη – αρκετά Megabytes (Matrox Meteor II: 4MB SGRAM) • Τέτοιες κάρτες συνήθως υποστηρίζουν: • Είσοδο βίντεο RS-170 • Συνεχής ψηφιοποίηση εικόνας στα 30 πλαίσια ανά δευτερόλεπτο • Επαναδιαμόρφωση ψηφιακού βίντεο για προβολή σε οθόνη • Αποθήκευση εικόνων σε ενσωματωμένη στην συσκευή μνήμη (on-board memory) • Διεξαγωγή ορισμένων βασικών λειτουργιών επεξεργασίας εικόνας • Μερικές εταιρείες: • Matrox (http://www.matrox.com/) • Imaging Technology, Inc. • Datacube • Data Translation
Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (1/4) • Όπως είπαμε, μια εικόνα αποθηκεύεται συνήθως ως ένας πίνακας από ακέραιους αριθμούς • Χρήση πινάκων για αναπαράσταση ψηφιακής εικόνας • Έστω τετραγωνικός πίνακας εικόνας I = [ I(i, j); 0 ≤ i, j ≤ N-1 ] Ο δείκτης i αντιπροσωπεύει αριθμό γραμμής στον πίνακα Ο δείκτης j αντιπροσωπεύει αριθμό στήλης στον πίνακα • Αυτό είναι σε αντίθεση με την συνήθη σημειογραφία των μαθηματικών, όπου χρησιμοποιούμε συνήθως την σύμβαση I(x,y), με το x να υποδηλώνει τον αριθμό στήλης και το y να υποδηλώνει τον αριθμό γραμμής. • Το I(i,j)αντιπροσωπεύει την τιμή του pixel στην γραμμή i, στήλη j
I = Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (2/4) Μορφή Πίνακα Εικόνας Διαστάσεων NxN Πίνακας Εικόνας Διαστάσεων NxN με Τιμές Pixel
Αναπαράσταση Και Αποθήκευση Ψηφιακής Εικόνας (3/4) • Ο αριθμός των Bits ανά pixel ο οποίος χρησιμοποιείται καθορίζει το πλήθος χρωμάτων (ή φωτεινότητας) τα οποία μπορεί να πάρει. • 4 bits: εικόνες 16 χρωμάτων • 8 bits: εικόνες 256 χρωμάτων ή εικόνες τόνων γκρίζου • 16, 24, 32 bits: εικόνες πραγματικού χρώματος κλπ • 2 bits ανά pixel: δυαδικές εικόνες (binary images) • Περιέχουν μόνο δύο χρώματα (συνήθως άσπρο και μαύρο) • Θα μας απασχολήσουν περισσότερο στο κεφάλαιο 2.