490 likes | 667 Views
Μια εισαγωγή στην ΠΕΡΙΛΗΨΗ ΒΙΝΤΕΟ - VIDEO SUMMARIZATION. Ψηφιακή Επεξεργασία Εικόνας και Video 2011-2012. Τι είναι η περίληψη βίντεο ; Ένας τρόπος για γρήγορη αποτίμηση του περιεχομένου του βίντεο. Ποιοι τρόποι υπάρχουν ; Dynamic video skimming : κινούμενες εικόνες - video trailer
E N D
Μια εισαγωγή στην ΠΕΡΙΛΗΨΗ ΒΙΝΤΕΟ - VIDEO SUMMARIZATION Ψηφιακή Επεξεργασία Εικόνας και Video 2011-2012 ΔΠΜΣ ΗΕΠ 2011-2012
Τι είναι η περίληψη βίντεο; Ένας τρόπος για γρήγορη αποτίμηση του περιεχομένου του βίντεο. • Ποιοι τρόποι υπάρχουν; Dynamic video skimming :κινούμενες εικόνες - video trailer Static video summary: στάσιμες εικόνες - storyboard Χαρακτηριστικά καρέ - Key frames ΔΠΜΣ ΗΕΠ 2011-2012
Που βρίσκει εφαρμογές; • Διαδικασία Browsing (Searching) Απαίτηση για γρήγορη περιήγηση στο περιεχόμενο του video. • Διαδικασία Retrieval Ανάκτηση ενός video, συγκεκριμένου περιεχόμενου, από ένα μεγάλο σύνολο videos . • Διαδικασία Indexing Απαίτηση για γρήγορη μετάβαση σε μια συγκεκριμένη περιοχή του video. ΔΠΜΣ ΗΕΠ 2011-2012
Όλα τα βίντεο έχουν τίτλο ‘New Indians’. Ψάχνω αυτό που απεικονίζει τρένο.. Ένα παράδειγμα ΔΠΜΣ ΗΕΠ 2011-2012
Χαρακτηριστικά storyboard Δεν αρκεί να βρεθεί μια μέθοδος εξαγωγής χαρακτηριστικών καρέ, αλλά πρέπει να είναι και αποτελεσματική... • Συνέχεια: πρέπει η περίληψη να μη διακόπτεται • Προτεραιότητα: η περίληψη πρέπει να περιέχει τα αντικείμενα «υψηλής προτεραιότητας» • Επανάληψη: δε χρειάζεται να αναπαριστούμε τα ίδια γεγονότα ή αντικείμενα συνεχώς ΔΠΜΣ ΗΕΠ 2011-2012
Ορολογία βίντεο • σκηνή (scene) καθορίζεται ως μια συλλογή από σημασιολογικά συσχετισμένα και χρονικά γειτονικά πλάνα, που απεικονίζουν και μεταβιβάζουν μια έννοια υψηλού επιπέδου – οι σκηνές διαχωρίζονται από σημασιολογικά όρια • πλάνο (shot) μια συνεχής ακολουθία από καρέ, καταγεγραμμένα από μία μόνο κάμερα • χαρακτηριστικό καρέ (key frame) είναι το καρέ που αναπαριστά το πιο αξιοπρόσεχτο οπτικό περιεχόμενο ενός πλάνου/βίντεο ΔΠΜΣ ΗΕΠ 2011-2012
Ορολογία βίντεο ΔΠΜΣ ΗΕΠ 2011-2012
Τρόποι εναλλαγής πλάνων (1) • Cut Πρόκειται για μετάβαση όπου το τελευταίο frame του προηγούμενου πλάνου ακολουθείται από το πρώτο frame του επόμενου πλάνου. • Fade Είναι η αργή μεταβολή στην φωτεινότητα (αύξηση ή μείωση) σε κάθε frame, με αποτέλεσμα την σταδιακή εμφάνιση (fade-in) ή την εξαφάνιση (fade-out) του πλάνου, από ή προς ένα μαύρο frame. ΔΠΜΣ ΗΕΠ 2011-2012
Τρόποι εναλλαγής πλάνων (2) • Dissolve Πρόκειται για έναν συνδυασμό fade-out και fade-in σε συνεχόμενα (χρονικά) πλάνα. Η φωτεινότητα του προηγούμενου πλάνου σταδιακά μειώνεται ενώ παράλληλα η φωτεινότητα του επόμενου πλάνου σταδιακά αυξάνει. • Wipe Το frame του προηγούμενου πλάνου με συγκεκριμένο σχήμα και κίνηση δίνει σταδιακά την θέση του στο frame του επόμενου πλάνου. http://www.mediacollege.com/video/editing/transition/types.html ΔΠΜΣ ΗΕΠ 2011-2012
Τυχαία ή ομοιόμορφη δειγματοληψία από όλο το βίντεο • Μειονέκτημα: εξάρτηση απο χρονική διάρκεια πλάνων Βασικές κατηγορίες μεθόδων εξαγωγής χαρακτηριστικών καρέ • Μέθοδοι δειγματοληψίας - Sampling based • Μέθοδοι εφαρμοζόμενες σε πλάνο - Shot based • Μέθοδοι ομαδοποίησης βίντεο – Clustering • Άλλες τεχνικές (π.χ. Xρήση VANTAGE points) • Προϋπόθεση:κατάτμησησε πλάνα • Χαρακτηριστικό καρέ:το 1ο καρέ από κάθε πλάνο για παράδειγμα • Αναφέρονται σε όλο το βίντεο – χωρίζουν τα καρέ σε ομάδες • Από κάθε ομάδα ένα αντιπροσωπευτικό καρέ ΔΠΜΣ ΗΕΠ 2011-2012
Περιγραφή εικόνας με : Ιστόγραμμα στονHSV χώρο • Γιατί επιλέγω αυτό το χαρακτηριστικό? -Χρωματική πληροφορία σημαντική -Σταθερό σε μικρές μεταβολές της κάμερας ! • Γιατί εργάζομαι στον HSV χώρο? - Πιστότερη αναπαράσταση ως προς την ανθρώπινη αντίληψη - Πρότυπο MPEG7 Hue χρώμα Saturationκορεσμός (ποσότητα λευκού χρώματος) Valueφωτεινότητα ΔΠΜΣ ΗΕΠ 2011-2012
Το βίντεό μας... ΔΠΜΣ ΗΕΠ 2011-2012
Βασικές κατηγορίες μεθόδων εξαγωγής χαρακτηριστικών καρέ • Μέθοδοι δειγματοληψίας - Sampling based • Μέθοδοι εφαρμοζόμενες σε πλάνο - Shot based • Μέθοδοι ομαδοποίησης βίντεο – Clustering • Άλλες τεχνικές (π.χ. Xρήση VANTAGE points) ΔΠΜΣ ΗΕΠ 2011-2012
Μέθοδοι κατάτμησης του βίντεο σε πλάνα &εξαγωγήςχαρακτηριστικών καρέ (Shot based) • Διαφορά ιστογραμμάτων μεταξύ διαδοχικών καρέ • Αθροιστική διαφορά ιστογραμμάτων ΔΠΜΣ ΗΕΠ 2011-2012
Διαφορά ιστογραμμάτων (1) Κατάτμησητου βίντεο σε πλάνα • Εικόνα ιστόγραμμα • Καρέ που ανήκουν σε διαφορετικά πλάνα θα έχουν διαφορετικό περιεχόμενο αντίστοιχα ιστογράμματα θα παρουσιάζουν διαφορές • Εφαρμογή κατωφλίου • Διαχωρισμός σε πλάνα ΔΠΜΣ ΗΕΠ 2011-2012
Διαφορά ιστογραμμάτων (2) ΔΠΜΣ ΗΕΠ 2011-2012
Διαφορά ιστογραμμάτων (3) Προβληματισμοί για την τάξη: • Εφαρμογή κατωφλίου ανεξάρτητη από το βίντεο? • Τι γίνεται στις μεταβάσεις που δεν είναι τύπου cut? Ερωτήματα για το εργαστήριο: • Ιστόγραμμα σε έγχρωμες εικόνες? • Bin size? • Μετρική απόστασης ιστογραμμάτων? ΔΠΜΣ ΗΕΠ 2011-2012
Διαφορά ιστογραμμάτων (4) Το 1ο καρέ του βίντεο κρατείται πάντα ως χαρακτηριστικό καρέ. Εξαγωγή χαρακτηριστικών καρέ • Eπιλογή 1ου καρέ από κάθε πλάνο • Επιλογή ενός τυχαίου καρέ από κάθε πλάνο ΔΠΜΣ ΗΕΠ 2011-2012
Διαφορά ιστογραμμάτων (5) Μειονεκτήματα: • Κατωφλιοποίηση • Όλα τα πλάνα θεωρούνται το ίδιο σημαντικά • Μεταβάσεις που δεν είναι τύπου cut και ανιχνευτούν θα δώσουν ‘’προβληματικό’’ χαρακτηριστικό καρέ ΔΠΜΣ ΗΕΠ 2011-2012
Αυτόματη περίληψη βίντεο – Ένα παράδειγμα ΔΠΜΣ ΗΕΠ 2011-2012
Αθροιστική διαφορά ιστογραμμάτων (1) Κατάτμηση του βίντεο σε πλάνα • Εικόνα ιστόγραμμαδιαφορές διαδοχικών ιστογραμμάτων • Αθροιστικές διαφορές αύξουσα συνάρτηση • Απότομες αλλαγές κλίσης δηλώνουν σημαντικές μεταβολές στο οπτικό περιεχόμενο (οξείες γωνίες) • Εφαρμογή κατωφλίου • Κατάτμηση σε πλάνα ΔΠΜΣ ΗΕΠ 2011-2012
Αθροιστική διαφορά ιστογραμμάτων (2) ΔΠΜΣ ΗΕΠ 2011-2012
απόσταση d i+1 θi i-1 i καρέ Αθροιστική διαφορά ιστογραμμάτων (3) Καθορισμός γωνίας ΔΠΜΣ ΗΕΠ 2011-2012
Αθροιστική διαφορά ιστογραμμάτων (4) ΔΠΜΣ ΗΕΠ 2011-2012
Αθροιστική διαφορά ιστογραμμάτων (5) Στο 1ο και στο τελευταίο καρέ του βίντεο θεωρώ ότι εμφανίζεται ακρότατο. Εξαγωγή χαρακτηριστικών καρέ • Επιλογή χαρακτηριστικού καρέ ως το καρέ που βρίσκεται ανάμεσα σε δύο διαδοχικά ακρότατα. ΔΠΜΣ ΗΕΠ 2011-2012
Αθροιστική διαφορά ιστογραμμάτων (6) Μειονεκτήματα: • Κατωφλιοποίηση – εξάρτηση από βίντεο • Μεταβάσεις τύπου dissolve μπορεί να μην ανιχνευτούν κίνδυνος επιλογής χαρακτηριστικού καρέ στην μετάβαση ΔΠΜΣ ΗΕΠ 2011-2012
Αποτίμηση... • Shot based μέθοδοι έχουν πρόβλημα σε δυναμικά πλάνα • Εφαρμόζονται σε κάθε πλάνο του βίντεο απαιτούν την κατάτμησή του σε πλάνα ΔΠΜΣ ΗΕΠ 2011-2012
Βασικές κατηγορίες μεθόδων εξαγωγής χαρακτηριστικών καρέ • Μέθοδοι δειγματοληψίας - Sampling based • Μέθοδοι εφαρμοζόμενες σε πλάνο - Shot based • Μέθοδοι ομαδοποίησης βίντεο – Clustering • Άλλες τεχνικές (π.χ. Xρήση VANTAGE points) ΔΠΜΣ ΗΕΠ 2011-2012
Ομαδοποίηση - Clustering ΔΠΜΣ ΗΕΠ 2011-2012
Ομαδοποίηση - Clustering ΔΠΜΣ ΗΕΠ 2011-2012
Μέθοδοιεξαγωγήςχαρακτηριστικών καρέ (Clustering) Γενικά: • Για κάθε καρέ εξάγω χαρακτηριστικό. • Ομαδοποιώ -χρησιμοποιώντας κάποια μέθοδο- σε κλάσεις. • Από κάθε κλάση επιλέγω το κέντρο ως χαρακτηριστικό καρέ. ΔΠΜΣ ΗΕΠ 2011-2012
Μειονεκτήματα μεθόδων ομαδοποίησης βίντεο: • Καθορισμός αριθμού ομάδων –κλάσεων • Υπολογιστικό κόστος ΛΥΣΗ: VISTO Μια λύση είναι το pre-sampling, δηλαδή εφαρμογή μεθόδου σε υποσύνολο. ΔΠΜΣ ΗΕΠ 2011-2012
Περίληψη βίντεο χρησιμοποιώντας την μέθοδο VΙsualSTOryboard • Ο χρόνος υπολογισμού του storyboard καθώς και το μήκος της περίληψης μπορεί να καθοριστεί από το χρήστη! • Δημιουργία περίληψης σε πραγματικό χρόνο! ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (1) Βήμα1. εξαγωγή χαρακτηριστικού από την εικόνα Ιστόγραμμα στον HSV χώρο αναπαράσταση κάθε εικόνας με ένα διάνυσμα Βήμα2. επιλογή μετρικής απόστασης ανάμεσα σε δύο εικόνες-διανύσματα, έστω s, z Generalized Jaccard Distance : ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (2) Bήμα 3. ομαδοποίηση – αριθμός κλάσεων Σκοπός είναι να χωριστούν σε ομάδες όλα τα καρέ του βίντεο, δηλαδή τα αντίστοιχα διανύσματα, χρησιμοποιώντας την μετρική απόστασης. Από κάθε κλάση θα επιλεγεί ένα καρέ ως key frame. • Αντιμετώπιση υπολογιστικού κόστους? • Καθορισμός αριθμού κλάσεων? ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (3) Υποδειγματοληψία .. Αντιμετώπιση υπολογιστικού κόστους: αλγόριθμος ομαδοποίησης γρήγορος. Βασική ιδέα Furthest Point Firstαλγόριθμου: -Αρχικό κέντρο = τυχαίο καρέ -Σε κάθε επανάληψη ο αλγόριθμος ‘γνωρίζει’ α) τα κέντρα που έχουν επιλεγεί β)την απόσταση κάθε καρέ από το κοντινότερο κέντρο ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (4) Βήματα αλγορίθμου σε κάθε επανάληψη: • Βρες το καρέ που έχει την μεγαλύτερη απόσταση από το κοντινότερό του κέντρο. • Θεώρησε αυτό το καρέ ως νέο κέντρο. • Επανυπολόγισε τις αποστάσεις των καρέ από τα νέα κέντρα πλέον. • Επανάλαβε μέχρις ότου βρεις όλα τα κέντρα. Πόσα κέντρα?? ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (5) Εφόσον ο χρήστης δε θέλει να επιλέξει τον αριθμό των key frames Καθορισμός αριθμού κλάσεων: -κράτησε 1 καρέ κάθε 10 -βρες αποστάσεις μεταξυ διαδοχικών καρέ -μεγάλη απόσταση μεγάλη ανομοιότητα -αριθμός ‘κορυφών’ = αριθμός κλάσεων αριθμός key frame Χρόνος εξαγωγής storyboard εξαρτάται από αριθμό κλάσεων ΔΠΜΣ ΗΕΠ 2011-2012
VIsual SΤΟryboard (5) Βήμα4. Μετα-επεξεργασία storyboard - Post Processing - Αφαίρεση key frames που δεν έχουν νόημα, π.χ. μαύρα καρέ σε μεταβάσεις τύπου fade Βήμα5. Αξιολόγηση storyboard - Mean Opinion Score 20 άτομα, βαθμολογία 1(bad) – 5 (excellent) ΔΠΜΣ ΗΕΠ 2011-2012
Βασικές κατηγορίες μεθόδων εξαγωγής χαρακτηριστικών καρέ • Μέθοδοι δειγματοληψίας - Sampling based • Μέθοδοι εφαρμοζόμενες σε πλάνο - Shot based • Μέθοδοι ομαδοποίησης βίντεο – Clustering • Άλλες τεχνικές - Xρήση VANTAGE points ΔΠΜΣ ΗΕΠ 2011-2012
Περίληψη βίντεο με χρήση VantagePoints • Εξαγωγή χαρακτηριστικών καρέ χωρίς να απαιτείται κατάτμηση του βίντεο σε πλάνα D.Besiris, N.Laskaris, F.Fotopoulou and G.Economou, ‘’Key frame extraction in video sequences: a vantage points approach’’, 2007 International Workshop on Multimedia Signal, pp. 434-437, Crete 2007 ΔΠΜΣ ΗΕΠ 2011-2012
Vantage points (1) • Τα χαρακτηριστικά καρέ εξάγονται σύμφωνα με τηναρχή της μεγαλύτερης ‘εξάπλωσης’ στο χώρο. • Eπιλογή χαρακτηριστικών καρέ, που είναι ομοιόμορφα κατανεμημένα στο χώρο. • Τα χαρακτηριστικά καρέ είναι αυτά που έχουν τη μέγιστη δυνατή απόσταση μεταξύ τους. ΔΠΜΣ ΗΕΠ 2011-2012
Vantage points (2) ΔΠΜΣ ΗΕΠ 2011-2012
Vantage points (3) Κεντρικό σημείο: έχει το μικρότερο άθροισμα αποστάσεων από όλα τα υπόλοιπα Η μέθοδος: Εικόναεξαγωγή ιστογράμματος 1οkey frame είναι ο vector median(διανυσματικός διάμεσος) 2οkey frame είναι αυτό που απέχει περισσότερο από τον vector median Επόμενο key frame είναι αυτό που έχει την μεγαλύτερη απόσταση ΚΑΙ από τα 2 key frames … Νοστοkey frame είναι αυτό που έχει τη μεγαλύτερη απόσταση από όλα τα προηγούμενα Ν-1 key frames ΔΠΜΣ ΗΕΠ 2011-2012
Vantage points (4) • Πότε σταματά ο αλγόριθμος? Όταν η απόσταση των χαρακτηριστικών καρέ γίνει μικρή γειτονικά καρέόμοια... Όχι μειονέκτημα κατωφλιοποίησης! Συγκρίνω με την απόσταση που έχουν τα 2 πρώτα key frames! ΔΠΜΣ ΗΕΠ 2011-2012
Αξιοπιστία αναπαράστασης (1) 1. Ανθρωποκεντρική προσέγγιση π.χ. Mean Opinion Score 2.Αντικειμενικές προσεγγίσεις 2.1 Πιστότητα (Fidelity) 2.2 Λόγος συμπίεσης (Compression Ratio) ΔΠΜΣ ΗΕΠ 2011-2012
Αξιοπιστία αναπαράστασης (2) Επιθυμώ υψηλές τιμές του δείκτη! • Πιστότητα (Fidelity) j : key-frame i≠j : frame dij:απόσταση μεταξύ κάθε καρέ i και τουχαρακτηριστικού καρέ j ΔΠΜΣ ΗΕΠ 2011-2012
Αξιοπιστία αναπαράστασης (3) • Λόγος συμπίεσης (Compression Ratio) Επιθυμώ υψηλές τιμές του δείκτη! • NKF : αριθμός των key frames • NF : ο αριθμός των frames ΔΠΜΣ ΗΕΠ 2011-2012
Θεωρία τέλος! Συνέχεια με την εργαστηριακή άσκηση! ΔΠΜΣ ΗΕΠ 2011-2012