1 / 14

Συντήρηση (Ψηφιακών) Εγγράφων Τι Αποτελεί την Επιτυχή Συντήρηση

Ιόνιο Πανεπιστήμιο – ΤΑΒ ΠΜΣ 2006-07 Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλον εργασία στο μάθημα : Ψηφιακές Βιβλιοθήκες της φοιτήτριας : Τσώνη Μαρία Διδάσκον : κ. Καπιδάκης.

Download Presentation

Συντήρηση (Ψηφιακών) Εγγράφων Τι Αποτελεί την Επιτυχή Συντήρηση

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ιόνιο Πανεπιστήμιο – ΤΑΒΠΜΣ 2006-07 Υπηρεσίες Πληροφόρησης σε Ψηφιακό Περιβάλλονεργασία στο μάθημα : Ψηφιακές Βιβλιοθήκεςτης φοιτήτριας : Τσώνη Μαρία Διδάσκον : κ. Καπιδάκης Μια ασυμβίβαστη Αρχιτεκτονική για τη Συντήρηση Ψηφιακών Εγγράφων(A No-Compromises Architecture for Digital Document Preservation)Thomas A. Phelps and P.B. Watry, University of Liverpool, Great Britain ECDL 2006 - LNCS 3652

  2. ΕισαγωγήΤο Πολυχρηστικό Πρότυπο (Multivalent)μια νέα αρχιτεκτονική συντήρησης των ψηφιακών εγγράφων Το πολυχρηστικό πρότυπο γεννήθηκε το 1997 ως ένα project μιας διατριβής στο Πανεπιστήμιο του Μπέρκλεΐ και ο δημιουργός του έχει μετακινηθεί από τότε στο πανεπιστήμιο του Λίβερπουλ. η εφαρμογή αυτή χρησιμοποιήθηκε για τη συντήρηση, πρώτη φορά στη πόλη Σαν Ντιέγκο της Αμερικής στο ερευνητικό κέντρο υπερυπολογιστών και συγκεκριμένα στο πρόγραμμα δοκιμών επίμονων αρχείων το 2004 Μια προηγούμενη εφαρμογή της έγινε με μεγάλη επιτυχία σε έναν φυλλομετρητή Ιστού (το σύστημα αυτό καταμετράει ήδη συνολικά άνω των 100.000 γραμμών και πάνω από 4 εκατομμύριων χαρακτήρων πηγαίου κώδικα)

  3. Συντήρηση (Ψηφιακών) Εγγράφων Τι Αποτελεί την Επιτυχή Συντήρηση • Για τα έγγραφα από χαρτί : συλλογή δεδομένων από φυσικά μέσα (χαρτί) και επιτυχής συντήρηση του φυσικού υλικού ώστε το περιεχόμενο να μπορεί να εξεταστεί .Για τα Ψηφιακά έγγραφα : η επιτυχής συντήρηση είναι πιο σύνθετη. • Κάποια Βασικά Προβλήματα της Ψηφιακής Συντήρησης • Προέλευση και Συλλογή δεδομένων διάφορων τύπων (διάφοροι μορφότυποι - ιστοσελίδες, CD, αρχεία Υπολογιστών, κ.α) • Αποκωδικοποίηση των δεδομένων μόνο από εξειδικευμένο λογισμικό (συχνά μη διαθέσιμο) και η Διαχείριση των πεπαλαιωμένων μορφότυπων από τα νέα μέσα • Διατήρηση των Μεταδεδομένων τους • Πολλαπλοί τύποι δεδομένων μέσα στο ίδιο αρχείο (εικόνες , βίντεο , ήχοι , κ.α) • Τα διάφορα ενεργά στοιχεία του εγγράφου (φόρμες , συνδέσεις) • Μακροχρόνια αποθήκευση τους σε φυσικά μέσα • Και άλλα …

  4. Η Εξομοίωση Τα Παγκόσμια Σχήματα Η Μετατροπή / Μετανάστευση Ο Παγκόσμιος Εικονικός Υπολογιστής οι πιο κοινές εφαρμογές που χρησιμοποιούνται για τηνΣυντήρηση Ψηφιακών Εγγράφων

  5. Η Εξομοίωση Οι εξομοιωτές είναι ειδικά προγράμματα που μπορούν να αντιγράφουν στη μνήμη τους το (παλαιό) υλικό/λογισμικό ενός έγγραφου και επομένως αναπαραγάγουν την ακριβής εμφάνιση και συμπεριφορά του. Μειονεκτήματα : • Απαιτεί πολλές ώρες εργασίας • Έχει αρκετά υψηλό λειτουργικό κόστος • Δημιουργία συνεχώς αναπτυσσόμενου σωρού εξομοιωτών (Κάθε εξομοιωτής λειτουργεί μέσα σε ένα δεδομένο σύστημα. Τα στοιχεία που αντιπροσωπεύουν το έγγραφο - οι δομές δεδομένων - και το περιεχόμενό του παραμένουν εγκλωβισμένα στη μνήμη του εξομοιωτή. Έτσι, είναι δύσκολη η εξαγωγή τους σε άλλο νέο σύστημα . Για να γίνει αυτό απαιτείται νέος εξομοιωτής που θα τρέξει τον προηγούμενο εξομοιωτή…)

  6. Η Μετατροπή / Μετανάστευση Η μετατροπή/μετανάστευση, έχει την ικανότητα να δέχεται το υλικό με έναν παλαιότερο μορφότυπο και να το κωδικοποιεί ξανά εκ νέου σε ένα νεότερο μορφότυπο. Μειονεκτήματα : • Με τις μετατροπές το έγγραφο χάνει πληροφορίες (π.χ πολλές έννοιες ενός μορφότυπου δεν μπορούν να εκφραστούν σε άλλον) • Υποβαθμίζεται η ποιότητα • Το λογισμικό είναι συμβατό με τις τελευταίες εκδόσεις ενός μορφότυπου και έτσι οι παλαιότερες εκδόσεις του (χωρίς αναβαθμίσεις-ενημερώσεις) πολύ πιθανόν να είναι δυσανάγνωστοι

  7. Το πρόγραμμα CAMiLEON To πρόγραμμα αυτό χρησιμοποιεί και στοιχεία της εξομοίωσης και της μετατροπής , ώστε να παράγει έναν ενδιάμεσο ενωτικό μορφότυπο που θα περιλαμβάνει τις έννοιες όλων των υποστηριζόμενων μορφότυπων που υπάρχουν σε ένα έγγραφο ώστε να μπορεί αυτό να εξεταστεί . Το πρόγραμμα CAMiLEON [ Creative Archiving at Michigan and Leeds Emulating the Old on the New ] είναι κοινή εργασία μεταξύ των πανεπιστημίων του Μίτσιγκαν (ΗΠΑ) και του Λίντς (Ηνωμένο Βασίλειο) και χρηματοδοτείται από το JISC & το NSF. Μειονεκτήματα : δεν καταδεικνύει την συμπεριφορά των εγγράφων τα σημασιολογικά χάσματα που δημιουργούνται απαιτούν υποβιβασμό κάποιων στοιχείων , άρα απώλεια πληροφοριών και αντίστοιχο υποβιβασμό της ποιότητας από πρακτικής σκοπιάς ένα ενδιάμεσο σχήμα που θα υποστηρίζει 100δες ή χιλιάδες μορφότυπων θα ήταν υπερβολικά μεγάλο και αδέξιο

  8. Τα Παγκόσμια Σχήματα Ο διασημότερος παγκόσμιος μορφότυπος είναι το PDF. - Μοναδικό πλεονέκτημα ότι μπορεί να συλλάβει οποιοδήποτε έγγραφο μπορεί να τυπωθεί (δηλ. όλους τους μορφότυπους με στατικό περιεχόμενο) - υποστηρίζει υψηλής πιστότητας εικόνα καθώς επίσης και κείμενο-βασισμένες διαδικασίες όπως η έρευνα . - μπορεί να ενσωματώσει το bitstream του αρχικού εγγράφου για μελλοντική επεξεργασία ή πιο απαιτητική συντήρηση. - Είναι λογισμικό ανοιχτού κώδικα και υποστηρίζει τα αρχεία μεταδεδομένων της γλώσσας XML. Μειονεκτήματα : δεν είναι πρακτικό να συλληφθούν εντελώς όλες οι πτυχές όλων των μορφότυπων εγγράφων μέσα σε ένα ενιαίο καθορισμένο μορφότυπο (αυτός θα ήταν αδέξιος, εχθρικός στην πλήρη εφαρμογή και θα έπρεπε να ενημερώνεται συνεχώς καθώς νέοι μορφότυποι θα εισάγονται) υπάρχει ένα βήμα μετατροπής και άρα μια αντίστοιχη απώλεια δεδομένων με τη χρήση των παγκόσμιων μορφότυπων (πρέπει λόγω πρακτικής ανάγκης να επιλέγουν ορισμένα μόνο χαρακτηριστικά των μορφότυπων που θα συνδυάζουν - και να προσπερνούν κάποια άλλα)

  9. Universal Virtual Computer Η έννοια του καθολικού εικονικού υπολογιστή αναπτύχθηκε από τον Raymond Lorie. Είναι ένα σύστημα που χρησιμοποιεί τα στοιχεία και της μετανάστευσης και της εξομοίωσης και επιτρέπει στα ψηφιακά αντικείμενα να ανασυγκροτηθούν με την αρχική μορφή τους. Η έννοια του UVC αποτελείται από : τον ίδιο τον UVC , (που είναι ένας λογικός μορφότυπος δεδομένων με περιγραφές των τύπων) το πρόγραμμα UVC (αποκωδικοποίησης μορφότυπων) και τον λογικό αναγνώστη δεδομένων. Ο UVC έχει ήδη πραγματοποιηθεί και έχει αποδειχθεί ικανός να εργάζεται για τους τύπους εικόνας χρησιμοποιώντας τα πρότυπα JPEG και GIF Μειονεκτήματα : • απαιτείται γλώσσα υψηλού επιπέδου (όπως η Java) και επιπλέον βιβλιοθήκες προκαθορισμένων λειτουργιών ώστε η αρχιτεκτονική να ενσωματώνει συγκεκριμένες έννοιες όπως τα μεταδεδομένα, τη συμπεριφορά, τη δομή, κ.α ( οι οποίες όλες να μπορούν να συνάγονται στον UVC ). • Ένα επίπεδο πάνω από τον UVC θα πρέπει να διασυνδεθεί με το υλικό (πληκτρολόγιο, ποντίκι, οθόνη …)

  10. Multivalent Το πρότυπο αυτό έχει υψηλού επιπέδου αρχιτεκτονική και εκτενή εφαρμογή καθώς επεκτείνεται εύκολα στους νέους μορφότυπους εγγράφων αφού : προσδιορίζεται από μια διασταύρωση της μορφής του δέντρου εγγράφου ως προς τη δομή των δεδομένων, η οποία - συλλαμβάνει πλήρως τη σημασιολογία και το σχεδιάγραμμα - υποστηρίζει την πλήρη έκφραση των συχνά ιδιοσυγκρασιακών εννοιών ενός μορφότυπου, καθώς και τη συμπεριφορά , - επιτρέπει το διαμοιρασμό της λειτουργικότητας μεταξύ των διαφόρων μορφότυπων και μειώνει έτσι την προσπάθεια εφαρμογής της. - Μπορεί να εισαγάγει νέες λειτουργίες όπως οι υπερσύνδεσμοι και οι σημειώσεις στις παλαιότερες μορφές τύπων που δεν μπορούσαν να εκφράσουν τη λειτουργία αυτή , - παρέχει μια ενιαία διεπαφή (API) σε όλους τους μορφότυπους .

  11. Multivalent Σε σύγκριση με τις υπάρχουσες προσεγγίσεις στην ψηφιακή συντήρηση εγγράφων, το πολυχρηστικό πρότυπο εγγράφου προσφέρει ένα βήμα προς τα εμπρός . έναντι της μετατροπής , το αρχικό έγγραφο παραμένει τέλεια συντηρημένο. έναντι της εξομοίωσης , το περιεχόμενο του εγγράφου είναι εύκολα διαθέσιμο. έναντι στον UVM, καθορίζεται από αρχιτεκτονική υψηλού επιπέδου που είναι απαραίτητη για τους μηχανικούς λογισμικού, η εφαρμογή του πολυχρηστικού προτύπου σε έναν αριθμό σύνθετων και ξεπερασμένων μορφότυπων εγγράφων αποδεικνύει τη καταλληλότητα του για τη συντήρηση.

  12. Προβληματισμοί … Υπάρχουν επίσης πολλοί τύποι μέσων (μερικοί εκ των οποίων ενσωματώνεται στα έγγραφα) που έχουν ανάγκη από συντήρηση. τα επιστημονικά δεδομένα, ο ήχος, τα πολυμέσα , τα μουσικά αποτελέσματα, τα βίντεο, τα προγράμματα επιλογών DVD, είναι μερικά μόνο από αυτά… Είναι ασαφές (ακόμη δεν έχει εξεταστεί στη πράξη) εάν όλοι αυτοί οι τύποι μπορούν να προσαρμοστούν στο πλαίσιο μιας κοινής αρχιτεκτονικής.

More Related