290 likes | 417 Views
Présentation d’AIM É. Préparé par : Guy Maréchal (CIRTEF) (Version consolidée au niveau de la ‘maquette’, tenant compte des décisions du 22 mai 2002). Le projet, la dynamique d’ AIM É. Le projet AIME traite de l’ARCHIVAGE
E N D
Présentation d’AIMÉ Préparé par : Guy Maréchal (CIRTEF) (Version consolidée au niveau de la ‘maquette’, tenant compte des décisions du 22 mai 2002)
Le projet AIME traite de l’ARCHIVAGE • C’est à dire de l’ensemble du processus d’archivage, depuis la collecte des documents et des métadonnées pour constituer les archives jusqu’à leurs exploitations ! • Plusieurs centres d’archivage peuvent coexister dans une même organisation. • L’archivage est une des composantes des processus internes aux organisations. • Les principaux processus qui sont en relation avec l’archivage sont : • La gestion de projets : • Programmation • Acquisition / Contribution • Production / Réalisation • Diffusion • Exploitation interne / externe • Exploitation via des agents … • La plupart des informations de ces autres processus sont supposées gérées localement. Cependant, certaines des informations de ces autres processus ont significativement à voir avec les contenus et leurs métadonnées ces informations seront donc aussi archivées.
Le projet AIME possède quatre segments : • La métabase Coordinateur : Marie-Pierre Dura • L’architecture Coordinateur : Guy Maréchal • Le produit logiciel / matériel (accord de consortium signé le 22 février 2002) • Applications :Coordinateur : Luc Peeters • Acquisition / transcodage / restitution • Gestion d’archivage • Catalogue inOvo§ • Intra-documents StreamCase (flux) § InfoGrafic (statique) § • Exports / Import StreamCase § • Sites Web(s) • AIME outils inOvo § • Services & plateformeCoordinateur : Christophe Traina • Web • FTP • Stream • DBMS • L’organisation • ValidationCoordinateur : Philippe Fannoy • EducationCoordinateur : Cirtef • OpérationsCoordinateur : <A définir> • SupportCoordinateur : <A définir> • Note : §marque les développements techniques principaux par opposition à de l’intégration
Avant de présenter un à un chaque segment, il est important et pédagogique d’introduire une des dimensions architecturale essentielle d’AIME : l’approche que la littérature informatique appelle ‘Collection based’ dont le formalisme a été notamment développé en référence. L’approche est caractérisée par divers éléments architecturaux dont les principaux sont : • Le monde est un ensemble de systèmes qui, de temps en temps, peuvent communiquer entre eux ; • Chaque système de gestion d’une archive est comme un ‘Univers île’, c’est à dire il a son autonomie, son état cohérent, incohérent, en panne, … ; un tel système peut être grand (par exemple, la Grande Bibliothèque de France GBF) ou petit (Le DVD de Matrix et de ses bonus). • Chaque système est auto-descriptif jusqu’au boût du niveau de normes, standards, conventions, langages, structures, protocoles, … ; • Chaque système a des moyens d’exportation et d’importation qui permettent non seulement de transmettre un ensemble cohérent de l’information contenue dans le système mais aussi la définition formelle de ce contenu en termes auto-descriptifs ; • Les systèmes possèdent des outils et des organisations qui leur permettent d’absorber (par conversion et non par émulation) des évolutions ou des différences (entre Univers îles ou entre eux-mêmes en évolution)! • Note : pour ne pas riquer de confusion avec la notion de ‘Collection’ dans la Métabase, l’approche ‘Collection based’ sera appelée dans AIME approche en ‘Univers îles’ ! • Références : • Rajasekar, A., Marciano, R., Moore, R., • "Collection-Based Persistent Archives," Proceedings of the 16th IEEE Symposium on Mass Storage Systems, March 1999. • Collection based persistent data archives (part 1) in • D-Lib MagazineApril 2000Volume 6 Number 3 ISSN 1082-9873http://www.dlib.org/dlib/march00/moore/03moore-pt1.html • Collection based persistent data archives (part 2) in • D-Lib MagazineApril 2000Volume 6 Number 4ISSN 1082-9873http://www.dlib.org/dlib/april00/moore/04moore-pt2.html
CD, DVD, Bandes Juke-box … Import / Export Import / Export Tampon des Contenus des documents Dossiers et fichiers des Contenus des documents Dossiers et fichiers des Contenus des documents Tampon des Contenus des documents • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Acquisition Acquisition Web server Web server Catalogue Catalogue Publieur Publieur Document Document Butineur Butineur Butineur Butineur Gestionnaire de DBMS Gestionnaire de DBMS Outils Outils Outils Outils Exemple de deux ‘Univers îles’ en liaison
AIMÉ-Métabase • Phase 1 : Établissement • Document de référence : ‘Structure et organisation Méta base • 12 02 2002’ • Phase 2 : Consolidation • Lancement aux réunions plénières des 28 et 29 mars 2002 • Consolidation pour la maquette le 22 mai 2002 • Phase 3 : Validation • Phase 4 : Exploitation
Principes et principaux objectifs de la seconde phase ‘Consolidation’ du segment ‘Métabase de la dynamique AIME’ • S’appuyer en principe sur le document ‘Métabase … 12 02 2002’ • Tenir compte des impératifs techniques de mise en oeuvre • Garantir la simplicité d’usage • Avoir une terminologie non ambiguë • Ajout de la liste minimale des rôles / profils • Ajout de règles minimales • Identifier ce qui est visé • Dans AIME-maquette • Dans AIME-tremplin • Dans AIME+ • …
Quelques définitions : • Le catalogue : l’ensemble des données de la base de données d’un Centre de documentation, jusqu’au niveau des TD (Types de Documents) (Entités TD # voir plus loin). • Une Collection : un ensemble d’opus relié par une intention commune (un feuilleton, les journaux télévisés, un programme éducatif en dix leçons, …) • Un ‘opus’ : un ensemble d’occurrences de documents typés se rapportant à un sujet ou objet unique • Type : le modèle qui servira à faciliter la création d’occurrences de ce type • (un document est l’occurrence d’un type de document) • Un document : l’ensemble • des instances des métadonnées associées à un ensemble cohérent de contenus • des contenus ‘internes’ et ‘externes’ • Un contenu ‘interne’ : la représentation des essences, données, contrôles, … sous forme d’un ou plusieurs fichiers typés • (un fichier MPEG-2, un fichier Word, …) • Un contenu ‘externe’ : un objet physique considéré comme pertinent dans l’opus’ • (un chapeau, une affiche, un film 35 mm, …) et / ou une représentation du contenu sur un support externe(une bande magnétique BetaCam-SP, un DVD, …)
Les profils de base • Le / la coordinateur/ trice de la fédération de sites AIME • L’administrateur / trice de sites AIME • Le / la documentaliste de sites AIME • L’opérateur / trice de sites AIME • Le client occasionnel de sites AIME • Le client affilié à un site AIME • L’agent de contenu appartenant à un autre site AIME
Structure ‘Archives’ AIMÉ-maquette 0-1 0-1 1 1 Types de documents (Entité 5) <logo > Centre (Entité 1) Formats de représentation (Entité 6) <logo > 1 Collection(Entité 2) 1 1 1 1 n n n n n Légende Opus / Œuvre (Entité 3) 1 1 < contenu > n < nom type > (Entité ) Document (métadonnées)(Entité 4) [Contenu(s) en externe] n Documents du ‘Type 2’ (métadonnées) (non structurés)(Entité TD 2) Lien relatif vers un fichier 1 1 Documents (métadonnées) (Entité 4) [Contenu(s) en interne] Lien vers un objet physique Hyperlien Documents du ‘Type 1’ (métadonnées) (non structurés) (Entité TD 1) Document (contenu) Plug-in = GUL !
E K N M L G J P H F D B I A C Un document avec contenus synchronisés et structurés(exemple) Contenus synchronisés 3.7 GO ? Contenu ‘Source’ en MPEG-2 à 15 Mbps 100 MO ? Contenu ‘Sélectionnel’ en QuickTime’ Avec incrustation de ‘time code’ Contenu ‘Sélectionnel’ en RealMedia 100 MO ? Avec incrustation de ‘time code’ Contenu ‘Sélectionnel’ en WindowsMedia 100 MO ? Avec incrustation de ‘time code’ Contenu ‘Table des matières’ en XML 9 * 10 KO ? Contenus ‘Mini photos’ en JPEG 3 * 20 KO ? 80 KO ? Contenu ‘Conduite’ en Word (encapsulé en ZIP) Document 1 3 2 Séquence Attributs de documents 1.3 1.1 1.2 3.2 3.3 2.1 3.4 3.1 2.2 Plan Evènement ‘Time code’
0-1 0-1 1 1 1 1 1 1 1 1 n 1 1 n n n n n n Légende 0 - 1 1 1 n 1 < contenu > n < nom type > (Entité ) n Lien relatif vers un fichier 1 1 Lien vers un objet physique n 1 Hyperlien Plug-in = GUL ! Structure ‘Archives’ AIMÉ-tremplin Types de documents (Entité 5) <logo > Centre (Entité 1) Organisation & gestion (Entité 10) Formats de représentation (Entité 6) <logo > Collection(Entité 2) Export / Import (Entité 8) Copie (Entité 9) Organisation détentrice des droits intellectuels(Entité 7) Opus / Œuvre (Entité 3) Document (métadonnées)(Entité 4) [Contenu(s) en externe] Documents du ‘Type 2’ (métadonnées) (non structurés)(Entité TD 2) Documents (métadonnées) (Entité 4) [Contenu(s) en interne] • Documents du ‘Type 3’ (structurés)(métadonnées) • Document (Entité TD 3.a) • Séquence / Rubrique (Entité TD 3.b) • Plan (Entité TD 3.c) • Evènement (Entité TD 3.d) Document (contenu) Documents du ‘Type 1’ (métadonnées) (non structurés) (Entité TD 1) Document (contenu)
n 1 0-1 0-1 1 1 1 1 1 1 n 1 1 1 n 1 1 n n n n n n Légende 0 - 1 1 1 n 1 < contenu > n < nom type > (Entité ) n Lien relatif vers un fichier 1 1 Lien vers un objet physique n 1 Hyperlien Plug-in = GUL ! Types de projets (Entité 11) Structure ‘Archives’ AIMÉ+ Types de documents (Entité 5) <logo > Centre (Entité 1) Organisation & gestion (Entité 10) Format de représentation (Entité 6) <logo > Projet(Entité 12) Bornes simples (Entité TP 1) Collection(Entité 2) Export / Import (Entité 8) Copie (Entité 9) Organisation détentrice des droits intellectuels(Entité 7) Opus / Œuvre (Entité 3) Document (métadonnées)(Entité 4) [Contenu(s) en externe] Documents du ‘Type 2’ (métadonnées) (non structurés)(Entité TD 2) Documents (métadonnées) (Entité 4) [Contenu(s) en interne] • Documents du ‘Type 3’ (structurés)(métadonnées) • Document (Entité TD 3.a) • Séquence / Rubrique (Entité TD 3.b) • Plan (Entité TD 3.c) • Evènement (Entité TD 3.d) Document (contenu) Documents du ‘Type 1’ (métadonnées) (non structurés) (Entité TD 1) Document (contenu)
Formats de représentation de contenus gérés par Aimé-tremplin • Formats de représentations supportés : • Télévision : • MPEG 4.2.2 (à 25 ou 50 Mbps) • MPEG-2 MP@ML • Radio : • CD-Audio (source) • MP-3 • Images • Jpeg • .gif • Données • PDF • Postscript • … • Sélectionnels • Windows media • Quick-time • Real • Contrôles et structures • HTML • XML / XSLT / • SQL (uniquement dans la gestion des TDs et TPs) • SMIL • … • Formats de programmes • DVB transport stream (one program) • DVD transport stream (one program) • Formats encapsulés, via zip • Structures de dossiers avec des fichiers en .doc, .xls, .ppt, .txt, … • Formats propriétaires typés en fichiers • ‘Sony’, … • Formats de supports acceptés (en entrée) : • DVD : • Sous boite • Nu • HDD : • FAT 32 • NTFS • Tape • Bétacam-SP • VHS (PAL, SECAM, NTSC) • CD • Audio • ROM • … • Formats de supports acceptés (en sortie) : • DVD : • Sous boite • Nu • HDD : • FAT 32 • NTFS • Tape • Bétacam-SP • VHS (PAL, SECAM […]) • CD • Audio • …
Le projet AIME (principes et architecture) [1/5] • La mise en œuvre et l’architecture visent à mettre en place des solutions correctes pour les produits et services (au sens du rapport du CNUD et des critères de l’UNESCO) ! • Formats de représentations des contenus non-propriétaires • Formats de représentation des métadonnées non propriétaires • Formats de représentation des structures non propriétaires • Types de supports à formats non-propriétaires • Formats de recherches à indexation automatique, mi-automatique ou manuelle • Utilisation, quand faire se peut, de logiciel ‘libre’, mais sous contrôle pour assurer sa pérennité.
Le projet AIME (principes et architecture) [2/5] • Comme dit précédemment, les solutions seront basées sur l’approche ‘Collection based’, appelée dans AIME ‘Univers îles’ c’est à dire où il y a coexistence et partenariat entre des bases de données différentes en formats et services : le métissage est inéluctable dans le temps et entre les systèmes à un même moment (y inclus l’évolution d’un système pour s’accommoder de l’évolution des techniques). • La mise en œuvre et l’architecture s’appuient sur une approche de fédération de bases de données, ayant une relative indépendance et s’échangeant des données via des fonctions d’Export / Import (impliquant éventuellement des conversions de formats et des conversions de modes d’interaction (protocoles différents). • Pour la facilité de mise en œuvre, un ‘Centre’ exporte ou importe de préférence le catalogue complet d’un centre et quelques uns des documents associés à un‘Opus’ • Les ‘contenus’, les ‘métadonnées’ et les ‘outils’ spécifiques sont archivés simultanément. • A priori tous les types de contenus sont représentables (audio, vidéo, images, textes, …) • Pour AIME, les formats d’organisation et représentation des données dans ces facilités d’Export / Import sont sous la forme de ‘Site Web portables’ (appelés ‘grappes’). Ils incluent le catalogue général, les outils de butinage et associés ainsi que, quand d’application, la représentation complète d’un ‘Opus’ (métadonnées et contenus). • Les supports peuvent être Off-line (DVD, Bandes, Disques durs amovibles, …) ou On-line (via les réseaux Internet). • Les champs de métadonnées sont eux-mêmes liés à un choix d’expression, en diverses langues, du nom des métadonnées
Le projet AIME (principes et architecture)[3/5] • Cette fédération de bases de données possède des facilités communes via un ‘Centre de support et de coordination’ • Identifieurs fondamentaux • Base des métadonnées (metadata repositery) • Veille technologique • Formation et éducation • Gestion de l’évolution • …
Le projet AIME (principes et architecture) [4/5] • La définition des métadonnées, des interfaces, des structures et des protocoles des transactions est rendue publique(idéalement via la normalisation), mais sous contrat avec le centre de support et de coordination ; les définitions des ‘Entités’ est faite en XML et la représentation via des XSLT (déclinées en langues) : • Gratuité d’accès et d’usage sans modification • Accès aux requêtes et validation des modifications ou extensions • Session au centre des droits patrimoniaux associés • Pénalités substantielles minimales, si dérogation au contrat
Le projet AIME (principes et architecture)[5/5] • Valorisation des applications basées sur ces principes et éléments architecturaux, grâce à l’appui du ‘Centre de support et de maintenance’ ! • Pour les industriels, il s’agit de valoriser les qualités de leurs applications venues commercialement • Pour les industrieux (en particulier les dévelopeurs de shareware) il s’agit de contribuer de manière efficace à la communauté des fournisseurs de ‘logiciels libre’. • Pour les contributeurs (industriels ou industrieux) en général, cette approche d’AIME est porteuse parce que il y a une composante de contiunité que l’approche strictement ‘en concurrenece’ ou strictement ‘libre ne permet pas !
Clients internes ‘AIMÉ reader’(outils Web spécifiques) Organisations des clients des clients cibles ‘AIMÉ reader’(outils Web spécifiques) StreamCase InfoGrafic • Organisations des clients cibles internes • Direction • Programmation • Réalisation • Contribution • Diffusion • … • Acquisitions en ‘Streams’ • Sources • Sélectionnels • Méta données associées • Segmentation • Codage • Transcodage • … • Sites WEB • Interne • Public • Réservé • … • Automate de gestion des sites WEB • Editeur • Séquenceurs • Synchronisation • Outils • Méta-outils • Export / Import de sélections E-Commerce • Acquisitions en ‘Statique’ • Sources • Sélectionnels • Méta données associées • Segmentation • Codage • Transcodage • … Gestion des supports CD, DVD, Bandes Juke-box … • Acquisitions du ‘Catalogue’ • Sources • Sélectionnels • Méta données associées • Segmentation • Codage • Transcodage • … Domaines de l’offre du Consortium • Liens vers la base de données • Automate (extracteur plein texte et XML) • Manuel (ajouts ciblés) • Recherche Base de données A choisir Gestion Système, enchaînements, métadonnées système et projets In-OVO Répositoire des métadonnées (Métadata repository) À attribuer
CD, DVD, Bandes Juke-box … CD, DVD, Bandes Juke-box … Dossiers et fichiers des Contenus des documents Tampon des Contenus des documents Le produit logiciel d’AIMÉ et exploitations internes Import / Export • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Acquisition Butineur Web server Outils Catalogue Publieur Document Gestionnaire de DBMS
Import / Export Tampon des Contenus des documents Dossiers et fichiers des Contenus des documents Dossiers et fichiers des Contenus des documents Tampon des Contenus des documents • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Acquisition Web server Catalogue Publieur Document Butineur Butineur Butineur Butineur Gestionnaire de DBMS Outils Outils Outils Outils Exemples de processus d ’exploitation (Transferts entres centres et évolutions de système) CD, DVD, Bandes Juke-box … Import / Export • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Acquisition Web server Catalogue Publieur Document Gestionnaire de DBMS
Tampon des Contenus des documents Dossiers et fichiers des Contenus des documents Dossiers et fichiers des Contenus des documents Butineur Outils Exemples de processus d ’exploitation (Distribution via DVD) Installation CD, DVD, Bandes Juke-box … Import / Export • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Import Acquisition Web server Catalogue Publieur Document • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Gestionnaire de DBMS Web server Gestionnaire de DBMS en lecture seule
Dossiers et fichiers des Contenus des documents Tampon des Contenus des documents Exemples de processus d ’exploitation (Modifications de normes de représentation) CD, DVD, Bandes Juke-box … Import / Export • Base de données • Registre des documents • Structures • Identifieurs • Descripteurs • Synchronisateurs • Registre de gestion • Registre des types Acquisition Web server Catalogue Publieur Document Gestionnaire de DBMS
Segment 4AIMÉ-Organisation • Validation • Education • Opérations • Support