180 likes | 304 Views
Numérisation de la presse Belge. Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique. Le projet en bref Titres concernés Principes clés du projet Situation en novembre 2008 Exploitation Démo Conclusion. Le projet en bref (1).
E N D
Numérisation de la presse Belge Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique
Le projet en bref • Titres concernés • Principes clés du projet • Situation en novembre 2008 • Exploitation • Démo • Conclusion
Le projet en bref (1) • Numérisation de 30 titres de la presse belge • Pourquoi, parmi les collections de la Bibliothèque royale, choisir les journaux comme principal axe de numérisation ? • Période couverte : début du journal jusque 1950 • Volume : 3.000.000 pages • En plus : presse clandestine et censurée des deux conflits mondiaux • Volume : 35.000 pages • Choix opéré par le CEGES et la KBR
Le projet en bref (2) • Cadre : projet de numérisation du patrimoine fédéral • 9 projets • 15.000.000 € • 2005-2008, reports sur 2009 autorisés • Investissement de l’Etat pour ce projet : 2.272.000 € • Futur ? En discussion actuellement • Souhait de la politique scientifique : un large PPP
les titres concernés (1) • Le Courrier de l’Escaut (1829-1950) • Le Journal de Charleroi (1837-1950) • L’Indépendance belge (1843-1940) • Het Handelsblad (1844-1950) • La Meuse (1855-1950) • La Gazette de Charleroi (1878-1950) • De Gentenaar (1879-1950) • Vooruit (1884-1950) • Le Peuple (1885-1950) • Het Nieuws van den dag (1885-1950) • Het laatste Nieuws (1888-1950) • De Gazet van Antwerpen (1891-1950) • Het Volk (1891-1950) • Le Vingtième Siècle (1895-1940) • L’avenir du Luxembourg (1897-1950)
Titres concernés (2) • La Dernière Heure (1906-1950) • De Standaard (1914-1950) • De Volksgazet (1914-1950) • La Libre Belgique (1915-1950) • La Nation belge (1918-1950) • Vers l’Avenir (1918-1950) • De Schelde (1918-1936) • La Wallonie (1919-1950) • Le Drapeau Rouge (1921-1950) • De Rode Vaan (1921-1950) • Grenz Echo (1927-1950) • De dag (1934-1944) • Le Pays Réel (1936-1944) • Volk en Staat (1937-1944) • La Cité nouvelle (1937-1950) • + presse clandestine et censurée des deux conflits mondiaux
Principes clés du projet • Scinder numérisation et exploitation • Confier via appel d’offre européen la numérisation à un sous-traitant • Scinder exploitation intranet et Internet • Négocier l’exploitation Internet avec les ayant droits • Assurer la conservation pérenne du patrimoine numérisé
Situation en novembre 2008 • Juillet 2007 : lancement de l’appel d’offre • Depuis janvier 2008 : numérisation + OCR + segmentation • Depuis janvier 2008 : réflexion sur le stockage et l’accès • Seuls (KBR + CEGES) ? (oui, mais insuffisant) • De façon concertée avec les autres ESF ? (toujours ouvert) • Via PPP, avec les éditeurs ? (toujours ouvert + auteurs + journalistes + ???) • Depuis juillet 2008 : exploitation (en fait… exploitations : cf slides suivants…)
Exploitation (1) • Interne : = missions de base de la bibliothèque • Externe : complexe, pcq nouvelles missions… mais on progresse • Belge : Belgica@kbr.be • Internationale : RFBNN • Internationale : Europeana • …
Exploitation (2) • De la totalité des pages numérisées : dans les murs de la bibliothèque • Partielle ou totale : sur Internet
Exploitation (3) • Gratuite : dans les murs de la bibliothèque • Gratuite : sur Internet pour les journaux libres de droits • Gratuite ou payante : sur Internet pour les journaux sous droits
Démo • Outils mis en place à la Bibliothèque royale (en développement) • http://mara.kbr.be/calendarapp/calendar1fr.php • http://mara.kbr.be/nutch/KBRSearch.php
Conclusion (1) • La numérisation prend plus de temps que prévu • Phase de démarrage = long dialogue… • Cadences difficiles à soutenir >< qualité • OCR erratique • Contrôle qualité nécessaire et long… • Très bonne volonté de nos partenaires • Le marché public nous protège très bien
Conclusion (2) • Le défi de l’exploitation est passionnant, mais complexe car neuf • Pour la Bibliothèque • Pour les représentants des auteurs, des journalistes • Pour les représentants des éditeurs • Globalement, les coûts de numérisation + exploitation sont et seront toujours supérieurs aux recettes futures • Le plus important = obtenir la sécurité juridique, via accord le plus large possible entre ayant droits, et conscience des droits et devoirs respectifs de tous ! • La complexité croît encore lorsqu’on se place dans la perspective d’un PPP global à tous les ESF, pour tout type de documents patrimoniaux numérisés
Conclusion (3) • Une seule plateforme d’exploitation ne suffit pas • La redondance permettra de toucher plus d’internautes • Via l’association privé-public, des plateformes à modalité d’accès et de services divers peuvent éclore. • Il n’y a aucune incompatibilité avec les missions de base des bibliothèques
Conclusion (4) • Au-delà de la numérisation et des formes d’exploitation, la préservation numérique est un vrai défi également • Notre approche : • Formats ouverts (le + possible) • Lien structurel entre les formats + métadonnées • Stockage multiple + monitoring : • On-line (serveur, Bibliothèque royale) • Near on-line (tape, Bibliothèque royale) • Off-line (disque + tape, hors site)
Contacts : • Coordination : alain.goossens@kbr.be • Technique : elisabeth.mazur@kbr.be • Presse belge : marc.dhoore@kbr.be • Presse clandestine et censurée : dirk.luyten@cegesoma.bejan.laplasse@cegesoma.be