360 likes | 507 Views
Troisième partie:. Le compresseur documentaire DjVu. Par Mario Lapointe ing. MBA Architecte d’affaires, RAMQ De 13h30 à 14h30. Le compresseur documentaire DjVu. Au programme. La numérisation; Les problèmes; Les besoins; Une solution; Comment cela fonctionne; Les bénéfices;
E N D
Troisième partie: Le compresseur documentaireDjVu Par Mario Lapointe ing. MBA Architecte d’affaires, RAMQ De 13h30 à 14h30
Le compresseur documentaire DjVu Au programme La numérisation; Les problèmes; Les besoins; Une solution; Comment cela fonctionne; Les bénéfices; Les produits.
Architecture de base • 3 préoccupations techniques à contrôler • Numérisation • Mode papier en mode numérique • Stockage • Papier dure 100 ans, le mode numérique ??? • Diffusion • Du papier à votre écran, portable, assistant personnel, cellulaire, tablette pc, etc.
Tout se numérise • Contenu • Votre information • Contenant • Votre fichier numérique Microfilms Pages Plans
Les fichiers TIFF sont volumineux • Page bitonale 50 Ko • Page tons de gris 1 900 Ko • Page couleur 4 200 Ko • Plan tons de gris 14 000 Ko • Plan couleur 42 000 Ko Fichier source en format TIFF compressé Difficilement utilisable sur un poste de travail Impossible en diffusion Web
Produire l’information numérique Numérisation Traitement Identification Stockage Conversion Fichier jpeg, gif, pdf Fichier TIFF
Les problèmes • Le format de numérisation ne fonctionne pas pour le Web. • La conversion en Web est complexe dépendant du type de document (bitonale, ton de gris ou couleur) et du nombre de pages • Les formats Web efficaces détériorent le contenu en information • Les formats de qualité génèrent des fichiers trop gros et trop lourds pour le réseau Internet
Méthode existante(Document composé de divers types) • Plusieurs efforts de format de documents(JBIG, CCITT III & IV, Tiff) • Très vieilles technologies • Pas de puissance • Travaille difficilement avec des documents composés de diverses sources (Noir et blanc, ton de gris et couleur) • Utilisation limitée pour de la haute qualité et pour les nouvelles technologies (cellulaire, assistant personnel, Wireless)
Méthode existante(Document composé) • Acrobat/PDF • Conçu pour une utilisation électronique à électronique (industrie de l’impression) et non pour la numérisation et pour le WEB. • Taille imposante du plugiciel (5.6MB pour PDF vs. 1.2MB pour DjVu) • Transporte le document au complet sur le réseau • Pour une même qualité de document, le fichier PDF sera beaucoup plus gros car il n’y a pas de compression. • Pour l’utilisateur, les fonctions sont similaires
Les besoins • Un format de fichiers conçu pour la diffusion. • Un format stable techniquement et dans le temps. • Un format compressé sans perte d’information. • Un format supportant le mode document. • Un format fluide sur le réseau. • Un format pouvant s’adapté aux nouveaux périphériques de consultation de l’information.
DjVu: la solution Scan-to-Web Exploiter toute la puissance des documents imprimés de votre organisation
DjVupour les documents numériques • Acquis par LizardTech en Mars 2000 de AT&T • Supporte le documents Noir et Blanc, ton de gris et couleur • La solution Scan-to-Web supérieure aux fichiers Jpeg et au PDF • Très haute qualité et une taille réduite des fichiers obtenus (100:1 à 2 000:1)
Qu’est-ce fait DjVu ? • Comment DjVu encode et décode un document • Sépare l’information à constraste élevé du fond graphique du document • Encode chaque couche d’information avec un algorithme spécifique • Décode et réassemble les couches sur le champ avec le plugiciel (plug-in) • Rend l’information par couche progressive et à haute qualité • Supporte les documents multipages • Outil d’ajout d’hyperliens vers d’autres fichiers, documents DjVu ou d’autres pages HTML. • Outil d’ajout de surlignage • Outil OCR pour tout le document
Comment fonctionne DjVu? Couche créée pour l’information de haut contraste. Compressé à 300-400 DPI avec JB2. Avant plan couleur compressé à 25 DPI avec IW44. Arrière plan graphique utilise la compression wavelet à 100 dpi avec IW44.
Comparons TIFF Exemple de traitement d’un rapport annuel couleur de 110 pages PDF JPEG DjVu Diffusion ouPublication3 MB Source2500 MB Publication155 MB Diffusion128 MB
Bénéfices • DjVu convertit les documents imprimés et les rend disponible sur le réseau Internet. • DjVu rend le transport facile et rapide sur le réseau et conserve l’intégrité en information texte et image. • DjVu rend impossible la modification d’un fichier encodé. • Le plugiciel (plug-in) DjVu s’installe automatiquement, il est compact (1.2MB) et gratuit.
Fonctionnalités • Fichier de taille réduite • Affichage rapide • Transport des pixels progessif • Impression de haute qualité • Convertisseur OCR disponible • Ajout de Hyperliens • Ajout de surlignage • Rend l’information non altérable
Avantage de l’OCR • Le texte est inclus dans une couche du fichier DjVu • Permet au plugiciel (plug-in) d’effectuer une recherche • Permet d’effectuer un copier-coller du texte reconnu • Permet à LizardTech Content Server de supporter la recherche d’information à la totalité du fichier image • Disponibilité gratuite d’un SDK permettant un accès à cette couche pour d’autres applications
Les formats reconnus • DJVU (*.djvu, *.djv) • BMP (*.bmp) • GIF (*.gif) • IW44 (*.iw44, *.iw4) • JPEG (*.jpeg, *.jpg) • PNM (*.pnm, *.ppm, *.pgm, *.pbm) • TIFF (*.tiff, *.tif) • PICT (*.pict)
La brasserie Unibroue • Dépliant publicitaire numérisé • 2 pages de 93 meg. cq en Tiff • Fichier DjVu Publication • (160 K) • Fichier DjVu diffusion • (2 pages de 65 et 96 K)
Démonstration • Démonstration de DjVu Editor version 3.6 • Numérisation d’une page d’un journal • Numérisé à 300 dpi, 25 meg. en TIFF • OCR afin de récupérer le contenu • Mise en évidence du numéro en vert • Ajout d’un hyperlien vers l’organisme • Fichier DjVu de 111 K • Soit 225 fois plus petit
Avantage du VPD • Convertit les documents numériques en image compressé DjVu • Rend uniforme le format peu importe la source • Rend le contenu non modifiable par les utilisateurs • Rend le contenu plus fluide et rapide sur le réseau Internet • Rend le contenu disponible pour de nouveaux dispositifs d’affichage (assistant personnel, …)
Exemple du VPD • Documentation informatique en Word disponible pour le télé-travail. • Rapport budgétaire fixe dans le temps. • Formation PowerPoint disponible sur le réseau Internet. • Dessin technique Visio disponible en consultation sur internet (70K à 7K). • Document PDF compressé et fluide sur le réseau.
Ministère des Ressources Naturelles • L’aménagement des peuplements forestiers touchés par le verglas. • Fichier PDF • (4.2 meg) • Fichier DjVu Publication • (1,6 meg) • Fichier DjVu diffusion • (66 pages de 25 k en moyenne, de 3 à 101 K )
Ministère de l’Agriculture des Pêcheries et de l’Alimentation • Politique québécoise de la transformation alimentaire • Fichier PDF • (6,1 meg) • Fichier DjVu Publication • (0,7 meg) • Fichier DjVu diffusion • (76 pages de 10 K en moyenne, de 1 à 53 K)
Ministère des Ressources Naturelles • Rapport sur les sciures et rabotures de bois au Québec pour l’année 2000. • Fichier PPT • (1,8 meg) • Fichier DjVu Publication • (0,8 meg) • Fichier DjVu diffusion • (26 pages de 30 k chaque en moyenne, de 1 à 66 K)
Rapport de formation • Rapport rédigé en Word • Fichier doc • (4,6 meg) • Fichier DjVu publication • (0,2 meg) • Fichier DjVu diffusion • (12 pages de 15 k chaque en moyenne, de 1 à 55 K)
Évaluation budgétaire • Évaluation rédigée avec Excell • Fichier xls • (132 k) • Fichier DjVu publication • (9 k) • L’évaluation peut être consultée ou imprimée mais ne peut pas être modifiée
Les utilisations possibles • Catalogue de produits, E Commerce • Rapport annuel, brochure, promotion • Procédure de travail • Guide d’utilisation, d ’installation • Photographie numérique • Cartes, plans, microfilms • Archive, manuscrit, comptabilité • Rapports et articles scientifiques
Album photo • Une caméra numérique de 4.1 méga pixels produit des fichiers jpeg de plus de 200 K. Trop gros pour être fluide sur le réseau Internet. • DjVu les compressent sans difficulté. • Vous pouvez même construire un album photo en considérant ces dernières comme des pages d’un document.
Plusieurs plateformes pour le plugiciel et les compresseurs • Navigateur clientsupporté • Plateformecompresseursupporté
Liste des produits • Numérisation • DjVu desktop • DjVu professional (multi-pages) • DjVu enterprise(command line ou serveur GUI) • DjVu provider (service bureau) • Publication électronique • VPD (Word, Excell, Powerpoint, Pdf, etc) • Pdf to DjVu (command line)
Pinnacle Micro Canada • Spécialisé dans les produits et services • Numérisation • Stockage courte et longue durée • Publication et diffusion sur le WEB • Service de numérisation et de conversion (DjVu MrSID) à la demande. www.pinnaclemicrocanada.com