Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Stage Maroc
Les formats d ’archivage et de consultationet les supports de stockage
Dominique Maillet
Bibliothèque nationale de France
21 au 25 mai 2012
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Exercice
�Avec un dos numérique 80 M pixels quelle est la dimension maximum d’un document (hauteur largeur) que l’on peut traiter à 300 et 600 dpi?
�Comment cette dimension varie si je numérise ce document en couleur ou en niveau de gris?
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
LA CHAINE DE NUMERISATION : LES 11 ETAPES
� 1) La sélection des fonds : QUOI� 2) Définition les modalités de mise à disposition de ces fonds:
POURQUOI� COMMENT :� 3) La gestion des droits d’auteur� 4) Catalogage des documents à numériser� 5) La préparation des documents à numériser � 6) La numérisation des documents � 7) La post-production (création des métadonnées)� 8) Le passage en OCR pour les documents imprimés� 9) Le contrôle qualité des documents numérisés.� 10) La sauvegarde des documents numérisés sur les s erveurs
informatiques� 11) La mise en consultation des documents numérisés.
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
LES FORMATS DE FICHIERS
On distingue :Le format d ’archivage: MatriceLe format de consultation
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
LES FORMATS D’ARCHIVAGE
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Le format TIFF
�TIFF (Tagged Image File Format) est un format de fichier graphique bitmap.
� Il a été mis au point en 1987 par la sociétéAldus (appartenant désormais à Adobe). Les dernières spécifications (Revision 6.0) ont étépubliées en 1992.
�Son intérêt principal est son entête normalisée carte d’identité du fichier.
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Types d’informations contenues dans les en-têtes TIFF
� Technique image - taille (nbre de points x nbre de lignes)
- résolution ; - compression ; - données colorimétriques ; etc.
� Production - date de création- producteur ;- type de numériseur ; etc.
� Administration - propriété ;- localisation ;- auteur ;
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Structure de l’entête TIFF
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Structure de l’entête TIFF
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Structure de l’entête TIFF
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Le format JPEG 2000
�Alternative au TIFF qui n’arrive pas às’implanter pour l’archivage car non natif sur les numériseurs et non pris en charge par les navigateurs Web populaires.
�Deux avantages cependant qui le rendent intéressant pour le stockage: �Poids de fichiers divisé par 2 (par rapport ai TIFF)�Possibilité de décliner à la volée des résolutions
différentes sans avoir à les stocker
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les Formats de diffusion
Parmi la multitude de formats de fichier utilisés pour la diffusion 3 sont majoritairement utilisés:Format JPEG compressé, JPEG2000, PDF
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Format JPEG
� Join Picture Expert Group�Utilisé pour la consultation.�Un fichier JPEG peut-être plus ou moins
compressé selon l’usage que l’on veut faire de l’image (compression avec perte systématique même si imperceptible).
�En général il est beaucoup compressé pour la consultation sur Internet pour que les fichiers soient peu volumineux pour transférer sur les réseaux et l’image non piratable.
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
JPEG(Joint Photographic Expert Group)
Le JPEG, norme ISO 10918-1 parties1, 2 et 3 (indice de classement AFNOR NF Z 75-001), peut être utilisé pour les images fixes en noir et blanc ou en couleur.
Son mode de compression avec perte divise l'image en carrés de 8 x 8 pixels, dans chaque bloc les valeurs les plus proches sont codées sur quelques bits. On peut fixer un taux de qualité de la compression : à 95 % ( soit un taux de compression compris entre 4 et 8), aucune perte n'est visible, à 75% (soit un taux de compression compris entre 7 et 15), on obtient une image de qualité où la perte d'informations est à peine perceptible. Le format JPEG atteignant de forts taux de compression est très utile pour la diffusion sur le web.
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bases techniques de la numérisation Dominique Maillet - Elvire Setruk
Le format JPEG 2000
�Avantages pour la diffusion�Affichage progressif global de l’image avec montée
en qualité de la résolution
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bases techniques de la numérisation Dominique Maillet - Elvire Setruk
Le format JPEG 2000
�Évolution du jpeg qui s’appuie sur :�La transparence d’une norme bien documentée et
largement diffusée�Un algorithme de compression avec perte amélioré�Une option de compression sans perte
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
JPEG 2000
Compression par ondelette (wavelet), avec ou sans perte.
Le contour des objets, caractérisé par les hautes fréquences est faiblement compressé.
Les basses fréquences ont une compression plus élevées.
Résultat : qualité supérieure / un poids inférieur
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bases techniques de la numérisation Dominique Maillet - Elvire Setruk
FORMAT de FICHIERFORMAT de FICHIER
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Image TIFF POIDS 76 MO
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
La même image en JPEG. Poids 7,6 MO
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
La même image en JPEG faible Poids 1,6 MO
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Comparaison des 3 qualités
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bases techniques de la numérisation Dominique Maillet - Elvire Setruk
La sauvegarde des documents num érisés sur les serveurs informatiques
C’est le fichier TIFF qui sert d ’archive et qui doit être sauvegard é. On peut toujours recréer le ou les fichiers de consultation avec le TIFFTIFF = l’équivalent du N égatif PhotoJPEG ou autre = équivalent du tirage Papier
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les m édias de stockage
� Les supports optiques� Les disques magnétiques
� Les bandes et cartouches magnétiques
�Et Les microformes
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les disques optiques num ériques
� CDROM DVD ROM BLUE RAY : support optiques, choix économique pour stocker des données sur des durées courtes.
� Intéressants pour échanger des fichiers trop volumineux pour passer sur ftp.
� Durée de vie variable selon des critères complexes comme la qualité du substrat, du réflecteur de la couche de protection , du procédé utilisé pour graver.
� Ils comportent par contre des mécanismes de tolérance aux erreurs qui permettent de les exploiter en cas de léger problème et d’identifier ainsi qu’il faut les remplacer .
� Coût de gestion élevé car il faut les manipuler un par un
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les disques optiques num ériques
Types de disques :
– ROM (read only memory) :– WORM (write once, read many) ;– WMRA (write many, write always).
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les disques durs magn étiques
� Tarifs très compétitifs � Grande capacité� Débits importants (Firewire ou Sata )� Par contre fragiles car constitués de pièces
mécaniques sensibles.� Il est préférable de choisir des solutions tolérants les
pannes basées sur des combinaisons de disques RAID1 (info dupliqué sur 2 disques ) ou RAID5 (des parties de l info sont dupliquées afin de pouvoir reconstituer l ensemble en cas de problème)
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bandes
� Bandes LTO: � Support bon marché� Très grande capacité LTO-4 offre 800 GO pour 120
MO/S � Simplicité mécanique� Mécanisme intégré de détection d’ erreur ce qui
minimise les risques. � Manipulable par des robots pour chargements
automatiques� Accès lent incompatible avec une mise en ligne
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Stockage Informatique de Masse : SPAR
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les bases techniques de la numérisation Dominique Maillet - Elvire Setruk
Salle informatique (1)
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Salle informatique (2)
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
Les microformes
Elles sont produites au moyen de COM (computer output microform).
Les plus récents permettent une excellente reproduction pour des documents numérisés.
• SMA eDocument SMA 51• Zeutschel Archive Writer OP 500
Les formats d'archivage et de consultation et les supports de stockage -Dominique Maillet
MERCI POUR VOTRE ATTENTION