Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
ArchiverArchiverMichel Jacobson
Archives de France
ArchiverArchiver
Plan Définition : archives, documents, informations
Les missions des archives La gestion du cycle de vie : Les 3 âges, la durée d'utilité, le sort-final Lisibilité, stabilité, traçabilité
L'information numérique Caractéristiques du numérique Déclinaison des missions sur le numérique
Les fonctions d'un SAE
A(a)rchive(s)A(a)rchive(s) « Les archives sont l'ensemble des documents, quels que
soient leur date, leur forme et leur support matériel, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l'exercice de leur activité. » Code du patrimoine, article L. 211-1.
« Une Archive est une organisation dont la vocation est de préserver l'information pour permettre à une communauté d’utilisateurs cible d'y accéder et de l'utiliser. » Norme ISO 14721:2003 (révisée 2012) « Open archival
information system »
DocumentDocument Les documents sont des informations organisées dans une
intention particulière. Par exemple une carte d'identité est un document rassemblant des
informations sur une personne (appellation, date de naissance, caractéristiques physiques) et sur une autorité de délivrance du document (l'état), permettant à une personne de prouver son identité.
InformationInformation La norme OAIS distingue :
l'information: connaissance que l'on peut échanger ; la donnée: représentation formalisée de la connaissance ;
Pour conserver une information, on lui donne une forme (la donnée). Cette forme peut être liée à des technologies qui sont éphémères. On a donc besoin de conserver aussi des informations sur cette forme (les métadonnées)
Les missions des archives : les 4CLes missions des archives : les 4C
Âgedéfinitif
Âgeintermédiaire
Âgecourant
La théorie des trois âgesLa théorie des trois âges
Utilité
TempsCréation
du document
valeur administrative
et juridiquevaleur historique
Collecte par le service d'archives
tableaux de gestion
Service producteur Service d'archivesResponsabilité/ charge
Peut en avoir besoin pourfonctionner au quotidien
Peut encore en avoir besoin pour des raisons fiscales,juridiques ou de fonctionnement occasionnel
Conservation en raisonde l'intérêt historique
Le sort finalLe sort final Gestion du cycle de vie de l'information
La durée d'utilité couvre les deux premiers âges. A l'issue de cette période le producteur applique un sort final aux
documents. Cas général : il peut détruire les documents
➔ Pour les archives publiques, il doit obtenir avis un visa d'élimination délivré par l'autorité de contrôle compétente.
Cas particulier : en raison d'un intérêt historique, le code du patrimoine permet la changement de finalité et le transfert de responsabilité à un service public d'archives.
Système d'archivageSystème d'archivage Un Système d'Archivage doit garantir l'intégrité et
l'authenticité de documents à travers trois critères La lisibilité, l'intelligibilité : avoir accès à l'ensemble du contenu
informationnel d'un document La stabilité: garantir que le contenu informationnel n'a subi aucun
ajout ou retrait d'information lors du processus de conservation La traçabilité: pouvoir produire une liste de l'ensemble des
traitements opérés sur le document lors de son existence
L'information numériqueL'information numérique
La représentation numériqueLa représentation numérique
Suite organisée d'unités binaires
Reproduction à l'identique
Reproduction à l'infini
Stockage à faible coût,
Facile à transmettre
Facile à traiter
Difficile à conserver...
001111000110100001110100011011010110110000111110000011010000101000111100011010000110010101100001011001000011111000001101000010100000100100111100011101000110100101110100011011000110010100111110010000110101001001000100010011110011110000101111011101000110100101110100011011000110010100111110000011010000101000111100001011110110100001100101011000010110010000111110
Vulnérabilité de l'information numériqueVulnérabilité de l'information numérique L'information sous forme numérique est difficile à
conserver Elle est codée (formats propriétaires) Elle est dépendante de la technologie (risque d'obsolescence) à
tous les étages
Support
Données
Vulnérabilité - couche supportVulnérabilité - couche support
Agressions Magnétiques Physiques Chimiques Biologiques Thermiques
Support
Vulnérabilité - couches matériel logicielVulnérabilité - couches matériel logiciel
Obsolescences technologiques matériel de lecture Pilote Cablage système de fichier système d'exploitation
Absence d'information techniques (de représentation) Codage inconnu Format propriétaire
Vulnérabilité – couche donnéesVulnérabilité – couche données
Με την Îννοια δομημÎνα δεδομÎνα ÎµÎ½Î½Î¿Î¿Ï Î¼Îµ μία συλλογή �
στοιχείων δεδομÎνων όπως είναι για Ï€Î±Ï Î¬Î´ÎµÎ¹Î³Î¼Î± τα �
λογιστικά Ï†Ï Î»Î»Î±, οι �
κατάλογοι Î´Î¹ÎµÏ…Î¸Ï Î½ÏƒÎµÏ‰Î½, οι �
Ï€Î±Ï Î¬Î¼ÎµÏ„Ï Î¿Î¹ Î´Î¹Î±Î¼ÏŒÏ Ï†Ï‰ÏƒÎ·Ï‚, οι � � �
οικονομικÎÏ‚ συναλλαγÎÏ‚ και τα τεχνικά σχÎδια.
Με την έννοια δομημένα δεδομένα εννοούμε μία συλλογή στοιχείων δεδομένων όπως είναι για παράδειγμα τα λογιστικά φύλλα, οι κατάλογοι διευθύνσεων, οι παράμετροι διαμόρφωσης, οι οικονομικές συναλλαγές και τα τεχνικά σχέδια.
Données
Vulnérabilité du numériqueVulnérabilité du numérique La perte d'information peut être brutale
Zone endommagé (dans le fichier, dans la table des matières du support)
DEL *.*
Les risques majeursLes risques majeurs
Intégrité de l’information Sans précautions, l’information peut être modifiée très facilement,
intentionnellement ou involontairement
Attention à la séparation du numérique et du non-numérique ou plus généralement à la dispersion des fonds
Lisibilité L’absence de veille sur les technologies permettant d’accéder à
l’information compromet la lisibilité des données sur un temps long
Accessibilité de l’information (absence de métadonnées) Si les métadonnées essentielles n’ont
pas été récupérées lors de l’archivage, risque de ne pas retrouver, de ne pas lire ou de ne pas comprendre l’information
Fonctions desFonctions desSystèmes d'archivage électroniqueSystèmes d'archivage électronique
(SAE)(SAE)
FonctionnalitésFonctionnalités
Déclinaisons des fonctions principales dans le numérique Authenticité
Stabilité
Lisibilité
Traçabilité
Fedisa
Déclinaison des fonctions dans le Déclinaison des fonctions dans le numériquenumérique
Stabilité Exemple : gestion des empreintes
Propriétés : absence de collision, non réversible, rapide, court
Document
Empreinte= résultat du
calcul
Algorithme de calcul
Nouveau calcul
Comparaison
OK intègre
00101011... 00101011...
Déclinaison des fonctions dans le Déclinaison des fonctions dans le numériquenumérique
Authenticité Exemple : la signatures
électronique Propriétés : authentique, infalsifiable,
non réutilisable, inaltérable, irrévocable
00101011...
10100111...
Document signé
hashage
Encryptage de L'empreinte avec
la clé privée
certificat
Lien aux données
Déclinaison des fonctions dans le Déclinaison des fonctions dans le numériquenumérique
Lisibilité Exemple : conversion de formats
Conversion
Déclinaison des fonctions dans le Déclinaison des fonctions dans le numériquenumérique
Traçabilité Exemple :horodatage
100100110011001000010111110011101110000010110001100100100010100100001100100001000110011001000111111001111
00101011... + =empreinte
autorité
00101011...
Un modèle conceptuel uniqueUn modèle conceptuel uniquepour les unifier touspour les unifier tous
OAISOAIS Un modèle de référence « Open Archival Information
System » Né dans le monde de l’aérospatiale (Groupe de travail du
Consultative Committee for Space Data Systems – CCSDS)
http://www.ssd.rl.ac.uk/ccsdsp2/isoas/bnsc97/oais1/
Norme ISO 14721:2003
La norme OAIS définit: Un vocabulaire Un modèle de l'information Un modèle fonctionnel (acteurs, processus)
Vocabulaire : les acteursVocabulaire : les acteurs
Producteur – Effectue des versements.
Utilisateur – Passe des commandes.
Archive – Reçoit des versement et communique les résultats des commandes.
Management – Définit le mandat de l'archive.
ArchiveProducteur Utilisateur
Management
Vocabulaire: les paquets d'informationVocabulaire: les paquets d'information
SIP
Submission information package
Paquet d'informations livré par le service producteur ou versant au système d'archivage
AIP
Archival Information Package
Paquet d’informations conservé dans le système d’archivage (contenus d’information et d’informations associées pour leur pérennisation).
DIP
Dissemination information package
Paquet d’informations reçu par l’Utilisateur en réponse à sa requête au système d’archivage
Producteur Utilisateur
Management
Archive
28
Le modèle d'informationLe modèle d'information
00111100010000100011111000111100010001100100111101001110010101000010000001000011010011110100110001001111010100100011110100100010001000110100011
ex. : Codage ASCII, format .csv
A8600200046A36
M Hxxx Bxxx
Numéro d’affaire ou numéro de parquet : constitué des zones suivantes :•- année sur 2 chiffres•- quantième du jour dans l’année sur 3 chiffres•- numéro d’ordre sur 4 chiffres•- une clé sur 1 chiffre calculée à partir des 9 chiffres ci-dessus : (3 Ci * i) mod 10••Nomenclatures employées pour coder les informations• exemple : nomenclature NATAFF (nature de l'affaire) :•B24 Vol par ruse ou usurpation d'identité
Objet contenu de données
Information de représentation
Contenu d’information
Le modèle d'informationLe modèle d'information
Information de provenance
Information de pérennisation
Information de contexte
Information d’identification
Information d’intégrité
ex. : extraction de l'application NCP
ex. : versement du TGI
ex. : URI
ex. : hash, procédé d’empreinte (MD5,
SHA1...)
Le modèle d'informationLe modèle d'information
Contenu d’information Information de pérennisation
Paquet d’information
Information d’empaquetage
Les fonctionsLes fonctions
Management
Planification de la pérennisation
Entrées Accès
Gestion de données
Stockage
Administration
UtilisateurProducteur
Politique de surveillanceet de migration des formats et supports
Analyse du paquet entrantformat de données,
contrôle des métadonnées,validation
Enregistrement desdonnées dans l'infrastructure
de stockage sécurisé
Accès aux données
Enregistrement etgestion des
utilisateurs (droits)
Gestion des donnéespar les métadonnéesRecherche dans lesmétadonnées pour la
consultation
Archiver la rechercheArchiver la recherche
Les résultats de la recherche ne sont pas les seules données intéressantes
Les résultats ne sont compréhensibles que si le contexte et le processus de production sont également documenté