Upload
guillaume-adreani
View
477
Download
5
Embed Size (px)
Citation preview
La documentation numérique
Guillaume ADREANI
16 juin 2015
La documentation numérique Guillaume Adreani - 16 juin 2015
2
La documentation numérique
Plan : • outils, traitements, créations et
valorisations• Panorama des bases de données
numériques en sciences humaines et sociale et en droit
La documentation numérique Guillaume Adreani - 16 juin 2015
3
LE DOCUMENT NUMÉRIQUE : CREATION, TRAITEMENT ET VALORISATION
La documentation numérique Guillaume Adreani - 16 juin 2015
4
Définition du document numérique
• Un document numérique reste un document c’est-à-dire un support d’information
• Un document numérique n’est plus matérialisé sur du papier
• Un document numérique est : – Instable: modifiable à tout moment (ex: un fichier informatique)– Fait partie d’une chaîne (ex: le document est un fichier informatique qui devient
page web)– Il est multiforme (ex: un fichier Word, un fichier texte, un PDF)– Il est enregistré sur de multiples supports (ex: un disque dur, une clé USB, un
serveur)
Source: Robert Pascal, Pinède Nathalie, « Le document numérique : un nouvel équipement politique de la mémoire sociale ? », Communication & Organisation 2/2012 (n° 42) , p. 191-202 URL : www.cairn.info/revue-communication-et-organisation-2012-2-page-191.htm.
La documentation numérique Guillaume Adreani - 16 juin 2015
5
CREATION DU DOCUMENT NUMERIQUE
La documentation numérique Guillaume Adreani - 16 juin 2015
6
Création du document numérique
• Il existe s’il est libéré de tout support physique
• Le document numérique est : – Un ensemble de 0 et de 1– Il a un poids en octets, Mo, Go, To– Il est créé dans une norme: Word, Pdf par ex.
La documentation numérique Guillaume Adreani - 16 juin 2015
7
Création du document numérique
• Il peut être de différentes natures :
– Structuré/non structuré (ex: fichier texte/fichier XML)– Lisible par une machine ou illisible (ex: fichier
texte/fichier PDF image)– Stable ou instable (ex: fichier Word/fichier PDF)– Dynamique ou fixe (ex: page web/fichier PDF)– Multiforme : à la fois document PDF et page Web– Créé par une personne ou une machine
La documentation numérique Guillaume Adreani - 16 juin 2015
8
TRAITEMENT DU DOCUMENT NUMERIQUE
La documentation numérique Guillaume Adreani - 16 juin 2015
9
Traitement du document numérique
• Un document numérique pour être exploitable doit être : – Structuré– Interopérable– Lisible par les hommes et les machines
La documentation numérique Guillaume Adreani - 16 juin 2015
10
Traitement du document numérique
• Un document structuré: du plus facile au plus difficile à traiter
Fichier XML
Fichier
Open Office ou Word avec titres
Fichier
Open Office ou Word sans titres
Fichier texte
Fichier PDF/texte
Fichier PDF image
La documentation numérique Guillaume Adreani - 16 juin 2015
11
Fichier XML
• Fichier texte délimité par des balises entre les symboles <> et </>.
Ex:
<notice>
<titre>La documentation numérique</titre>
<auteur>Jean-François Martin </auteur>
</notice>
La documentation numérique Guillaume Adreani - 16 juin 2015
12
Fichier avec titres
• La mise en forme avec les titres de Word ou Open office permet:– De créer des sommaires accessibles et de
structurer l’information– De rendre accessible le document
La documentation numérique Guillaume Adreani - 16 juin 2015
13
Les fichiers texte
• Lisible mais sans structure.• Nécessite de faire du retraitement :
– Par détection d’entités nommées (ex: noms de ville, noms propres)
– De l’analyse syntaxique (détection des expressions et du sens des phrases)
La documentation numérique Guillaume Adreani - 16 juin 2015
14
Les fichiers non structurés
• Fichiers images (jpg, tiff, gif, png)• Fichiers PDF images
• Nécessité de procéder à la reconnaissance des caractères (OCR) et aux opérations sur les fichiers textes
La documentation numérique Guillaume Adreani - 16 juin 2015
15
Interopérabilité
• Seul le fichier XML permet une réutilisation du document pour d’autres usages
• Le fichier XML doit répondre à un modèle pour pouvoir communiquer avec tout logiciel (ex TEI, RDF, Dublin Core)
ET/OU
• Le document peut être également intégré dans une base de données
• Il doit pouvoir être récupéré par un protocole d’échange (Z39-50, OAI par exemple)
La documentation numérique Guillaume Adreani - 16 juin 2015
16
Conclusion: lisibilité du document
• Le document doit être lisible: – En état uniquement du texte
(Pas de fichier image)– Doit être accessible. Ex dans Word:
• Le document doit avoir une structure: – Des titres bien déterminés– Des métadonnées : auteur,
date et mots-clés
La documentation numérique Guillaume Adreani - 16 juin 2015
17
VALORISATION DU DOCUMENT : LES OUTILS DISPONIBLES
La documentation numérique Guillaume Adreani - 16 juin 2015
18
Ne pas confondre
• Edition et diffusion– Edition : création de document– Diffusion: documents déjà existants
– Systèmes de diffusions des documents : • SIGB/OPAC : Système intégré de gestion de
bibliothèque (PMB, Koha)• Repository software: système de dépôt
d’archives pour des bibliothèques numériques (Omeka, Dspace, Flora)
La documentation numérique Guillaume Adreani - 16 juin 2015
19
Les logiciels
• Traitement de texte: Word, OpenOffice etc.
• Logiciels de PAO (publication assistée par ordinateur): Adobe InDesign, Microsoft Publisher, Scribus
La documentation numérique Guillaume Adreani - 16 juin 2015
20
Les CMS
CMS: Content management system =
Système de gestion de contenu
La documentation numérique Guillaume Adreani - 16 juin 2015
21
Les Wikis
La documentation numérique Guillaume Adreani - 16 juin 2015
22
Les logiciels d’édition électroniques
La documentation numérique Guillaume Adreani - 16 juin 2015
23
PANORAMA DES BASES DE DONNÉES NUMÉRIQUES
La documentation numérique Guillaume Adreani - 16 juin 2015
24
Panorama des bases de données numériques
• Sciences sociales
La documentation numérique Guillaume Adreani - 16 juin 2015
25
Panorama des bases de données numériques
• En droit
Liste complète: http://www.legifrance.gouv.fr/Sites/Editeurs