25
La documentation numérique Guillaume ADREANI 16 juin 2015

La documentation numérique

Embed Size (px)

Citation preview

Page 1: La documentation numérique

La documentation numérique

Guillaume ADREANI

16 juin 2015

Page 2: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

2

La documentation numérique

Plan : • outils, traitements, créations et

valorisations• Panorama des bases de données

numériques en sciences humaines et sociale et en droit

Page 3: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

3

LE DOCUMENT NUMÉRIQUE : CREATION, TRAITEMENT ET VALORISATION

Page 4: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

4

Définition du document numérique

• Un document numérique reste un document c’est-à-dire un support d’information

• Un document numérique n’est plus matérialisé sur du papier

• Un document numérique est : – Instable: modifiable à tout moment (ex: un fichier informatique)– Fait partie d’une chaîne (ex: le document est un fichier informatique qui devient

page web)– Il est multiforme (ex: un fichier Word, un fichier texte, un PDF)– Il est enregistré sur de multiples supports (ex: un disque dur, une clé USB, un

serveur)

Source: Robert Pascal, Pinède Nathalie, « Le document numérique : un nouvel équipement politique de la mémoire sociale ? », Communication & Organisation 2/2012 (n° 42) , p. 191-202 URL : www.cairn.info/revue-communication-et-organisation-2012-2-page-191.htm.

Page 5: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

5

CREATION DU DOCUMENT NUMERIQUE

Page 6: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

6

Création du document numérique

• Il existe s’il est libéré de tout support physique

• Le document numérique est : – Un ensemble de 0 et de 1– Il a un poids en octets, Mo, Go, To– Il est créé dans une norme: Word, Pdf par ex.

Page 7: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

7

Création du document numérique

• Il peut être de différentes natures :

– Structuré/non structuré (ex: fichier texte/fichier XML)– Lisible par une machine ou illisible (ex: fichier

texte/fichier PDF image)– Stable ou instable (ex: fichier Word/fichier PDF)– Dynamique ou fixe (ex: page web/fichier PDF)– Multiforme : à la fois document PDF et page Web– Créé par une personne ou une machine

Page 8: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

8

TRAITEMENT DU DOCUMENT NUMERIQUE

Page 9: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

9

Traitement du document numérique

• Un document numérique pour être exploitable doit être : – Structuré– Interopérable– Lisible par les hommes et les machines

Page 10: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

10

Traitement du document numérique

• Un document structuré: du plus facile au plus difficile à traiter

Fichier XML

Fichier

Open Office ou Word avec titres

Fichier

Open Office ou Word sans titres

Fichier texte

Fichier PDF/texte

Fichier PDF image

Page 11: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

11

Fichier XML

• Fichier texte délimité par des balises entre les symboles <> et </>.

Ex:

<notice>

<titre>La documentation numérique</titre>

<auteur>Jean-François Martin </auteur>

</notice>

Page 12: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

12

Fichier avec titres

• La mise en forme avec les titres de Word ou Open office permet:– De créer des sommaires accessibles et de

structurer l’information– De rendre accessible le document

Page 13: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

13

Les fichiers texte

• Lisible mais sans structure.• Nécessite de faire du retraitement :

– Par détection d’entités nommées (ex: noms de ville, noms propres)

– De l’analyse syntaxique (détection des expressions et du sens des phrases)

Page 14: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

14

Les fichiers non structurés

• Fichiers images (jpg, tiff, gif, png)• Fichiers PDF images

• Nécessité de procéder à la reconnaissance des caractères (OCR) et aux opérations sur les fichiers textes

Page 15: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

15

Interopérabilité

• Seul le fichier XML permet une réutilisation du document pour d’autres usages

• Le fichier XML doit répondre à un modèle pour pouvoir communiquer avec tout logiciel (ex TEI, RDF, Dublin Core)

ET/OU

• Le document peut être également intégré dans une base de données

• Il doit pouvoir être récupéré par un protocole d’échange (Z39-50, OAI par exemple)

Page 16: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

16

Conclusion: lisibilité du document

• Le document doit être lisible: – En état uniquement du texte

(Pas de fichier image)– Doit être accessible. Ex dans Word:

• Le document doit avoir une structure: – Des titres bien déterminés– Des métadonnées : auteur,

date et mots-clés

Page 17: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

17

VALORISATION DU DOCUMENT : LES OUTILS DISPONIBLES

Page 18: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

18

Ne pas confondre

• Edition et diffusion– Edition : création de document– Diffusion: documents déjà existants

– Systèmes de diffusions des documents : • SIGB/OPAC : Système intégré de gestion de

bibliothèque (PMB, Koha)• Repository software: système de dépôt

d’archives pour des bibliothèques numériques (Omeka, Dspace, Flora)

Page 19: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

19

Les logiciels

• Traitement de texte: Word, OpenOffice etc.

• Logiciels de PAO (publication assistée par ordinateur): Adobe InDesign, Microsoft Publisher, Scribus

Page 20: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

20

Les CMS

CMS: Content management system =

Système de gestion de contenu

Page 21: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

21

Les Wikis

Page 22: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

22

Les logiciels d’édition électroniques

Page 23: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

23

PANORAMA DES BASES DE DONNÉES NUMÉRIQUES

Page 24: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

24

Panorama des bases de données numériques

• Sciences sociales

Page 25: La documentation numérique

La documentation numérique Guillaume Adreani - 16 juin 2015

25

Panorama des bases de données numériques

• En droit

Liste complète: http://www.legifrance.gouv.fr/Sites/Editeurs