37
cours n°2 ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°2 Gestion des documents : Formalisation des données bibliographiques Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA [email protected]

UE 304 b Cours_L2.documentation_n°2

  • Upload
    kana

  • View
    25

  • Download
    0

Embed Size (px)

DESCRIPTION

UE 304 b Cours_L2.documentation_n°2. Gestion des documents : Formalisation des données bibliographiques. Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA [email protected]. Formalisation des données bibliographiques. 1. Démarche 2. Paysage - PowerPoint PPT Presentation

Citation preview

Page 1: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom)

UE 304 b Cours_L2.documentation_n°2

Gestion des documents : Formalisation des données bibliographiques

Par :Sahbi SIDHOM

MCF. Université Nancy 2

Équipe de recherche SITE – LORIA

[email protected]

Page 2: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 2

Formalisation des données bibliographiques

1.  Démarche 2.  Paysage 3.  Crises de la formalisation

bibliographique4.  X-transformation5.  Révolutions

Page 3: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 3

1. Démarche

Concertation pour une information bibliographique enrichie

Formats de documents (c'est la façon de coder les

données) Normes (dispositions destinées à un usage commun et répété,

visant à l'obtention du degré optimal dans un contexte d’échange) Passerelles d’échange (système logiciel et/ou matériel

gérant le passage d'un environnement à un autre, en assurant la

conversion des informations d'un format à l'autre)

www.abf.asso.fr/enrichi

Page 4: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 4

L'origine

Besoins :Enrichissement des OPACOPAC : (Online Public Access Catalogues) Catalogue en ligne d'une bibliothèque ouverte au

public.

Offre :Données enrichies : textuelles et multimédias

Cadre normatif inadapté :Formats d'échange (MARC, MARC21, UNIMARC, TEI, … )

Page 5: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 5

La méthode

1. Discussion entre trois types d'acteurs Bibliothécaires...et finalement utilisateurs professionnels au sens large Fournisseurs de systèmes

SIGB : Système Intégré de Gestion de Bibliothèque Intégrateurs : Constructeur informatique capable de faire

fonctionner ensemble des sous-systèmes provenant de fabricants différents

Fournisseurs de données Acteurs bibliographiques traditionnels Librairies en ligne

2. Mode d'organisation Réunions

Discussion Apprentissage

Site Web et messagerie

Page 6: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 6

2. Paysage

Une formalisation structurée et spécialisée : Normes de catalogage / ISBD Formats bibliographiques :

famille MARC et autres

Page 7: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 7

Les fondamentaux

Un traitement de la seule information secondaire La notice bibliographique

à ajouter Les données sur les exemplaires

physiques La gestion d'accès contrôlés

Page 8: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 8

Une dissociation peu aisée entre code et éléments entre données et présentation

Le catalogage mêle indissociablement les deux Une séparation nette entre description et accès

autrement dit, entre affichage et index

Page 9: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 9

L'approche informatique

Systèmes intégrés Produits spécifiques aux bibliothèques Hégémonie de la culture du format bibliographiquel'arbre normatif cache la forêt informatique Distinction et confusion entre format d'échange et structure des BDDs  entre données et index 

Page 10: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 10

Le schéma logique / descriptif norme > format > logiciel

Le schéma réel / physique logiciel > format > norme

Page 11: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 11

Complexité, pauvreté

Enchevêtrement des fichiers Description bibliographique à plusieurs niveaux :

Bibliographique, exemplaire, vedette, autorité

Conversions et accumulation des couches logicielles Import Stockage Export Affichage Conversion entre formats et variantes de format

(BabelMARC)

Page 12: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 12

Noms des éléments de a à z de 1 à 9 de 001 à 999 On dirait du MS-DOS !

Arborescence Indicateurs, zones, sous-zones 

une antichambre à deux place: un rez-de-chaussée, un sous-sol,

c'est maigre !

Page 13: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 13

L'acquis des formats MARC

Codification très grande richesse des éléments Échanges Importation Exportation Ré-informatisation ! Recherche !

Possibilité de réduire le catalogage local la résistance est acharnée

Page 14: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 14

3. Crises de la formalisation bibliographique

Une si tranquille assurance Inflation des formations sur les formats :

UNIMARC / RAMEAU / … Offres d'emploi réclamant ces compétences MARC continue et ne se simplifie pas

UNIMARC MARC 21

D'autres couches se surajoutent Z39.50 (ISO 239.50)

Le choc World Wide Web

Page 15: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 15

Crise interne

Limites des concepts bibliographiques classiques Aller plus profondément vers le

document lui-même, y compris le document dit "physique"

Tenir compte des ressources électroniques accessibles en ligne

Tenir compte de l'environnement juridique et économique

Page 16: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 16

Limites du cadre descriptif Les parties composantes

les articles de périodiques les fascicules de périodiques

Les besoins fonctionnels (functional requirements) notions d'œuvre, d'expression, de manifestation schéma 1 | schéma 2

Page 17: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 17

Schéma 1 Schéma 2

Page 18: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 18

Limites des SIGB SIGB (Système Intégré de Gestion de

Bibliothèque) système intégré au système d'information

(SI)

Les difficultés de l'interrogation simultanée La diversité des formats, MARCs et autres,

est à nu

Page 19: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 19

Un contexte dépassé La distinction entre description et

accès n'a plus de sens Quel gâchis de stocker des données par lesquelles ont ne peut pas accéder !

La taille mémoire n'est plus un problème Toutes les normes fondées sur la concision et la limitation des accès sont obsolètes

Page 20: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 20

Normes et formats ont été conçus en fonction de la rareté du papier, de l'espace et du temps

le gaspillage ne pose plus de problème !

d'un état des ordinateurs et des programmes

vieux maintenant de plus de 40 ans !

Page 21: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 21

Crise externe

Un « apartheid » bibliographique Clôture avec les autres professions du

livre Clôture avec le monde de la

documentation Rapports difficiles avec le monde

informatique Clôture même avec une partie des

bibliothèques

Page 22: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 22

... manifestant une rupture de la chaîne numérique Du manuscrit à l'impression Catalogage par l'agence

bibliographique et/ou la bibliothèque (Re)numérisation Document électronique

Page 23: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 23

La globalisation Les technologies de l'information

un des agents principal de globalisation du monde

un des terrains concrets de cette globalisation

Le principal acteur : Internet standards communs applications communes : navigateur,

client universel , interface simplifiée

Page 24: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 24

Une nouvelle façon de produire des normes Il n'y a de normes qu'internationales

c'est-à-dire très souvent américaines

Il n'y a de normes que partagées par plusieurs métiers  le modèle W3C

Page 25: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 25

Une pression de l'offre et de la demande Il faut travailler entre secteurs

jusqu'ici cloisonnés Les usagers spécialisés ou non

ignorent les clivages techniques qui ont structuré ces secteurs

Page 26: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 26

Des idées … des solutions !

Serge Salomon, 1996Dick R. Miller, 2000Dovey Matthew, 2000

Page 27: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 27

Serge SalomonVoyage devant les écrans

in : Bulletin d'informations de l'ABF n°171, 1996

Dans le processus d'informatisation des bibliothèques des années 80 :format de données , élaboré par des utilisateurs, dans un contexte technologique tout à fait obsolète (fin des années 60)

format qui a été imposé aux développeurs. Une modélisation menée selon les règles de l'art et sans contraintes de l'historique : le format MARC.

Page 28: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 28

Dick R. MillerXML and MARC: A Choice or a Replacement

ALA annual conference, 2000.

"MARC problems" Ségrégation des données

bibliographiques Complexité inutile Limitation des champs fixes Mélange valeur et propriété des données Liens insatisfaisants Sous-champs excessifs ou insuffisants

Page 29: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 29

Dovey MatthewProvocative Points

ZIG meeting, Washington, décembre 2000.

Z39.50 apparaît comme... trop bibliothécaire (library-centric

reputation) pré-Web ou non-Web compliqué à implémenter, donc coûteux

On lui reproche une trop grande spécificité du vocabulaire du protocole

Page 30: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 30

4. X-transformation : XMLisation

Le XML ?La « bonne » à tout faire ?

d'abord, l'information primaire

mais aussi, l'information secondaire

et enfin,les protocoles

Page 31: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 31

Arguments d'autorité

Organismes gouvernementaux ADAE www.adae.gouv.fr

Agence pour le développement de l'administration électronique

Rapports au Sénat ou ou gouvernement L'hyper-République : bâtir l'administration

en réseau autour du citoyenrapport à Henri Plagnol, secrétaire d'Etat à la Réforme de l'Etat

Page 32: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 32

Les élites mondialisées

Le W3C, notre maître à tous :XML activity

XML Web services SOAP, protocole XML WSDL

ZIG et LoC ZING

WSDL SOAP xCQL

OAI PHP

Page 33: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 33

Développement des sigles

W3C : World Wide Web Consortium www.w3.org)XML = eXtended Mark-up Language www.w3.org/xml)SOAP = Simple Object Access Protocole (www.w3.org/TR/SOAP)ZIG = Z39.50 Implementer's Group (lcweb.loc.gov/z3950/agency/zig/zig.html)ZING = Z39.50 international next generation (www.loc.gov/z3950/agency/zing)WSDL = Web services Description Language (www.w3.org/TR/wsdl)XQL = eXtended Common Query Language (www.loc.gov/z3950/agency/zing/cql/xcql.htm)OAI = Open Archive Initiative (http://www.openarchives.org et http://www.soros.org/openaccess/fr/index.shtml)

Page 34: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 34

5. Révolutions

L'information secondaire n'est plus au centre L'utilisateur ne pense qu'à

l'information primaire changement des besoins

Du SIGB au système d'information ancrage ou assimilation ?

Page 35: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 35

Les données ne sont plus au centre Ownership versus access Du système d'information au portail

Les médiateurs ne sont plus au centre ... mais tout simplement la médiation

Page 36: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 36

Les bibliothèques ne sont plus au centre mais un élément parmi d'autres du

dispositif d'accès à l'information, à la documentation, à la culture, aux loisirs, etc.

entre e-administration et e-commerce

Page 37: UE 304 b Cours_L2.documentation_n°2

cours n°2 ue304b (S. Sidhom) 37

Conclusion

Des technologies matériels standards

à partager avec : le monde du livre          le monde du texte          le monde de la création culturelle et artistique     le monde de l'information et de la documentation     le monde de l'informatique         le monde des institutions publiques       le monde du commerce et de l'industrie    etc.