5
Tous droits réservés © Association pour l'avancement des sciences et des techniques de la documentation (ASTED), 1999 Ce document est protégé par la loi sur le droit d’auteur. L’utilisation des services d’Érudit (y compris la reproduction) est assujettie à sa politique d’utilisation que vous pouvez consulter en ligne. https://apropos.erudit.org/fr/usagers/politique-dutilisation/ Cet article est diffusé et préservé par Érudit. Érudit est un consortium interuniversitaire sans but lucratif composé de l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal. Il a pour mission la promotion et la valorisation de la recherche. https://www.erudit.org/fr/ Document généré le 19 jan. 2022 04:35 Documentation et bibliothèques Identification des ressources sur Internet et métadonnées : diversité des standards Identification of Ressources on the Internet and Metadata: A Diversity of Standards Identificación de los recursos en Internet y metadatos: diversidad de normas Catherine Lupovici Édition électronique Volume 45, numéro 4, octobre–décembre 1999 URI : https://id.erudit.org/iderudit/1032722ar DOI : https://doi.org/10.7202/1032722ar Aller au sommaire du numéro Éditeur(s) Association pour l'avancement des sciences et des techniques de la documentation (ASTED) ISSN 0315-2340 (imprimé) 2291-8949 (numérique) Découvrir la revue Citer cet article Lupovici, C. (1999). Identification des ressources sur Internet et métadonnées : diversité des standards. Documentation et bibliothèques, 45(4), 191–194. https://doi.org/10.7202/1032722ar Résumé de l'article L’identification des ressources électroniques disponibles sur Internet, ainsi que les métadonnées créées pour permettre leur découverte et leur gestion, ont profondément modifié les standards traditionnels de numérotation normalisée et de description bibliographique et documentaire. Les nouveaux standards en évolution permanente sont désormais très génériques et proches de la modélisation objet. Ils n’ignorent cependant pas l’existant et sont élaborés par une communauté beaucoup plus large que celle de l’information et de la documentation qui y apporte une contribution active.

Identification des ressources sur Internet et métadonnées

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Identification des ressources sur Internet et métadonnées

Tous droits reacuteserveacutes copy Association pour lavancement des sciences et destechniques de la documentation (ASTED) 1999

Ce document est proteacutegeacute par la loi sur le droit drsquoauteur Lrsquoutilisation desservices drsquoEacuterudit (y compris la reproduction) est assujettie agrave sa politiquedrsquoutilisation que vous pouvez consulter en lignehttpsaproposeruditorgfrusagerspolitique-dutilisation

Cet article est diffuseacute et preacuteserveacute par EacuteruditEacuterudit est un consortium interuniversitaire sans but lucratif composeacute delrsquoUniversiteacute de Montreacuteal lrsquoUniversiteacute Laval et lrsquoUniversiteacute du Queacutebec agraveMontreacuteal Il a pour mission la promotion et la valorisation de la recherchehttpswwweruditorgfr

Document geacuteneacutereacute le 19 jan 2022 0435

Documentation et bibliothegraveques

Identification des ressources sur Internet et meacutetadonneacutees diversiteacute des standardsIdentification of Ressources on the Internet and Metadata ADiversity of StandardsIdentificacioacuten de los recursos en Internet y metadatosdiversidad de normasCatherine Lupovici

Eacutedition eacutelectroniqueVolume 45 numeacutero 4 octobrendashdeacutecembre 1999

URI httpsideruditorgiderudit1032722arDOI httpsdoiorg1072021032722ar

Aller au sommaire du numeacutero

Eacutediteur(s)Association pour lavancement des sciences et des techniques de ladocumentation (ASTED)

ISSN0315-2340 (imprimeacute)2291-8949 (numeacuterique)

Deacutecouvrir la revue

Citer cet articleLupovici C (1999) Identification des ressources sur Internet et meacutetadonneacutees diversiteacute des standards Documentation et bibliothegraveques 45(4) 191ndash194httpsdoiorg1072021032722ar

Reacutesumeacute de larticleLrsquoidentification des ressources eacutelectroniques disponibles sur Internet ainsi queles meacutetadonneacutees creacuteeacutees pour permettre leur deacutecouverte et leur gestion ontprofondeacutement modifieacute les standards traditionnels de numeacuterotation normaliseacuteeet de description bibliographique et documentaire Les nouveaux standards eneacutevolution permanente sont deacutesormais tregraves geacuteneacuteriques et proches de lamodeacutelisation objet Ils nrsquoignorent cependant pas lrsquoexistant et sont eacutelaboreacutes parune communauteacute beaucoup plus large que celle de lrsquoinformation et de ladocumentation qui y apporte une contribution active

Documentation et bibliothegraveques

Identification des ressources sur Internet et meacutetadonneacutees diversiteacute des standards

Catherine Lupovicicirc Directrice Deacutepartement de la bibliothegraveque numeacuterique Bibliothegraveque nationale de France catherinelupovici bnffr

Lidentification des ressources eacutelectroniques disponibles sur Internet ainsi que les meacutetadonneacutees creacuteeacutees pour permettre leur deacutecouverte et leur gestion ont profondeacutement modifieacute les standards traditionnels de numeacuterotation normaliseacutee et de description bibliographique et doshycumentaire Les nouveaux standards en eacutevolution permanente sont deacutesormais tregraves geacuteneacuteriques et proches de la modeacutelisation objet Ils nignorent cependant pas lexistant et sont eacutelaboreacutes par une communauteacute beaucoup plus large que celle de linformation et de la docushymentation qui y apporte une contribution active

Identification of Ressources on the Internet and Metadata A Diversity of Standards Internet Electronic ressources identification and metadata creashytion for their discovery and their management are deeply modishyfying traditional standards for international numbering and biblioshygraphic description The new emerging standards are continuousshyly evolving They are more generic and developed in an object-oriented approach They are at the same time building on the exisshyting ones and the information and documentation community is acshytively contributing to their elaboration within the new enlarged comshymunity involved in this standardization process

Identificaciocircn de los recursos en Internet y metadatos diver-sidad de normas La identificaciocircn de los recursos electrocircnicos disponibles en Intershynet asfcomo los metadatos creados para permitir que se descu-brieran y administraran modificaron profundamente las normas tradicionales de numeraciocircn normaiizada y de descripcion bi-bliogracircfica y documentai Las nuevas normas que evolucionan en forma permanente son por el momento muy geacuteneacuterales y se acercan a la enfoque centrado en el objeto No obstante no igno-ran lo existente y han sido elaboradas por una comunidad mucho mas grande que la de la informaciocircn y la de la documentaciocircn que aporta una contribuciocircn muy activa a elia

Le terme de meacutetadonneacutees deacutesigne de maniegravere geacuteneacuterique les donneacutees creacuteeacutees pour fournir des informations sur des resshysources eacutelectroniques dinformation Les meacutetadonneacutees peuvent remplir diffeacuterentes fonctions telles que la gestion des ressourshyces deacutecrites (par exemple le suivi du cycle de vie dun document) la gestion des inforshymations deacutecrivant le contenu dun docushyment ou dune ressource pour en faciliter la deacutecouverte ou la localisation puis lacshycegraves ou celle encore des informations relashytives aux droits daccegraves aux ressources Le concept de meacutetadonneacutees est une extenshysion agrave lenvironnement des ressources eacutelectroniques - et essentiellement agrave lheure actuelle agrave celui des services Web de lInternet - du concept dinformation seshycondaire deacutecrivant une ressource prishymaire

Le contexte Internet Dans le contexte classique de docushy

ments primaires deacutecrits dans des banques de donneacutees bibliographiques etou docushymentaires on avait affaire agrave deux mondes distincts ayant chacun leurs propres techshyniques et donc leurs propres standards Leacutemergence de documents eacutelectronishyques tout dabord sur des supports hors ligne comme le ceacutedeacuterom puis sur Intershynet a consideacuterablement modifieacute la situashytion de ces deux mondes dont les technishyques se sont rapprocheacutees avec des conseacutequences directes sur les standards techniques utiliseacutes par chacun

Tout dabord la notion mecircme de docushyment et la typologie des documents ont eacutevolueacute On parle davantage aujourdhui dans le monde du document eacutelectronique en ligne de ressource celle-ci devient un concept geacuteneacuterique deacutesignant un enshysemble de donneacutees pouvant ecirctre utiliseacute

comme un tout et relativement agrave un contexte deacutefini dutilisation Ainsi le terme de ressource pourra aussi bien sapplishyquer agrave un site complet ou agrave une page Web que bientocirct -conseacutequence de leacutevolution que le passage du codage HTML au coshydage XML va imposer au Web - agrave une porshytion de page degraves lors quelle sera autosuffishysante par rapport agrave une utilisation particushyliegravere

Les meacutetadonneacutees quant agrave elles peushyvent deacutesormais ecirctre exprimeacutees dans le forshymat technique de codage de la ressource quelles accompagnent et ecirctre disponibles en mecircme temps quelle Cette simultaneacuteiteacute peut ecirctre offerte par le biais de lapplicashytion qui rapproche deux sources diffeacuterenshytes en offrant agrave lutilisateur une interface unique de recherche et de consultation pour les deux types de donneacutees elle peut aussi provenir de ce que les meacutetadonneacutees et le document sont traiteacutes dans un mecircme fichier informatique degraves lors quils sont

octobre-deacutecembre 1999 191

Documentation et bibliothegraveques

encodes dans le mecircme format et geacutereacutes par les mecircmes logiciels

Enfin on considegravere quune mecircme resshysource peut ecirctre utiliseacutee dans tel contexte comme un ensemble de donneacutees sur des donneacutees et comme une ressource dans tel autre contexte Il ne sagit plus seuleshyment de creacuteer a priori linformation seconshydaire qui sera ulteacuterieurement exploiteacutee pour trouver la ressource cest lors de lutishylisation et gracircce agrave un outil approprieacute de traishytement intelligent que les informations de base seront interpreacuteteacutees pour donner acshycegraves agrave cette ressource

Les diffeacuterents acteurs qui souhaitent exploiter Internet font par ailleurs pression pour acceacuteleacuterer sa normalisation technique afin de faciliter la deacutecouverte dinformation gracircce agrave des moteurs de recherche plus inshytelligents et de mettre en œuvre la gestion des droits dutilisation des ressources

Le Resource Description Framework (RDF)

Cest pour faciliter cette normalisation technique que le W3Consortium qui est responsable des eacutevolutions techniques dInternet a proposeacute degraves octobre 1997 un cadre geacuteneacuteral pour la description des resshysources deacute lInternet le Resource Descripshytion Framework Son objectif eacutetait de faire passer le Web du niveau de machine-reashydable agrave celui de machine-understandable

Le modegravele RDF ne prend en compte que les meacutetadonneacutees creacuteeacutees dans une mention speacutecifique identifieacutee en tant que telle Cette mention de meacutetadonneacutees peut ecirctre associeacutee agrave la ressource de quatre mashyniegraveres diffeacuterentes

raquo les meacutetadonneacutees sont encapsushyleacutees dans la ressource cest le mode emshybedded

bull les meacutetadonneacutees sont externes agrave la ressource mais seront fournies avec elle dans le meacutecanisme de transfert de la reacuteshyponse agrave une recherche dinformation cest le mode along-with

laquo les meacutetadonneacutees seront utiliseacutees seacutepareacutement de la ressource pour une reshycherche dinformation eacuteventuellement dans des bases de donneacutees diffeacuterentes cest le mode service bureau

bull la ressource est encapsuleacutee dans les meacutetadonneacutees qui la deacutecrivent cest le mode wrapped

Le dispositif RDF qui est en cours

dadoption comprend le modegravele et une syntaxe en XML (Extended Markup Lanshyguage) Le modegravele est geacuteneacuterique et peut ecirctre exploiteacute avec une autre syntaxe que XML Ce dispositif comprend eacutegalement des speacutecifications de scheacutemas regroupant des classes de types de ressources

RDF est deacutefini par des groupes dutilishysateurs tregraves divers comme les acteurs de la normalisation relative agrave Internet les bishybliothegraveques les speacutecialistes de la structushyration des documents (XMLSGML) et ceux de la repreacutesentation du savoir Il beacuteneacuteshyficie aussi dune forte contribution techshynique provenant des communauteacutes de la programmation orienteacutee objet des langashyges de modeacutelisation et des systegravemes de gestion de bases de donneacutees

RDF est une modeacutelisation des diffeacuteshyrentes faccedilons de geacuterer des meacutetadonneacutees qui integravegre celles qui existent deacutejagrave dans la documentation et dans la gestion des resshysources eacutelectroniques des diffeacuterentes comshymunauteacutes participant agrave son eacutelaboration Il existe donc deacutejagrave des standards de meacutetashydonneacutees qui appartiennent agrave lun ou agrave lautre mode dassociation de meacutetadonshyneacutees et de ressource et qui sont deacutecrits dans le modegravele RDF Voici quelques exemshyples de linteacutegration dans le modegravele RDF de standards de la documentation ou des bibliothegraveques

Standards pour le mode laquo service bureau raquo

Ces standards concernent la descripshytion bibliographique ou documentaire Ils recouvrent

bull les regravegles de description cest-agrave-dire la deacutefinition des eacuteleacutements de descripshytion et les regravegles agrave observer pour creacuteer ces descriptifs agrave partir des informations figushyrant dans les ressources que lon deacutecrit

bull les formats de description cest-agrave-dire le codage en machine permettant de structurer les donneacutees en vue de leur exploishytation dans des systegravemes dinterrogation

Certains dentre eux se sont deacutejagrave adapteacutes au contexte des ressources eacutelecshytroniques en eacutetendant les regravegles de desshycription et les formats aux besoins de reshycherche et daccegraves direct aux ressources eacutelectroniques Cest ainsi que les formats MARC (Machine Readable Cataloging) ofshyfrent deacutesormais la possibiliteacute dindiquer la localisation de la ressource eacutelectronique ses caracteacuteristiques techniques ainsi que

le lien agrave partir duquel on pourra y acceacuteder Les formats USMAcircRC et UNIMAcircRC ont deacutefini le champ 856 agrave cet effet

Standards pour le mode laquoembedded raquo

Deux standards principaux ont eacuteteacute deacuteshyfinis lun par la communauteacute des docushyments structureacutes lautre par celle de la norshymalisation Internet

Le projet TEI

La Text Encoding Initiative (TEI) a eacuteteacute deacuteveloppeacutee degraves le deacutebut de la mise en oeuvre de SGML (Standard Generalized Markup Language ISO 8879) par un groupe de chercheurs en sciences humaishynes litteacuterature et linguistique sinteacuteressant agrave lutilisation de linformatique Le projet TEI sest concreacutetiseacute par une DTD (Deacutefinishytion de Type de Document) SGML accomshypagneacutee de recommandations pour le coshydage de structure et leacutechange des textes La DTD TEI sapplique agrave chaque docushyment eacutelectronique encode selon la DTD et deacutefinit pour chaque uniteacute documentaire eacutelectronique un en-tecircte obligatoire comshyportant les meacutetadonneacutees

La seacutemantique de ces meacutetadonneacutees peut ecirctre reacutegie selon des regravegles de descripshytion standardiseacutees ou proprieacutetaires Dans le cadre dune application telle que le proshyjet American Memory de la Bibliothegraveque du Congregraves une DTD TEI a eacuteteacute deacuteveshyloppeacutee et les meacutetadonneacutees sont reacutedigeacutees selon les AACR2 (Anglo-American Cataloshyging Rules 2)

La syntaxe meta HTML

La DTD HTML (Hypertext Markup Lanshyguage) qui a eacuteteacute deacutefinie pour la structurashytion des pages Web de lInternet comporte une codification ltmetagt et une syntaxe pour leacutecriture des meacutetadonneacutees dans les pages Web Ces tags ltmetagt ne sont pas afficheacutes par les navigateurs mais ils sont utiliseacutes par certains moteurs de recherche sur Internet de maniegravere pondeacutereacutee par rapshyport au reste du texte des pages Web

Dans le cadre de cette standardisashytion Internet certaines communauteacutes dutishylisateurs dont les bibliothegraveques et les proshyducteurs de banques de donneacutees ont trashyvailleacute agrave la standardisation des types de meacuteshytadonneacutees Cest ainsi quest neacute le Dublin

192 octobre-deacutecembre 1999

Documentation et bibliothegraveques

Core qui deacutefinit un ensemble de quinze meacuteshytadonneacutees reacuteparties en trois grands types

bull des meacutetadonneacutees relatives au contenu intellectuel de la page Web

a des meacutetadonneacutees relatives agrave la proshyprieacuteteacute intellectuelle et en particulier aux inshyformations sur la gestion des droits dutilishysation de la page Web

m des meacutetadonneacutees relatives agrave la resshysource elle-mecircme et en particulier lidentishyfiant de la ressource si possible unique et persistant Voir le tableau 1 du texte laquo La publication eacutelectronique des thegraveses raquo des auteurs Bouleacutetreau Gauvin et Ducasse page 187

Le succegraves du Dublin Core a eacuteteacute tel que les eacuteleacutements de description qui y sont deacutefinis sont retenus comme seacutemantique de meacutetadonneacutees en dehors de la syntaxe ltmetagt HTML ils ont deacutejagrave eacuteteacute repris dans les premiegraveres speacutecifications de XML dans un scheacutema minimum de base

Standards pour le mode laquowrappedraquo

Ce mode considegravere les meacutetadonneacutees comme leacuteleacutement englobant pour la resshysource La DTD EAD (Encoding Archival Description) a eacuteteacute deacuteveloppeacutee dans le continent nord-ameacutericain pour la structurashytion et lencodage en XML des instrushyments de recherche deacutecrivant des collecshytions speacutecialiseacutees telles que les archives ou les collections de papiers Ces instrushyments de recherche sont par exemple des inventaires darchives publiques ou prishyveacutees ou des catalogues de collections de documents manuscrits

Cette DTD autorise une structuration de linstrument de recherche en douze nishyveaux hieacuterarchiques et permet dattacher la ressource eacutelectronique agrave sa description

Elle est deacutejagrave utiliseacutee dans des projets coopeacuteratifs de collections de ressources eacutelectroniques Larborescence de linstrushyment de recherche peut servir de support agrave la navigation dans une telle collection

La DTD EAD eacutemane de la communaushyteacute des archives et des bibliothegraveques mais elle est aussi expeacuterimenteacutee par des mushyseacutees dAmeacuterique du Nord

Lidentification des ressources

Des numeacuteros ou des codes didentifishy

cation des documents ont eacuteteacute creacuteeacutes deshypuis une trentaine danneacutees pour diffeacuteshyrents types de documents LISBN (InternashytionalStandard Book Number) pour le livre et lISSN (International Standard Serial Numbei) pour les publications en seacuterie sont les plus anciens et ont acquis le statut de normes internationales ISO Lorganisashytion de ces systegravemes de numeacuterotation reshypose sur un reacuteseau international dagenshyces dattribution et denregistrement des numeacuteros Ces identifiants sont utiliseacutes agrave la fois par les eacutediteurs pour la gestion de la commercialisation et par les bibliothegraveques et centres de documentation pour la gesshytion des commandes et lidentification bishybliographique et documentaire des ouvrashyges et peacuteriodiques

Ce systegraveme de codes didentification a ensuite eacuteteacute eacutetendu aux uniteacutes logiques composant un document par exemple larshyticle dans un fascicule de peacuteriodique Dans la deacutecennie quatre-vingt-dix cette extension a eacuteteacute adapteacutee aux besoins de la gestion puis de la distribution de docushyments sous forme eacutelectronique

Alors que le concept de ressource prend le pas sur celui de publication une reacuteflexion est actuellement conduite sur lidentification des ressources Envisageacutee dans le contexte du Web cette identificashytion saccompagne dune dimension dynashymique car il est devenu neacutecessaire que le systegraveme didentification non content didentifier et de localiser une ressource y donne eacutegalement accegraves Lidentifiant deshyvient actif et laquocliquableraquo

Le systegraveme URI LInternet Engineering Task Force

(IETF) qui deacuteveloppe les standards Intershynet a lanceacute un travail de standardisation pour un systegraveme geacuteneacuterique didentificashytion des ressources du reacuteseau dont le prinshycipe est que lidentifiant peut agrave la fois repreacuteshysenter la ressource et permettre dy acceacuteshyder cest le systegraveme URI (Uniform Reshysource Identifie) Il sagit de proposer un cadre et des regravegles pour permettre agrave des organismes denregistrement de deacutecrire des ressources et den assurer la disponishybiliteacute de maniegravere agrave ce quelles soient finaleshyment accessibles dans un ou plusieurs sites via leurs URL Ce cadre didentificashytion sappuie sur le dispositif suivant

a LURN (Uniform Resource Name) de la ressource est son nom (au sens Intershy

net du terme) unique et persistant il deacuteshysigne une ressource qui pourra ecirctre preacuteshysente sur plusieurs sites comme autant dexemplaires Ce numeacutero est reacutesolu -cest-agrave-dire quil indique le ou les URL du ou des sites ougrave lon peut consulter la resshysource - par une agence ougrave il est enregisshytreacute et qui maintient la validiteacute des URL Cette agence sappelle une agence de reacuteshysolution du nom

m LURL (Uniform Resource Locatoi) est ladresse du site ougrave se trouve la resshysource On se connecte agrave ceJle-ci en clishyquant sur ce lien qui nest pas persistant et dont la validiteacute nest pas garantie

u LURC (Uniform Resource Characshyteristic) contient des meacutetadonneacutees sur la ressource et en particulier les modaliteacutes daccegraves et la gestion des droits Ces meacutetashydonneacutees peuvent ecirctre stockeacutees dans une banque de donneacutees denregistrement des URN maintenue par lagence denregistreshyment et de reacutesolution Elles peuvent eacutegaleshyment se trouver sur un site diffeacuterent et lieacutees aux URN

Le systegraveme DOI Le systegraveme DOI (Digital Object Identishy

fie) est une application du systegraveme URI mise en œuvre par une feacutedeacuteration deacutedishyteurs commerciaux par lintermeacutediaire de la Fondation DOI

Cette Fondation sest constitueacutee comme agence denregistrement des idenshytifiants DOI des publications Le numeacutero DOI est un URN au sens Internet et il en a la structure composeacutee dun preacutefixe attrishybueacute agrave leacutediteur et dun suffixe qui est le nushymeacutero de la ressource chez leacutediteur ou le deacutetenteur des droits Lattribution de ce nushymeacutero relegraveve de la responsabiliteacute de leacutedishyteur ou du deacutetenteur des droits Il peut ecirctre un identifiant issu des systegravemes existants tels lISBN ou lISSN Lattribution dun preacutefixe est conditionneacutee au paiement dun droit par leacutediteur et elle comporte une clause sur le respect du copyright et lengashygement de mettre agrave jour en cas de modifishycation les URL servant agrave la reacutesolution des DOI

Les eacutediteurs entretiennent des bases dinformation sur les ressources quils gegraveshyrent elles contiennent des URC et cest sur celles-ci que pointent les numeacuteros DOI de la base denregistrement Un utilisateur effectuant une recherche par numeacutero URN aura ainsi accegraves agrave la base URC

octobre-deacutecembre 1999 193

Documentation et bibliothegraveques

associeacutee agrave ce numeacutero et aura connaisshysance des conditions daccegraves agrave la resshysource (accegraves gratuit paiement agrave lacte conditions dabonnement etc)

Les publications eacutelectroniques sur Internet utilisent et utiliseront de plus en plus souvent des donneacutees multimeacutedias avec des droits complexes et entrelaceacutes De plus reacutevolution programmeacutee de la structure des pages Web qui verra le passhysage du codage HTML au codage XML conduit agrave imaginer dattribuer des identishyfiants agrave des portions de contenus agrave linteacuteshyrieur mecircme des ressources cela conduira agrave un deacutecoupage en uniteacutes plus fines que la page Web Les eacutediteurs et la Fondation DOI travaillent donc en suivant les eacutevolushytions de la standardisation Internet agrave des extensions de ces notions didentification des ressources et aux moyens de mettre en œuvre les meacutetadonneacutees associeacutees aux identifiants dans le contexte de leacutedition eacutelectronique sur le Web

Les tendances preacutesentes sont lidentishyfication dun document ou dune ressource et de ses inscriptions dans des publicashytions papier eacutelectronique hors ligne eacutelecshytronique en ligne une des difficulteacutes eacutetant que cette diversification des types de manishyfestations dune œuvre fait eacuteclater les typoshylogies classiques et en particulier la noshytion de publication en seacuterie avec tout lapshypareil didentification qui laccompagnait Agrave cet eacutegard lun des thegravemes de reacuteflexion actuellement le plus important - et directeshyment lieacute agrave lidentification et aux meacutetadonshyneacutees - est la mise en œuvre de la gestion des droits daccegraves aux ressources par navishygation a partir des citations dans les artishycles

De nouveaux partenaires

Les publications sur Internet ne peuvent ecirctre geacutereacutees agrave laide des standards des publications classiques On assiste acshytuellement agrave un grand mouvement de reacuteshyflexion et de modeacutelisation conceptuelle qui englobe les publications classiques et les ressources eacutelectroniques Cette modeacutelisashytion saccompagne de standards plus geacuteshyneacuteriques que ceux que nous avons connus pour les publications traditionnelshyles Leur eacutelaboration se fait en collaborashytion avec de nouveaux partenaires pour lesquels lapport des professionnels de linshy

formation peut ecirctre tregraves important Un exemple frappant en est le cas du Dublin Core

Sources consulteacutees

Digital libraries cataloging and indexing of electronic resources Bibliography In IFLA electronic colshylections ltURL httpiflainistfrlleataloghtmgt

Digital libraries metadata resources In IFLA electroshynic collections ltURL httpiflainistfrImetashydata htmgt

Lupovici Catherine 1998 Le Digital Object Identifier le systegraveme DOI Bulletin des bibliothegraveques de France 43 ( 3) 49-54 ltURL httpwwwens-sibfrEnssibbbfbbfhtmgt

1998 Linformation bibliographique des doshycuments eacutelectroniques Bulletin des bibliothegraveshyques de France 43 (4) 42-47 ltURL http wwwenssibfrEnssibbbfbbfhtmgt

gts

^Hnadiana Jampiuml La bibliographie nationale

The National Bibliography

Canadicircana sur ceacutedeacuterom comprend 18 million de notices et notamment

bull toutes les notices contenues dans les versions anteacuterieures du ceacutedeacuterom Canadicircana

bull les notices bibliographiques et dautoriteacutes ajouteacutees ou modifieacutees par la Bibliothegraveque nationale en 1999

bull les notices de Carto-Canadana ajouteacutees ou modifieacutees par les Archives nationales en 1999

bull les notices de Canadicircana anciens microfilmeacutees et publieacutees en 1999 par lInstitut canadien de microreproductions historiques (ICMH)

Pour plus dinformation visitez notre site Web agrave httpwwwnlc-bnccacanadiana ou teacuteleacutephonez au (819) 994-6921 Courriel canadiananlc-bncca

Pour commander veuillez communiquer avec Les Editions du gouvernement du Canada ou teacuteleacutephonez au 1 -800-635-7943 ou (819) 956-4800 ou Teacuteleacutecopieur 1-800-565-7757 ou (819) 994-1498 site Web httppublicationspwgscgcca

1 ^ 1 Bibliothegraveque nationale bull bull bull du Canada

National Library of Canada Canada

194 octobre-deacutecembre 1999

Page 2: Identification des ressources sur Internet et métadonnées

Documentation et bibliothegraveques

Identification des ressources sur Internet et meacutetadonneacutees diversiteacute des standards

Catherine Lupovicicirc Directrice Deacutepartement de la bibliothegraveque numeacuterique Bibliothegraveque nationale de France catherinelupovici bnffr

Lidentification des ressources eacutelectroniques disponibles sur Internet ainsi que les meacutetadonneacutees creacuteeacutees pour permettre leur deacutecouverte et leur gestion ont profondeacutement modifieacute les standards traditionnels de numeacuterotation normaliseacutee et de description bibliographique et doshycumentaire Les nouveaux standards en eacutevolution permanente sont deacutesormais tregraves geacuteneacuteriques et proches de la modeacutelisation objet Ils nignorent cependant pas lexistant et sont eacutelaboreacutes par une communauteacute beaucoup plus large que celle de linformation et de la docushymentation qui y apporte une contribution active

Identification of Ressources on the Internet and Metadata A Diversity of Standards Internet Electronic ressources identification and metadata creashytion for their discovery and their management are deeply modishyfying traditional standards for international numbering and biblioshygraphic description The new emerging standards are continuousshyly evolving They are more generic and developed in an object-oriented approach They are at the same time building on the exisshyting ones and the information and documentation community is acshytively contributing to their elaboration within the new enlarged comshymunity involved in this standardization process

Identificaciocircn de los recursos en Internet y metadatos diver-sidad de normas La identificaciocircn de los recursos electrocircnicos disponibles en Intershynet asfcomo los metadatos creados para permitir que se descu-brieran y administraran modificaron profundamente las normas tradicionales de numeraciocircn normaiizada y de descripcion bi-bliogracircfica y documentai Las nuevas normas que evolucionan en forma permanente son por el momento muy geacuteneacuterales y se acercan a la enfoque centrado en el objeto No obstante no igno-ran lo existente y han sido elaboradas por una comunidad mucho mas grande que la de la informaciocircn y la de la documentaciocircn que aporta una contribuciocircn muy activa a elia

Le terme de meacutetadonneacutees deacutesigne de maniegravere geacuteneacuterique les donneacutees creacuteeacutees pour fournir des informations sur des resshysources eacutelectroniques dinformation Les meacutetadonneacutees peuvent remplir diffeacuterentes fonctions telles que la gestion des ressourshyces deacutecrites (par exemple le suivi du cycle de vie dun document) la gestion des inforshymations deacutecrivant le contenu dun docushyment ou dune ressource pour en faciliter la deacutecouverte ou la localisation puis lacshycegraves ou celle encore des informations relashytives aux droits daccegraves aux ressources Le concept de meacutetadonneacutees est une extenshysion agrave lenvironnement des ressources eacutelectroniques - et essentiellement agrave lheure actuelle agrave celui des services Web de lInternet - du concept dinformation seshycondaire deacutecrivant une ressource prishymaire

Le contexte Internet Dans le contexte classique de docushy

ments primaires deacutecrits dans des banques de donneacutees bibliographiques etou docushymentaires on avait affaire agrave deux mondes distincts ayant chacun leurs propres techshyniques et donc leurs propres standards Leacutemergence de documents eacutelectronishyques tout dabord sur des supports hors ligne comme le ceacutedeacuterom puis sur Intershynet a consideacuterablement modifieacute la situashytion de ces deux mondes dont les technishyques se sont rapprocheacutees avec des conseacutequences directes sur les standards techniques utiliseacutes par chacun

Tout dabord la notion mecircme de docushyment et la typologie des documents ont eacutevolueacute On parle davantage aujourdhui dans le monde du document eacutelectronique en ligne de ressource celle-ci devient un concept geacuteneacuterique deacutesignant un enshysemble de donneacutees pouvant ecirctre utiliseacute

comme un tout et relativement agrave un contexte deacutefini dutilisation Ainsi le terme de ressource pourra aussi bien sapplishyquer agrave un site complet ou agrave une page Web que bientocirct -conseacutequence de leacutevolution que le passage du codage HTML au coshydage XML va imposer au Web - agrave une porshytion de page degraves lors quelle sera autosuffishysante par rapport agrave une utilisation particushyliegravere

Les meacutetadonneacutees quant agrave elles peushyvent deacutesormais ecirctre exprimeacutees dans le forshymat technique de codage de la ressource quelles accompagnent et ecirctre disponibles en mecircme temps quelle Cette simultaneacuteiteacute peut ecirctre offerte par le biais de lapplicashytion qui rapproche deux sources diffeacuterenshytes en offrant agrave lutilisateur une interface unique de recherche et de consultation pour les deux types de donneacutees elle peut aussi provenir de ce que les meacutetadonneacutees et le document sont traiteacutes dans un mecircme fichier informatique degraves lors quils sont

octobre-deacutecembre 1999 191

Documentation et bibliothegraveques

encodes dans le mecircme format et geacutereacutes par les mecircmes logiciels

Enfin on considegravere quune mecircme resshysource peut ecirctre utiliseacutee dans tel contexte comme un ensemble de donneacutees sur des donneacutees et comme une ressource dans tel autre contexte Il ne sagit plus seuleshyment de creacuteer a priori linformation seconshydaire qui sera ulteacuterieurement exploiteacutee pour trouver la ressource cest lors de lutishylisation et gracircce agrave un outil approprieacute de traishytement intelligent que les informations de base seront interpreacuteteacutees pour donner acshycegraves agrave cette ressource

Les diffeacuterents acteurs qui souhaitent exploiter Internet font par ailleurs pression pour acceacuteleacuterer sa normalisation technique afin de faciliter la deacutecouverte dinformation gracircce agrave des moteurs de recherche plus inshytelligents et de mettre en œuvre la gestion des droits dutilisation des ressources

Le Resource Description Framework (RDF)

Cest pour faciliter cette normalisation technique que le W3Consortium qui est responsable des eacutevolutions techniques dInternet a proposeacute degraves octobre 1997 un cadre geacuteneacuteral pour la description des resshysources deacute lInternet le Resource Descripshytion Framework Son objectif eacutetait de faire passer le Web du niveau de machine-reashydable agrave celui de machine-understandable

Le modegravele RDF ne prend en compte que les meacutetadonneacutees creacuteeacutees dans une mention speacutecifique identifieacutee en tant que telle Cette mention de meacutetadonneacutees peut ecirctre associeacutee agrave la ressource de quatre mashyniegraveres diffeacuterentes

raquo les meacutetadonneacutees sont encapsushyleacutees dans la ressource cest le mode emshybedded

bull les meacutetadonneacutees sont externes agrave la ressource mais seront fournies avec elle dans le meacutecanisme de transfert de la reacuteshyponse agrave une recherche dinformation cest le mode along-with

laquo les meacutetadonneacutees seront utiliseacutees seacutepareacutement de la ressource pour une reshycherche dinformation eacuteventuellement dans des bases de donneacutees diffeacuterentes cest le mode service bureau

bull la ressource est encapsuleacutee dans les meacutetadonneacutees qui la deacutecrivent cest le mode wrapped

Le dispositif RDF qui est en cours

dadoption comprend le modegravele et une syntaxe en XML (Extended Markup Lanshyguage) Le modegravele est geacuteneacuterique et peut ecirctre exploiteacute avec une autre syntaxe que XML Ce dispositif comprend eacutegalement des speacutecifications de scheacutemas regroupant des classes de types de ressources

RDF est deacutefini par des groupes dutilishysateurs tregraves divers comme les acteurs de la normalisation relative agrave Internet les bishybliothegraveques les speacutecialistes de la structushyration des documents (XMLSGML) et ceux de la repreacutesentation du savoir Il beacuteneacuteshyficie aussi dune forte contribution techshynique provenant des communauteacutes de la programmation orienteacutee objet des langashyges de modeacutelisation et des systegravemes de gestion de bases de donneacutees

RDF est une modeacutelisation des diffeacuteshyrentes faccedilons de geacuterer des meacutetadonneacutees qui integravegre celles qui existent deacutejagrave dans la documentation et dans la gestion des resshysources eacutelectroniques des diffeacuterentes comshymunauteacutes participant agrave son eacutelaboration Il existe donc deacutejagrave des standards de meacutetashydonneacutees qui appartiennent agrave lun ou agrave lautre mode dassociation de meacutetadonshyneacutees et de ressource et qui sont deacutecrits dans le modegravele RDF Voici quelques exemshyples de linteacutegration dans le modegravele RDF de standards de la documentation ou des bibliothegraveques

Standards pour le mode laquo service bureau raquo

Ces standards concernent la descripshytion bibliographique ou documentaire Ils recouvrent

bull les regravegles de description cest-agrave-dire la deacutefinition des eacuteleacutements de descripshytion et les regravegles agrave observer pour creacuteer ces descriptifs agrave partir des informations figushyrant dans les ressources que lon deacutecrit

bull les formats de description cest-agrave-dire le codage en machine permettant de structurer les donneacutees en vue de leur exploishytation dans des systegravemes dinterrogation

Certains dentre eux se sont deacutejagrave adapteacutes au contexte des ressources eacutelecshytroniques en eacutetendant les regravegles de desshycription et les formats aux besoins de reshycherche et daccegraves direct aux ressources eacutelectroniques Cest ainsi que les formats MARC (Machine Readable Cataloging) ofshyfrent deacutesormais la possibiliteacute dindiquer la localisation de la ressource eacutelectronique ses caracteacuteristiques techniques ainsi que

le lien agrave partir duquel on pourra y acceacuteder Les formats USMAcircRC et UNIMAcircRC ont deacutefini le champ 856 agrave cet effet

Standards pour le mode laquoembedded raquo

Deux standards principaux ont eacuteteacute deacuteshyfinis lun par la communauteacute des docushyments structureacutes lautre par celle de la norshymalisation Internet

Le projet TEI

La Text Encoding Initiative (TEI) a eacuteteacute deacuteveloppeacutee degraves le deacutebut de la mise en oeuvre de SGML (Standard Generalized Markup Language ISO 8879) par un groupe de chercheurs en sciences humaishynes litteacuterature et linguistique sinteacuteressant agrave lutilisation de linformatique Le projet TEI sest concreacutetiseacute par une DTD (Deacutefinishytion de Type de Document) SGML accomshypagneacutee de recommandations pour le coshydage de structure et leacutechange des textes La DTD TEI sapplique agrave chaque docushyment eacutelectronique encode selon la DTD et deacutefinit pour chaque uniteacute documentaire eacutelectronique un en-tecircte obligatoire comshyportant les meacutetadonneacutees

La seacutemantique de ces meacutetadonneacutees peut ecirctre reacutegie selon des regravegles de descripshytion standardiseacutees ou proprieacutetaires Dans le cadre dune application telle que le proshyjet American Memory de la Bibliothegraveque du Congregraves une DTD TEI a eacuteteacute deacuteveshyloppeacutee et les meacutetadonneacutees sont reacutedigeacutees selon les AACR2 (Anglo-American Cataloshyging Rules 2)

La syntaxe meta HTML

La DTD HTML (Hypertext Markup Lanshyguage) qui a eacuteteacute deacutefinie pour la structurashytion des pages Web de lInternet comporte une codification ltmetagt et une syntaxe pour leacutecriture des meacutetadonneacutees dans les pages Web Ces tags ltmetagt ne sont pas afficheacutes par les navigateurs mais ils sont utiliseacutes par certains moteurs de recherche sur Internet de maniegravere pondeacutereacutee par rapshyport au reste du texte des pages Web

Dans le cadre de cette standardisashytion Internet certaines communauteacutes dutishylisateurs dont les bibliothegraveques et les proshyducteurs de banques de donneacutees ont trashyvailleacute agrave la standardisation des types de meacuteshytadonneacutees Cest ainsi quest neacute le Dublin

192 octobre-deacutecembre 1999

Documentation et bibliothegraveques

Core qui deacutefinit un ensemble de quinze meacuteshytadonneacutees reacuteparties en trois grands types

bull des meacutetadonneacutees relatives au contenu intellectuel de la page Web

a des meacutetadonneacutees relatives agrave la proshyprieacuteteacute intellectuelle et en particulier aux inshyformations sur la gestion des droits dutilishysation de la page Web

m des meacutetadonneacutees relatives agrave la resshysource elle-mecircme et en particulier lidentishyfiant de la ressource si possible unique et persistant Voir le tableau 1 du texte laquo La publication eacutelectronique des thegraveses raquo des auteurs Bouleacutetreau Gauvin et Ducasse page 187

Le succegraves du Dublin Core a eacuteteacute tel que les eacuteleacutements de description qui y sont deacutefinis sont retenus comme seacutemantique de meacutetadonneacutees en dehors de la syntaxe ltmetagt HTML ils ont deacutejagrave eacuteteacute repris dans les premiegraveres speacutecifications de XML dans un scheacutema minimum de base

Standards pour le mode laquowrappedraquo

Ce mode considegravere les meacutetadonneacutees comme leacuteleacutement englobant pour la resshysource La DTD EAD (Encoding Archival Description) a eacuteteacute deacuteveloppeacutee dans le continent nord-ameacutericain pour la structurashytion et lencodage en XML des instrushyments de recherche deacutecrivant des collecshytions speacutecialiseacutees telles que les archives ou les collections de papiers Ces instrushyments de recherche sont par exemple des inventaires darchives publiques ou prishyveacutees ou des catalogues de collections de documents manuscrits

Cette DTD autorise une structuration de linstrument de recherche en douze nishyveaux hieacuterarchiques et permet dattacher la ressource eacutelectronique agrave sa description

Elle est deacutejagrave utiliseacutee dans des projets coopeacuteratifs de collections de ressources eacutelectroniques Larborescence de linstrushyment de recherche peut servir de support agrave la navigation dans une telle collection

La DTD EAD eacutemane de la communaushyteacute des archives et des bibliothegraveques mais elle est aussi expeacuterimenteacutee par des mushyseacutees dAmeacuterique du Nord

Lidentification des ressources

Des numeacuteros ou des codes didentifishy

cation des documents ont eacuteteacute creacuteeacutes deshypuis une trentaine danneacutees pour diffeacuteshyrents types de documents LISBN (InternashytionalStandard Book Number) pour le livre et lISSN (International Standard Serial Numbei) pour les publications en seacuterie sont les plus anciens et ont acquis le statut de normes internationales ISO Lorganisashytion de ces systegravemes de numeacuterotation reshypose sur un reacuteseau international dagenshyces dattribution et denregistrement des numeacuteros Ces identifiants sont utiliseacutes agrave la fois par les eacutediteurs pour la gestion de la commercialisation et par les bibliothegraveques et centres de documentation pour la gesshytion des commandes et lidentification bishybliographique et documentaire des ouvrashyges et peacuteriodiques

Ce systegraveme de codes didentification a ensuite eacuteteacute eacutetendu aux uniteacutes logiques composant un document par exemple larshyticle dans un fascicule de peacuteriodique Dans la deacutecennie quatre-vingt-dix cette extension a eacuteteacute adapteacutee aux besoins de la gestion puis de la distribution de docushyments sous forme eacutelectronique

Alors que le concept de ressource prend le pas sur celui de publication une reacuteflexion est actuellement conduite sur lidentification des ressources Envisageacutee dans le contexte du Web cette identificashytion saccompagne dune dimension dynashymique car il est devenu neacutecessaire que le systegraveme didentification non content didentifier et de localiser une ressource y donne eacutegalement accegraves Lidentifiant deshyvient actif et laquocliquableraquo

Le systegraveme URI LInternet Engineering Task Force

(IETF) qui deacuteveloppe les standards Intershynet a lanceacute un travail de standardisation pour un systegraveme geacuteneacuterique didentificashytion des ressources du reacuteseau dont le prinshycipe est que lidentifiant peut agrave la fois repreacuteshysenter la ressource et permettre dy acceacuteshyder cest le systegraveme URI (Uniform Reshysource Identifie) Il sagit de proposer un cadre et des regravegles pour permettre agrave des organismes denregistrement de deacutecrire des ressources et den assurer la disponishybiliteacute de maniegravere agrave ce quelles soient finaleshyment accessibles dans un ou plusieurs sites via leurs URL Ce cadre didentificashytion sappuie sur le dispositif suivant

a LURN (Uniform Resource Name) de la ressource est son nom (au sens Intershy

net du terme) unique et persistant il deacuteshysigne une ressource qui pourra ecirctre preacuteshysente sur plusieurs sites comme autant dexemplaires Ce numeacutero est reacutesolu -cest-agrave-dire quil indique le ou les URL du ou des sites ougrave lon peut consulter la resshysource - par une agence ougrave il est enregisshytreacute et qui maintient la validiteacute des URL Cette agence sappelle une agence de reacuteshysolution du nom

m LURL (Uniform Resource Locatoi) est ladresse du site ougrave se trouve la resshysource On se connecte agrave ceJle-ci en clishyquant sur ce lien qui nest pas persistant et dont la validiteacute nest pas garantie

u LURC (Uniform Resource Characshyteristic) contient des meacutetadonneacutees sur la ressource et en particulier les modaliteacutes daccegraves et la gestion des droits Ces meacutetashydonneacutees peuvent ecirctre stockeacutees dans une banque de donneacutees denregistrement des URN maintenue par lagence denregistreshyment et de reacutesolution Elles peuvent eacutegaleshyment se trouver sur un site diffeacuterent et lieacutees aux URN

Le systegraveme DOI Le systegraveme DOI (Digital Object Identishy

fie) est une application du systegraveme URI mise en œuvre par une feacutedeacuteration deacutedishyteurs commerciaux par lintermeacutediaire de la Fondation DOI

Cette Fondation sest constitueacutee comme agence denregistrement des idenshytifiants DOI des publications Le numeacutero DOI est un URN au sens Internet et il en a la structure composeacutee dun preacutefixe attrishybueacute agrave leacutediteur et dun suffixe qui est le nushymeacutero de la ressource chez leacutediteur ou le deacutetenteur des droits Lattribution de ce nushymeacutero relegraveve de la responsabiliteacute de leacutedishyteur ou du deacutetenteur des droits Il peut ecirctre un identifiant issu des systegravemes existants tels lISBN ou lISSN Lattribution dun preacutefixe est conditionneacutee au paiement dun droit par leacutediteur et elle comporte une clause sur le respect du copyright et lengashygement de mettre agrave jour en cas de modifishycation les URL servant agrave la reacutesolution des DOI

Les eacutediteurs entretiennent des bases dinformation sur les ressources quils gegraveshyrent elles contiennent des URC et cest sur celles-ci que pointent les numeacuteros DOI de la base denregistrement Un utilisateur effectuant une recherche par numeacutero URN aura ainsi accegraves agrave la base URC

octobre-deacutecembre 1999 193

Documentation et bibliothegraveques

associeacutee agrave ce numeacutero et aura connaisshysance des conditions daccegraves agrave la resshysource (accegraves gratuit paiement agrave lacte conditions dabonnement etc)

Les publications eacutelectroniques sur Internet utilisent et utiliseront de plus en plus souvent des donneacutees multimeacutedias avec des droits complexes et entrelaceacutes De plus reacutevolution programmeacutee de la structure des pages Web qui verra le passhysage du codage HTML au codage XML conduit agrave imaginer dattribuer des identishyfiants agrave des portions de contenus agrave linteacuteshyrieur mecircme des ressources cela conduira agrave un deacutecoupage en uniteacutes plus fines que la page Web Les eacutediteurs et la Fondation DOI travaillent donc en suivant les eacutevolushytions de la standardisation Internet agrave des extensions de ces notions didentification des ressources et aux moyens de mettre en œuvre les meacutetadonneacutees associeacutees aux identifiants dans le contexte de leacutedition eacutelectronique sur le Web

Les tendances preacutesentes sont lidentishyfication dun document ou dune ressource et de ses inscriptions dans des publicashytions papier eacutelectronique hors ligne eacutelecshytronique en ligne une des difficulteacutes eacutetant que cette diversification des types de manishyfestations dune œuvre fait eacuteclater les typoshylogies classiques et en particulier la noshytion de publication en seacuterie avec tout lapshypareil didentification qui laccompagnait Agrave cet eacutegard lun des thegravemes de reacuteflexion actuellement le plus important - et directeshyment lieacute agrave lidentification et aux meacutetadonshyneacutees - est la mise en œuvre de la gestion des droits daccegraves aux ressources par navishygation a partir des citations dans les artishycles

De nouveaux partenaires

Les publications sur Internet ne peuvent ecirctre geacutereacutees agrave laide des standards des publications classiques On assiste acshytuellement agrave un grand mouvement de reacuteshyflexion et de modeacutelisation conceptuelle qui englobe les publications classiques et les ressources eacutelectroniques Cette modeacutelisashytion saccompagne de standards plus geacuteshyneacuteriques que ceux que nous avons connus pour les publications traditionnelshyles Leur eacutelaboration se fait en collaborashytion avec de nouveaux partenaires pour lesquels lapport des professionnels de linshy

formation peut ecirctre tregraves important Un exemple frappant en est le cas du Dublin Core

Sources consulteacutees

Digital libraries cataloging and indexing of electronic resources Bibliography In IFLA electronic colshylections ltURL httpiflainistfrlleataloghtmgt

Digital libraries metadata resources In IFLA electroshynic collections ltURL httpiflainistfrImetashydata htmgt

Lupovici Catherine 1998 Le Digital Object Identifier le systegraveme DOI Bulletin des bibliothegraveques de France 43 ( 3) 49-54 ltURL httpwwwens-sibfrEnssibbbfbbfhtmgt

1998 Linformation bibliographique des doshycuments eacutelectroniques Bulletin des bibliothegraveshyques de France 43 (4) 42-47 ltURL http wwwenssibfrEnssibbbfbbfhtmgt

gts

^Hnadiana Jampiuml La bibliographie nationale

The National Bibliography

Canadicircana sur ceacutedeacuterom comprend 18 million de notices et notamment

bull toutes les notices contenues dans les versions anteacuterieures du ceacutedeacuterom Canadicircana

bull les notices bibliographiques et dautoriteacutes ajouteacutees ou modifieacutees par la Bibliothegraveque nationale en 1999

bull les notices de Carto-Canadana ajouteacutees ou modifieacutees par les Archives nationales en 1999

bull les notices de Canadicircana anciens microfilmeacutees et publieacutees en 1999 par lInstitut canadien de microreproductions historiques (ICMH)

Pour plus dinformation visitez notre site Web agrave httpwwwnlc-bnccacanadiana ou teacuteleacutephonez au (819) 994-6921 Courriel canadiananlc-bncca

Pour commander veuillez communiquer avec Les Editions du gouvernement du Canada ou teacuteleacutephonez au 1 -800-635-7943 ou (819) 956-4800 ou Teacuteleacutecopieur 1-800-565-7757 ou (819) 994-1498 site Web httppublicationspwgscgcca

1 ^ 1 Bibliothegraveque nationale bull bull bull du Canada

National Library of Canada Canada

194 octobre-deacutecembre 1999

Page 3: Identification des ressources sur Internet et métadonnées

Documentation et bibliothegraveques

encodes dans le mecircme format et geacutereacutes par les mecircmes logiciels

Enfin on considegravere quune mecircme resshysource peut ecirctre utiliseacutee dans tel contexte comme un ensemble de donneacutees sur des donneacutees et comme une ressource dans tel autre contexte Il ne sagit plus seuleshyment de creacuteer a priori linformation seconshydaire qui sera ulteacuterieurement exploiteacutee pour trouver la ressource cest lors de lutishylisation et gracircce agrave un outil approprieacute de traishytement intelligent que les informations de base seront interpreacuteteacutees pour donner acshycegraves agrave cette ressource

Les diffeacuterents acteurs qui souhaitent exploiter Internet font par ailleurs pression pour acceacuteleacuterer sa normalisation technique afin de faciliter la deacutecouverte dinformation gracircce agrave des moteurs de recherche plus inshytelligents et de mettre en œuvre la gestion des droits dutilisation des ressources

Le Resource Description Framework (RDF)

Cest pour faciliter cette normalisation technique que le W3Consortium qui est responsable des eacutevolutions techniques dInternet a proposeacute degraves octobre 1997 un cadre geacuteneacuteral pour la description des resshysources deacute lInternet le Resource Descripshytion Framework Son objectif eacutetait de faire passer le Web du niveau de machine-reashydable agrave celui de machine-understandable

Le modegravele RDF ne prend en compte que les meacutetadonneacutees creacuteeacutees dans une mention speacutecifique identifieacutee en tant que telle Cette mention de meacutetadonneacutees peut ecirctre associeacutee agrave la ressource de quatre mashyniegraveres diffeacuterentes

raquo les meacutetadonneacutees sont encapsushyleacutees dans la ressource cest le mode emshybedded

bull les meacutetadonneacutees sont externes agrave la ressource mais seront fournies avec elle dans le meacutecanisme de transfert de la reacuteshyponse agrave une recherche dinformation cest le mode along-with

laquo les meacutetadonneacutees seront utiliseacutees seacutepareacutement de la ressource pour une reshycherche dinformation eacuteventuellement dans des bases de donneacutees diffeacuterentes cest le mode service bureau

bull la ressource est encapsuleacutee dans les meacutetadonneacutees qui la deacutecrivent cest le mode wrapped

Le dispositif RDF qui est en cours

dadoption comprend le modegravele et une syntaxe en XML (Extended Markup Lanshyguage) Le modegravele est geacuteneacuterique et peut ecirctre exploiteacute avec une autre syntaxe que XML Ce dispositif comprend eacutegalement des speacutecifications de scheacutemas regroupant des classes de types de ressources

RDF est deacutefini par des groupes dutilishysateurs tregraves divers comme les acteurs de la normalisation relative agrave Internet les bishybliothegraveques les speacutecialistes de la structushyration des documents (XMLSGML) et ceux de la repreacutesentation du savoir Il beacuteneacuteshyficie aussi dune forte contribution techshynique provenant des communauteacutes de la programmation orienteacutee objet des langashyges de modeacutelisation et des systegravemes de gestion de bases de donneacutees

RDF est une modeacutelisation des diffeacuteshyrentes faccedilons de geacuterer des meacutetadonneacutees qui integravegre celles qui existent deacutejagrave dans la documentation et dans la gestion des resshysources eacutelectroniques des diffeacuterentes comshymunauteacutes participant agrave son eacutelaboration Il existe donc deacutejagrave des standards de meacutetashydonneacutees qui appartiennent agrave lun ou agrave lautre mode dassociation de meacutetadonshyneacutees et de ressource et qui sont deacutecrits dans le modegravele RDF Voici quelques exemshyples de linteacutegration dans le modegravele RDF de standards de la documentation ou des bibliothegraveques

Standards pour le mode laquo service bureau raquo

Ces standards concernent la descripshytion bibliographique ou documentaire Ils recouvrent

bull les regravegles de description cest-agrave-dire la deacutefinition des eacuteleacutements de descripshytion et les regravegles agrave observer pour creacuteer ces descriptifs agrave partir des informations figushyrant dans les ressources que lon deacutecrit

bull les formats de description cest-agrave-dire le codage en machine permettant de structurer les donneacutees en vue de leur exploishytation dans des systegravemes dinterrogation

Certains dentre eux se sont deacutejagrave adapteacutes au contexte des ressources eacutelecshytroniques en eacutetendant les regravegles de desshycription et les formats aux besoins de reshycherche et daccegraves direct aux ressources eacutelectroniques Cest ainsi que les formats MARC (Machine Readable Cataloging) ofshyfrent deacutesormais la possibiliteacute dindiquer la localisation de la ressource eacutelectronique ses caracteacuteristiques techniques ainsi que

le lien agrave partir duquel on pourra y acceacuteder Les formats USMAcircRC et UNIMAcircRC ont deacutefini le champ 856 agrave cet effet

Standards pour le mode laquoembedded raquo

Deux standards principaux ont eacuteteacute deacuteshyfinis lun par la communauteacute des docushyments structureacutes lautre par celle de la norshymalisation Internet

Le projet TEI

La Text Encoding Initiative (TEI) a eacuteteacute deacuteveloppeacutee degraves le deacutebut de la mise en oeuvre de SGML (Standard Generalized Markup Language ISO 8879) par un groupe de chercheurs en sciences humaishynes litteacuterature et linguistique sinteacuteressant agrave lutilisation de linformatique Le projet TEI sest concreacutetiseacute par une DTD (Deacutefinishytion de Type de Document) SGML accomshypagneacutee de recommandations pour le coshydage de structure et leacutechange des textes La DTD TEI sapplique agrave chaque docushyment eacutelectronique encode selon la DTD et deacutefinit pour chaque uniteacute documentaire eacutelectronique un en-tecircte obligatoire comshyportant les meacutetadonneacutees

La seacutemantique de ces meacutetadonneacutees peut ecirctre reacutegie selon des regravegles de descripshytion standardiseacutees ou proprieacutetaires Dans le cadre dune application telle que le proshyjet American Memory de la Bibliothegraveque du Congregraves une DTD TEI a eacuteteacute deacuteveshyloppeacutee et les meacutetadonneacutees sont reacutedigeacutees selon les AACR2 (Anglo-American Cataloshyging Rules 2)

La syntaxe meta HTML

La DTD HTML (Hypertext Markup Lanshyguage) qui a eacuteteacute deacutefinie pour la structurashytion des pages Web de lInternet comporte une codification ltmetagt et une syntaxe pour leacutecriture des meacutetadonneacutees dans les pages Web Ces tags ltmetagt ne sont pas afficheacutes par les navigateurs mais ils sont utiliseacutes par certains moteurs de recherche sur Internet de maniegravere pondeacutereacutee par rapshyport au reste du texte des pages Web

Dans le cadre de cette standardisashytion Internet certaines communauteacutes dutishylisateurs dont les bibliothegraveques et les proshyducteurs de banques de donneacutees ont trashyvailleacute agrave la standardisation des types de meacuteshytadonneacutees Cest ainsi quest neacute le Dublin

192 octobre-deacutecembre 1999

Documentation et bibliothegraveques

Core qui deacutefinit un ensemble de quinze meacuteshytadonneacutees reacuteparties en trois grands types

bull des meacutetadonneacutees relatives au contenu intellectuel de la page Web

a des meacutetadonneacutees relatives agrave la proshyprieacuteteacute intellectuelle et en particulier aux inshyformations sur la gestion des droits dutilishysation de la page Web

m des meacutetadonneacutees relatives agrave la resshysource elle-mecircme et en particulier lidentishyfiant de la ressource si possible unique et persistant Voir le tableau 1 du texte laquo La publication eacutelectronique des thegraveses raquo des auteurs Bouleacutetreau Gauvin et Ducasse page 187

Le succegraves du Dublin Core a eacuteteacute tel que les eacuteleacutements de description qui y sont deacutefinis sont retenus comme seacutemantique de meacutetadonneacutees en dehors de la syntaxe ltmetagt HTML ils ont deacutejagrave eacuteteacute repris dans les premiegraveres speacutecifications de XML dans un scheacutema minimum de base

Standards pour le mode laquowrappedraquo

Ce mode considegravere les meacutetadonneacutees comme leacuteleacutement englobant pour la resshysource La DTD EAD (Encoding Archival Description) a eacuteteacute deacuteveloppeacutee dans le continent nord-ameacutericain pour la structurashytion et lencodage en XML des instrushyments de recherche deacutecrivant des collecshytions speacutecialiseacutees telles que les archives ou les collections de papiers Ces instrushyments de recherche sont par exemple des inventaires darchives publiques ou prishyveacutees ou des catalogues de collections de documents manuscrits

Cette DTD autorise une structuration de linstrument de recherche en douze nishyveaux hieacuterarchiques et permet dattacher la ressource eacutelectronique agrave sa description

Elle est deacutejagrave utiliseacutee dans des projets coopeacuteratifs de collections de ressources eacutelectroniques Larborescence de linstrushyment de recherche peut servir de support agrave la navigation dans une telle collection

La DTD EAD eacutemane de la communaushyteacute des archives et des bibliothegraveques mais elle est aussi expeacuterimenteacutee par des mushyseacutees dAmeacuterique du Nord

Lidentification des ressources

Des numeacuteros ou des codes didentifishy

cation des documents ont eacuteteacute creacuteeacutes deshypuis une trentaine danneacutees pour diffeacuteshyrents types de documents LISBN (InternashytionalStandard Book Number) pour le livre et lISSN (International Standard Serial Numbei) pour les publications en seacuterie sont les plus anciens et ont acquis le statut de normes internationales ISO Lorganisashytion de ces systegravemes de numeacuterotation reshypose sur un reacuteseau international dagenshyces dattribution et denregistrement des numeacuteros Ces identifiants sont utiliseacutes agrave la fois par les eacutediteurs pour la gestion de la commercialisation et par les bibliothegraveques et centres de documentation pour la gesshytion des commandes et lidentification bishybliographique et documentaire des ouvrashyges et peacuteriodiques

Ce systegraveme de codes didentification a ensuite eacuteteacute eacutetendu aux uniteacutes logiques composant un document par exemple larshyticle dans un fascicule de peacuteriodique Dans la deacutecennie quatre-vingt-dix cette extension a eacuteteacute adapteacutee aux besoins de la gestion puis de la distribution de docushyments sous forme eacutelectronique

Alors que le concept de ressource prend le pas sur celui de publication une reacuteflexion est actuellement conduite sur lidentification des ressources Envisageacutee dans le contexte du Web cette identificashytion saccompagne dune dimension dynashymique car il est devenu neacutecessaire que le systegraveme didentification non content didentifier et de localiser une ressource y donne eacutegalement accegraves Lidentifiant deshyvient actif et laquocliquableraquo

Le systegraveme URI LInternet Engineering Task Force

(IETF) qui deacuteveloppe les standards Intershynet a lanceacute un travail de standardisation pour un systegraveme geacuteneacuterique didentificashytion des ressources du reacuteseau dont le prinshycipe est que lidentifiant peut agrave la fois repreacuteshysenter la ressource et permettre dy acceacuteshyder cest le systegraveme URI (Uniform Reshysource Identifie) Il sagit de proposer un cadre et des regravegles pour permettre agrave des organismes denregistrement de deacutecrire des ressources et den assurer la disponishybiliteacute de maniegravere agrave ce quelles soient finaleshyment accessibles dans un ou plusieurs sites via leurs URL Ce cadre didentificashytion sappuie sur le dispositif suivant

a LURN (Uniform Resource Name) de la ressource est son nom (au sens Intershy

net du terme) unique et persistant il deacuteshysigne une ressource qui pourra ecirctre preacuteshysente sur plusieurs sites comme autant dexemplaires Ce numeacutero est reacutesolu -cest-agrave-dire quil indique le ou les URL du ou des sites ougrave lon peut consulter la resshysource - par une agence ougrave il est enregisshytreacute et qui maintient la validiteacute des URL Cette agence sappelle une agence de reacuteshysolution du nom

m LURL (Uniform Resource Locatoi) est ladresse du site ougrave se trouve la resshysource On se connecte agrave ceJle-ci en clishyquant sur ce lien qui nest pas persistant et dont la validiteacute nest pas garantie

u LURC (Uniform Resource Characshyteristic) contient des meacutetadonneacutees sur la ressource et en particulier les modaliteacutes daccegraves et la gestion des droits Ces meacutetashydonneacutees peuvent ecirctre stockeacutees dans une banque de donneacutees denregistrement des URN maintenue par lagence denregistreshyment et de reacutesolution Elles peuvent eacutegaleshyment se trouver sur un site diffeacuterent et lieacutees aux URN

Le systegraveme DOI Le systegraveme DOI (Digital Object Identishy

fie) est une application du systegraveme URI mise en œuvre par une feacutedeacuteration deacutedishyteurs commerciaux par lintermeacutediaire de la Fondation DOI

Cette Fondation sest constitueacutee comme agence denregistrement des idenshytifiants DOI des publications Le numeacutero DOI est un URN au sens Internet et il en a la structure composeacutee dun preacutefixe attrishybueacute agrave leacutediteur et dun suffixe qui est le nushymeacutero de la ressource chez leacutediteur ou le deacutetenteur des droits Lattribution de ce nushymeacutero relegraveve de la responsabiliteacute de leacutedishyteur ou du deacutetenteur des droits Il peut ecirctre un identifiant issu des systegravemes existants tels lISBN ou lISSN Lattribution dun preacutefixe est conditionneacutee au paiement dun droit par leacutediteur et elle comporte une clause sur le respect du copyright et lengashygement de mettre agrave jour en cas de modifishycation les URL servant agrave la reacutesolution des DOI

Les eacutediteurs entretiennent des bases dinformation sur les ressources quils gegraveshyrent elles contiennent des URC et cest sur celles-ci que pointent les numeacuteros DOI de la base denregistrement Un utilisateur effectuant une recherche par numeacutero URN aura ainsi accegraves agrave la base URC

octobre-deacutecembre 1999 193

Documentation et bibliothegraveques

associeacutee agrave ce numeacutero et aura connaisshysance des conditions daccegraves agrave la resshysource (accegraves gratuit paiement agrave lacte conditions dabonnement etc)

Les publications eacutelectroniques sur Internet utilisent et utiliseront de plus en plus souvent des donneacutees multimeacutedias avec des droits complexes et entrelaceacutes De plus reacutevolution programmeacutee de la structure des pages Web qui verra le passhysage du codage HTML au codage XML conduit agrave imaginer dattribuer des identishyfiants agrave des portions de contenus agrave linteacuteshyrieur mecircme des ressources cela conduira agrave un deacutecoupage en uniteacutes plus fines que la page Web Les eacutediteurs et la Fondation DOI travaillent donc en suivant les eacutevolushytions de la standardisation Internet agrave des extensions de ces notions didentification des ressources et aux moyens de mettre en œuvre les meacutetadonneacutees associeacutees aux identifiants dans le contexte de leacutedition eacutelectronique sur le Web

Les tendances preacutesentes sont lidentishyfication dun document ou dune ressource et de ses inscriptions dans des publicashytions papier eacutelectronique hors ligne eacutelecshytronique en ligne une des difficulteacutes eacutetant que cette diversification des types de manishyfestations dune œuvre fait eacuteclater les typoshylogies classiques et en particulier la noshytion de publication en seacuterie avec tout lapshypareil didentification qui laccompagnait Agrave cet eacutegard lun des thegravemes de reacuteflexion actuellement le plus important - et directeshyment lieacute agrave lidentification et aux meacutetadonshyneacutees - est la mise en œuvre de la gestion des droits daccegraves aux ressources par navishygation a partir des citations dans les artishycles

De nouveaux partenaires

Les publications sur Internet ne peuvent ecirctre geacutereacutees agrave laide des standards des publications classiques On assiste acshytuellement agrave un grand mouvement de reacuteshyflexion et de modeacutelisation conceptuelle qui englobe les publications classiques et les ressources eacutelectroniques Cette modeacutelisashytion saccompagne de standards plus geacuteshyneacuteriques que ceux que nous avons connus pour les publications traditionnelshyles Leur eacutelaboration se fait en collaborashytion avec de nouveaux partenaires pour lesquels lapport des professionnels de linshy

formation peut ecirctre tregraves important Un exemple frappant en est le cas du Dublin Core

Sources consulteacutees

Digital libraries cataloging and indexing of electronic resources Bibliography In IFLA electronic colshylections ltURL httpiflainistfrlleataloghtmgt

Digital libraries metadata resources In IFLA electroshynic collections ltURL httpiflainistfrImetashydata htmgt

Lupovici Catherine 1998 Le Digital Object Identifier le systegraveme DOI Bulletin des bibliothegraveques de France 43 ( 3) 49-54 ltURL httpwwwens-sibfrEnssibbbfbbfhtmgt

1998 Linformation bibliographique des doshycuments eacutelectroniques Bulletin des bibliothegraveshyques de France 43 (4) 42-47 ltURL http wwwenssibfrEnssibbbfbbfhtmgt

gts

^Hnadiana Jampiuml La bibliographie nationale

The National Bibliography

Canadicircana sur ceacutedeacuterom comprend 18 million de notices et notamment

bull toutes les notices contenues dans les versions anteacuterieures du ceacutedeacuterom Canadicircana

bull les notices bibliographiques et dautoriteacutes ajouteacutees ou modifieacutees par la Bibliothegraveque nationale en 1999

bull les notices de Carto-Canadana ajouteacutees ou modifieacutees par les Archives nationales en 1999

bull les notices de Canadicircana anciens microfilmeacutees et publieacutees en 1999 par lInstitut canadien de microreproductions historiques (ICMH)

Pour plus dinformation visitez notre site Web agrave httpwwwnlc-bnccacanadiana ou teacuteleacutephonez au (819) 994-6921 Courriel canadiananlc-bncca

Pour commander veuillez communiquer avec Les Editions du gouvernement du Canada ou teacuteleacutephonez au 1 -800-635-7943 ou (819) 956-4800 ou Teacuteleacutecopieur 1-800-565-7757 ou (819) 994-1498 site Web httppublicationspwgscgcca

1 ^ 1 Bibliothegraveque nationale bull bull bull du Canada

National Library of Canada Canada

194 octobre-deacutecembre 1999

Page 4: Identification des ressources sur Internet et métadonnées

Documentation et bibliothegraveques

Core qui deacutefinit un ensemble de quinze meacuteshytadonneacutees reacuteparties en trois grands types

bull des meacutetadonneacutees relatives au contenu intellectuel de la page Web

a des meacutetadonneacutees relatives agrave la proshyprieacuteteacute intellectuelle et en particulier aux inshyformations sur la gestion des droits dutilishysation de la page Web

m des meacutetadonneacutees relatives agrave la resshysource elle-mecircme et en particulier lidentishyfiant de la ressource si possible unique et persistant Voir le tableau 1 du texte laquo La publication eacutelectronique des thegraveses raquo des auteurs Bouleacutetreau Gauvin et Ducasse page 187

Le succegraves du Dublin Core a eacuteteacute tel que les eacuteleacutements de description qui y sont deacutefinis sont retenus comme seacutemantique de meacutetadonneacutees en dehors de la syntaxe ltmetagt HTML ils ont deacutejagrave eacuteteacute repris dans les premiegraveres speacutecifications de XML dans un scheacutema minimum de base

Standards pour le mode laquowrappedraquo

Ce mode considegravere les meacutetadonneacutees comme leacuteleacutement englobant pour la resshysource La DTD EAD (Encoding Archival Description) a eacuteteacute deacuteveloppeacutee dans le continent nord-ameacutericain pour la structurashytion et lencodage en XML des instrushyments de recherche deacutecrivant des collecshytions speacutecialiseacutees telles que les archives ou les collections de papiers Ces instrushyments de recherche sont par exemple des inventaires darchives publiques ou prishyveacutees ou des catalogues de collections de documents manuscrits

Cette DTD autorise une structuration de linstrument de recherche en douze nishyveaux hieacuterarchiques et permet dattacher la ressource eacutelectronique agrave sa description

Elle est deacutejagrave utiliseacutee dans des projets coopeacuteratifs de collections de ressources eacutelectroniques Larborescence de linstrushyment de recherche peut servir de support agrave la navigation dans une telle collection

La DTD EAD eacutemane de la communaushyteacute des archives et des bibliothegraveques mais elle est aussi expeacuterimenteacutee par des mushyseacutees dAmeacuterique du Nord

Lidentification des ressources

Des numeacuteros ou des codes didentifishy

cation des documents ont eacuteteacute creacuteeacutes deshypuis une trentaine danneacutees pour diffeacuteshyrents types de documents LISBN (InternashytionalStandard Book Number) pour le livre et lISSN (International Standard Serial Numbei) pour les publications en seacuterie sont les plus anciens et ont acquis le statut de normes internationales ISO Lorganisashytion de ces systegravemes de numeacuterotation reshypose sur un reacuteseau international dagenshyces dattribution et denregistrement des numeacuteros Ces identifiants sont utiliseacutes agrave la fois par les eacutediteurs pour la gestion de la commercialisation et par les bibliothegraveques et centres de documentation pour la gesshytion des commandes et lidentification bishybliographique et documentaire des ouvrashyges et peacuteriodiques

Ce systegraveme de codes didentification a ensuite eacuteteacute eacutetendu aux uniteacutes logiques composant un document par exemple larshyticle dans un fascicule de peacuteriodique Dans la deacutecennie quatre-vingt-dix cette extension a eacuteteacute adapteacutee aux besoins de la gestion puis de la distribution de docushyments sous forme eacutelectronique

Alors que le concept de ressource prend le pas sur celui de publication une reacuteflexion est actuellement conduite sur lidentification des ressources Envisageacutee dans le contexte du Web cette identificashytion saccompagne dune dimension dynashymique car il est devenu neacutecessaire que le systegraveme didentification non content didentifier et de localiser une ressource y donne eacutegalement accegraves Lidentifiant deshyvient actif et laquocliquableraquo

Le systegraveme URI LInternet Engineering Task Force

(IETF) qui deacuteveloppe les standards Intershynet a lanceacute un travail de standardisation pour un systegraveme geacuteneacuterique didentificashytion des ressources du reacuteseau dont le prinshycipe est que lidentifiant peut agrave la fois repreacuteshysenter la ressource et permettre dy acceacuteshyder cest le systegraveme URI (Uniform Reshysource Identifie) Il sagit de proposer un cadre et des regravegles pour permettre agrave des organismes denregistrement de deacutecrire des ressources et den assurer la disponishybiliteacute de maniegravere agrave ce quelles soient finaleshyment accessibles dans un ou plusieurs sites via leurs URL Ce cadre didentificashytion sappuie sur le dispositif suivant

a LURN (Uniform Resource Name) de la ressource est son nom (au sens Intershy

net du terme) unique et persistant il deacuteshysigne une ressource qui pourra ecirctre preacuteshysente sur plusieurs sites comme autant dexemplaires Ce numeacutero est reacutesolu -cest-agrave-dire quil indique le ou les URL du ou des sites ougrave lon peut consulter la resshysource - par une agence ougrave il est enregisshytreacute et qui maintient la validiteacute des URL Cette agence sappelle une agence de reacuteshysolution du nom

m LURL (Uniform Resource Locatoi) est ladresse du site ougrave se trouve la resshysource On se connecte agrave ceJle-ci en clishyquant sur ce lien qui nest pas persistant et dont la validiteacute nest pas garantie

u LURC (Uniform Resource Characshyteristic) contient des meacutetadonneacutees sur la ressource et en particulier les modaliteacutes daccegraves et la gestion des droits Ces meacutetashydonneacutees peuvent ecirctre stockeacutees dans une banque de donneacutees denregistrement des URN maintenue par lagence denregistreshyment et de reacutesolution Elles peuvent eacutegaleshyment se trouver sur un site diffeacuterent et lieacutees aux URN

Le systegraveme DOI Le systegraveme DOI (Digital Object Identishy

fie) est une application du systegraveme URI mise en œuvre par une feacutedeacuteration deacutedishyteurs commerciaux par lintermeacutediaire de la Fondation DOI

Cette Fondation sest constitueacutee comme agence denregistrement des idenshytifiants DOI des publications Le numeacutero DOI est un URN au sens Internet et il en a la structure composeacutee dun preacutefixe attrishybueacute agrave leacutediteur et dun suffixe qui est le nushymeacutero de la ressource chez leacutediteur ou le deacutetenteur des droits Lattribution de ce nushymeacutero relegraveve de la responsabiliteacute de leacutedishyteur ou du deacutetenteur des droits Il peut ecirctre un identifiant issu des systegravemes existants tels lISBN ou lISSN Lattribution dun preacutefixe est conditionneacutee au paiement dun droit par leacutediteur et elle comporte une clause sur le respect du copyright et lengashygement de mettre agrave jour en cas de modifishycation les URL servant agrave la reacutesolution des DOI

Les eacutediteurs entretiennent des bases dinformation sur les ressources quils gegraveshyrent elles contiennent des URC et cest sur celles-ci que pointent les numeacuteros DOI de la base denregistrement Un utilisateur effectuant une recherche par numeacutero URN aura ainsi accegraves agrave la base URC

octobre-deacutecembre 1999 193

Documentation et bibliothegraveques

associeacutee agrave ce numeacutero et aura connaisshysance des conditions daccegraves agrave la resshysource (accegraves gratuit paiement agrave lacte conditions dabonnement etc)

Les publications eacutelectroniques sur Internet utilisent et utiliseront de plus en plus souvent des donneacutees multimeacutedias avec des droits complexes et entrelaceacutes De plus reacutevolution programmeacutee de la structure des pages Web qui verra le passhysage du codage HTML au codage XML conduit agrave imaginer dattribuer des identishyfiants agrave des portions de contenus agrave linteacuteshyrieur mecircme des ressources cela conduira agrave un deacutecoupage en uniteacutes plus fines que la page Web Les eacutediteurs et la Fondation DOI travaillent donc en suivant les eacutevolushytions de la standardisation Internet agrave des extensions de ces notions didentification des ressources et aux moyens de mettre en œuvre les meacutetadonneacutees associeacutees aux identifiants dans le contexte de leacutedition eacutelectronique sur le Web

Les tendances preacutesentes sont lidentishyfication dun document ou dune ressource et de ses inscriptions dans des publicashytions papier eacutelectronique hors ligne eacutelecshytronique en ligne une des difficulteacutes eacutetant que cette diversification des types de manishyfestations dune œuvre fait eacuteclater les typoshylogies classiques et en particulier la noshytion de publication en seacuterie avec tout lapshypareil didentification qui laccompagnait Agrave cet eacutegard lun des thegravemes de reacuteflexion actuellement le plus important - et directeshyment lieacute agrave lidentification et aux meacutetadonshyneacutees - est la mise en œuvre de la gestion des droits daccegraves aux ressources par navishygation a partir des citations dans les artishycles

De nouveaux partenaires

Les publications sur Internet ne peuvent ecirctre geacutereacutees agrave laide des standards des publications classiques On assiste acshytuellement agrave un grand mouvement de reacuteshyflexion et de modeacutelisation conceptuelle qui englobe les publications classiques et les ressources eacutelectroniques Cette modeacutelisashytion saccompagne de standards plus geacuteshyneacuteriques que ceux que nous avons connus pour les publications traditionnelshyles Leur eacutelaboration se fait en collaborashytion avec de nouveaux partenaires pour lesquels lapport des professionnels de linshy

formation peut ecirctre tregraves important Un exemple frappant en est le cas du Dublin Core

Sources consulteacutees

Digital libraries cataloging and indexing of electronic resources Bibliography In IFLA electronic colshylections ltURL httpiflainistfrlleataloghtmgt

Digital libraries metadata resources In IFLA electroshynic collections ltURL httpiflainistfrImetashydata htmgt

Lupovici Catherine 1998 Le Digital Object Identifier le systegraveme DOI Bulletin des bibliothegraveques de France 43 ( 3) 49-54 ltURL httpwwwens-sibfrEnssibbbfbbfhtmgt

1998 Linformation bibliographique des doshycuments eacutelectroniques Bulletin des bibliothegraveshyques de France 43 (4) 42-47 ltURL http wwwenssibfrEnssibbbfbbfhtmgt

gts

^Hnadiana Jampiuml La bibliographie nationale

The National Bibliography

Canadicircana sur ceacutedeacuterom comprend 18 million de notices et notamment

bull toutes les notices contenues dans les versions anteacuterieures du ceacutedeacuterom Canadicircana

bull les notices bibliographiques et dautoriteacutes ajouteacutees ou modifieacutees par la Bibliothegraveque nationale en 1999

bull les notices de Carto-Canadana ajouteacutees ou modifieacutees par les Archives nationales en 1999

bull les notices de Canadicircana anciens microfilmeacutees et publieacutees en 1999 par lInstitut canadien de microreproductions historiques (ICMH)

Pour plus dinformation visitez notre site Web agrave httpwwwnlc-bnccacanadiana ou teacuteleacutephonez au (819) 994-6921 Courriel canadiananlc-bncca

Pour commander veuillez communiquer avec Les Editions du gouvernement du Canada ou teacuteleacutephonez au 1 -800-635-7943 ou (819) 956-4800 ou Teacuteleacutecopieur 1-800-565-7757 ou (819) 994-1498 site Web httppublicationspwgscgcca

1 ^ 1 Bibliothegraveque nationale bull bull bull du Canada

National Library of Canada Canada

194 octobre-deacutecembre 1999

Page 5: Identification des ressources sur Internet et métadonnées

Documentation et bibliothegraveques

associeacutee agrave ce numeacutero et aura connaisshysance des conditions daccegraves agrave la resshysource (accegraves gratuit paiement agrave lacte conditions dabonnement etc)

Les publications eacutelectroniques sur Internet utilisent et utiliseront de plus en plus souvent des donneacutees multimeacutedias avec des droits complexes et entrelaceacutes De plus reacutevolution programmeacutee de la structure des pages Web qui verra le passhysage du codage HTML au codage XML conduit agrave imaginer dattribuer des identishyfiants agrave des portions de contenus agrave linteacuteshyrieur mecircme des ressources cela conduira agrave un deacutecoupage en uniteacutes plus fines que la page Web Les eacutediteurs et la Fondation DOI travaillent donc en suivant les eacutevolushytions de la standardisation Internet agrave des extensions de ces notions didentification des ressources et aux moyens de mettre en œuvre les meacutetadonneacutees associeacutees aux identifiants dans le contexte de leacutedition eacutelectronique sur le Web

Les tendances preacutesentes sont lidentishyfication dun document ou dune ressource et de ses inscriptions dans des publicashytions papier eacutelectronique hors ligne eacutelecshytronique en ligne une des difficulteacutes eacutetant que cette diversification des types de manishyfestations dune œuvre fait eacuteclater les typoshylogies classiques et en particulier la noshytion de publication en seacuterie avec tout lapshypareil didentification qui laccompagnait Agrave cet eacutegard lun des thegravemes de reacuteflexion actuellement le plus important - et directeshyment lieacute agrave lidentification et aux meacutetadonshyneacutees - est la mise en œuvre de la gestion des droits daccegraves aux ressources par navishygation a partir des citations dans les artishycles

De nouveaux partenaires

Les publications sur Internet ne peuvent ecirctre geacutereacutees agrave laide des standards des publications classiques On assiste acshytuellement agrave un grand mouvement de reacuteshyflexion et de modeacutelisation conceptuelle qui englobe les publications classiques et les ressources eacutelectroniques Cette modeacutelisashytion saccompagne de standards plus geacuteshyneacuteriques que ceux que nous avons connus pour les publications traditionnelshyles Leur eacutelaboration se fait en collaborashytion avec de nouveaux partenaires pour lesquels lapport des professionnels de linshy

formation peut ecirctre tregraves important Un exemple frappant en est le cas du Dublin Core

Sources consulteacutees

Digital libraries cataloging and indexing of electronic resources Bibliography In IFLA electronic colshylections ltURL httpiflainistfrlleataloghtmgt

Digital libraries metadata resources In IFLA electroshynic collections ltURL httpiflainistfrImetashydata htmgt

Lupovici Catherine 1998 Le Digital Object Identifier le systegraveme DOI Bulletin des bibliothegraveques de France 43 ( 3) 49-54 ltURL httpwwwens-sibfrEnssibbbfbbfhtmgt

1998 Linformation bibliographique des doshycuments eacutelectroniques Bulletin des bibliothegraveshyques de France 43 (4) 42-47 ltURL http wwwenssibfrEnssibbbfbbfhtmgt

gts

^Hnadiana Jampiuml La bibliographie nationale

The National Bibliography

Canadicircana sur ceacutedeacuterom comprend 18 million de notices et notamment

bull toutes les notices contenues dans les versions anteacuterieures du ceacutedeacuterom Canadicircana

bull les notices bibliographiques et dautoriteacutes ajouteacutees ou modifieacutees par la Bibliothegraveque nationale en 1999

bull les notices de Carto-Canadana ajouteacutees ou modifieacutees par les Archives nationales en 1999

bull les notices de Canadicircana anciens microfilmeacutees et publieacutees en 1999 par lInstitut canadien de microreproductions historiques (ICMH)

Pour plus dinformation visitez notre site Web agrave httpwwwnlc-bnccacanadiana ou teacuteleacutephonez au (819) 994-6921 Courriel canadiananlc-bncca

Pour commander veuillez communiquer avec Les Editions du gouvernement du Canada ou teacuteleacutephonez au 1 -800-635-7943 ou (819) 956-4800 ou Teacuteleacutecopieur 1-800-565-7757 ou (819) 994-1498 site Web httppublicationspwgscgcca

1 ^ 1 Bibliothegraveque nationale bull bull bull du Canada

National Library of Canada Canada

194 octobre-deacutecembre 1999