12
Document généré le 15 sep. 2018 13:22 Documentation et bibliothèques Cataloguer le cyberespace : le défi des ressources électroniques Roman S. Panchyshyn et France Bouthillier Volume 43, numéro 3, juillet–septembre 1997 URI : id.erudit.org/iderudit/1033029ar DOI : 10.7202/1033029ar Aller au sommaire du numéro Éditeur(s) Association pour l'avancement des sciences et des techniques de la documentation (ASTED) ISSN 0315-2340 (imprimé) 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le cyberespace : le défi des ressources électroniques. Documentation et bibliothèques, 43(3), 137–147. doi:10.7202/1033029ar Résumé de l'article Le catalogage des ressources accessibles dans le réseau Internet est problématique. Plusieurs initiatives américaines ont permis d’identifier des problèmes majeurs, par exemple les projets Ressources Internet et Intercat d’OCLC, le projet d’encodage de texte (TEI) et le projet Dublin Core d’OCLC. Par ailleurs, des outils tels les URC, les URN et les PURL ont été conçus pour aider les bibliothécaires à mettre de l’ordre dans le chaos existant dans Internet. L’article décrit ces projets et outils pour identifier les principaux problèmes auxquels les bibliothécaires doivent faire face dans le traitement de ces ressources. Enfin, les niveaux de compétence dont les bibliothécaires au catalogage auront besoin à l’avenir et leur rôle dans l’établissement de normes pour l’échange d’information dans la communauté Internet sont brièvement discutés. Ce document est protégé par la loi sur le droit d'auteur. L'utilisation des services d'Érudit (y compris la reproduction) est assujettie à sa politique d'utilisation que vous pouvez consulter en ligne. [https://apropos.erudit.org/fr/usagers/politique- dutilisation/] Cet article est diffusé et préservé par Érudit. Érudit est un consortium interuniversitaire sans but lucratif composé de l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal. Il a pour mission la promotion et la valorisation de la recherche. www.erudit.org Tous droits réservés © Association pour l'avancement des sciences et des techniques de la documentation (ASTED), 1997

Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

  • Upload
    lamque

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Document geacuteneacutereacute le 15 sep 2018 1322

Documentation et bibliothegraveques

Cataloguer le cyberespace le deacutefi des ressourceseacutelectroniques

Roman S Panchyshyn et France Bouthillier

Volume 43 numeacutero 3 juilletndashseptembre 1997

URI ideruditorgiderudit1033029arDOI 1072021033029ar

Aller au sommaire du numeacutero

Eacutediteur(s)

Association pour lavancement des sciences et des techniquesde la documentation (ASTED)

ISSN 0315-2340 (imprimeacute)

2291-8949 (numeacuterique)

Deacutecouvrir la revue

Citer cet article

Panchyshyn R amp Bouthillier (1997) Cataloguer lecyberespace le deacutefi des ressources eacutelectroniques Documentation et bibliothegraveques 43(3) 137ndash147doi1072021033029ar

Reacutesumeacute de larticle

Le catalogage des ressources accessibles dans le reacuteseauInternet est probleacutematique Plusieurs initiatives ameacutericainesont permis drsquoidentifier des problegravemes majeurs par exempleles projets Ressources Internet et Intercat drsquoOCLC le projetdrsquoencodage de texte (TEI) et le projet Dublin Core drsquoOCLC Parailleurs des outils tels les URC les URN et les PURL ont eacuteteacuteconccedilus pour aider les bibliotheacutecaires agrave mettre de lrsquoordre dansle chaos existant dans Internet Lrsquoarticle deacutecrit ces projets etoutils pour identifier les principaux problegravemes auxquels lesbibliotheacutecaires doivent faire face dans le traitement de cesressources Enfin les niveaux de compeacutetence dont lesbibliotheacutecaires au catalogage auront besoin agrave lrsquoavenir et leurrocircle dans lrsquoeacutetablissement de normes pour lrsquoeacutechangedrsquoinformation dans la communauteacute Internet sont briegravevementdiscuteacutes

Ce document est proteacutegeacute par la loi sur le droit dauteur Lutilisation des servicesdEacuterudit (y compris la reproduction) est assujettie agrave sa politique dutilisation que vouspouvez consulter en ligne [httpsaproposeruditorgfrusagerspolitique-dutilisation]

Cet article est diffuseacute et preacuteserveacute par Eacuterudit

Eacuterudit est un consortium interuniversitaire sans but lucratif composeacute de lrsquoUniversiteacutede Montreacuteal lrsquoUniversiteacute Laval et lrsquoUniversiteacute du Queacutebec agrave Montreacuteal Il a pourmission la promotion et la valorisation de la recherche wwweruditorg

Tous droits reacuteserveacutes copy Association pour lavancementdes sciences et des techniques de la documentation(ASTED) 1997

Documentation et bibliothegraveques

Cataloguer le cyberespace le deacutefi des ressources eacutelectroniques

Roman S Panchyshyn Diplocircmeacute de la Graduate School of Library and Information Studies (GSLIS) Universiteacute McGill France Bouthillier Professeure adjointe GSLIS Universiteacute McGill

Le catalogage des ressources accessibles dans le reacuteseau Internet est probleacutematique Plusieurs initiatives ameacutericaines ont permis didentifier des problegravemes majeurs par exemple les projets Ressources Internet et Intercat dOCLC le projet dencodage de texte (TEi) et le projet Dublin Core dOCLC Par ailleurs des outils tels les URC les URN et les PURL ont eacuteteacute conccedilus pour aider les bibliotheacutecaires agrave mettre de lordre dans le chaos existant dans Internet Larticle deacutecrit ces projets et outils pour identifier les principaux problegravemes auxquels les bibliotheacutecaires doivent faire face dans le traitement de ces ressources Enfin les niveaux de compeacutetence dont les bibliotheacutecaires au catalogage auront besoin agrave lavenir et leur rocircle dans leacutetablissement de normes pour leacutechange dinformation dans la communauteacute Internet sont briegravevement discuteacutes

Cataloguing in cyberspace the challenges of electronic doshycuments

Catalogar el cyberespacio el desafio de los recursos electrocircnicos

Cataloging documents taken from the Internet is truly challenging Several projects undertaken in the United States such as OCLC Internet Resources and Intercat Project the Text Encoding Initiashytive (TEI) and the OCLC Dublin Core Project helped to identify major problems Tools such as URCs URNs and PURLs were developed to assist cataloguers in bringing order to the chaos of Internet The article describes those projects and tools used to identify the problems encountered by cataloguers in the course of theirwork Finally the levels of competency required by cataloguers in the future and their role in establishing standards for information exchange in the Internet community are briefly discussed

La catalogaciocircn de los recursos accesibles por Internet es problemacirctica Muchas iniciativas americanas han permitido de identificarlos problemas macircs importantes porejemplo los projectos Recursos Internet et Intercat de la OCLC elprojecto de codificaciocircn de texto (TEI) y elprojecto Dublin Core de la OCLC Porotra parte instrumentes como los URC los URn et los PURL han sido concebidos para ayudar a los bibliotecarios a poner orden en el caos actual que existe en el Internet El articulo describe estos proyectos y instrumentes para identificarlos principales problemas encontrados por los bibliotecarios en el tratamiento de estos recursos Por fin los niveleacutes de calificaciocircn necesarios para los bibliotecarios responsables de la catalogaciocircn en elporveniry sus papeles en el establecimiento de normas para el intercambio de informaciocircn en la comunidad Internet son brevemente discutidos

Le catalogage doit ecirctre consideacutereacute comme lactiviteacute de base en biblio-theacuteconomie Leacutetablissement et lentretien de systegravemes dorganisation de linformashytion sont des tacircches essentielles pour gashyrantir laccegraves agrave linformation Cependant dans le contexte actuel de compressions budgeacutetaires les activiteacutes traditionnelles de catalogage sont remises en question En effet les bibliotheacutecaires affecteacutes au catalogage font face agrave la deacutepro-fessionnalisation agrave limpartition et agrave leacuteroshy

sion des standards de catalogage (Dunkle 1996 Zyroff 1996) Quel rocircle devront jouer ces bibliotheacutecaires dans le futur

Avec reacutevolution du reacuteseau Internet et la prolifeacuteration de ressources eacutelectronishyques laccegraves agrave linformation subit une transshyformation rapide Dans les bibliothegraveques lobjectif visant agrave posseacuteder et agrave organiser une collection locale est en train de ceacuteder la place agrave un autre objectif qui consiste agrave organiser laquolaccegravesraquo agrave de multiples collecshy

tions entreposeacutees localement et ailleurs (Demas McDonald and Lawrence 1995 Lougee 1995) Ce pheacutenomegravene affecte le catalogage dans la mesure ougrave de nouvelshyles approches doivent ecirctre deacuteveloppeacutees de faccedilon agrave cataloguer des documents pushyblieacutes sur des supports non traditionnels

Les auteurs remercient le professeur John E Leide pour la supervision du projet de recherche agrave lorishygine de cet article et Ared Misirliyan pour laide apporteacutee agrave la traduction

juillet - septembre 1997 137

Documentation et bibliothegraveques

qui sont souvent stockeacutes en dehors des limites dune collection locale Ces deacuteveshyloppements reacutecents ainsi que la prolifeacuterashytion des peacuteriodiques eacutelectroniques ont proshyvoqueacute une reacuteflexion sur le catalogage des documents numeacuteriseacutes (Morgan 1995 1996) Linformation dans Internet contishynue de croicirctre et de prendre de limporshytance ainsi que dacqueacuterir une leacutegitimiteacute au sein de la communauteacute scientifique et acadeacutemique Toutefois les utilisateurs sont souvent frustreacutes et confus en raison de la croissance rapide du reacuteseau Internet et de leur difficulteacute agrave y trouver linformation pershytinente rapidement Ils doivent alors se tourner vers les bibliotheacutecaires pour avoir de laide Le deacutefi agrave relever pour les responshysables du catalogage est eacutevident comshyment les ressources eacutelectroniques peushyvent-elles ecirctre organiseacutees catalogueacutees et classifieacutees de faccedilon agrave reacutepondre aux attentes et aux besoins des utilisateurs

Cet article reacutesume plusieurs projets ameacutericains importants concernant le catalogage des ressources Internet et autres ressources ordinolingues et permet de voir comment les bibliotheacutecaires ameacuteshyricains travaillent agrave reacutegler cette question Larticle cherche agrave identifier les facteurs et tendances qui peuvent entraicircner des chanshygements reacuteels dans la fonction du catalogage traditionnel et dans les proceacuteshydures de catalogage des ressources Internet Lexamen de ces projets permet aussi de se rendre compte des nouvelles variables et conditions qui auront un effet sur la pratique du catalogage Enfin lartishycle discute de la faccedilon dont la profession de bibliotheacutecaire au catalogage est affecshyteacutee par ces nouveaux eacuteleacutements Bien que le texte qui suit ne relate pas de projets francophones il devrait ecirctre utile pour deacuteshygager des conclusions pertinentes agrave la pratique du catalogage en milieu francoshyphone

Le catalogage des ressources dans Internet termes et notions de base

Sil nest plus neacutecessaire de deacutefinir le terme Internet il est essentiel de clarifier ce que sont des laquoressources Internetraquo Ces ressources correspondent agrave des lishyvres numeacuteriseacutes des journaux eacutelectronishyques des bases de donneacutees composeacutees dimages des encyclopeacutedies hypermedias et multimeacutedias des sites Web ou des groupes de nouvelles et de discussions

Le deacutebat sur la deacutefinition de ressources Internet a deacutebuteacute agrave leacuteteacute 1991 quand le Comiteacute MARBI1 a proposeacute une seacuterie deacuteleacuteshyments qui pouvaient ecirctre utiles pour la description des ressources en ligne Leur caracteacuteristique principale et commune a eacuteteacute deacutefinie comme eacutetant la possibiliteacute dacshycegraves agrave distance Les ressources en ligne par opposition aux disques rigides ou disshyquettes dordinateur ne peuvent ecirctre deacuteshycrites physiquement poseacutees sur des rayons ou precircteacutees aux usagers De plus on sentendait pour dire que lunivers des ressources accessibles agrave distance poushyvait ecirctre diviseacute en deux cateacutegories (1) des ressources de donneacutees par exemple des logiciels ou des bases de donneacutees numeacuteshyriques bibliographiques et textuelles et (2) des systegravemes ou des services par exemshyple des systegravemes de catalogues et des tableaux daffichage eacutelectroniques (Caplan 1993) Ce rapport de discussion a donneacute lieu en 1993 agrave la publication dun autre document (MARBI Proposai 93-4) qui reshycommandait des changements au format bibliographique USMARC pour accommoshyder les journaux eacutelectroniques et autres documents disponibles dans Internet Ainsi les sites FTP (protocoles de transshyfert de fichiers) par exemple pouvaient ecirctre traiteacutes de la mecircme faccedilon que les ressources physiques comme les livres Enfin il a eacuteteacute recommandeacute de creacuteer une nouvelle zone du MARC (856) pour y indishyquer les adresses eacutelectroniques et les faccedilons dacceacuteder aux documents dans Internet (Caplan 1993)

Par ailleurs le catalogage des resshysources Internet doit sharmoniser avec la mission geacuteneacuterale des bibliothegraveques Toushytefois cette mission na pas encore vraishyment eacuteteacute assumeacutee en ce qui concerne les documents numeacuteriseacutes Premiegraverement les strateacutegies de deacuteveloppement des collecshytions les meacutethodes et les critegraveres de seacuteshylection doivent ecirctre ajusteacutes pour assimiler les ressources Internet Les politiques de seacutelection doivent inciter les bibliotheacutecaires agrave relever le deacutefi consistant agrave choisir soishygneusement les ressources eacutelectroniques et agrave inteacutegrer des ressources accessibles agrave distance dans les collections de bibliothegraveshyques (Demas McDonald and Lawrence 1995) Les politiques doivent aussi tenir compte des questions comme le droit dauteur lentreposage optimal la diffushysion des documents la preacuteservation et les meacutethodes darchivage

Les politiques de bibliothegraveque en ce qui concerne laccegraves aux ressources eacutelecshytroniques doivent reacutepondre aux besoins de leurs usagers En ce moment les outils disponibles dans Internet qui visent agrave sashytisfaire les exigences des usagers en mashytiegravere daccegraves sont deacuteficients Cette deacutefishycience est due agrave divers facteurs tels que la complexiteacute des commandes des divers moteurs de recherche (ex Lycos Yahoo Alta Vista) les limites des options de reshycherche de ces moteurs la qualiteacute du contenu des bases de donneacutees dans lesshyquelles ces moteurs exeacutecutent la rechershyche et la compeacutetence du chercheur agrave formuler des strateacutegies de recherche adeacuteshyquates (Venditto 1996) Jusquagrave tout reacuteshycemment les systegravemes traditionnellement utiliseacutes dans les bibliothegraveques comme les systegravemes de classification et les vedettes-matiegravere qui correspondent agrave un vocabushylaire controcircleacute neacutetaient pas appliqueacutes dans les outils de navigation Internet Deux raishysons expliquent cette situation les biblioshytheacutecaires nont joueacute aucun rocircle dans la construction de ces outils et leur culture professionnelle nencourageait pas leur participation au deacuteveloppement chaotique dInternet surtout dans un contexte ougrave des solutions connues ne paraissaient pas ecirctre eacutevidentes et immeacutediatement applicables (Flannery 1995)

Reacutecemment des sites comme CyberStacks agrave la lowa State University2 ont commenceacute agrave organiser les ressources Internet avec des systegravemes de classificashytion standards et non standards ainsi quavec un vocabulaire controcircleacute Ces sysshytegravemes comprennent la Classification deacutecishymale Dewey (CDD) la Classification deacutecishymale universelle (CDU) la classification de la Library of Congress (LCCN) et les vedettes-matiegravere de la Library of Congress (LCSH) Le World Wide Web Consortium (W3C) composeacute de diverses organisashytions inteacuteresseacutees agrave deacutefinir des speacutecificashytions communes pour le Web a aussi

1 MARBI est le sigle de Machine-Readable Form of Bibliographie Information Le Comiteacute MARBI est responsable de la preacuteservation et des modifications du format MARC (Machine-Readable Cataloguing) ameacutericain ou le USMARC

2 Voir httpwwwpubliciastateedu -CYBERSTACKShomepagehtml Ce site a eacuteteacute creacuteeacute par Gerry McKiernan

138 juillet - septembre 1997

Documentation et bibliothegraveques

amorceacute le projet PICS (Platform for Internet Content Selection) Ce projet visait agrave creacuteer un systegraveme de classement permettant de fournir des moyens techniques pour deacutefishynir le contenu et pour seacutelectionner des documents dans le Web3 Le PICS se veut un filtre pour classer les systegravemes et les services Web et est une reacuteponse agrave la pression politique et aux menaces de censhysure qui pourraient en effet menacer le libre eacutechange de linformation dans Internet (Weibel 1996)

Une des notions les plus importantes pour le catalogage des ressources Internet est celle de laquomeacutetadonneacuteeraquo (metadata) Priscilla Caplan (1995) a deacutefini les meacutetadonneacutees comme eacutetant des donneacutees relatives agrave dautres donneacutees Une notice catalographique est ainsi consideacutereacutee comme une meacutetadonneacutee Le terme a eacuteteacute inventeacute pour deacutesigner la documentation lisible par machine relative aux fichiers de donneacutees lisibles par machine Dans la communauteacute Internet le terme laquomeacutetashydonneacuteesraquo a acquis le sens de donneacutees sur des ressources dinformation eacutelectronique Lexpression laquomeacutetadonneacutees bibliographishyquesraquo a un sens plus eacutetroit qui signifie des donneacutees ou de linformation sur des objets qui contiennent des donneacutees telles que des livres (Wool 1996) Ce dernier terme est important pour comprendre lenjeu de certains projets discuteacutes plus loin (TEI et Dublin Core)

Aux Eacutetats-Unis lentreprise OCLC (Online Computer Library Center) a joueacute un rocircle de leadership dans la recherche sur les questions relatives au catalogage de linformation eacutelectronique Situeacute agrave Dushyblin dans lEacutetat de lOhio OCLC est le centre de recherche le plus important au monde en matiegravere de reacuteseaux de biblioshythegraveques et de catalogues en ligne Les chercheurs affilieacutes agrave OCLC ont contribueacute de faccedilon majeure aux projets Intercat et Dublin Core Le preacutesent article fait le point sur les quatre projets suivants les projets Ressources Internet et Intercat dOCLC le projet dencodage de textes ou TEI (Text Encoding Initiative) avec le langage SGML et le projet Dublin Core

Les projets Ressources Internet et Intercat dOCLC

La premiegravere grande initiative visant agrave deacutefinir des regravegles de catalogage des resshy

sources accessibles dans le reacuteseau Internet eacutetait le projet Ressources Internet dOCLC (OCLC Internet Resources Project) Ce projet a eacuteteacute entrepris agrave partir des preacutemisses suivantes - Il existe beaushycoup de ressources disponibles dans Internet - Ces ressources doivent ecirctre orshyganiseacutees pour ecirctre accessibles - La meacuteshythode la plus efficace pour acceacuteder agrave ces ressources est dutiliser des techniques et des proceacutedures valideacutees en biblio-theacuteconomie et deacute creacuteer des notices biblioshygraphiques dans les catalogues en ligne actuels (Oison 1995)

Le projet a deacutebuteacute en 1992 apregraves la parution du document du Comiteacute MARBI (Discussion Paper 49) deacutetaillant les chanshygements agrave apporter au USMARC pour accommoder les ressources eacutelectroniques Le Bureau de recherche dOCLC financeacute en partie par le Deacutepartement deacuteducation ameacutericain a commenceacute agrave eacutetudier la nature de linformation disponible dans Internet (Caplan 1994 Dillon and Jul 1994 Dillon et al 1994) Le projet comportait deux phases la premiegravere portait sur leacutetude de la quantiteacute et du type dinformation disposhynible dans Internet et la seconde avait pour but dexaminer les problegravemes de catalogage de cette information relieacutes agrave lutilisation des regravegles AACR2 (Anglo Amerian Cataloguing Rules 2) et plus parshyticuliegraverement des regravegles relatives aux fishychiers de donneacutees lisibles par machine Pour la deuxiegraveme phase les chercheurs ont choisi 300 laquoobjetsraquo Internet Les docushyments eacutetaient groupeacutes au hasard en 30 groupes de 10 notices chacun puis multishyplieacutes par trois pour un total de 900 notices bibliographiques Trente bibliotheacutecaires beacuteneacutevoles provenant de diverses biblioshythegraveques ont eacuteteacute choisis Ces beacuteneacutevoles eacutetaient prieacutes de cataloguer le mieux possishyble ces notices en utilisant leurs connaisshysances des AACR2 et des regravegles relatives aux fichiers de donneacutees lisibles par mashychine et de noter les problegravemes quils rencontraient Une fois le catalogage acheveacute les notices ont eacuteteacute analyseacutees avec des meacutethodes automatiseacutees et manuelles (Caplan 1994)

La principale conclusion fut quavec certaines modifications les regravegles relatishyves aux fichiers de donneacutees lisibles par machine le chapitre 9 des AACR2 poushyvaient ecirctre adeacutequates pour le traitement des ressources Internet Lexpeacuterience a

donneacute lieu agrave trois seacuteries de recommandashytions suggeacuterant des modifications aux regraveshygles de catalogage des modifications au format USMARC et la reacutedaction de directishyves pour le catalogage La premiegravere seacuterie de recommandations incluait une proposishytion pour lexpansion de la regravegle 93B1 des AACR2 de maniegravere agrave inclure des termes comme journal eacutelectronique document eacutelectronique et base de donneacutees biblioshygraphiques

La deuxiegraveme recommandation proshyposeacutee et accepteacutee a meneacute agrave leacutetablisseshyment de la zone 856 du MARC Cette zone est eacutequivalente sur le plan conceptuel agrave la zone 852 utiliseacutee pour indiquer le lieu ougrave un document est physiquement entreposeacute La zone 856 sert agrave indiquer le lieu des documents entreposeacutes agrave distance Par ailleurs la zone 538 utiliseacutee pour fournir des deacutetails relatifs au systegraveme est toushyjours valable pour indiquer le mode dacshycegraves (Oison 1995)

La troisiegraveme proposition consistait agrave reacutediger une seacuterie de directives pour le catalogage des ressources Internet ce qui a donneacute lieu au guide de Nancy Oison (1995) et agrave un guide du Bureau de la Library of Congress sur les normes MARC (Guidelines forthe Use of Field 856 March 1996)4 La zone 856 approuveacutee par le Comiteacute MARBI est utile pour deacutefinir des eacuteleacutements de donneacutees afin de permettre aux usagers dextraire des fichiers au moyen des protocoles utiliseacutes dans Internet et de sabonner aux journaux et aux confeacuteshyrences eacutelectroniques Malgreacute ce potentiel lutilisation de cette zone nest pas sans problegraveme Un des problegravemes principaux est de sassurer que les donneacutees soient inscrites correctement et quelles soient exactes Ainsi dans le cadre de lexpeacuteshyrience citeacutee plus haut les bibliotheacutecaires neacutetaient pas autant agrave laise avec les conshycepts ou la terminologie dInternet quils le sont maintenant et cela nuisait agrave la preacutecishysion des donneacutees lors de leur saisie Un autre problegraveme reacuteside dans la question de la permanence et de lentretien des fishychiers agrave distance et de leurs adresses qui

3 Voir http1823022pubWWWPICS Overviewhtml

4 Voir httplcweblocgovmarc 856guidehtml

juillet - septembre 1997 139

Documentation et bibliothegraveques

peuvent constamment changer De plus dans lexpeacuterience citeacutee les beacuteneacutevoles devaient faire du catalogage original et le laps de temps neacutecessaire pour la creacuteation de notices eacutelectroniques originales eacutetait long entraicircnant un problegraveme potentiel de temps et de ressources pour une telle activiteacute Enfin une autre question qui nest pas relieacutee speacutecifiquement agrave lactiviteacute de catalogage mais peut ecirctre probleacutematique a eacuteteacute souleveacutee il sagit de lentreposage et de linteacutegriteacute des donneacutees En effet qui devrait ecirctre responsable de lexactitude des donneacutees

Lusage du format MARC pour le catalogage des ressources Internet comshyporte plusieurs avantages (Sha 1995) Ce format est en fait une norme (ANSINISO Z392) qui permet de transfeacuterer des resshysources dinformation dun systegraveme agrave un autre Ainsi lors dun transfert de donneacutees ou dun changement de systegraveme cette norme assure la compatibiliteacute des donshyneacutees Une notice composeacutee en MARC fournit une structure simple et flexible pershymettant une description de diffeacuterents nishyveaux de renseignements bibliographishyques Le format MARC implique une mulshytitude de pointe daccegraves qui sont utiles agrave la recherche par mots cleacutes Ces eacuteleacutements peuvent ainsi ecirctre utiliseacutes pour limiter la recherche La description bibliographique complegravete permet aux usagers de deacutecider si la ressource en question correspond agrave leurs besoins Le format MARC rend aussi possible la modification des formats de preacutesentation Par exemple une fois introshyduites dans un systegraveme local les donneacutees peuvent ecirctre disposeacutees de diffeacuterentes fashyccedilons pour divers usages ou selon les particulariteacutes des formats daffichage de catalogues en ligne Le format MARC rend ainsi possible linteacutegration de notices catalographiques de divers types de docushyments dans le catalogue eacutelectronique dune bibliothegraveque Enfin lusage du format MARC serait un moyen pour garantir un libre accegraves aux ressources Internet car dune part les bibliothegraveques peuvent catashyloguer ces ressources et dautre part les usagers deacutepourvus daccegraves agrave Internet peushyvent consulter de tels catalogues

Ayant conclu que les ressources Internet pouvaient ecirctre catalogueacutees en utilisant les AACR2 et le format MARC OCLC a amorceacute le projet Intercat Ce deuxiegraveme projet visait agrave creacuteer une base de donneacutees en ligne regroupant des ressourshy

ces Internet catalogueacutees avec les AACR2 USMARC LCSH et des indices numeacuterishyques de classification En plus de la creacuteashytion dun tel catalogue lobjectif global eacutetait de tester et deacutevaluer lefficaciteacute de lutilisation de TUSMARC pour fournir la description le lieu et les renseignements daccegraves pour des documents accessibles agrave distance (Sha 1995)

Le projet Intercat a eacuteteacute subventionneacute en partie par le Bureau des programmes de bibliothegraveques du Deacutepartement deacutedushycation ameacutericain Au deacutepart la construcshytion de la base de donneacutees devait se reacutealiser entre le 1er octobre 1994 et le 31 mars 1996 gracircce agrave la participation de plushysieurs bibliothegraveques Le catalogue Intercat est opeacuterationnel et son deacuteveloppement se poursuit Il a eacuteteacute inteacutegreacute agrave dautres services dOCLC comme NetFirst et FirstSearch5 En 1996 il y avait environ 200 bibliothegraveshyques qui participaient au projet Avec une structure semblable agrave celles des cataloshygues de la Library of Congress dOCLC du Research Libraries Network et du Wesshytern Libraries Network la base de donshyneacutees Intercat reccediloit sauvegarde et distrishybue les notices bibliographiques fournies par les bibliothegraveques membres Le cataloshygue Intercat repreacutesente un pas important vers linteacutegration de diverses ressources dinformation dans les catalogues eacutelectroshyniques des bibliothegraveques Un autre pas majeur sera lameacutelioration des catalogues eacutelectroniques actuels et le deacuteveloppement des catalogues inteacutegreacutes au WWW utilisant la norme Z3950 ce qui facilitera laccegraves agrave linformation pour lusager Celui-ci pourra alors acceacuteder directement aux autres doshycuments catalogueacutes par des hyperliens qui seront creacuteeacutes-dans la zone 856 Des catalogues eacutelectroniques impliquant de telles options sont actuellement deacutevelopshypeacutes par plusieurs compagnies comme DRA (Data Research Associates) SIRSI WebCat INNOPAC et autres (Sha 1995) Toutefois le format USMARC ninclut pas actuellement les caractegraveres despacement comme le symbole tilde H et celui de soulignement (_) qui sont freacutequemment utiliseacutes dans les adresses URL Par conshyseacutequent il est parfois difficile deacutetablir des hyperliens agrave partir de la zone 856 lorsque les adresses comprennent de tels symboshyles

Selon Vianne Sha (1995) le projet Intercat deacutemontre que le catalogage des ressources Internet est une tacircche eacutenorme

et complexe qui neacutecessite un travail deacutequipe et la collaboration de diffeacuterents acteurs Ces acteurs sont les gestionnaishyres de bibliothegraveques les speacutecialistes en deacuteveloppement de collections les eacutequishypes de catalogage les bibliotheacutecaires de reacutefeacuterence les techniciens en reacuteseautique les auteurs et les reacutedacteurs de ressourshyces Internet et les vendeurs de systegravemes pour bibliothegraveques Pour reacuteussir agrave^donner accegraves agrave linformation disponible sur divers supports au moyen dun seul systegraveme dinformation soit le catalogue dune bishybliothegraveque la coopeacuteration entre toutes ces personnes est essentielle Reacutealiser ce catalogue eacutelectronique inteacutegreacute serait le meilleur moyen pour reacutepondre aux beshysoins dinformation du public

Le projet Intercat a souleveacute dautres questions notamment celle relative agrave la deacutefinition de la nature des documents Ainsi en ce qui concerne les journaux eacutelectroniques la question est de deacutetermishyner sil sagit de bases de donneacutees ou de peacuteriodiques Des efforts sont faits pour deacutefinir la nature des journaux eacutelectronishyques leurs caracteacuteristiques et leur catalogage6 Un projet important sur le catalogage et la classification de ces jourshynaux Mr Serials a eacuteteacute meneacute agrave la North Carolina State University sous la direction dEric Lease Morgan Des proceacutedures de catalogage deacuteveloppeacutees dans le cadre de ce projet permettent dautomatiser la colshylection lorganisation larchivage lindexashytion et la diffusion des peacuteriodiques eacutelectroshyniques Ces proceacutedures de catalogage facilitent la creacuteation de notices MARC agrave partir de documents HTML en utilisant des modegraveles ou templates (Morgan 1995 1996) Ce mode de creacuteation de notices MARC agrave partir de modegraveles est une variashytion de lapproche qui consiste agrave eacutelaborer des notices MARC tireacutees de meacutetadonneacutees ou donneacutees rattacheacutees aux documents eacutelectroniques

5 Intercat est disponible agrave ladresse suivante httporcrschoclcorg6990 La base de donshyneacutees contient plus de 40 000 notices et croicirct agrave un rythme de 4 000 notices par mois environ

6 Le manuel de CONSER (pour Cooperative Online Serials Program) consacre tout un chashypitre agrave ce sujet voir httplcweblocgovacq corneraboutconhtml

140 juillet - septembre 1997

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 2: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

Cataloguer le cyberespace le deacutefi des ressources eacutelectroniques

Roman S Panchyshyn Diplocircmeacute de la Graduate School of Library and Information Studies (GSLIS) Universiteacute McGill France Bouthillier Professeure adjointe GSLIS Universiteacute McGill

Le catalogage des ressources accessibles dans le reacuteseau Internet est probleacutematique Plusieurs initiatives ameacutericaines ont permis didentifier des problegravemes majeurs par exemple les projets Ressources Internet et Intercat dOCLC le projet dencodage de texte (TEi) et le projet Dublin Core dOCLC Par ailleurs des outils tels les URC les URN et les PURL ont eacuteteacute conccedilus pour aider les bibliotheacutecaires agrave mettre de lordre dans le chaos existant dans Internet Larticle deacutecrit ces projets et outils pour identifier les principaux problegravemes auxquels les bibliotheacutecaires doivent faire face dans le traitement de ces ressources Enfin les niveaux de compeacutetence dont les bibliotheacutecaires au catalogage auront besoin agrave lavenir et leur rocircle dans leacutetablissement de normes pour leacutechange dinformation dans la communauteacute Internet sont briegravevement discuteacutes

Cataloguing in cyberspace the challenges of electronic doshycuments

Catalogar el cyberespacio el desafio de los recursos electrocircnicos

Cataloging documents taken from the Internet is truly challenging Several projects undertaken in the United States such as OCLC Internet Resources and Intercat Project the Text Encoding Initiashytive (TEI) and the OCLC Dublin Core Project helped to identify major problems Tools such as URCs URNs and PURLs were developed to assist cataloguers in bringing order to the chaos of Internet The article describes those projects and tools used to identify the problems encountered by cataloguers in the course of theirwork Finally the levels of competency required by cataloguers in the future and their role in establishing standards for information exchange in the Internet community are briefly discussed

La catalogaciocircn de los recursos accesibles por Internet es problemacirctica Muchas iniciativas americanas han permitido de identificarlos problemas macircs importantes porejemplo los projectos Recursos Internet et Intercat de la OCLC elprojecto de codificaciocircn de texto (TEI) y elprojecto Dublin Core de la OCLC Porotra parte instrumentes como los URC los URn et los PURL han sido concebidos para ayudar a los bibliotecarios a poner orden en el caos actual que existe en el Internet El articulo describe estos proyectos y instrumentes para identificarlos principales problemas encontrados por los bibliotecarios en el tratamiento de estos recursos Por fin los niveleacutes de calificaciocircn necesarios para los bibliotecarios responsables de la catalogaciocircn en elporveniry sus papeles en el establecimiento de normas para el intercambio de informaciocircn en la comunidad Internet son brevemente discutidos

Le catalogage doit ecirctre consideacutereacute comme lactiviteacute de base en biblio-theacuteconomie Leacutetablissement et lentretien de systegravemes dorganisation de linformashytion sont des tacircches essentielles pour gashyrantir laccegraves agrave linformation Cependant dans le contexte actuel de compressions budgeacutetaires les activiteacutes traditionnelles de catalogage sont remises en question En effet les bibliotheacutecaires affecteacutes au catalogage font face agrave la deacutepro-fessionnalisation agrave limpartition et agrave leacuteroshy

sion des standards de catalogage (Dunkle 1996 Zyroff 1996) Quel rocircle devront jouer ces bibliotheacutecaires dans le futur

Avec reacutevolution du reacuteseau Internet et la prolifeacuteration de ressources eacutelectronishyques laccegraves agrave linformation subit une transshyformation rapide Dans les bibliothegraveques lobjectif visant agrave posseacuteder et agrave organiser une collection locale est en train de ceacuteder la place agrave un autre objectif qui consiste agrave organiser laquolaccegravesraquo agrave de multiples collecshy

tions entreposeacutees localement et ailleurs (Demas McDonald and Lawrence 1995 Lougee 1995) Ce pheacutenomegravene affecte le catalogage dans la mesure ougrave de nouvelshyles approches doivent ecirctre deacuteveloppeacutees de faccedilon agrave cataloguer des documents pushyblieacutes sur des supports non traditionnels

Les auteurs remercient le professeur John E Leide pour la supervision du projet de recherche agrave lorishygine de cet article et Ared Misirliyan pour laide apporteacutee agrave la traduction

juillet - septembre 1997 137

Documentation et bibliothegraveques

qui sont souvent stockeacutes en dehors des limites dune collection locale Ces deacuteveshyloppements reacutecents ainsi que la prolifeacuterashytion des peacuteriodiques eacutelectroniques ont proshyvoqueacute une reacuteflexion sur le catalogage des documents numeacuteriseacutes (Morgan 1995 1996) Linformation dans Internet contishynue de croicirctre et de prendre de limporshytance ainsi que dacqueacuterir une leacutegitimiteacute au sein de la communauteacute scientifique et acadeacutemique Toutefois les utilisateurs sont souvent frustreacutes et confus en raison de la croissance rapide du reacuteseau Internet et de leur difficulteacute agrave y trouver linformation pershytinente rapidement Ils doivent alors se tourner vers les bibliotheacutecaires pour avoir de laide Le deacutefi agrave relever pour les responshysables du catalogage est eacutevident comshyment les ressources eacutelectroniques peushyvent-elles ecirctre organiseacutees catalogueacutees et classifieacutees de faccedilon agrave reacutepondre aux attentes et aux besoins des utilisateurs

Cet article reacutesume plusieurs projets ameacutericains importants concernant le catalogage des ressources Internet et autres ressources ordinolingues et permet de voir comment les bibliotheacutecaires ameacuteshyricains travaillent agrave reacutegler cette question Larticle cherche agrave identifier les facteurs et tendances qui peuvent entraicircner des chanshygements reacuteels dans la fonction du catalogage traditionnel et dans les proceacuteshydures de catalogage des ressources Internet Lexamen de ces projets permet aussi de se rendre compte des nouvelles variables et conditions qui auront un effet sur la pratique du catalogage Enfin lartishycle discute de la faccedilon dont la profession de bibliotheacutecaire au catalogage est affecshyteacutee par ces nouveaux eacuteleacutements Bien que le texte qui suit ne relate pas de projets francophones il devrait ecirctre utile pour deacuteshygager des conclusions pertinentes agrave la pratique du catalogage en milieu francoshyphone

Le catalogage des ressources dans Internet termes et notions de base

Sil nest plus neacutecessaire de deacutefinir le terme Internet il est essentiel de clarifier ce que sont des laquoressources Internetraquo Ces ressources correspondent agrave des lishyvres numeacuteriseacutes des journaux eacutelectronishyques des bases de donneacutees composeacutees dimages des encyclopeacutedies hypermedias et multimeacutedias des sites Web ou des groupes de nouvelles et de discussions

Le deacutebat sur la deacutefinition de ressources Internet a deacutebuteacute agrave leacuteteacute 1991 quand le Comiteacute MARBI1 a proposeacute une seacuterie deacuteleacuteshyments qui pouvaient ecirctre utiles pour la description des ressources en ligne Leur caracteacuteristique principale et commune a eacuteteacute deacutefinie comme eacutetant la possibiliteacute dacshycegraves agrave distance Les ressources en ligne par opposition aux disques rigides ou disshyquettes dordinateur ne peuvent ecirctre deacuteshycrites physiquement poseacutees sur des rayons ou precircteacutees aux usagers De plus on sentendait pour dire que lunivers des ressources accessibles agrave distance poushyvait ecirctre diviseacute en deux cateacutegories (1) des ressources de donneacutees par exemple des logiciels ou des bases de donneacutees numeacuteshyriques bibliographiques et textuelles et (2) des systegravemes ou des services par exemshyple des systegravemes de catalogues et des tableaux daffichage eacutelectroniques (Caplan 1993) Ce rapport de discussion a donneacute lieu en 1993 agrave la publication dun autre document (MARBI Proposai 93-4) qui reshycommandait des changements au format bibliographique USMARC pour accommoshyder les journaux eacutelectroniques et autres documents disponibles dans Internet Ainsi les sites FTP (protocoles de transshyfert de fichiers) par exemple pouvaient ecirctre traiteacutes de la mecircme faccedilon que les ressources physiques comme les livres Enfin il a eacuteteacute recommandeacute de creacuteer une nouvelle zone du MARC (856) pour y indishyquer les adresses eacutelectroniques et les faccedilons dacceacuteder aux documents dans Internet (Caplan 1993)

Par ailleurs le catalogage des resshysources Internet doit sharmoniser avec la mission geacuteneacuterale des bibliothegraveques Toushytefois cette mission na pas encore vraishyment eacuteteacute assumeacutee en ce qui concerne les documents numeacuteriseacutes Premiegraverement les strateacutegies de deacuteveloppement des collecshytions les meacutethodes et les critegraveres de seacuteshylection doivent ecirctre ajusteacutes pour assimiler les ressources Internet Les politiques de seacutelection doivent inciter les bibliotheacutecaires agrave relever le deacutefi consistant agrave choisir soishygneusement les ressources eacutelectroniques et agrave inteacutegrer des ressources accessibles agrave distance dans les collections de bibliothegraveshyques (Demas McDonald and Lawrence 1995) Les politiques doivent aussi tenir compte des questions comme le droit dauteur lentreposage optimal la diffushysion des documents la preacuteservation et les meacutethodes darchivage

Les politiques de bibliothegraveque en ce qui concerne laccegraves aux ressources eacutelecshytroniques doivent reacutepondre aux besoins de leurs usagers En ce moment les outils disponibles dans Internet qui visent agrave sashytisfaire les exigences des usagers en mashytiegravere daccegraves sont deacuteficients Cette deacutefishycience est due agrave divers facteurs tels que la complexiteacute des commandes des divers moteurs de recherche (ex Lycos Yahoo Alta Vista) les limites des options de reshycherche de ces moteurs la qualiteacute du contenu des bases de donneacutees dans lesshyquelles ces moteurs exeacutecutent la rechershyche et la compeacutetence du chercheur agrave formuler des strateacutegies de recherche adeacuteshyquates (Venditto 1996) Jusquagrave tout reacuteshycemment les systegravemes traditionnellement utiliseacutes dans les bibliothegraveques comme les systegravemes de classification et les vedettes-matiegravere qui correspondent agrave un vocabushylaire controcircleacute neacutetaient pas appliqueacutes dans les outils de navigation Internet Deux raishysons expliquent cette situation les biblioshytheacutecaires nont joueacute aucun rocircle dans la construction de ces outils et leur culture professionnelle nencourageait pas leur participation au deacuteveloppement chaotique dInternet surtout dans un contexte ougrave des solutions connues ne paraissaient pas ecirctre eacutevidentes et immeacutediatement applicables (Flannery 1995)

Reacutecemment des sites comme CyberStacks agrave la lowa State University2 ont commenceacute agrave organiser les ressources Internet avec des systegravemes de classificashytion standards et non standards ainsi quavec un vocabulaire controcircleacute Ces sysshytegravemes comprennent la Classification deacutecishymale Dewey (CDD) la Classification deacutecishymale universelle (CDU) la classification de la Library of Congress (LCCN) et les vedettes-matiegravere de la Library of Congress (LCSH) Le World Wide Web Consortium (W3C) composeacute de diverses organisashytions inteacuteresseacutees agrave deacutefinir des speacutecificashytions communes pour le Web a aussi

1 MARBI est le sigle de Machine-Readable Form of Bibliographie Information Le Comiteacute MARBI est responsable de la preacuteservation et des modifications du format MARC (Machine-Readable Cataloguing) ameacutericain ou le USMARC

2 Voir httpwwwpubliciastateedu -CYBERSTACKShomepagehtml Ce site a eacuteteacute creacuteeacute par Gerry McKiernan

138 juillet - septembre 1997

Documentation et bibliothegraveques

amorceacute le projet PICS (Platform for Internet Content Selection) Ce projet visait agrave creacuteer un systegraveme de classement permettant de fournir des moyens techniques pour deacutefishynir le contenu et pour seacutelectionner des documents dans le Web3 Le PICS se veut un filtre pour classer les systegravemes et les services Web et est une reacuteponse agrave la pression politique et aux menaces de censhysure qui pourraient en effet menacer le libre eacutechange de linformation dans Internet (Weibel 1996)

Une des notions les plus importantes pour le catalogage des ressources Internet est celle de laquomeacutetadonneacuteeraquo (metadata) Priscilla Caplan (1995) a deacutefini les meacutetadonneacutees comme eacutetant des donneacutees relatives agrave dautres donneacutees Une notice catalographique est ainsi consideacutereacutee comme une meacutetadonneacutee Le terme a eacuteteacute inventeacute pour deacutesigner la documentation lisible par machine relative aux fichiers de donneacutees lisibles par machine Dans la communauteacute Internet le terme laquomeacutetashydonneacuteesraquo a acquis le sens de donneacutees sur des ressources dinformation eacutelectronique Lexpression laquomeacutetadonneacutees bibliographishyquesraquo a un sens plus eacutetroit qui signifie des donneacutees ou de linformation sur des objets qui contiennent des donneacutees telles que des livres (Wool 1996) Ce dernier terme est important pour comprendre lenjeu de certains projets discuteacutes plus loin (TEI et Dublin Core)

Aux Eacutetats-Unis lentreprise OCLC (Online Computer Library Center) a joueacute un rocircle de leadership dans la recherche sur les questions relatives au catalogage de linformation eacutelectronique Situeacute agrave Dushyblin dans lEacutetat de lOhio OCLC est le centre de recherche le plus important au monde en matiegravere de reacuteseaux de biblioshythegraveques et de catalogues en ligne Les chercheurs affilieacutes agrave OCLC ont contribueacute de faccedilon majeure aux projets Intercat et Dublin Core Le preacutesent article fait le point sur les quatre projets suivants les projets Ressources Internet et Intercat dOCLC le projet dencodage de textes ou TEI (Text Encoding Initiative) avec le langage SGML et le projet Dublin Core

Les projets Ressources Internet et Intercat dOCLC

La premiegravere grande initiative visant agrave deacutefinir des regravegles de catalogage des resshy

sources accessibles dans le reacuteseau Internet eacutetait le projet Ressources Internet dOCLC (OCLC Internet Resources Project) Ce projet a eacuteteacute entrepris agrave partir des preacutemisses suivantes - Il existe beaushycoup de ressources disponibles dans Internet - Ces ressources doivent ecirctre orshyganiseacutees pour ecirctre accessibles - La meacuteshythode la plus efficace pour acceacuteder agrave ces ressources est dutiliser des techniques et des proceacutedures valideacutees en biblio-theacuteconomie et deacute creacuteer des notices biblioshygraphiques dans les catalogues en ligne actuels (Oison 1995)

Le projet a deacutebuteacute en 1992 apregraves la parution du document du Comiteacute MARBI (Discussion Paper 49) deacutetaillant les chanshygements agrave apporter au USMARC pour accommoder les ressources eacutelectroniques Le Bureau de recherche dOCLC financeacute en partie par le Deacutepartement deacuteducation ameacutericain a commenceacute agrave eacutetudier la nature de linformation disponible dans Internet (Caplan 1994 Dillon and Jul 1994 Dillon et al 1994) Le projet comportait deux phases la premiegravere portait sur leacutetude de la quantiteacute et du type dinformation disposhynible dans Internet et la seconde avait pour but dexaminer les problegravemes de catalogage de cette information relieacutes agrave lutilisation des regravegles AACR2 (Anglo Amerian Cataloguing Rules 2) et plus parshyticuliegraverement des regravegles relatives aux fishychiers de donneacutees lisibles par machine Pour la deuxiegraveme phase les chercheurs ont choisi 300 laquoobjetsraquo Internet Les docushyments eacutetaient groupeacutes au hasard en 30 groupes de 10 notices chacun puis multishyplieacutes par trois pour un total de 900 notices bibliographiques Trente bibliotheacutecaires beacuteneacutevoles provenant de diverses biblioshythegraveques ont eacuteteacute choisis Ces beacuteneacutevoles eacutetaient prieacutes de cataloguer le mieux possishyble ces notices en utilisant leurs connaisshysances des AACR2 et des regravegles relatives aux fichiers de donneacutees lisibles par mashychine et de noter les problegravemes quils rencontraient Une fois le catalogage acheveacute les notices ont eacuteteacute analyseacutees avec des meacutethodes automatiseacutees et manuelles (Caplan 1994)

La principale conclusion fut quavec certaines modifications les regravegles relatishyves aux fichiers de donneacutees lisibles par machine le chapitre 9 des AACR2 poushyvaient ecirctre adeacutequates pour le traitement des ressources Internet Lexpeacuterience a

donneacute lieu agrave trois seacuteries de recommandashytions suggeacuterant des modifications aux regraveshygles de catalogage des modifications au format USMARC et la reacutedaction de directishyves pour le catalogage La premiegravere seacuterie de recommandations incluait une proposishytion pour lexpansion de la regravegle 93B1 des AACR2 de maniegravere agrave inclure des termes comme journal eacutelectronique document eacutelectronique et base de donneacutees biblioshygraphiques

La deuxiegraveme recommandation proshyposeacutee et accepteacutee a meneacute agrave leacutetablisseshyment de la zone 856 du MARC Cette zone est eacutequivalente sur le plan conceptuel agrave la zone 852 utiliseacutee pour indiquer le lieu ougrave un document est physiquement entreposeacute La zone 856 sert agrave indiquer le lieu des documents entreposeacutes agrave distance Par ailleurs la zone 538 utiliseacutee pour fournir des deacutetails relatifs au systegraveme est toushyjours valable pour indiquer le mode dacshycegraves (Oison 1995)

La troisiegraveme proposition consistait agrave reacutediger une seacuterie de directives pour le catalogage des ressources Internet ce qui a donneacute lieu au guide de Nancy Oison (1995) et agrave un guide du Bureau de la Library of Congress sur les normes MARC (Guidelines forthe Use of Field 856 March 1996)4 La zone 856 approuveacutee par le Comiteacute MARBI est utile pour deacutefinir des eacuteleacutements de donneacutees afin de permettre aux usagers dextraire des fichiers au moyen des protocoles utiliseacutes dans Internet et de sabonner aux journaux et aux confeacuteshyrences eacutelectroniques Malgreacute ce potentiel lutilisation de cette zone nest pas sans problegraveme Un des problegravemes principaux est de sassurer que les donneacutees soient inscrites correctement et quelles soient exactes Ainsi dans le cadre de lexpeacuteshyrience citeacutee plus haut les bibliotheacutecaires neacutetaient pas autant agrave laise avec les conshycepts ou la terminologie dInternet quils le sont maintenant et cela nuisait agrave la preacutecishysion des donneacutees lors de leur saisie Un autre problegraveme reacuteside dans la question de la permanence et de lentretien des fishychiers agrave distance et de leurs adresses qui

3 Voir http1823022pubWWWPICS Overviewhtml

4 Voir httplcweblocgovmarc 856guidehtml

juillet - septembre 1997 139

Documentation et bibliothegraveques

peuvent constamment changer De plus dans lexpeacuterience citeacutee les beacuteneacutevoles devaient faire du catalogage original et le laps de temps neacutecessaire pour la creacuteation de notices eacutelectroniques originales eacutetait long entraicircnant un problegraveme potentiel de temps et de ressources pour une telle activiteacute Enfin une autre question qui nest pas relieacutee speacutecifiquement agrave lactiviteacute de catalogage mais peut ecirctre probleacutematique a eacuteteacute souleveacutee il sagit de lentreposage et de linteacutegriteacute des donneacutees En effet qui devrait ecirctre responsable de lexactitude des donneacutees

Lusage du format MARC pour le catalogage des ressources Internet comshyporte plusieurs avantages (Sha 1995) Ce format est en fait une norme (ANSINISO Z392) qui permet de transfeacuterer des resshysources dinformation dun systegraveme agrave un autre Ainsi lors dun transfert de donneacutees ou dun changement de systegraveme cette norme assure la compatibiliteacute des donshyneacutees Une notice composeacutee en MARC fournit une structure simple et flexible pershymettant une description de diffeacuterents nishyveaux de renseignements bibliographishyques Le format MARC implique une mulshytitude de pointe daccegraves qui sont utiles agrave la recherche par mots cleacutes Ces eacuteleacutements peuvent ainsi ecirctre utiliseacutes pour limiter la recherche La description bibliographique complegravete permet aux usagers de deacutecider si la ressource en question correspond agrave leurs besoins Le format MARC rend aussi possible la modification des formats de preacutesentation Par exemple une fois introshyduites dans un systegraveme local les donneacutees peuvent ecirctre disposeacutees de diffeacuterentes fashyccedilons pour divers usages ou selon les particulariteacutes des formats daffichage de catalogues en ligne Le format MARC rend ainsi possible linteacutegration de notices catalographiques de divers types de docushyments dans le catalogue eacutelectronique dune bibliothegraveque Enfin lusage du format MARC serait un moyen pour garantir un libre accegraves aux ressources Internet car dune part les bibliothegraveques peuvent catashyloguer ces ressources et dautre part les usagers deacutepourvus daccegraves agrave Internet peushyvent consulter de tels catalogues

Ayant conclu que les ressources Internet pouvaient ecirctre catalogueacutees en utilisant les AACR2 et le format MARC OCLC a amorceacute le projet Intercat Ce deuxiegraveme projet visait agrave creacuteer une base de donneacutees en ligne regroupant des ressourshy

ces Internet catalogueacutees avec les AACR2 USMARC LCSH et des indices numeacuterishyques de classification En plus de la creacuteashytion dun tel catalogue lobjectif global eacutetait de tester et deacutevaluer lefficaciteacute de lutilisation de TUSMARC pour fournir la description le lieu et les renseignements daccegraves pour des documents accessibles agrave distance (Sha 1995)

Le projet Intercat a eacuteteacute subventionneacute en partie par le Bureau des programmes de bibliothegraveques du Deacutepartement deacutedushycation ameacutericain Au deacutepart la construcshytion de la base de donneacutees devait se reacutealiser entre le 1er octobre 1994 et le 31 mars 1996 gracircce agrave la participation de plushysieurs bibliothegraveques Le catalogue Intercat est opeacuterationnel et son deacuteveloppement se poursuit Il a eacuteteacute inteacutegreacute agrave dautres services dOCLC comme NetFirst et FirstSearch5 En 1996 il y avait environ 200 bibliothegraveshyques qui participaient au projet Avec une structure semblable agrave celles des cataloshygues de la Library of Congress dOCLC du Research Libraries Network et du Wesshytern Libraries Network la base de donshyneacutees Intercat reccediloit sauvegarde et distrishybue les notices bibliographiques fournies par les bibliothegraveques membres Le cataloshygue Intercat repreacutesente un pas important vers linteacutegration de diverses ressources dinformation dans les catalogues eacutelectroshyniques des bibliothegraveques Un autre pas majeur sera lameacutelioration des catalogues eacutelectroniques actuels et le deacuteveloppement des catalogues inteacutegreacutes au WWW utilisant la norme Z3950 ce qui facilitera laccegraves agrave linformation pour lusager Celui-ci pourra alors acceacuteder directement aux autres doshycuments catalogueacutes par des hyperliens qui seront creacuteeacutes-dans la zone 856 Des catalogues eacutelectroniques impliquant de telles options sont actuellement deacutevelopshypeacutes par plusieurs compagnies comme DRA (Data Research Associates) SIRSI WebCat INNOPAC et autres (Sha 1995) Toutefois le format USMARC ninclut pas actuellement les caractegraveres despacement comme le symbole tilde H et celui de soulignement (_) qui sont freacutequemment utiliseacutes dans les adresses URL Par conshyseacutequent il est parfois difficile deacutetablir des hyperliens agrave partir de la zone 856 lorsque les adresses comprennent de tels symboshyles

Selon Vianne Sha (1995) le projet Intercat deacutemontre que le catalogage des ressources Internet est une tacircche eacutenorme

et complexe qui neacutecessite un travail deacutequipe et la collaboration de diffeacuterents acteurs Ces acteurs sont les gestionnaishyres de bibliothegraveques les speacutecialistes en deacuteveloppement de collections les eacutequishypes de catalogage les bibliotheacutecaires de reacutefeacuterence les techniciens en reacuteseautique les auteurs et les reacutedacteurs de ressourshyces Internet et les vendeurs de systegravemes pour bibliothegraveques Pour reacuteussir agrave^donner accegraves agrave linformation disponible sur divers supports au moyen dun seul systegraveme dinformation soit le catalogue dune bishybliothegraveque la coopeacuteration entre toutes ces personnes est essentielle Reacutealiser ce catalogue eacutelectronique inteacutegreacute serait le meilleur moyen pour reacutepondre aux beshysoins dinformation du public

Le projet Intercat a souleveacute dautres questions notamment celle relative agrave la deacutefinition de la nature des documents Ainsi en ce qui concerne les journaux eacutelectroniques la question est de deacutetermishyner sil sagit de bases de donneacutees ou de peacuteriodiques Des efforts sont faits pour deacutefinir la nature des journaux eacutelectronishyques leurs caracteacuteristiques et leur catalogage6 Un projet important sur le catalogage et la classification de ces jourshynaux Mr Serials a eacuteteacute meneacute agrave la North Carolina State University sous la direction dEric Lease Morgan Des proceacutedures de catalogage deacuteveloppeacutees dans le cadre de ce projet permettent dautomatiser la colshylection lorganisation larchivage lindexashytion et la diffusion des peacuteriodiques eacutelectroshyniques Ces proceacutedures de catalogage facilitent la creacuteation de notices MARC agrave partir de documents HTML en utilisant des modegraveles ou templates (Morgan 1995 1996) Ce mode de creacuteation de notices MARC agrave partir de modegraveles est une variashytion de lapproche qui consiste agrave eacutelaborer des notices MARC tireacutees de meacutetadonneacutees ou donneacutees rattacheacutees aux documents eacutelectroniques

5 Intercat est disponible agrave ladresse suivante httporcrschoclcorg6990 La base de donshyneacutees contient plus de 40 000 notices et croicirct agrave un rythme de 4 000 notices par mois environ

6 Le manuel de CONSER (pour Cooperative Online Serials Program) consacre tout un chashypitre agrave ce sujet voir httplcweblocgovacq corneraboutconhtml

140 juillet - septembre 1997

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 3: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

qui sont souvent stockeacutes en dehors des limites dune collection locale Ces deacuteveshyloppements reacutecents ainsi que la prolifeacuterashytion des peacuteriodiques eacutelectroniques ont proshyvoqueacute une reacuteflexion sur le catalogage des documents numeacuteriseacutes (Morgan 1995 1996) Linformation dans Internet contishynue de croicirctre et de prendre de limporshytance ainsi que dacqueacuterir une leacutegitimiteacute au sein de la communauteacute scientifique et acadeacutemique Toutefois les utilisateurs sont souvent frustreacutes et confus en raison de la croissance rapide du reacuteseau Internet et de leur difficulteacute agrave y trouver linformation pershytinente rapidement Ils doivent alors se tourner vers les bibliotheacutecaires pour avoir de laide Le deacutefi agrave relever pour les responshysables du catalogage est eacutevident comshyment les ressources eacutelectroniques peushyvent-elles ecirctre organiseacutees catalogueacutees et classifieacutees de faccedilon agrave reacutepondre aux attentes et aux besoins des utilisateurs

Cet article reacutesume plusieurs projets ameacutericains importants concernant le catalogage des ressources Internet et autres ressources ordinolingues et permet de voir comment les bibliotheacutecaires ameacuteshyricains travaillent agrave reacutegler cette question Larticle cherche agrave identifier les facteurs et tendances qui peuvent entraicircner des chanshygements reacuteels dans la fonction du catalogage traditionnel et dans les proceacuteshydures de catalogage des ressources Internet Lexamen de ces projets permet aussi de se rendre compte des nouvelles variables et conditions qui auront un effet sur la pratique du catalogage Enfin lartishycle discute de la faccedilon dont la profession de bibliotheacutecaire au catalogage est affecshyteacutee par ces nouveaux eacuteleacutements Bien que le texte qui suit ne relate pas de projets francophones il devrait ecirctre utile pour deacuteshygager des conclusions pertinentes agrave la pratique du catalogage en milieu francoshyphone

Le catalogage des ressources dans Internet termes et notions de base

Sil nest plus neacutecessaire de deacutefinir le terme Internet il est essentiel de clarifier ce que sont des laquoressources Internetraquo Ces ressources correspondent agrave des lishyvres numeacuteriseacutes des journaux eacutelectronishyques des bases de donneacutees composeacutees dimages des encyclopeacutedies hypermedias et multimeacutedias des sites Web ou des groupes de nouvelles et de discussions

Le deacutebat sur la deacutefinition de ressources Internet a deacutebuteacute agrave leacuteteacute 1991 quand le Comiteacute MARBI1 a proposeacute une seacuterie deacuteleacuteshyments qui pouvaient ecirctre utiles pour la description des ressources en ligne Leur caracteacuteristique principale et commune a eacuteteacute deacutefinie comme eacutetant la possibiliteacute dacshycegraves agrave distance Les ressources en ligne par opposition aux disques rigides ou disshyquettes dordinateur ne peuvent ecirctre deacuteshycrites physiquement poseacutees sur des rayons ou precircteacutees aux usagers De plus on sentendait pour dire que lunivers des ressources accessibles agrave distance poushyvait ecirctre diviseacute en deux cateacutegories (1) des ressources de donneacutees par exemple des logiciels ou des bases de donneacutees numeacuteshyriques bibliographiques et textuelles et (2) des systegravemes ou des services par exemshyple des systegravemes de catalogues et des tableaux daffichage eacutelectroniques (Caplan 1993) Ce rapport de discussion a donneacute lieu en 1993 agrave la publication dun autre document (MARBI Proposai 93-4) qui reshycommandait des changements au format bibliographique USMARC pour accommoshyder les journaux eacutelectroniques et autres documents disponibles dans Internet Ainsi les sites FTP (protocoles de transshyfert de fichiers) par exemple pouvaient ecirctre traiteacutes de la mecircme faccedilon que les ressources physiques comme les livres Enfin il a eacuteteacute recommandeacute de creacuteer une nouvelle zone du MARC (856) pour y indishyquer les adresses eacutelectroniques et les faccedilons dacceacuteder aux documents dans Internet (Caplan 1993)

Par ailleurs le catalogage des resshysources Internet doit sharmoniser avec la mission geacuteneacuterale des bibliothegraveques Toushytefois cette mission na pas encore vraishyment eacuteteacute assumeacutee en ce qui concerne les documents numeacuteriseacutes Premiegraverement les strateacutegies de deacuteveloppement des collecshytions les meacutethodes et les critegraveres de seacuteshylection doivent ecirctre ajusteacutes pour assimiler les ressources Internet Les politiques de seacutelection doivent inciter les bibliotheacutecaires agrave relever le deacutefi consistant agrave choisir soishygneusement les ressources eacutelectroniques et agrave inteacutegrer des ressources accessibles agrave distance dans les collections de bibliothegraveshyques (Demas McDonald and Lawrence 1995) Les politiques doivent aussi tenir compte des questions comme le droit dauteur lentreposage optimal la diffushysion des documents la preacuteservation et les meacutethodes darchivage

Les politiques de bibliothegraveque en ce qui concerne laccegraves aux ressources eacutelecshytroniques doivent reacutepondre aux besoins de leurs usagers En ce moment les outils disponibles dans Internet qui visent agrave sashytisfaire les exigences des usagers en mashytiegravere daccegraves sont deacuteficients Cette deacutefishycience est due agrave divers facteurs tels que la complexiteacute des commandes des divers moteurs de recherche (ex Lycos Yahoo Alta Vista) les limites des options de reshycherche de ces moteurs la qualiteacute du contenu des bases de donneacutees dans lesshyquelles ces moteurs exeacutecutent la rechershyche et la compeacutetence du chercheur agrave formuler des strateacutegies de recherche adeacuteshyquates (Venditto 1996) Jusquagrave tout reacuteshycemment les systegravemes traditionnellement utiliseacutes dans les bibliothegraveques comme les systegravemes de classification et les vedettes-matiegravere qui correspondent agrave un vocabushylaire controcircleacute neacutetaient pas appliqueacutes dans les outils de navigation Internet Deux raishysons expliquent cette situation les biblioshytheacutecaires nont joueacute aucun rocircle dans la construction de ces outils et leur culture professionnelle nencourageait pas leur participation au deacuteveloppement chaotique dInternet surtout dans un contexte ougrave des solutions connues ne paraissaient pas ecirctre eacutevidentes et immeacutediatement applicables (Flannery 1995)

Reacutecemment des sites comme CyberStacks agrave la lowa State University2 ont commenceacute agrave organiser les ressources Internet avec des systegravemes de classificashytion standards et non standards ainsi quavec un vocabulaire controcircleacute Ces sysshytegravemes comprennent la Classification deacutecishymale Dewey (CDD) la Classification deacutecishymale universelle (CDU) la classification de la Library of Congress (LCCN) et les vedettes-matiegravere de la Library of Congress (LCSH) Le World Wide Web Consortium (W3C) composeacute de diverses organisashytions inteacuteresseacutees agrave deacutefinir des speacutecificashytions communes pour le Web a aussi

1 MARBI est le sigle de Machine-Readable Form of Bibliographie Information Le Comiteacute MARBI est responsable de la preacuteservation et des modifications du format MARC (Machine-Readable Cataloguing) ameacutericain ou le USMARC

2 Voir httpwwwpubliciastateedu -CYBERSTACKShomepagehtml Ce site a eacuteteacute creacuteeacute par Gerry McKiernan

138 juillet - septembre 1997

Documentation et bibliothegraveques

amorceacute le projet PICS (Platform for Internet Content Selection) Ce projet visait agrave creacuteer un systegraveme de classement permettant de fournir des moyens techniques pour deacutefishynir le contenu et pour seacutelectionner des documents dans le Web3 Le PICS se veut un filtre pour classer les systegravemes et les services Web et est une reacuteponse agrave la pression politique et aux menaces de censhysure qui pourraient en effet menacer le libre eacutechange de linformation dans Internet (Weibel 1996)

Une des notions les plus importantes pour le catalogage des ressources Internet est celle de laquomeacutetadonneacuteeraquo (metadata) Priscilla Caplan (1995) a deacutefini les meacutetadonneacutees comme eacutetant des donneacutees relatives agrave dautres donneacutees Une notice catalographique est ainsi consideacutereacutee comme une meacutetadonneacutee Le terme a eacuteteacute inventeacute pour deacutesigner la documentation lisible par machine relative aux fichiers de donneacutees lisibles par machine Dans la communauteacute Internet le terme laquomeacutetashydonneacuteesraquo a acquis le sens de donneacutees sur des ressources dinformation eacutelectronique Lexpression laquomeacutetadonneacutees bibliographishyquesraquo a un sens plus eacutetroit qui signifie des donneacutees ou de linformation sur des objets qui contiennent des donneacutees telles que des livres (Wool 1996) Ce dernier terme est important pour comprendre lenjeu de certains projets discuteacutes plus loin (TEI et Dublin Core)

Aux Eacutetats-Unis lentreprise OCLC (Online Computer Library Center) a joueacute un rocircle de leadership dans la recherche sur les questions relatives au catalogage de linformation eacutelectronique Situeacute agrave Dushyblin dans lEacutetat de lOhio OCLC est le centre de recherche le plus important au monde en matiegravere de reacuteseaux de biblioshythegraveques et de catalogues en ligne Les chercheurs affilieacutes agrave OCLC ont contribueacute de faccedilon majeure aux projets Intercat et Dublin Core Le preacutesent article fait le point sur les quatre projets suivants les projets Ressources Internet et Intercat dOCLC le projet dencodage de textes ou TEI (Text Encoding Initiative) avec le langage SGML et le projet Dublin Core

Les projets Ressources Internet et Intercat dOCLC

La premiegravere grande initiative visant agrave deacutefinir des regravegles de catalogage des resshy

sources accessibles dans le reacuteseau Internet eacutetait le projet Ressources Internet dOCLC (OCLC Internet Resources Project) Ce projet a eacuteteacute entrepris agrave partir des preacutemisses suivantes - Il existe beaushycoup de ressources disponibles dans Internet - Ces ressources doivent ecirctre orshyganiseacutees pour ecirctre accessibles - La meacuteshythode la plus efficace pour acceacuteder agrave ces ressources est dutiliser des techniques et des proceacutedures valideacutees en biblio-theacuteconomie et deacute creacuteer des notices biblioshygraphiques dans les catalogues en ligne actuels (Oison 1995)

Le projet a deacutebuteacute en 1992 apregraves la parution du document du Comiteacute MARBI (Discussion Paper 49) deacutetaillant les chanshygements agrave apporter au USMARC pour accommoder les ressources eacutelectroniques Le Bureau de recherche dOCLC financeacute en partie par le Deacutepartement deacuteducation ameacutericain a commenceacute agrave eacutetudier la nature de linformation disponible dans Internet (Caplan 1994 Dillon and Jul 1994 Dillon et al 1994) Le projet comportait deux phases la premiegravere portait sur leacutetude de la quantiteacute et du type dinformation disposhynible dans Internet et la seconde avait pour but dexaminer les problegravemes de catalogage de cette information relieacutes agrave lutilisation des regravegles AACR2 (Anglo Amerian Cataloguing Rules 2) et plus parshyticuliegraverement des regravegles relatives aux fishychiers de donneacutees lisibles par machine Pour la deuxiegraveme phase les chercheurs ont choisi 300 laquoobjetsraquo Internet Les docushyments eacutetaient groupeacutes au hasard en 30 groupes de 10 notices chacun puis multishyplieacutes par trois pour un total de 900 notices bibliographiques Trente bibliotheacutecaires beacuteneacutevoles provenant de diverses biblioshythegraveques ont eacuteteacute choisis Ces beacuteneacutevoles eacutetaient prieacutes de cataloguer le mieux possishyble ces notices en utilisant leurs connaisshysances des AACR2 et des regravegles relatives aux fichiers de donneacutees lisibles par mashychine et de noter les problegravemes quils rencontraient Une fois le catalogage acheveacute les notices ont eacuteteacute analyseacutees avec des meacutethodes automatiseacutees et manuelles (Caplan 1994)

La principale conclusion fut quavec certaines modifications les regravegles relatishyves aux fichiers de donneacutees lisibles par machine le chapitre 9 des AACR2 poushyvaient ecirctre adeacutequates pour le traitement des ressources Internet Lexpeacuterience a

donneacute lieu agrave trois seacuteries de recommandashytions suggeacuterant des modifications aux regraveshygles de catalogage des modifications au format USMARC et la reacutedaction de directishyves pour le catalogage La premiegravere seacuterie de recommandations incluait une proposishytion pour lexpansion de la regravegle 93B1 des AACR2 de maniegravere agrave inclure des termes comme journal eacutelectronique document eacutelectronique et base de donneacutees biblioshygraphiques

La deuxiegraveme recommandation proshyposeacutee et accepteacutee a meneacute agrave leacutetablisseshyment de la zone 856 du MARC Cette zone est eacutequivalente sur le plan conceptuel agrave la zone 852 utiliseacutee pour indiquer le lieu ougrave un document est physiquement entreposeacute La zone 856 sert agrave indiquer le lieu des documents entreposeacutes agrave distance Par ailleurs la zone 538 utiliseacutee pour fournir des deacutetails relatifs au systegraveme est toushyjours valable pour indiquer le mode dacshycegraves (Oison 1995)

La troisiegraveme proposition consistait agrave reacutediger une seacuterie de directives pour le catalogage des ressources Internet ce qui a donneacute lieu au guide de Nancy Oison (1995) et agrave un guide du Bureau de la Library of Congress sur les normes MARC (Guidelines forthe Use of Field 856 March 1996)4 La zone 856 approuveacutee par le Comiteacute MARBI est utile pour deacutefinir des eacuteleacutements de donneacutees afin de permettre aux usagers dextraire des fichiers au moyen des protocoles utiliseacutes dans Internet et de sabonner aux journaux et aux confeacuteshyrences eacutelectroniques Malgreacute ce potentiel lutilisation de cette zone nest pas sans problegraveme Un des problegravemes principaux est de sassurer que les donneacutees soient inscrites correctement et quelles soient exactes Ainsi dans le cadre de lexpeacuteshyrience citeacutee plus haut les bibliotheacutecaires neacutetaient pas autant agrave laise avec les conshycepts ou la terminologie dInternet quils le sont maintenant et cela nuisait agrave la preacutecishysion des donneacutees lors de leur saisie Un autre problegraveme reacuteside dans la question de la permanence et de lentretien des fishychiers agrave distance et de leurs adresses qui

3 Voir http1823022pubWWWPICS Overviewhtml

4 Voir httplcweblocgovmarc 856guidehtml

juillet - septembre 1997 139

Documentation et bibliothegraveques

peuvent constamment changer De plus dans lexpeacuterience citeacutee les beacuteneacutevoles devaient faire du catalogage original et le laps de temps neacutecessaire pour la creacuteation de notices eacutelectroniques originales eacutetait long entraicircnant un problegraveme potentiel de temps et de ressources pour une telle activiteacute Enfin une autre question qui nest pas relieacutee speacutecifiquement agrave lactiviteacute de catalogage mais peut ecirctre probleacutematique a eacuteteacute souleveacutee il sagit de lentreposage et de linteacutegriteacute des donneacutees En effet qui devrait ecirctre responsable de lexactitude des donneacutees

Lusage du format MARC pour le catalogage des ressources Internet comshyporte plusieurs avantages (Sha 1995) Ce format est en fait une norme (ANSINISO Z392) qui permet de transfeacuterer des resshysources dinformation dun systegraveme agrave un autre Ainsi lors dun transfert de donneacutees ou dun changement de systegraveme cette norme assure la compatibiliteacute des donshyneacutees Une notice composeacutee en MARC fournit une structure simple et flexible pershymettant une description de diffeacuterents nishyveaux de renseignements bibliographishyques Le format MARC implique une mulshytitude de pointe daccegraves qui sont utiles agrave la recherche par mots cleacutes Ces eacuteleacutements peuvent ainsi ecirctre utiliseacutes pour limiter la recherche La description bibliographique complegravete permet aux usagers de deacutecider si la ressource en question correspond agrave leurs besoins Le format MARC rend aussi possible la modification des formats de preacutesentation Par exemple une fois introshyduites dans un systegraveme local les donneacutees peuvent ecirctre disposeacutees de diffeacuterentes fashyccedilons pour divers usages ou selon les particulariteacutes des formats daffichage de catalogues en ligne Le format MARC rend ainsi possible linteacutegration de notices catalographiques de divers types de docushyments dans le catalogue eacutelectronique dune bibliothegraveque Enfin lusage du format MARC serait un moyen pour garantir un libre accegraves aux ressources Internet car dune part les bibliothegraveques peuvent catashyloguer ces ressources et dautre part les usagers deacutepourvus daccegraves agrave Internet peushyvent consulter de tels catalogues

Ayant conclu que les ressources Internet pouvaient ecirctre catalogueacutees en utilisant les AACR2 et le format MARC OCLC a amorceacute le projet Intercat Ce deuxiegraveme projet visait agrave creacuteer une base de donneacutees en ligne regroupant des ressourshy

ces Internet catalogueacutees avec les AACR2 USMARC LCSH et des indices numeacuterishyques de classification En plus de la creacuteashytion dun tel catalogue lobjectif global eacutetait de tester et deacutevaluer lefficaciteacute de lutilisation de TUSMARC pour fournir la description le lieu et les renseignements daccegraves pour des documents accessibles agrave distance (Sha 1995)

Le projet Intercat a eacuteteacute subventionneacute en partie par le Bureau des programmes de bibliothegraveques du Deacutepartement deacutedushycation ameacutericain Au deacutepart la construcshytion de la base de donneacutees devait se reacutealiser entre le 1er octobre 1994 et le 31 mars 1996 gracircce agrave la participation de plushysieurs bibliothegraveques Le catalogue Intercat est opeacuterationnel et son deacuteveloppement se poursuit Il a eacuteteacute inteacutegreacute agrave dautres services dOCLC comme NetFirst et FirstSearch5 En 1996 il y avait environ 200 bibliothegraveshyques qui participaient au projet Avec une structure semblable agrave celles des cataloshygues de la Library of Congress dOCLC du Research Libraries Network et du Wesshytern Libraries Network la base de donshyneacutees Intercat reccediloit sauvegarde et distrishybue les notices bibliographiques fournies par les bibliothegraveques membres Le cataloshygue Intercat repreacutesente un pas important vers linteacutegration de diverses ressources dinformation dans les catalogues eacutelectroshyniques des bibliothegraveques Un autre pas majeur sera lameacutelioration des catalogues eacutelectroniques actuels et le deacuteveloppement des catalogues inteacutegreacutes au WWW utilisant la norme Z3950 ce qui facilitera laccegraves agrave linformation pour lusager Celui-ci pourra alors acceacuteder directement aux autres doshycuments catalogueacutes par des hyperliens qui seront creacuteeacutes-dans la zone 856 Des catalogues eacutelectroniques impliquant de telles options sont actuellement deacutevelopshypeacutes par plusieurs compagnies comme DRA (Data Research Associates) SIRSI WebCat INNOPAC et autres (Sha 1995) Toutefois le format USMARC ninclut pas actuellement les caractegraveres despacement comme le symbole tilde H et celui de soulignement (_) qui sont freacutequemment utiliseacutes dans les adresses URL Par conshyseacutequent il est parfois difficile deacutetablir des hyperliens agrave partir de la zone 856 lorsque les adresses comprennent de tels symboshyles

Selon Vianne Sha (1995) le projet Intercat deacutemontre que le catalogage des ressources Internet est une tacircche eacutenorme

et complexe qui neacutecessite un travail deacutequipe et la collaboration de diffeacuterents acteurs Ces acteurs sont les gestionnaishyres de bibliothegraveques les speacutecialistes en deacuteveloppement de collections les eacutequishypes de catalogage les bibliotheacutecaires de reacutefeacuterence les techniciens en reacuteseautique les auteurs et les reacutedacteurs de ressourshyces Internet et les vendeurs de systegravemes pour bibliothegraveques Pour reacuteussir agrave^donner accegraves agrave linformation disponible sur divers supports au moyen dun seul systegraveme dinformation soit le catalogue dune bishybliothegraveque la coopeacuteration entre toutes ces personnes est essentielle Reacutealiser ce catalogue eacutelectronique inteacutegreacute serait le meilleur moyen pour reacutepondre aux beshysoins dinformation du public

Le projet Intercat a souleveacute dautres questions notamment celle relative agrave la deacutefinition de la nature des documents Ainsi en ce qui concerne les journaux eacutelectroniques la question est de deacutetermishyner sil sagit de bases de donneacutees ou de peacuteriodiques Des efforts sont faits pour deacutefinir la nature des journaux eacutelectronishyques leurs caracteacuteristiques et leur catalogage6 Un projet important sur le catalogage et la classification de ces jourshynaux Mr Serials a eacuteteacute meneacute agrave la North Carolina State University sous la direction dEric Lease Morgan Des proceacutedures de catalogage deacuteveloppeacutees dans le cadre de ce projet permettent dautomatiser la colshylection lorganisation larchivage lindexashytion et la diffusion des peacuteriodiques eacutelectroshyniques Ces proceacutedures de catalogage facilitent la creacuteation de notices MARC agrave partir de documents HTML en utilisant des modegraveles ou templates (Morgan 1995 1996) Ce mode de creacuteation de notices MARC agrave partir de modegraveles est une variashytion de lapproche qui consiste agrave eacutelaborer des notices MARC tireacutees de meacutetadonneacutees ou donneacutees rattacheacutees aux documents eacutelectroniques

5 Intercat est disponible agrave ladresse suivante httporcrschoclcorg6990 La base de donshyneacutees contient plus de 40 000 notices et croicirct agrave un rythme de 4 000 notices par mois environ

6 Le manuel de CONSER (pour Cooperative Online Serials Program) consacre tout un chashypitre agrave ce sujet voir httplcweblocgovacq corneraboutconhtml

140 juillet - septembre 1997

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 4: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

amorceacute le projet PICS (Platform for Internet Content Selection) Ce projet visait agrave creacuteer un systegraveme de classement permettant de fournir des moyens techniques pour deacutefishynir le contenu et pour seacutelectionner des documents dans le Web3 Le PICS se veut un filtre pour classer les systegravemes et les services Web et est une reacuteponse agrave la pression politique et aux menaces de censhysure qui pourraient en effet menacer le libre eacutechange de linformation dans Internet (Weibel 1996)

Une des notions les plus importantes pour le catalogage des ressources Internet est celle de laquomeacutetadonneacuteeraquo (metadata) Priscilla Caplan (1995) a deacutefini les meacutetadonneacutees comme eacutetant des donneacutees relatives agrave dautres donneacutees Une notice catalographique est ainsi consideacutereacutee comme une meacutetadonneacutee Le terme a eacuteteacute inventeacute pour deacutesigner la documentation lisible par machine relative aux fichiers de donneacutees lisibles par machine Dans la communauteacute Internet le terme laquomeacutetashydonneacuteesraquo a acquis le sens de donneacutees sur des ressources dinformation eacutelectronique Lexpression laquomeacutetadonneacutees bibliographishyquesraquo a un sens plus eacutetroit qui signifie des donneacutees ou de linformation sur des objets qui contiennent des donneacutees telles que des livres (Wool 1996) Ce dernier terme est important pour comprendre lenjeu de certains projets discuteacutes plus loin (TEI et Dublin Core)

Aux Eacutetats-Unis lentreprise OCLC (Online Computer Library Center) a joueacute un rocircle de leadership dans la recherche sur les questions relatives au catalogage de linformation eacutelectronique Situeacute agrave Dushyblin dans lEacutetat de lOhio OCLC est le centre de recherche le plus important au monde en matiegravere de reacuteseaux de biblioshythegraveques et de catalogues en ligne Les chercheurs affilieacutes agrave OCLC ont contribueacute de faccedilon majeure aux projets Intercat et Dublin Core Le preacutesent article fait le point sur les quatre projets suivants les projets Ressources Internet et Intercat dOCLC le projet dencodage de textes ou TEI (Text Encoding Initiative) avec le langage SGML et le projet Dublin Core

Les projets Ressources Internet et Intercat dOCLC

La premiegravere grande initiative visant agrave deacutefinir des regravegles de catalogage des resshy

sources accessibles dans le reacuteseau Internet eacutetait le projet Ressources Internet dOCLC (OCLC Internet Resources Project) Ce projet a eacuteteacute entrepris agrave partir des preacutemisses suivantes - Il existe beaushycoup de ressources disponibles dans Internet - Ces ressources doivent ecirctre orshyganiseacutees pour ecirctre accessibles - La meacuteshythode la plus efficace pour acceacuteder agrave ces ressources est dutiliser des techniques et des proceacutedures valideacutees en biblio-theacuteconomie et deacute creacuteer des notices biblioshygraphiques dans les catalogues en ligne actuels (Oison 1995)

Le projet a deacutebuteacute en 1992 apregraves la parution du document du Comiteacute MARBI (Discussion Paper 49) deacutetaillant les chanshygements agrave apporter au USMARC pour accommoder les ressources eacutelectroniques Le Bureau de recherche dOCLC financeacute en partie par le Deacutepartement deacuteducation ameacutericain a commenceacute agrave eacutetudier la nature de linformation disponible dans Internet (Caplan 1994 Dillon and Jul 1994 Dillon et al 1994) Le projet comportait deux phases la premiegravere portait sur leacutetude de la quantiteacute et du type dinformation disposhynible dans Internet et la seconde avait pour but dexaminer les problegravemes de catalogage de cette information relieacutes agrave lutilisation des regravegles AACR2 (Anglo Amerian Cataloguing Rules 2) et plus parshyticuliegraverement des regravegles relatives aux fishychiers de donneacutees lisibles par machine Pour la deuxiegraveme phase les chercheurs ont choisi 300 laquoobjetsraquo Internet Les docushyments eacutetaient groupeacutes au hasard en 30 groupes de 10 notices chacun puis multishyplieacutes par trois pour un total de 900 notices bibliographiques Trente bibliotheacutecaires beacuteneacutevoles provenant de diverses biblioshythegraveques ont eacuteteacute choisis Ces beacuteneacutevoles eacutetaient prieacutes de cataloguer le mieux possishyble ces notices en utilisant leurs connaisshysances des AACR2 et des regravegles relatives aux fichiers de donneacutees lisibles par mashychine et de noter les problegravemes quils rencontraient Une fois le catalogage acheveacute les notices ont eacuteteacute analyseacutees avec des meacutethodes automatiseacutees et manuelles (Caplan 1994)

La principale conclusion fut quavec certaines modifications les regravegles relatishyves aux fichiers de donneacutees lisibles par machine le chapitre 9 des AACR2 poushyvaient ecirctre adeacutequates pour le traitement des ressources Internet Lexpeacuterience a

donneacute lieu agrave trois seacuteries de recommandashytions suggeacuterant des modifications aux regraveshygles de catalogage des modifications au format USMARC et la reacutedaction de directishyves pour le catalogage La premiegravere seacuterie de recommandations incluait une proposishytion pour lexpansion de la regravegle 93B1 des AACR2 de maniegravere agrave inclure des termes comme journal eacutelectronique document eacutelectronique et base de donneacutees biblioshygraphiques

La deuxiegraveme recommandation proshyposeacutee et accepteacutee a meneacute agrave leacutetablisseshyment de la zone 856 du MARC Cette zone est eacutequivalente sur le plan conceptuel agrave la zone 852 utiliseacutee pour indiquer le lieu ougrave un document est physiquement entreposeacute La zone 856 sert agrave indiquer le lieu des documents entreposeacutes agrave distance Par ailleurs la zone 538 utiliseacutee pour fournir des deacutetails relatifs au systegraveme est toushyjours valable pour indiquer le mode dacshycegraves (Oison 1995)

La troisiegraveme proposition consistait agrave reacutediger une seacuterie de directives pour le catalogage des ressources Internet ce qui a donneacute lieu au guide de Nancy Oison (1995) et agrave un guide du Bureau de la Library of Congress sur les normes MARC (Guidelines forthe Use of Field 856 March 1996)4 La zone 856 approuveacutee par le Comiteacute MARBI est utile pour deacutefinir des eacuteleacutements de donneacutees afin de permettre aux usagers dextraire des fichiers au moyen des protocoles utiliseacutes dans Internet et de sabonner aux journaux et aux confeacuteshyrences eacutelectroniques Malgreacute ce potentiel lutilisation de cette zone nest pas sans problegraveme Un des problegravemes principaux est de sassurer que les donneacutees soient inscrites correctement et quelles soient exactes Ainsi dans le cadre de lexpeacuteshyrience citeacutee plus haut les bibliotheacutecaires neacutetaient pas autant agrave laise avec les conshycepts ou la terminologie dInternet quils le sont maintenant et cela nuisait agrave la preacutecishysion des donneacutees lors de leur saisie Un autre problegraveme reacuteside dans la question de la permanence et de lentretien des fishychiers agrave distance et de leurs adresses qui

3 Voir http1823022pubWWWPICS Overviewhtml

4 Voir httplcweblocgovmarc 856guidehtml

juillet - septembre 1997 139

Documentation et bibliothegraveques

peuvent constamment changer De plus dans lexpeacuterience citeacutee les beacuteneacutevoles devaient faire du catalogage original et le laps de temps neacutecessaire pour la creacuteation de notices eacutelectroniques originales eacutetait long entraicircnant un problegraveme potentiel de temps et de ressources pour une telle activiteacute Enfin une autre question qui nest pas relieacutee speacutecifiquement agrave lactiviteacute de catalogage mais peut ecirctre probleacutematique a eacuteteacute souleveacutee il sagit de lentreposage et de linteacutegriteacute des donneacutees En effet qui devrait ecirctre responsable de lexactitude des donneacutees

Lusage du format MARC pour le catalogage des ressources Internet comshyporte plusieurs avantages (Sha 1995) Ce format est en fait une norme (ANSINISO Z392) qui permet de transfeacuterer des resshysources dinformation dun systegraveme agrave un autre Ainsi lors dun transfert de donneacutees ou dun changement de systegraveme cette norme assure la compatibiliteacute des donshyneacutees Une notice composeacutee en MARC fournit une structure simple et flexible pershymettant une description de diffeacuterents nishyveaux de renseignements bibliographishyques Le format MARC implique une mulshytitude de pointe daccegraves qui sont utiles agrave la recherche par mots cleacutes Ces eacuteleacutements peuvent ainsi ecirctre utiliseacutes pour limiter la recherche La description bibliographique complegravete permet aux usagers de deacutecider si la ressource en question correspond agrave leurs besoins Le format MARC rend aussi possible la modification des formats de preacutesentation Par exemple une fois introshyduites dans un systegraveme local les donneacutees peuvent ecirctre disposeacutees de diffeacuterentes fashyccedilons pour divers usages ou selon les particulariteacutes des formats daffichage de catalogues en ligne Le format MARC rend ainsi possible linteacutegration de notices catalographiques de divers types de docushyments dans le catalogue eacutelectronique dune bibliothegraveque Enfin lusage du format MARC serait un moyen pour garantir un libre accegraves aux ressources Internet car dune part les bibliothegraveques peuvent catashyloguer ces ressources et dautre part les usagers deacutepourvus daccegraves agrave Internet peushyvent consulter de tels catalogues

Ayant conclu que les ressources Internet pouvaient ecirctre catalogueacutees en utilisant les AACR2 et le format MARC OCLC a amorceacute le projet Intercat Ce deuxiegraveme projet visait agrave creacuteer une base de donneacutees en ligne regroupant des ressourshy

ces Internet catalogueacutees avec les AACR2 USMARC LCSH et des indices numeacuterishyques de classification En plus de la creacuteashytion dun tel catalogue lobjectif global eacutetait de tester et deacutevaluer lefficaciteacute de lutilisation de TUSMARC pour fournir la description le lieu et les renseignements daccegraves pour des documents accessibles agrave distance (Sha 1995)

Le projet Intercat a eacuteteacute subventionneacute en partie par le Bureau des programmes de bibliothegraveques du Deacutepartement deacutedushycation ameacutericain Au deacutepart la construcshytion de la base de donneacutees devait se reacutealiser entre le 1er octobre 1994 et le 31 mars 1996 gracircce agrave la participation de plushysieurs bibliothegraveques Le catalogue Intercat est opeacuterationnel et son deacuteveloppement se poursuit Il a eacuteteacute inteacutegreacute agrave dautres services dOCLC comme NetFirst et FirstSearch5 En 1996 il y avait environ 200 bibliothegraveshyques qui participaient au projet Avec une structure semblable agrave celles des cataloshygues de la Library of Congress dOCLC du Research Libraries Network et du Wesshytern Libraries Network la base de donshyneacutees Intercat reccediloit sauvegarde et distrishybue les notices bibliographiques fournies par les bibliothegraveques membres Le cataloshygue Intercat repreacutesente un pas important vers linteacutegration de diverses ressources dinformation dans les catalogues eacutelectroshyniques des bibliothegraveques Un autre pas majeur sera lameacutelioration des catalogues eacutelectroniques actuels et le deacuteveloppement des catalogues inteacutegreacutes au WWW utilisant la norme Z3950 ce qui facilitera laccegraves agrave linformation pour lusager Celui-ci pourra alors acceacuteder directement aux autres doshycuments catalogueacutes par des hyperliens qui seront creacuteeacutes-dans la zone 856 Des catalogues eacutelectroniques impliquant de telles options sont actuellement deacutevelopshypeacutes par plusieurs compagnies comme DRA (Data Research Associates) SIRSI WebCat INNOPAC et autres (Sha 1995) Toutefois le format USMARC ninclut pas actuellement les caractegraveres despacement comme le symbole tilde H et celui de soulignement (_) qui sont freacutequemment utiliseacutes dans les adresses URL Par conshyseacutequent il est parfois difficile deacutetablir des hyperliens agrave partir de la zone 856 lorsque les adresses comprennent de tels symboshyles

Selon Vianne Sha (1995) le projet Intercat deacutemontre que le catalogage des ressources Internet est une tacircche eacutenorme

et complexe qui neacutecessite un travail deacutequipe et la collaboration de diffeacuterents acteurs Ces acteurs sont les gestionnaishyres de bibliothegraveques les speacutecialistes en deacuteveloppement de collections les eacutequishypes de catalogage les bibliotheacutecaires de reacutefeacuterence les techniciens en reacuteseautique les auteurs et les reacutedacteurs de ressourshyces Internet et les vendeurs de systegravemes pour bibliothegraveques Pour reacuteussir agrave^donner accegraves agrave linformation disponible sur divers supports au moyen dun seul systegraveme dinformation soit le catalogue dune bishybliothegraveque la coopeacuteration entre toutes ces personnes est essentielle Reacutealiser ce catalogue eacutelectronique inteacutegreacute serait le meilleur moyen pour reacutepondre aux beshysoins dinformation du public

Le projet Intercat a souleveacute dautres questions notamment celle relative agrave la deacutefinition de la nature des documents Ainsi en ce qui concerne les journaux eacutelectroniques la question est de deacutetermishyner sil sagit de bases de donneacutees ou de peacuteriodiques Des efforts sont faits pour deacutefinir la nature des journaux eacutelectronishyques leurs caracteacuteristiques et leur catalogage6 Un projet important sur le catalogage et la classification de ces jourshynaux Mr Serials a eacuteteacute meneacute agrave la North Carolina State University sous la direction dEric Lease Morgan Des proceacutedures de catalogage deacuteveloppeacutees dans le cadre de ce projet permettent dautomatiser la colshylection lorganisation larchivage lindexashytion et la diffusion des peacuteriodiques eacutelectroshyniques Ces proceacutedures de catalogage facilitent la creacuteation de notices MARC agrave partir de documents HTML en utilisant des modegraveles ou templates (Morgan 1995 1996) Ce mode de creacuteation de notices MARC agrave partir de modegraveles est une variashytion de lapproche qui consiste agrave eacutelaborer des notices MARC tireacutees de meacutetadonneacutees ou donneacutees rattacheacutees aux documents eacutelectroniques

5 Intercat est disponible agrave ladresse suivante httporcrschoclcorg6990 La base de donshyneacutees contient plus de 40 000 notices et croicirct agrave un rythme de 4 000 notices par mois environ

6 Le manuel de CONSER (pour Cooperative Online Serials Program) consacre tout un chashypitre agrave ce sujet voir httplcweblocgovacq corneraboutconhtml

140 juillet - septembre 1997

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 5: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

peuvent constamment changer De plus dans lexpeacuterience citeacutee les beacuteneacutevoles devaient faire du catalogage original et le laps de temps neacutecessaire pour la creacuteation de notices eacutelectroniques originales eacutetait long entraicircnant un problegraveme potentiel de temps et de ressources pour une telle activiteacute Enfin une autre question qui nest pas relieacutee speacutecifiquement agrave lactiviteacute de catalogage mais peut ecirctre probleacutematique a eacuteteacute souleveacutee il sagit de lentreposage et de linteacutegriteacute des donneacutees En effet qui devrait ecirctre responsable de lexactitude des donneacutees

Lusage du format MARC pour le catalogage des ressources Internet comshyporte plusieurs avantages (Sha 1995) Ce format est en fait une norme (ANSINISO Z392) qui permet de transfeacuterer des resshysources dinformation dun systegraveme agrave un autre Ainsi lors dun transfert de donneacutees ou dun changement de systegraveme cette norme assure la compatibiliteacute des donshyneacutees Une notice composeacutee en MARC fournit une structure simple et flexible pershymettant une description de diffeacuterents nishyveaux de renseignements bibliographishyques Le format MARC implique une mulshytitude de pointe daccegraves qui sont utiles agrave la recherche par mots cleacutes Ces eacuteleacutements peuvent ainsi ecirctre utiliseacutes pour limiter la recherche La description bibliographique complegravete permet aux usagers de deacutecider si la ressource en question correspond agrave leurs besoins Le format MARC rend aussi possible la modification des formats de preacutesentation Par exemple une fois introshyduites dans un systegraveme local les donneacutees peuvent ecirctre disposeacutees de diffeacuterentes fashyccedilons pour divers usages ou selon les particulariteacutes des formats daffichage de catalogues en ligne Le format MARC rend ainsi possible linteacutegration de notices catalographiques de divers types de docushyments dans le catalogue eacutelectronique dune bibliothegraveque Enfin lusage du format MARC serait un moyen pour garantir un libre accegraves aux ressources Internet car dune part les bibliothegraveques peuvent catashyloguer ces ressources et dautre part les usagers deacutepourvus daccegraves agrave Internet peushyvent consulter de tels catalogues

Ayant conclu que les ressources Internet pouvaient ecirctre catalogueacutees en utilisant les AACR2 et le format MARC OCLC a amorceacute le projet Intercat Ce deuxiegraveme projet visait agrave creacuteer une base de donneacutees en ligne regroupant des ressourshy

ces Internet catalogueacutees avec les AACR2 USMARC LCSH et des indices numeacuterishyques de classification En plus de la creacuteashytion dun tel catalogue lobjectif global eacutetait de tester et deacutevaluer lefficaciteacute de lutilisation de TUSMARC pour fournir la description le lieu et les renseignements daccegraves pour des documents accessibles agrave distance (Sha 1995)

Le projet Intercat a eacuteteacute subventionneacute en partie par le Bureau des programmes de bibliothegraveques du Deacutepartement deacutedushycation ameacutericain Au deacutepart la construcshytion de la base de donneacutees devait se reacutealiser entre le 1er octobre 1994 et le 31 mars 1996 gracircce agrave la participation de plushysieurs bibliothegraveques Le catalogue Intercat est opeacuterationnel et son deacuteveloppement se poursuit Il a eacuteteacute inteacutegreacute agrave dautres services dOCLC comme NetFirst et FirstSearch5 En 1996 il y avait environ 200 bibliothegraveshyques qui participaient au projet Avec une structure semblable agrave celles des cataloshygues de la Library of Congress dOCLC du Research Libraries Network et du Wesshytern Libraries Network la base de donshyneacutees Intercat reccediloit sauvegarde et distrishybue les notices bibliographiques fournies par les bibliothegraveques membres Le cataloshygue Intercat repreacutesente un pas important vers linteacutegration de diverses ressources dinformation dans les catalogues eacutelectroshyniques des bibliothegraveques Un autre pas majeur sera lameacutelioration des catalogues eacutelectroniques actuels et le deacuteveloppement des catalogues inteacutegreacutes au WWW utilisant la norme Z3950 ce qui facilitera laccegraves agrave linformation pour lusager Celui-ci pourra alors acceacuteder directement aux autres doshycuments catalogueacutes par des hyperliens qui seront creacuteeacutes-dans la zone 856 Des catalogues eacutelectroniques impliquant de telles options sont actuellement deacutevelopshypeacutes par plusieurs compagnies comme DRA (Data Research Associates) SIRSI WebCat INNOPAC et autres (Sha 1995) Toutefois le format USMARC ninclut pas actuellement les caractegraveres despacement comme le symbole tilde H et celui de soulignement (_) qui sont freacutequemment utiliseacutes dans les adresses URL Par conshyseacutequent il est parfois difficile deacutetablir des hyperliens agrave partir de la zone 856 lorsque les adresses comprennent de tels symboshyles

Selon Vianne Sha (1995) le projet Intercat deacutemontre que le catalogage des ressources Internet est une tacircche eacutenorme

et complexe qui neacutecessite un travail deacutequipe et la collaboration de diffeacuterents acteurs Ces acteurs sont les gestionnaishyres de bibliothegraveques les speacutecialistes en deacuteveloppement de collections les eacutequishypes de catalogage les bibliotheacutecaires de reacutefeacuterence les techniciens en reacuteseautique les auteurs et les reacutedacteurs de ressourshyces Internet et les vendeurs de systegravemes pour bibliothegraveques Pour reacuteussir agrave^donner accegraves agrave linformation disponible sur divers supports au moyen dun seul systegraveme dinformation soit le catalogue dune bishybliothegraveque la coopeacuteration entre toutes ces personnes est essentielle Reacutealiser ce catalogue eacutelectronique inteacutegreacute serait le meilleur moyen pour reacutepondre aux beshysoins dinformation du public

Le projet Intercat a souleveacute dautres questions notamment celle relative agrave la deacutefinition de la nature des documents Ainsi en ce qui concerne les journaux eacutelectroniques la question est de deacutetermishyner sil sagit de bases de donneacutees ou de peacuteriodiques Des efforts sont faits pour deacutefinir la nature des journaux eacutelectronishyques leurs caracteacuteristiques et leur catalogage6 Un projet important sur le catalogage et la classification de ces jourshynaux Mr Serials a eacuteteacute meneacute agrave la North Carolina State University sous la direction dEric Lease Morgan Des proceacutedures de catalogage deacuteveloppeacutees dans le cadre de ce projet permettent dautomatiser la colshylection lorganisation larchivage lindexashytion et la diffusion des peacuteriodiques eacutelectroshyniques Ces proceacutedures de catalogage facilitent la creacuteation de notices MARC agrave partir de documents HTML en utilisant des modegraveles ou templates (Morgan 1995 1996) Ce mode de creacuteation de notices MARC agrave partir de modegraveles est une variashytion de lapproche qui consiste agrave eacutelaborer des notices MARC tireacutees de meacutetadonneacutees ou donneacutees rattacheacutees aux documents eacutelectroniques

5 Intercat est disponible agrave ladresse suivante httporcrschoclcorg6990 La base de donshyneacutees contient plus de 40 000 notices et croicirct agrave un rythme de 4 000 notices par mois environ

6 Le manuel de CONSER (pour Cooperative Online Serials Program) consacre tout un chashypitre agrave ce sujet voir httplcweblocgovacq corneraboutconhtml

140 juillet - septembre 1997

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 6: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

SGML et TEI (Text Encoding Initiative)

Le projet Intercat a prouveacute que des normes eacutetablies comme les AACR2 et le format MARC sont adeacutequates et adaptashybles pour le catalogage de textes eacutelectroshyniques Un des problegravemes majeurs pour les speacutecialistes en catalogage qui trashyvaillent avec des documents eacutelectroniques consiste agrave extraire les renseignements neacutecessaires pour la creacuteation de notices de bonne qualiteacute Contrairement agrave la nature statique des pages imprimeacutees dun livre ou dun article de peacuteriodique laspect physishyque des documents eacutelectroniques peut varier selon le systegraveme de traitement Cet aspect physique comporte des caracteacuterisshytiques (caractegraveres gras taille et type de caractegravere) qui sont propres agrave un certain systegraveme dexploitation et agrave un certain logishyciel Si le contenu dun document eacutelectroshynique doit ecirctre reacuteutiliseacute dans un autre sysshytegraveme ou logiciel ou style les codes speacutecishyfiques devront alors ecirctre enleveacutes et de nouveaux codes devront ecirctre ajouteacutes pour reacutealiser la nouvelle disposition du texte Leacutechange de documents eacutelectroniques impliquant des meacutecanismes de balisage fonctionne bien seulement si lexpeacutediteur et le receveur utilisent le mecircme systegraveme (Gaynor 1996)

Afin dassurer luniformiteacute des docushyments des efforts sont faits dans le doshymaine de leacutedition eacutelectronique pour deacuteveshylopper des langages visant agrave transformer des pages imprimeacutees en un format eacutelecshytronique normaliseacute et transfeacuterable Ces langages preacutecisent comment lencre (ou son eacutequivalent) sera deacuteposeacutee sur le papier (ou autre support) Par exemple le language de balisage geacuteneacuteraliseacute (SGML pour Standard Generalized Markup Language) est un language descriptif Il deacutecrit la structure ou le contenu dun docushyment plutocirct que son apparence physique sur une page ou sur un eacutecran Le contenu est dissocieacute du style de preacutesentation et la nature de ce contenu ne deacutepend plus du systegraveme dexploitation ou logiciel (Gaynor 1996)

Le langage SGML deacuteveloppeacute dabord en 1970 sous le nom de GML (Generalized Markup Language) est une norme internationale depuis 1986 (norme ISO no 8879) Le SGML est un meacutetaian-gage cest-agrave dire quil deacutecrit et deacutefinit dautres langages de balisage Il possegravede

deux caracteacuteristiques il cateacutegorise des parties du texte au lieu de preacuteciser les processus de traitement de texte et il permet la deacutefinition du type de document (DTD) ce qui fournit une syntaxe normalishyseacutee pour la deacutefinition de classes de docushyments (Gaynor 1994 Sperberg-McQueen and Burnard 1994)

Le SGML est en train de devenir le format preacutefeacutereacute des reacutedacteurs agrave cause de ses capaciteacutes danalyse du contenu et de ses proprieacuteteacutes qui ne deacutependent pas dun systegraveme particulier (Cole and Kazmer 1995) Des documents codeacutes en SGML peuvent ecirctre consulteacutes par des outils de navigation Web Un des meilleurs outils de navigation SGML mis gratuitement agrave la disposition des utilisateurs dInternet est Panorama conccedilu par SoftQuad7

Pourquoi le langage SGML est-il imshyportant pour les bibliothegraveques et pour le travail de catalogage Principalement parce que le format MARC nest pas tout-agrave-fait adeacutequat lorsquon essaie deacutetablir laccegraves agrave plusieurs versions de documents numeacuteriseacutes Des projets comme le Berkeshyley Finding Aids Project et le Columbia University Digital Image Access Program ont deacutemontreacute les deacuteficiences suivantes du MARC incapaciteacute agrave structurer linformashytion analytique non bibliographique esshysentielle pour repeacuterer des documents eacutelecshytroniques et impossibiliteacute dacceacuteder agrave difshyfeacuterents niveaux danalyse (Gaynor 1996)

La complexiteacute du travail de catalogage est particuliegraverement eacutevidente lorsquon considegravere quun document peut en fait engendrer plusieurs documents difshyfeacuterents Par exemple un livre imprimeacute qui comprend des cartes geacuteographiques en couleur des dessins en noir et blanc et 300 pages de texte peut ecirctre transformeacute en un microfilm du livre complet incluant les illustrations un ensemble de 300 imashyges numeacuteriseacutees du livre complet sans les illustrations des images eacutelectroniques agrave haute reacutesolution des cartes couleurs faites agrave partir de cartes plus grandes que celles dans le livre et des reproductions numeacuterishyseacutees des illustrations agrave reacutesolution multiple faites agrave partir de diapositives des origishynaux

Le catalogage de toutes ces resshysources devrait permettre deacutetablir des liens hieacuterarchiques indiquant la source du doshy

cument et les particulariteacutes de sa transforshymation Alors que le format MARC exigeshyrait la fragmentation de composantes reshylieacutees de faccedilon hieacuterarchique en vue de creacuteer des notices seacutepareacutees et uniques le langage SGML permet denregistrer des notices structureacutees hieacuterarchiquement ce qui est fort utile pour les ressources eacutelecshytroniques Un catalogue en ligne ne serait ainsi plus horizontal mais pourrait ecirctre hieacuterarchiseacute avec des notices relieacutees entre elles agrave plusieurs niveaux (Gaynor 1996) Pour reacutealiser cela le langage SGML doit ecirctre utiliseacute avec des en-tecirctes TEI (pour Text Encoding Initiative) mises au point dans le cadre dun projet de coopeacuteration internationale du mecircme nom Ce projet visait essentiellement agrave deacutevelopper des regravegles pour faciliter la preacuteparation et leacutechange de textes eacutelectroniques Une premiegravere version complegravete des directives (Guidelines for Electronic Text Encoding and Interchange) a eacuteteacute publieacutee en 19948 Lobjectif rechercheacute eacutetait de mettre au point une meacutethode de classement compatible avec les conventions de catalogage utilishyseacutees dans les bibliothegraveques permettant de retracer lhistoire de la production ou de la transformation dun texte eacutelectronique Cette meacutethode devait donner les moyens dauthentifier la provenance dun texte et les modifications faites agrave celui-ci (Ide and Sperberg-McQueen 1995)

Len-tecircteTEl attacheacute aux documents SGML est en fait une meacutetadonneacutee Il correspond agrave un ensemble de deacutetails desshycriptifs qui est leacutequivalent de la page de titre dun livre imprimeacute laquelle comprend linformation neacutecessaire aux encodeurs pour documenter la description du docushyment Cet en-tecircte est pertinent pour trois groupes dacteurs les concepteurs de texshytes numeacuteriques qui doivent fournir une certaine documentation relative agrave leurs textes les utilisateurs de ces textes tels que les bibliotheacutecaires qui doivent structushyrer linformation pour les fins de catalogage et les chercheurs Len-tecircte TEI est comshyposeacute de quatre parties fonctionnelles la description du fichier qui documente la description bibliographique du document

7 Le logiciel de Panorama est disponible pour teacuteleacutedeacutecharger agrave httpwwwoclcorg5047 oclc researchpanorama

8 Voir httpetextvirginiaeduTEIhtml

juillet - septembre 1997 141

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 7: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

et de sa source celle de lencodage du texte celle de ses caracteacuteristiques non bibliographiques et celle des reacutevisions du texte cest-agrave-dire les changements ou les mises agrave jour apporteacutes au document Les bibliotheacutecaires sont particuliegraverement preacuteshyoccupeacutes par la section incluant la descripshytion du fichier parce quelle contient la description bibliographique du document et de sa source qui est essentielle pour repeacuterer un texte (Giordano 1995)

Selon les directives publieacutees la foncshytion des en-tecirctes TEI est dassurer que linformation neacutecessaire pour creacuteer une notice catalographique soit facilement re-peacuterable et que le lien entre cette notice et len-tecircte soit maintenu dune faccedilon aussi simple que possible (Sperberg-McQueen and Burnard 1994) Les directives explishyquent aussi que les notices MARC et les en-tecirctes TEI nont pas le mecircme rocircle Les enregistrements MARC sont fondamentashylement une version eacutelectronique dune fishyche de catalogue qui fait reacutefeacuterence agrave un objet physique Les en-tecirctes TEI fournisshysent toute linformation bibliographique tout comme une fiche de catalogue mais eacutegalement toute linformation non biblioshygraphique qui est deacuteterminante dans le traitement reacutealiseacute par des humains ou des machines du texte eacutelectronique Cette information si elle est retenue dans un enregistrement MARC doit ecirctre mise dans des notes qui nont pas la structure requise pour le repeacuterage et lanalyse par ordinashyteur Len-tecircte TEI avec ses zones desshycriptives peut ecirctre facilement repeacutereacute et analyseacute par machine et assure un lien direct avec le texte lui-mecircme relieacute aux eacuteleacutements pertinents de len-tecircte (Sperberg-McQueen and Burnard 1994)

Malgreacute ces avantages des en-tecirctes TEI le format MARC assure pour linstant leacutechange dinformation entre les cataloshygues en ligne au moyen de la norme Z3950 Tant que les catalogues nauront pas doutils de navigation pour le Web et ne seront pas compatibles avec le lanshygage SGML ce qui eacutelargirait leurs potenshytiel MARC restera la norme de choix Les directives relatives aux en-tecirctes TEI nont pas le statut de normes Cependant la Library of Congress a entrepris en 1996 le projet SGML-MARC qui a pour but de deacutevelopper une version SGML du format MARC En creacuteant des notices catalogra-phiques agrave la fois compatibles avec le forshy

mat MARC et le langage SGML ces notishyces pourraient ecirctre accessibles par des logiciels qui fonctionnent avec un des deux protocoles (Davis 1996) Ce projet vise leacutetablissement dune norme MARC-DTD qui permettrait la conversion des notices MARC en notices SGML sans perte de donneacutees ainsi que la conversion inverse (SGML vers MARC) ou en dautres mots une convertibiliteacute complegravete Un test Alpha de la version MARC-DTD a eacuteteacute entrepris en feacutevrier 1997 et les conclusions se sont aveacutereacutees positives laissant preacutesager lutilishysation agrave plus grande eacutechelle de cette vershysion9

Parallegravelement agrave ces initiatives plushysieurs projets sont en cours en vue de cataloguer des textes eacutelectroniques encodes en SGML Deux meacuteritent decirctre mentionneacutes Electronic Texts Center (ETC) agrave PUniversity of Virginia10 auquel il est possible dacceacuteder gracircce agrave un logiciel speacuteshycial permettant de visionner les documents au moyen doutils de navigation et le Center for Electronic Texts in the Humanities (CETH) agrave la Rutgers University11- Ces deux sites ont publieacute des manuels pour cataloshyguer des textes eacutelectroniques qui eacutenonshycent les proceacutedures utiliseacutees par les biblioshytheacutecaires de ces universiteacutes Agrave lUniversity of Virginia on utilise aussi des modegraveles similaires agrave ceux utiliseacutes dans le projet Mr Serials qui facilitent la creacuteation den-tecirctes TEI et leur conversion dans un format MARC

Lobjectif ultime de SGML-MARC est de permettre lutilisation universelle de ressources eacutelectroniques agrave travers divers reacuteseaux de faccedilon hieacuterarchique Cepenshydant cet objectif soulegraveve plusieurs problegraveshymes Premiegraverement bien quil y ait une norme pour la deacutefinition du type de docushyment il ny a pas encore de norme pour les en-tecirctes TEL Ainsi la qualiteacute des enregisshytrements MARC extraits des en-tecirctes TEI peut varier consideacuterablement Si les enshytecirctes eacutetaient normaliseacutes des programmes experts pourraient ecirctre mis au point pour creacuteer des notices catalographiques sans intervention humaine Mais ce processus pourrait engendrer un deacuteclin dans la quashyliteacute dapplication des normes de catalogage et rendre des outils comme les AACR2 et MARC superflus Il serait inapproprieacute de suggeacuterer la disparition du format MARC dans le futur au profit du langage SGML car les coucircts de conversion au SGML

seraient trop eacuteleveacutes Cependant le catalogage avec le format MARC pourrait ecirctre transformeacute pour inclure les mecircmes structures hieacuterarchiques qui sont possishybles avec le langage SGML (Heaney 1995) La recherche de normalisation dune meacutetadonneacutee conccedilue comme un en-tecircte repreacutesente le coeur dun autre projet dOCLC le Dublin Core

Le projet Dublin Core dOCLC

En mars 1995 OCLC et le National Centre for Supercomputing Applications (NCSA) a parraineacute la premiegravere confeacuterence sur les meacutetadonneacutees (Metadata Workshop) Cette confeacuterence devait conshytribuer agrave la compreacutehension des besoins des forces des faiblesses et des solutions preacuteconiseacutees par des utilisateurs tels que les bibliotheacutecaires et les archivistes Cette compreacutehension devait permettre deacutetablir un consensus sur les eacuteleacutements essentiels des meacutetadonneacutees pour une description adeacutequate des ressources accessibles dans Internet (Weibel Godby and Miller 1995) Ces ressources ont eacuteteacute deacutesigneacutees comme les DLO (document-like objects) qui peushyvent ecirctre assimileacutes aux versions eacutelectronishyques de journaux de dictionnaires de cartes geacuteographiques et autres mais qui nincluent pas des documents comme des diapositives ou des affichages de groupes de nouvelles Usenet Les DLO qui sont en fait les eacutequivalents numeacuteriques des proshyduits imprimeacutes sur papier eacutetaient consideacuteshyreacutes comme les ressources les plus rechershycheacutees par les utilisateurs dInternet

Le projet voulait relever un deacutefi imshyportant offrir une aide ameacutelioreacutee pour le repeacuterage des ressources DLO Puisqulnternet contient plus dinformation que tout ce que les indexeurs et les biblioshytheacutecaires professionnels peuvent geacuterer en utilisant les meacutethodes et systegravemes existants il semblait raisonnable de donshyner des outils aux auteurs et aux fournisshyseurs dinformation eacutelectronique pour leur permettre de deacutecrire eux-mecircmes leurs

9 Voir httpwwwlocgovmarcmarcdtd marcdtdalpha html

10 Voir httpwwwlibvirginiaeduetext ETChtm

11 Voir httpwwwcethrutgersedu

142 juillet - septembre 1997

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 8: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

documents et ce sans avoir une formation exhaustive sur les normes relatives agrave la creacuteation de notices bibliographiques Il sagissait donc didentifier un ensemble deacuteleacutements pertinents pour creacuteer des meacutetadonneacutees qui faciliteraient le repeacuterage des documents peu importe le sujet ou la complexiteacute du texte (Weibel Godby and Miller 1995)

Suite agrave la confeacuterence un ensemble de 13 eacuteleacutements de base a eacuteteacute deacutetermineacute pour lenregistrement de meacutetadonneacutees ensemble maintenant appeleacute Dublin Core Depuis deux eacuteleacutements ont eacuteteacute ajouteacutes et dautres ont eacuteteacute modifieacutes de sorte que depuis janvier 1997 le Dublin Core comshyprend 15 eacuteleacutements Auteur ou creacuteateur -Titre - Sujet et mots cleacutes - Description incluant les reacutesumeacutes - Eacutediteur - Date -Autres contributeurs les personnes comme leacutediteur et le transcripteur qui ont contribueacute de faccedilon significative au conshytenu intellectuel du document - Identificashyteur de ressources chaicircne ou nombre utiliseacute uniquement pour identifier lobjet -Type de ressource le type dobjet (roshyman poegraveme ou dictionnaire) - Support la preacutesentation des donneacutees constituant lobshyjet (ex des fichiers PostScript) - Relation le ou les liens avec dautres documents -Langue langue du contenu intellectuel -Source les documents imprimeacutes ou eacutelecshytroniques desquels lobjet est deacuteriveacute sil y a lieu - Couverture les caracteacuteristiques de la localisation spatiale et temporelle de lobjet - Droits dauteur pour le controcircle laccegraves et la reproduction12

Chaque eacuteleacutement est optionnel peut ecirctre reacutepeacuteteacute et peut avoir des sous-eacuteleacuteshyments afin de qualifier ou dexpliquer dashyvantage la nature des donneacutees Par exemshyple leacuteleacutement sujet pourrait avoir un sous-eacuteleacutement appeleacute zone=LCSH pour indiquer une vedette-matiegravere de la Library of Congress ou une zone=reacutesumeacute si un reacuteshysumeacute eacutetait fourni au lieu dune rubrique sujet Il faut noter que le type de meacutetadonneacutee normaliseacutee proposeacute ne presshycrit aucunement la faccedilon denregistrer linshyformation car il se veut indeacutependant de la syntaxe utiliseacutee Les donneacutees peuvent ecirctre enregistreacutees en USMARC HTML SGML ou autrement Tout ce qui peut ecirctre utiliseacute ou eacutechangeacute avec dautres systegravemes est accepteacute (Caplan 1995)

Depuis 1995 il y eu dautres deacuteveshyloppements relatifs au Dublin Core Une

autre confeacuterence sest tenue en avril 1996 au Royaume-Uni agrave la Warwick University agrave la suite de laquelle une syntaxe particushyliegravere a eacuteteacute mise au point pour le Dublin Core et qui correspond au SGML DTD Cette syntaxe a eacuteteacute relieacutee agrave des eacutetiquettes HTML existantes de faccedilon agrave incorporer des meacutetadonneacutees dans les documents Web Elle a eacuteteacute approuveacutee par le W3C agrave leacuteteacute de 1996 Cette confeacuterence a aussi permis deacutetablir le Warwick Framework soit une architecture ayant le potentiel de mettre ensemble des meacutetadonneacutees agrave strucshytures syntaxiques diverses qui sont accesshysibles et maintenues seacutepareacutement (Demp-sey and Weibel 1996) Une autre confeacuteshyrence dOCLC sur les meacutetadonneacutees relashytives aux images accessibles en reacuteseau (CNIOCLC Metatada for Networked Imashyges) tenue en septembre 1996 a rendu possible lutilisation du Dublin Core dans le domaines des images (Weibel and Miller 1997) Enfin la confeacuterence la plus reacutecente (DC-4 Down Under) qui a eu lieu agrave Canberra en Australie en mars 1997 a engendreacute une proposition de demande formelle pour faire du Dublin Core une norme internationale

Le Dublin Core est semblable agrave lenshytecircte TEI parce quil nest quun en-tecircte pour texte numeacuterique mais il ne se limite pas au langage de balisage geacuteneacuteraliseacute (SGML) Cependant il comporte quelques problegravemes Les donneacutees introduites agrave la source par les auteurs et non par des bibliotheacutecaires professionnels peuvent eacutechapper au controcircle et compromettre ainsi leur fiabiliteacute pour les fins de repeacuterage Par deacutefinition les formes dencodage et les speacutecifications du Dublin Core ne seront jamais autant normaliseacutees que ne lest le format USMARC Toutefois il est possible dimaginer que les reacuteseaux de bibliothegraveshyque puissent importer certains eacuteleacutements du Dublin Core et les transformer en notishyces USMARC (Xu 1996) Ce sceacutenario a deacutejagrave eacuteteacute discuteacute dans deux rapports du comiteacute MARBI (Discussion Paper sect86 June 1995 Discussion Paper99 January 1997)13

En lien avec ce projet le concept de semantic interoperability ou la capaciteacute dopeacuteration seacutemantique entre divers sysshytegravemes est en train de prendre de limporshytance Pour deacutevelopper cette ideacutee le Dublin Core pourrait fournir un modegravele suffisamment simple pour ecirctre implanteacute dans plusieurs systegravemes descriptifs et

assez complet pour faciliter la recherche documentaire Bien que chaque eacuteleacutement descriptif soit limiteacute agrave un champ preacutecis un chevauchement seacutemantique creacutee de ce fait un noyau de champs descriptifs Ce noyau pourrait servir aux usagers de point de deacutepart pour commencer une recherche impliquant une varieacuteteacute de types de resshysources accessibles sur de multiples supshyports (Weibel 1996) Un projet conjoint auquel participent les bibliothegraveques natioshynales dAustralie et de Nouvelle-Zeacutelande appeleacute le National Document and Informashytion Service (NDIS) vise preacuteciseacutement agrave appliquer le Dublin Core de cette faccedilon14

Les URC les URN et les PURL

Plusieurs autres projets de rechershyche sur le catalogage des ressources Internet progressent actuellement et sont connus sous le terme geacuteneacuteral URI (Uniform Resource Identifiers) ou identificateurs uniformes de ressources puisquils sont produits par le Uniform Resource Identifier Working Group of the Internet Engineering Task Force (Caplan 1996) Ce groupe travaille agrave deacutevelopper des outils en vue dameacuteliorer le repeacuterage de documents On connaicirct le terme URL signifiant localisateur uniforme de ressources (Uniform Resource Locator) qui est en fait ladresse dun document Web URC correspond aux cashyracteacuteristiques uniformes dune ressource (Uniform Resource Characteristic) et URN est le titre uniforme dune ressource (Uniform Resource Name) qui a eacuteteacute proshyposeacute pour assigner des identificateurs uniques et indeacutependants des lieux des documents Ce dernier outil est semblable aux ISBN utiliseacutes dans leacutedition (Xu 1996)

Les URC garantissent le repeacuterage par machine des ressources et ont eacuteteacute proposeacutes comme un moyen de connexion entre les URN et les URL Si ladresse URL change les usagers autoriseacutes peuvent entrer dans le service dURC pour modifier ladresse URL qui est relieacutee au URN Cela signifie que TURN ne change pas mecircme si

12 Voir httppurlorgmetadatadublin_core elements

13 Les deux documents sont disponibles agrave gophermarvellocgov7waissrc3a waissrcusmarc-dmarbi

14 Voir httpwwwnlagovau2ZNDIS

juillet - septembre 1997 143

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 9: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

ladresse URL est modifieacutee LURC peut contenir des meacutetadonneacutees relatives agrave lauteur au titre agrave leacutediteur et au sujet lesquelles peuvent faciliter la recherche documentaire

De plus TURC peut inclure dautres renseignements comme des signatures eacutelectroniques de linformation sur la reacutevishysion du document qui assure lauthenticiteacute de la ressource de linformation sur les restrictions relatives agrave lutilisation du texte ou des eacuteleacutements permettant de retracer lhistoire de la production ou de leacutedition du document (Xu 1996) Toutes ces caracteacuteshyristiques rendent TURC tregraves inteacuteressant pour les eacutediteurs de journaux eacutelectronishyques

La derniegravere version des speacutecificashytions dURC est baseacutee sur les 15 eacuteleacutements du Dublin Core ce qui devrait encourager les auteurs et les eacutediteurs agrave fournir des renseignements sur leurs propres ressourshyces Les URN seraient connecteacutes aux sershyveurs de recherche qui stockeraient les meacutetadonneacutees Les bibliotheacutecaires pourshyraient se servir des meacutetadonneacutees pour creacuteer des descriptions plus complexes et complegravetes telles que des notices catalographiques et des en-tecirctes TEL Lasshypect important agrave noter est quil ne serait plus neacutecessaire de stocker les URL qui changent souvent dans la zone 856 dune notice MARC mais seulement les URN lesquels ne sont pas variables (Caplan 1996) Il sagit dune solution pertinente au problegraveme des documents Internet qui sont deacuteplaceacutes qui changent de titre ou dadresse ou qui disparaissent entiegravereshyment soit le problegraveme des cibles qui boushygent (moving target problem)

Une solution inteacuterimaire pour le proshyblegraveme dURN est deacuteveloppeacutee par OCLC et elle est connue sous le nom de PURL (Persistent Uniform Resource Locator)15 Du point de vue de son fonctionnement un PURL est un URL mais au lieu dindiquer ladresse dune ressource Internet direcshytement comme un URL le PURL indique un service inteacuterimaire de recherche Le service de recherche associe le PURL avec PURL et renvoie lURL au client qui peut donc compleacuteter la consultation dune faccedilon normale Les logiciels utiliseacutes par les administrateurs de PURL surveillent et mettent agrave jour les URL Gracircce agrave ce service ladresse fournie dans le champ 856 dune

notice MARC indiquerait toujours le PURL et en assurerait la stabiliteacute

La classification des ressources Internet et laccegraves theacutematique

La possibiliteacute dutiliser des systegravemes de classification et des vedettes-matiegravere pour les ressources Internet existe aujourdhui gracircce agrave la norme MARC au deacuteveloppement des MARC-DTD et des en-tecirctes TEI ainsi que du Dublin Core La classification sert dabord agrave deacuteterminer ougrave se trouvent les documents sur les rayons agrave regrouper des documents autour dun mecircme sujet et agrave fournir des balises pour leur exclusion En ce qui concerne la reshycherche documentaire la classification joue un rocircle important car elle permet agrave un utilisateur de fureter sur les rayons de naviguer didentifier deacutevaluer et de filtrer les documents Dans le domaine de la gestion des documents la classification est essentielle pour la gestion des fonds la gestion des bases de donneacutees et la construction et lentretien des theacutesaurus Un environnement eacutelectronique permet lutilisation simultaneacutee de plusieurs systegraveshymes de classification et par conseacutequent offre une meilleure preacutecision et un meilleur rappel Il existe deacutejagrave des zones dans le format MARC pour les indices de classifishycation Ces zones pourraient facilement ecirctre ajouteacutees aux MARC-DTD aux enshytecirctes TEI au Dublin Core et aux notices URC Actuellement il y a tregraves peu de sites sur Internet comme celui de CyberStacks susmentionneacute qui se servent de systegravemes de classification Il a eacuteteacute proposeacute dintroshyduire des indices de classification dans les adresses URL pour creacuteer une certaine structure dans les ressources Internet (Lincicum 1996)

OCLC a deacutejagrave amorceacute des rechershyches sur la classification automatique des ressources accessibles en reacuteseau Un de leurs projets consistait agrave assigner automashytiquement des numeacuteros de classification Dewey agrave laide de 1 800 vedettes-matiegravere de la Library of Congress agrave des publicashytions pour les jeunes OCLC a aussi entreshypris des expeacuteriences visant agrave utiliser lencodage SGML avec lindex de la Classification deacutecimale Dewey La creacuteashytion dun DTD pour cet index pourrait ecirctre le premier pas vers la creacuteation ou la resshytructuration de systegravemes de classification nouveaux ou en usage Une autre solution

envisageacutee consistait agrave rendre disponible les outils de classification et de catalogage en formant les auteurs agrave classifier et agrave regrouper leurs oeuvres dans Internet (Wyly 1996)

Les systegravemes de classification deacutecishymale Dewey (CDD) et CDU sont les deux systegravemes les plus faciles agrave adapter pour des manipulations par machine Une vershysion lisible par machine de CDD existe deacutejagrave car elle possegravede des caracteacuteristiques importantes pour le classement de resshysources Internet telles que 1 un systegraveme de numeacuteration hieacuterarchique 2 la particushylariteacute de permettre la recherche en passhysant du geacuteneacuteral au particulier puisquon peut identifier un indice numeacuterique geacuteneacuteshyral qui inclut des indices speacutecifiques 3 des niveaux de speacutecificiteacute 4 un filtrage efficace 5 un controcircle des synonymes 6 des traits mneacutemoniques 7 des sous-divishysions normaliseacutees 8 une manipulation efficace par ordinateur et 9 une possibiliteacute dindexation semi-automatique (Micco 1995 Part 2)

Un bon systegraveme de classification des ressources Internet doit ecirctre relieacute agrave un ensemble de vedettes-matiegravere construit agrave partir dun vocabulaire controcircleacute Bien que les bibliotheacutecaires aient deacuteveloppeacute de multiples outils pour le controcircle de vocashybulaire entre autres LCSH et plusieurs thesauri il ny a pas eu jusquici suffisamshyment dinteacuterecirct ou de ressources financiegraveshyres pour automatiser ces outils Des liens entre les indices de classification les tershymes controcircleacutes et non controcircleacutes dans les reacutesumeacutes et les textes des documents aideshyraient grandement les utilisateurs agrave formushyler des strateacutegies de recherche adeacutequates et agrave filtrer linformation (Micco 1995) Si un systegraveme dautoriteacute de controcircle des noms eacutetait en place dans Internet les utilisashyteurs pourraient veacuterifier la forme approshyprieacutee des noms En labsence de systegraveme expert agrave cet effet lintervention des professhysionnels en catalogage demeure neacutecesshysaire

15 Voir OCLC PURL Frequently Asked Quesshytions httppurloclc orgdocspurljaqhtmT) pour nimporte quelle information sur PURLs

144 juillet - septembre 1997

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 10: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

Conclusion

Lexamen de quatre projets majeurs et de plusieurs initiatives mineures a fait ressorshytir les deacutefis entourant le catalogage des ressources Internet Le projet Intercat a eacuteteacute un succegraves compte tenu de la creacuteation dune base de donneacutees de ressources eacutelectroniques qui contient maintenant plus de 4 000 documents Le projet SGML-TEI a connu un certain succegraves malgreacute quelshyques limites Un problegraveme de deacutedoubleshyment a eacuteteacute souleveacute puisque les bibliotheacuteshycaires doivent creacuteer des notices MARC ainsi que des en-tecirctes TEL De plus ces en-tecirctes sont souvent utiliseacutes de pair avec la numeacuterisation de textes reacutealiseacutee avec des logiciel de reconnaissance optique de caractegraveres qui ne sont pas toujours fiables et demandent une relecture des textes Enfin la question des droits dauteurs nest pas reacutesolue Par conseacutequent seulement les textes sans droits dauteurs sont pour linstant numeacuteriseacutes ce qui veut dire que les meilleurs textes ainsi que les plus reacutecents ne sont pas disponibles sous forme numeacuterique Le projet Dublin Core est enshycore en deacuteveloppement mais reacutecemment agrave une confeacuterence sur le concept de meacutetadonneacutee tenue agrave la Bibliothegraveque natioshynale du Canada (mars 1997) Stuart Weibel dOCLC a annonceacute que le goushyvernement du Danemark implanterait bienshytocirct le systegraveme Dublin Core pour ses publishycations gouvernementales ainsi que pour sa bibliographie nationale

Lampleur de ces projets de rechershyche donne une ideacutee de la complexiteacute du travail neacutecessaire agrave lorganisation des resshysources Internet et de limmense deacutefi que les bibliotheacutecaires doivent relever pour mettre de lordre dans le chaos actuel Des problegravemes de diffeacuterents ordres existent - les ressources Internet eacutetant toujours en eacutevolution le maintien de notices bibliograshyphiques exige beaucoup de temps mais cet effort est neacutecessaire pour que les notishyces continuent decirctre utiles - il ny a pas de document physique agrave examiner la docushymentation est enfouie dans les fichiers - les documents doivent donc ecirctre lus pour quon leur assigne des vedettes-matiegravere et des indices de classification - il nexiste pas encore beaucoup de notices biblioshygraphiques de ressources internet regroushypeacutees dans des bases de donneacutees qui pourraient servir de modegravele pour le catalogage deacuteriveacute - la question de droits

dauteur reste probleacutematique - linteacutegriteacute des documents est difficile agrave garantir -enfin les problegravemes darchivage et denshytreposage de ressources eacutelectroniques demeurent entiers (Weihs 1996)

Les utilisateurs dInternet demandent deacutejagrave et revendiqueront davantage un meilleur accegraves aux ressources eacutelectronishyques Du point de vue des bibliotheacutecaires lactiviteacute traditionnelle de catalogage est en train decirctre redeacutefinie Il est clair que de plus en plus de postes de bibliotheacutecaires au catalogage sont reacuteorienteacutes vers le catalogage et la classification de ressourshyces numeacuteriques Cette reacuteorientation est accompagneacutee dun plus grand besoin de compeacutetences chez les professionnels afshyfecteacutes au catalogage Les besoins de forshymation initiale et deacuteducation permanente sont nombreux Pour cataloguer les resshysources Internet les bibliotheacutecaires doishyvent posseacuteder les connaissances tradishytionnelles les AACR2 le format MARC lanalyse documentaire le controcircle dautoshyriteacute les systegravemes de classification et soushyvent des langues eacutetrangegraveres En plus de deacutetenir les habileteacutes relatives agrave lutilisation de ces connaissances ils doivent posseacuteshyder aussi des connaissances pour conceshyvoir et deacutevelopper des bases de donneacutees une connaissance des langages de balishysage tels le SGML le HTML et autres langages de programmation et de descripshytion une connaissance des protocoles et de la terminologie Internet une connaisshysance des logiciels et des normes utiliseacutes pour la preacutesentation des divers documents numeacuteriseacutes incluant les outils de navigashytion les navigateurs en mode graphique les catalogues eacutelectroniques utiliseacutes dans le Web la norme Z3950 etc une conshynaissance des enjeux leacutegaux et commershyciaux concernant laccegraves lutilisation et leacutedition des ressources eacutelectroniques une connaissance approfondie des besoins et des exigences des usagers quant aux documents numeacuteriseacutes

Les reacutesultats dune enquecircte reacutecente aux Eacutetats-Unis indiquent que seulement 6 des eacutetudiants inscrits dans les proshygrammes de maicirctrise en bibliotheacuteconomie choisissent le catalogage comme speacuteciashylisation (Zyroff 1996) Est-ce que ce pheacuteshynomegravene suggegravere que les eacutetudiants nenshytrevoient plus les possibiliteacutes demploi dans ce domaine ou quils ont limpression decirctre insuffisamment preacutepareacutes agrave cette speacutecialishy

sation ou encore quils doutent de la quashyliteacute de la formation offerte dans les proshygrammes Il faut effectivement se demanshyder si les eacutecoles de bibliotheacuteconomie et des sciences de linformation couvrent bien tous les volets dune formation en catalogage qui permettront aux futurs proshyfessionnels dexceller dans ce domaine

Un des aspects les plus importants du catalogage des ressources eacutelectronishyques est la coopeacuteration neacutecessaire agrave la creacuteation et au maintien de normes internashytionales de catalogage Cette coopeacuteration est la cleacute qui permettra leacutechange efficace de linformation agrave travers la communauteacute Internet Les bibliotheacutecaires ont toujours eacuteteacute engageacutes dans leacutetablissement de norshymes Avec la prolifeacuteration des ressources Internet de nouvelles normes devront ecirctre creacuteeacutees et celles qui existent devront ecirctre adapteacutees et continuellement mises agrave jour La Library of Congress et OCLC prennent les devants pour deacutevelopper ces normes mais lengagement des bibliotheacutecaires dans lapplication de celles-ci sera vraishyment leacuteleacutement deacuteterminant pour lorganishysation de linformation eacutelectronique Les bibliotheacutecaires ont donc la responsabiliteacute professionnelle dapporter leur expertise et leurs connaissances dans le reacuteseau Internet Toutefois tout indique que leur rocircle dans cet univers en matiegravere de catalogage sera transformeacute Eacutetant donneacute la prolifeacuteration des ressources Internet et limmense travail de catalogage original neacutecessaire agrave lorganisation de ces resshysources la participation des usagers dInternet au processus de catalogage et de classification de ces documents semshyble ecirctre une tendance ineacutevitable En fait si le pheacutenomegravene Internet est en train deacutelimishyner la distinction entre producteur et utilishysateur dinformation car lun peut ecirctre lautre nous pouvons nous demander si nous ne sommes pas en train dassister eacutegalement agrave leacutelimination de la distinction entre producteurutilisateur et organisashyteur dinformation Il semble dores et deacutejagrave que les bibliotheacutecaires en catalogage auront donc un rocircle deformation important aupregraves de la communauteacute des internautes qui consistera agrave les former agrave lutilisation de systegravemes de classification et de normes de catalogage On peut ainsi imaginer une situation ougrave les bibliotheacutecaires devront non seulement former le public agrave utiliser les ressources Internet mais devront aussi former un autre public agrave organiser ces

juillet - septembre 1997 145

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 11: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

ressources condition essentielle pour permettre leur exploitation maximale Cette fonction peut impliquer la creacuteation de bishybliotheacutecaires virtuels assurant une telle formation dans le cyberespace Les proshyjets deacutecrits deacutemontrent que lorganisation de linformation dans le reacuteseau Internet est possible Deacuteterminer le rocircle des bibliotheacuteshycaires et celui des autres acteurs implishyqueacutes de mecircme que les connaissances et habileteacutes dont ils auront besoin pour releshyver ce deacutefi est donc de toute premiegravere importance

Sources consulteacutees

Basili Caria 1995 Subject searching for informashytion What does it mean in todays Internet environment Electronic Library 13(5) 459-466

Beck Melissa et al 1996 Module 31 Remote access computer file serials Washington DC CONSER Library of Congress (URL = http leweb locgovacqconsermodule3 1 html)

Beckett David 1995 IAEA templates in use as Internet metadata Canterbury University of Kent Computing Laboratory (URL = http www hensa ac uktoolswwwiafatoolspaper paperhtml)

Brugger Judith M 1996 Cataloging for digital libraries Cataloging amp Classification Quarterly 22 (34) 59-74

Bumard Lou 1995 What is SGML and how does it help Computers and the Humanities 29 (1) 41-50

Caplan Priscilla 1993 Cataloging Internet resources Public-Access Computer Systems Review 4 (2) 61-66 (URL = gopher infolibuhedu00articlese-journals uhlibrarypacsreviewv4n2caplan4nl)

1994 Controlling E-Journals The Internet resources project cataloging guidelines and USMARC Serials Librarian 24 ( 3-4) 103-111

1995 You call it corn we call it syntax-independent metadata for document-like objects Public Access Computer Systems Review 6 (4) (URL = httpinfolibuheduprv6n4 capl6n4html)

- 1996 U-R-stars Standards for controlling Internet resources Serials Librarian 28 (34) 239-246

Caplan Priscilla and Rebecca Guenther 1996 Metadata for Internet resources The Dublin Core metadata elements set and its mapping to USMARC Cataloging amp Classification Quarterly 22 ( 34) 43-58

Chan Lois Mai 1996 Classification present and future Cataloging amp Classification Quarterly 21 ( 2) 5-17

Clark Mae M Michael D Esman and Claudia V Weston 1994 Cataloging challenges providing bibliographic access to Floridas full-text electronic state documents Cataloging amp Classhysification Quarterly 18 ( 3-4) 97-119

Cochenour Dormice 1994 Linking remote users and information Cataloging Internet publicashytions Colorado Libraries 20 (Fall) 20-23

Cole Timothy W and Michelle M Kazmer 1995 SGML as a component of the digital library Library Hi Tech 13 (4) 75-90

Davis Stephen Paul 1996 SGML-MARC Incorporating library cataloging into the TEI environment Presentation originally delivered on March 23 1996 at the workshop on laquoThe Text Encoding Initiative and Guidelines and their Application to Building Digital Librariesraquo held in conjunction with the First ACM Internashytional Conference on Digital Libraries 1996 Bethesda Md New York Columbia Univershysity (URL =httpwww columbiaeducu librariesinsideprojectssgmlsgmlmarc davis9603htmt)

Demas Samuel Peter McDonald and Gregory Lawrence 1995 The Internet and collection development Mainstreaming selection of Internet resources Library Resources amp Technical Services 39 (3) 275-290

Dempsey Lorcan and Stuart L Weibel 1996 The Warwick metadata workshop A framework for the deployment of resource description D-Lib Magazine (URL = httpwwwdliborgdlib july9607weibelhtml)

Dillon Martin and Eric Jul 1994 Assessing inforshymation on the Internet Toward providing library services for computer-mediated communicashytion OCLC Systems and Services 10 86-92

1996 Cataloging Internet resources The convergence of libraries and Internet resources Cataloging amp Classification Quarterly 22(3 4) 197-206

Dillon Martin et al 1994 The OCLC Internet resources project Toward providing library services for computer-mediated communicashytion Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 54-69

Drabenstott Karen Markey and Pauline Atherton Cochrane 1994 Improvements needed for better subject access to library catalogs via the Internet Clinic on Library Applications of Data Processing (30th 1993 University of Illinois at Urbana-Champaign) Urbana University of Illinois at Urbana-Champaign Graduate School of Library amp Information Science 70-83

Dunkle Clare B 1996 Outsourcing the catalog department A meditation inspired by the busishyness and library literature Journal of Academic Librarianship 22 (1) 33-44

Fattig Karl and Rick Block 1997 Cataloging Internet resources Policy procedure and practice Technicalities 17(1) 1 3-6

Flannery Melinda Reagor 1995 Cataloging Internet resources Bulletin of the Medical Library Asshysociation 83(2) 211-215

Floridi Luciano 1996 The Internet Which future for organised knowledge Frankenstein or Pygmalion Part 1 Electronic Library 14 (1) 43-48

1996 The Internet Which future for organised knowledge Frankenstein or Pygmashylion Part 2 Electronic Library 14 (1) 49-52

Gaynor Edward 1994 Cataloging electronic texts The University of Virginia library experience Library Resources amp Technical Services 38(4) 403-413

1996 From MARC to markup SGML and online library systems ALCTS Newsletter 1 (2) Supplement A-D

Giordano Richard 1994 The Documentation of electronic texts using text encoding initiative Headers An Introduction Library Resources amp Technical Services 38 (4) 389-401

1995 The TEI header and the documentashytion of electronic texts Computers and the Humanities 29 (1) 75-84

Heaney Michael 1995 Object-oriented cataloging Information Technology and Libraries 14 (3) 135-153

Heery Rachel 1996 Review of metadata formats Program 30 (4) 345-373

Hockey Susan 1993 Developing access to electronic texts in the humanities Computers in Libraries 13 (3) 41-43

Hoogcarspel Annelies 1994 Guidelines for cataloging monographic electronic texts at the Center for electronic texts in the humanities New Brunswick NJ CETH (Postscript URL = httpcethmacprincetonedudocscatguidps)

Hruska Martha 1995 Remote Internet serials in the OP AC Serials Review 21 (4) 68-70

Hsieh-Yee Ingrid 1996 Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqhsieh htm)

Ide Nancy M and CM Sperberg-McQueen 1995 The TEI History goals and future Computers and the Humanities 29 (1) 5-15

Leahy Sheila and Richard J Smith 1992 A suggested guide and comments for cataloging electronic files Technicalities 12 8-11

146 juillet - septembre 1997

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147

Page 12: Cataloguer le cyberespace : le défi des ressources ... · 2291-8949 (numérique) Découvrir la revue Citer cet article Panchyshyn, R. & Bouthillier, . (1997). Cataloguer le ... Cataloguer

Documentation et bibliothegraveques

Lincicum Shirley 1996 Critical appraisal of the use of classification in the future Non-traditional uses of classification Report of a panel discusshysion Cataloging amp Classification Quarterly 21 (2) 87-89

Lougee Wendy P 1995 Beyond access New conshycepts new tensions for collection development in a digital environment Collection Building 14 (3) 19-25

Mandel Carol A and Robert Wolven 1996 Intellectual access to digital documents Joining proven principles with new technologies Cataloging amp Classification Quarterly 22 (3 4) 25-42

Micco Mary 1995 Subject authority control in the world of the Internet (Part 1) ALCTS Newsletter 6 (5) Supplement A-D

1995 Subject authority control in the world of the Internet (Part 2) ALCTS Newsletter 6 (6) Supplement A-D

Molholt Pat 1996 Qualities of classification schemes for the information superhighway Cataloging amp Classification Quarterly 21 (2) 19-22

Morgan Eric Lease 1995 Adding Internet resources to Our OPACs Serials Review 21 (4) 70-72

1995 Description and evaluation of the Mr Serials process Automatically collecting organizing archiving indexing and disseminating electronic serials Serials Review 21 (4) 1-12

1996 Mr Serials revisits cataloging Cataloging electronic serials and Internet resources Serials Librarian 28 (34) 229-238

Olson Nancy B 1995 Cataloging Internet resources A manual and practical guide Dushyblin Ohio OCLC (URL = httpwwwoclcorg oclcman9256cattoc h tm)

Price-Wilkin John 1994 Using the World-Wide Web to deliver complex electronic documents implications for libraries The Public-Access Computer Systems Review 5 (3) 5-21 (URL = gopher-Jinfo lib uh edu00articlese-jour nais uhlibrarypacsreviewv5n3pricewil5n3)

Reynolds Regina 1995 Inventory list or informashytion gateway The role of the catalog in the digital age Serials Review 21 (4) 75-77

Rosenfeld Louis B 1994 Guides clearinghouses and value-added repackaging Some thoughts on how librarians can improve the Internet Reference Services Review 22 (4) 11-16

Seaman David M 1996 Selection access and control in a library of electronic texts Cataloging amp Classification Quarterly 22 (34) 75-84

Sha Vianne T 1995 Cataloging Internet resources The Library approach Electronic Library 13 (5) 467-476

Sha Vianne T Timothy B Patrick and Thomas R Kochtanek 1996 The traditional library and the national information infrastructure Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 191996 Dublin Ohio OCLC (URL = http www oclc orgoclcmancolloqsha htm)

Shieh Jackie 1996 Does it really matter The cataloging format the sequential order of note fields and the specifics of field 856 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqshieh htm)

Sperberg-McQueen CM and Lou Bumard 1995 The design of the TEI encoding scheme Computers and the Humanities 29 (1) 17-39

Sperberg-McQueen CM and Lou Burnard eacutedishyteurs 1994 Guidelines for electronic text encoding and interchange Chicago Text Encoding Initiative (URL = http etext Virginia eduTEI htm Icirc)

Thorburn Colleen 1992 Cataloging remote electronic journals and databases The Serials Librarian 23 (1-2) 11-23

Venditto Gus 1996 Search engine showdown Internet World 7 (5) 79-86

Vizine-Goetz Diane 1996 Using library classificashytion schemes for Internet resources Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwwwoclcorgoclc mancolloqv-g htm)

Weibel Stuart 1996 The changing landscape of networked resource description Library Hi Tech 14 (1) 7-10

Weibel Stuart and Eric Miller 1997 Image descripshytion on the Internet A summary of the CNI OCLC Image Metadata Workshop D-Lib Mashygazine (URL = httpwwwdliborgdlib january9 7oclc01 weibel html)

Weibel Stuart Jean Godby and Eric Miller 1995 OCLCNCSA Metadata Workshop Report Dublin Ohio OCLC (URL = http www oclc org 504 7oclcresearchpublications weibelmetadatadublin_core report htm I)

Weihs Jean 1996 Solving the Internet cataloging nightmare Technicalities^ (4) 4-6

Wool Gregory James 1996 Bibliographical metadata or we need a client-server cataloging code Proceedings of the conference Finding Common Ground Creating a Library of the Future Without Diminishing the Library of the Past (March 30-31 1996 Cambridge MA) Ed by Cheryl LaGuardia and Barbara A Mitchell New York Neal Schuman Available via e-mail at listservubvmccbuffaloedu with command laquoget metadata reportraquo

Wyly Brendan 1996 What lies ahead for classifishycation in information networks Report of a panel discussion Cataloging amp Classification Quarterly 21 (2) 75-82

Xu Amanda 1996 Accessing information on the Internet feasibility study of USMARC format and AACR2 Proceedings of the OCLC Internet Cataloging Colloquium San Antonio Texas Jan 19 1996 Dublin Ohio OCLC (URL = httpwww oclc orgoclcmancolloqxu htm)

ZyrofF Ellen 1996 Cataloging is a prime number American Libraries 27 (5) 47-50

juillet - septembre 1997 147