8
Tous droits réservés © Association pour l'avancement des sciences et des techniques de la documentation (ASTED), 2011 Ce document est protégé par la loi sur le droit d’auteur. L’utilisation des services d’Érudit (y compris la reproduction) est assujettie à sa politique d’utilisation que vous pouvez consulter en ligne. https://apropos.erudit.org/fr/usagers/politique-dutilisation/ Cet article est diffusé et préservé par Érudit. Érudit est un consortium interuniversitaire sans but lucratif composé de l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal. Il a pour mission la promotion et la valorisation de la recherche. https://www.erudit.org/fr/ Document généré le 22 mars 2021 16:24 Documentation et bibliothèques Bibliothèques et accès à l’information multilingue : pour en finir avec Babel Libraries and Access to Multilingual Information: The End of Babel Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro 4, octobre–décembre 2011 URI : https://id.erudit.org/iderudit/1028989ar DOI : https://doi.org/10.7202/1028989ar Aller au sommaire du numéro Éditeur(s) Association pour l'avancement des sciences et des techniques de la documentation (ASTED) ISSN 0315-2340 (imprimé) 2291-8949 (numérique) Découvrir la revue Citer cet article Ménard, E. (2011). Bibliothèques et accès à l’information multilingue : pour en finir avec Babel. Documentation et bibliothèques, 57 (4), 205–211. https://doi.org/10.7202/1028989ar Résumé de l'article La bibliothèque est de plus en plus confrontée à des demandes complexes sur les plans multimédia, multiculturel et multilingue. Cet article évoque les défis auxquels font face les bibliothèques à l’heure du numérique. La problématique de l’accès à l’information multilingue est décrite, de même que les solutions proposées par divers travaux de recherche.

Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

Tous droits reacuteserveacutes copy Association pour lavancement des sciences et destechniques de la documentation (ASTED) 2011

Ce document est proteacutegeacute par la loi sur le droit drsquoauteur Lrsquoutilisation desservices drsquoEacuterudit (y compris la reproduction) est assujettie agrave sa politiquedrsquoutilisation que vous pouvez consulter en lignehttpsaproposeruditorgfrusagerspolitique-dutilisation

Cet article est diffuseacute et preacuteserveacute par EacuteruditEacuterudit est un consortium interuniversitaire sans but lucratif composeacute delrsquoUniversiteacute de Montreacuteal lrsquoUniversiteacute Laval et lrsquoUniversiteacute du Queacutebec agraveMontreacuteal Il a pour mission la promotion et la valorisation de la recherchehttpswwweruditorgfr

Document geacuteneacutereacute le 22 mars 2021 1624

Documentation et bibliothegraveques

Bibliothegraveques et accegraves agrave lrsquoinformation multilingue pour enfinir avec BabelLibraries and Access to Multilingual Information The End ofBabelBibliotecas y acceso a la informacioacuten multilinguumle para ponerlefin a BabelElaine Meacutenard

Volume 57 numeacutero 4 octobrendashdeacutecembre 2011

URI httpsideruditorgiderudit1028989arDOI httpsdoiorg1072021028989ar

Aller au sommaire du numeacutero

Eacutediteur(s)Association pour lavancement des sciences et des techniques de ladocumentation (ASTED)

ISSN0315-2340 (imprimeacute)2291-8949 (numeacuterique)

Deacutecouvrir la revue

Citer cet articleMeacutenard E (2011) Bibliothegraveques et accegraves agrave lrsquoinformation multilingue pour enfinir avec Babel Documentation et bibliothegraveques 57 (4) 205ndash211httpsdoiorg1072021028989ar

Reacutesumeacute de larticleLa bibliothegraveque est de plus en plus confronteacutee agrave des demandes complexes surles plans multimeacutedia multiculturel et multilingue Cet article eacutevoque les deacutefisauxquels font face les bibliothegraveques agrave lrsquoheure du numeacuterique La probleacutematiquede lrsquoaccegraves agrave lrsquoinformation multilingue est deacutecrite de mecircme que les solutionsproposeacutees par divers travaux de recherche

DOCUMENTATION B I B L I O H H Egrave Q U E S

Bibliothegraveques et accegraves agrave linformation multilingue pour en finir avec Babel

ELAINE MENARD School of Information Studies McGill University Montreacuteal Canada elainemenardmcgillca

RESUME | ABSTRACTS | RESUMEN

La bibliothegraveque est de plus en plus confronteacutee agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue Cet article eacutevoque les deacutefis auxquels font face les bibliothegraveques agrave lheure du numeacuterique La probleacutematique de laccegraves agrave Vinforma-tion multilingue est deacutecrite de mecircme que les solutions proposeacutees par divers travaux de recherche

Libraries and Access to Multilingual Information The End of Babel

The library is being increasingly confronted by complex demands for multimedia multicultural and multilingual materials This article describes some of the challenges faced by libraries in a digital era The problems associated with the access to multilingual information are described as well as solutions proposed by various research projects

Bibliotecas y acceso a la informaciocircn multilingue para ponerle fin a Babel

La biblioteca enfrenta cada dia pedidos mas complejos en el arnbito multimedial multicultural y multilingue Este articulo evoca los desafios que enfrentan las bibliotecas en la era digital Se describe la problemacirctica del acceso a la informaciocircn multilingue asi como las soluciones propuestas a traveacutes de varios trabajos de investigaciocircn

Cette reacuteflexion a eacuteteacute preacutesenteacutee lors de la table ronde laquo Bibliothegraveques et Sciences de linformation les projets de recherche comme espaces de dialogue raquo dans le cadre des Entretiens Jacques-Cartier Lyon 24 novembre 2010 This paper was presented at the laquo Libraries and Information Sciences Research Projects as a Places of Dialogue raquo round table held at the Entretiens Jacques-Cartier in Lyon November 242010 Esta reflexion fue presentada durante la mesa redonda laquo Bibliotecas y ciencias de la informaciocircn proyectos de investigaciocircn como espacios de diacirclogo raquo en el marco de las Conversaciones en el centro Jacques-Cartier que se desarrollaron en Lyon el 24 de noviembre de 2010

La bibliothegraveque du xxie siegravecle

TRADITIONNELLEMENT la bibliothegraveque acquiert des documents sur supports imprimeacutes tels que des livres journaux cartes illustrations etc

Cette image un peu poussieacutereuse un peu suranneacutee de la bibliothegraveque a pourtant eacutevolueacute depuis quelques anneacutees Malgreacute cette conception quelque peu erroneacutee mais largement reacutepandue la bibliothegraveque ne se limite plus seulement agrave lacquisition de documents sur support papier Agrave lheure du numeacuterique leffort des biblioshythegraveques se porte maintenant sur lorganisation et la mise en valeur des collections fort diffeacuterentes La biblioshythegraveque avec lavegravenement des documents agrave contenu numeacuterique entre de plain-pied en compeacutetition avec les intervenants aussi nouveaux que diffeacuterents que sont les sites commerciaux les blogs et autres sites Web issus de reacuteseaux sociaux offrant une panoplie de contenus La bibliothegraveque doit faire face agrave de nouveaux deacutefis et sadapter agrave de nouvelles reacutealiteacutes Si elle veut survivre la bibliothegraveque doit se doter des outils neacutecessaires pour mettre en valeur de nouveaux contenus et reacutepondre aux besoins dutilisateurs appartenant agrave des communauteacutes linguistiques diverses

La bibliothegraveque a pour mission de fournir les ressources et les services documentaires requis aux fins denseignement de recherche et dactiviteacutes culturelles diverses De plus en plus les bibliothegraveques du monde entier se preacuteoccupent de la cueillette du traitement de la conservation et de la diffusion des publications numeacuteriques diffuseacutees sur Internet La bibliothegraveque doit aussi organiser ses documents de maniegravere agrave ce que ceux-ci soient accessibles localement mais eacutegaleshyment agrave distance Lorganisation preacutesuppose eacutevidemshyment la description lindexation et la classification des ressources acquises Le but premier de cette organisashytion documentaire est de permettre une exploitation et une diffusion efficaces et efficientes de cette documentashytion accessible par lensemble de la communauteacute

David Crystal (2006) un speacutecialiste des langages mentionnait que le Web est un moyen de communishycation changeant qui accueille tous les styles linguisshytiques au sein dune langue donneacutee mais eacutegalement toutes les langues La connaissance des comporteshyments linguistiques sur Internet et la mesure de leur diversiteacute constituent des questions importantes Il est toutefois difficile destimer avec preacutecision la diversiteacute

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 5

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas stricshytement par une eacutevolution technologique

mais neacutecessite un changement dans le parashydigme par lequel les individus accegravedent

et interagissent avec Vinformation ltxgtxxgtoltxgtltgtoltgtltxgtoltgtltgtltgt^

linguistique du Web Certaines statistiques annuelles rapportent reacuteguliegraverement le recul du nombre dintershynautes de langue maternelle anglaise Par exemple en 2010 on rapportait que la proportion dutilisateurs anglophones du Web neacutetait plus que de 273 compashyrativement agrave 359 en 2004 (Internet World Stats 2010) Cette mutation implique neacutecessairement une reacuteorganishysation des services offerts sur Internet y compris ceux des bibliothegraveques

Les deacutefis de la bibliothegraveque de leacutetagegravere agrave leacutecran

Avec lavegravenement du numeacuterique le document imprimeacute nest plus au centre des preacuteoccupations des bibliothegraveques laccegraves agrave dautres formes documentaires jusquici moins accessibles savegravere maintenant possible Dautres types de documents (tableaux cartes images dessins videacuteos fichiers sonores) font deacutesormais partie des collections privileacutegieacutees par les utilisateurs des bibliothegraveques Si de nombreux documents composeacutes de textes et dautres types dinformations multimeacuteshydias peuvent souvent ecirctre repeacutereacutes gracircce agrave la preacutesence de texte lieacute laccegraves agrave des documents strictement non-textuels continue de se faire plus difficilement En outre ce problegraveme se complique lorsque les documents combinent des eacuteleacutements linguistiques de diverses natures

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas strictement par une eacutevolution technologique mais neacutecessite un changement dans le paradigme par lequel les individus accegravedent et interagissent avec linformation La bibliothegraveque tradishytionnelle sest longtemps concentreacutee sur lentreposage et la conservation des eacuteleacutements physiques notamment des livres et des peacuteriodiques sur le catalogage de haut niveau de deacutetail et sur un systegraveme de navigation baseacute sur la proximiteacute physique des sujets lieacutes Par exemple les livres portant sur la religion eacutetaient regroupeacutes sur les rayons Lorganisation passive de linformation faisait en sorte que lutilisateur devait venir agrave la bibliothegraveque pour en faire usage puisque celle-ci eacutetait physiquement accessible en un seul endroit

En revanche le contenu numeacuterique des biblioshythegraveques diffegravere puisque laccegraves aux documents numeacuterishyques peut se faire de nimporte ougrave et les exigences en termes dentreposage du support physique sont eacutelimishy

neacutees Le catalogage peut exploiter le texte inteacutegral et la navigation est baseacutee sur des liens hypertextes des mots cleacutes des systegravemes de classifications ou de mise en grappes clustering) Les documents traitant dun mecircme sujet nont plus besoin decirctre physiquement situeacutes les uns pregraves des autres Gracircce agrave des moyens technologishyques de plus en plus sophistiqueacutes les utilisateurs nont plus neacutecessairement besoin de visiter la bibliothegraveque puisque laccegraves et la diffusion de linformation se fait par voie eacutelectronique Pheacutenomegravene des temps nouveaux la bibliothegraveque se trouve agrave tout endroit ougrave lutilisateur peut y avoir accegraves de la maison agrave leacutecole en passant par le bureau laeacuteroport et agrave partir de presque tous les moyens de transports terrestres et autres Il faut eacutegaleshyment constater que lavegravenement des teacuteleacutephones mobiles ordinateurs portatifs et bloc-notes eacutelectroniques a consideacuterablement modifieacute les habitudes des internautes de mecircme que le mode daccegraves au catalogues en ligne

Le catalogue de bibliothegraveque agrave lheure du numeacuterique

Un document numeacuterique se preacutesente comme un ensemble de fichiers identifieacutes par un identifiant unique Ce document quel quil soit doit ecirctre deacutecrit de maniegravere agrave ce quil soit repeacuterable par une majoriteacute dindividus Cette description comporte un ensemble de meacutetadonneacutees Sans ses meacutetadonneacutees le docushyment numeacuterique na aucune existence reacuteelle puisquil demeure inaccessible Les meacutetadonneacutees descriptives ont pour principale fonction de pourvoir une description bibliographique approfondie et deacutetailleacutee dans un format normaliseacute permettant laccegraves au document de mecircme que leacutechange avec dautres institutions Les meacutetadonshyneacutees structurelles ont pour objectif de reconstituer la structure du document cest-agrave-dire de faire connaicirctre tous les fichiers qui composent un document (textes images videacuteos sons) et deacutetablir les relations qui exisshytent entre eux Finalement les meacutetadonneacutees admishynistratives sont neacutecessaires pour la gestion des droits daccegraves (droits dauteur confidentialiteacute) et dutilisation (droits dimpression de reproduction de modification) Elles ont eacutegalement pour objectif de garantir linteacutegriteacute des fichiers et le suivi de leurs eacuteventuelles modifications et de preacuteserver les informations techniques neacutecessaires agrave la lecture des fichiers (Haynes 2004)

Tel un outil cleacute le catalogue est le point dentreacutee par excellence des bibliothegraveques Il permet de repeacuterer les documents gracircce agrave des points daccegraves divers auteurs (personnes physiques ou collectiviteacutes) sujets indices de classification ou collections Tous les types de docushyments sont deacutecrits et inclus dans le catalogue texte imprimeacute (livres peacuteriodiques etc) musique imprimeacutee et manuscrite documents iconographiques enregisshytrements sonores images animeacutees documents eacutelecshytroniques documents multisupports et multimeacutedias

2 0 6 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Interface de recherche - Catalogue IRIS (BAnQ)

Recherche simple JLAlaquoEacuteL Q poser me weamptm

copyTout O Livres CMustque QRIms O Revues et journaux G Images

CZIZZIZZIIZZZZZZIZZZ3 Gacirciumliiii CIumlIumlHIuml)

Quick search

copyAll 0 Books

F -

0 Music U Films C- Magazines and laquoewspapers

_ ~ ^ I I 1 SB

JLHecircte 0 As

C Images

lt a oueslio

documents cartographiques documents darchives et manuscrits etc

Mecircme si la recherche dans le catalogue en ligne ne donne pas neacutecessairement accegraves agrave lobjet documenshytaire en tant que tel il permet un premier contact entre lutilisateur et le document La notice bibliographique contient diffeacuterents types dinformation les meacuteta-donneacutees relatives agrave un document Plus preacuteciseacutement la notice comporte les renseignements permettant agrave lusager didentifier rapidement un document (titre ou nom du ou des auteurs) des informations destineacutees agrave le localiser avec preacutecision (la cote dun livre dans une bibliothegraveque le numeacutero de volume de fascicule et le numeacutero de la premiegravere page pour un article de peacuterioshydique) des identifiants deacutecrivant une entiteacute bibliograshyphique de faccedilon unique (un numeacutero ISBN ou ISSN un lien URL) de mecircme que des informations permettant agrave lutilisateur du catalogue de se faire une ideacutee concregravete du contenu (termes dindexation reacutesumeacute)

Lutilisateur du catalogue en ligne accegravede agrave ces informations gracircce agrave une interface offrant des options de recherche permettant la recherche simple (titre de louvrage nom de lauteur) et la recherche dite laquo avanceacutee raquo lui permettant de combiner plusieurs cleacutes daccegraves de maniegravere agrave raffiner la requecircte Lexamen des interfaces des catalogues de bibliothegraveques reacutevegravele que celles-ci varient consideacuterablement dune bibliothegraveque agrave lautre en ce qui concerne les fonctionnaliteacutes offertes Trop souvent le manque flagrant de convivialiteacute et des cleacutes de recherche offrant un vocabulaire irreacutemeacuteshydiablement hermeacutetique engendrent beaucoup dincershytitude et de frustration chez lutilisateur De plus en plus habitueacute agrave chercher avec des moteurs de recherche de type Google lutilisateur qui tente sa chance dans un catalogue de bibliothegraveque abandonnera rapidement ses recherches et se tournera vers dautres outils ougrave il se sentira deacutefinitivement plus en confiance et pourra se dire en lanccedilant sa requecircte laquo Jai de la chance raquo

Une autre difficulteacute agrave laquelle se heurte lutilisateur du catalogue est dordre linguistique Par exemple le catalogue IRIS de Bibliothegraveque et Archives nationales du Queacutebec (BAnQ 2011) offre la possibiliteacute de chercher des notices bibliographiques avec des fonctionnaliteacutes de recherche en langue franccedilaise et anglaise (Figure 1)

En plus de modifier linterface de recherche le catalogue IRIS agrave linstar de nombreux catalogues offre

Figure 2 Affichage des reacutesultats - Catalogue IRIS (BAnQ)

Titre Contes du lundi Alphonse Daueumlet preacuteface et commentaires de Catherine Eugegravene

Auteur Daudet Alphonse 18401897 [277] amp

Eacutediteur Paris Pocket 1999raquo 47411 Description xvis 364 xxxi p 18 cm Sujets Guerre franagtatlemancje 1870-1871-Romans

nouvelles etc (33] g i Paris (France^laquoHistoire-1871 fCommuna^-Romansraquo nouvelles etc [43] p i

Title Contes du lundi Alphonse Daydet preacutefaee et commentaires de Catherine Eugegravene

Author Daudet Alphonse 1840-1897 f2771 j g

Publisher Paris Pocket 1999 [4741] Description xvi 384 xxxiiicirc p 18 cm Subjects Ouerre franco-allemande 1870-1871-Romans

nouvellesraquo etc [33] amp Paris (France^Hlstolre-1871 ^Commune)-Romans nouvelles etc [43] g i

un affichage des reacutesultats dans la langue choisie par lutilisateur (Figure 2)

Une fois repeacutereacutees les notices bibliographiques preacutesentent linformation de maniegravere agrave peu pregraves uniforme et consistante gracircce agrave des regravegles de catalo-gage aussi complexes que strictes Toutefois dans la majoriteacute des catalogues en ligne cette information est afficheacutee en une seule langue la langue de creacuteation de la notice Cest le cas par exemple des vedettes-matiegravere mot ou groupe de mots indiquant le sujet sous lequel tous les eacutecrits ou autres documents traitant du mecircme thegraveme sont entreacutes et regroupeacutes (Office queacutebeacutecois de la langue franccedilaise 2011) Les vedettes-matiegravere sont tireacutes de reacutepertoires ou de listes qui nexistent souvent quen une seule langue Par conseacutequent la notice bibliograshyphique une fois afficheacutee preacutesentera linformation sujet en une seule langue dans les champs SujetsSubjects (Figure 2) Lutilisateur unilingue du catalogue se heurshytera ainsi agrave une difficulteacute importante En effet mecircme sil parvient agrave faire sa recherche gracircce aux fonctionshynaliteacutes de recherche multilingue offertes par le catashylogue lexamen des sujets demeura un mystegravere pour lui puisque ces repreacutesentations de sujets sont extraites dun reacutepertoire eacutelaboreacute dans une langue qui ne lui est pas neacutecessairement familiegravere

Accegraves agrave linformation multilingue numeacuterique

Laccegraves agrave linformation multilingue est un problegraveme de recherche pour lequel des solutions adapteacutees ne sont toujours pas mises en place En 2001 lUNESCO

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 201 1 | 2 0 7

Laccegraves agrave Vinformation multilingue numeacuterique constitue sans aucun

doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier

dans les pays non anglophones ltxgtltxxxgtoltxgtoltgtltgtltgtltgtltgtltx^

sengageait entre autres agrave laquopromouvoir la diversiteacute linguistique dans lespace numeacuterique et encourager laccegraves universel agrave travers les reacuteseaux mondiaux agrave toutes les informations qui relegravevent du domaine public raquo (UNESCO 2003) Cet engagement ferme de lUNESCO laisse deacutejagrave entrevoir un inteacuterecirct croissant envers linforshymation multilingue Toutefois dix ans plus tard cet engagement ne demeure quun pieux souhait Pourshytant selon Fluhr (2010) les applications neacutecessitant la prise en compte dinformations multilingues sont fort nombreuses veille strateacutegique commerciale scientifique brevet surveillance dopinion au niveau international partage dinformation entre socieacuteteacutes multinationales partage dinformation dans des pays plurilingues seacutecuriteacute nationale (lutte contre le terroshyrisme prolifeacuteration nucleacuteaire) etc Laccegraves agrave linformashytion multilingue numeacuterique constitue sans aucun doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier dans les pays non anglophones La question linguistique soulegraveve de nombreuses questions pouvant se reacutesumer ainsi comment les utilisateurs des catalogues en ligne peuvent-ils acceacuteder agrave des documents numeacuteriques divers dans des langues eacutetrangegraveres de maniegravere agrave en faire une utilisation efficace

La probleacutematique de la recherche dinformation multilingue nest pas nouvelle puisque dans les anneacutees 1950 les documentalistes eacutetaient deacutejagrave conscients de limportance de se preacuteoccuper de ce type dinformation (Meacutenard 2008) Comme le suggeacuterait deacutejagrave Suzanne Briet agrave cette peacuteriode

laquo Limportance de la connaissance des langues eacutetrangegraveres pour assurer lune quelconque des formes documentaires na plus besoin decirctre deacutemontreacutee Pour comprendre les documents il faut pouvoir les lire [] Ce sera le rocircle du documentaliste de mettre les documents en des langues diverses agrave la porteacutee de ses usagers raquo (1951)

La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuterishyseacutees des services patrimoniaux des museacutees des biblioshythegraveques et des archives de diffeacuterentes communauteacutes linguistiques est incommensurable Il faut mentionner que linformation multilingue est tout aussi capitale pour les entreprises qui deacutesirent demeurer compeacutetitives surtout avec leacutemergence du pheacutenomegravene de mondialisashy

tion qui magnifie la concurrence entre celles-ci (Meacutenard 2008) De plus les acteurs du commerce eacutelectronique reconnaissent progressivement la neacutecessiteacute dexploiter la langue et les traditions culturelles speacutecifiques des marcheacutes viseacutes (Hillier 2003) La communication multishylingue permet la diffusion dinformation au-delagrave des frontiegraveres des langues Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer et maicirctriser la communication multilingue Dune part linformation numeacuterique a eacuteteacute creacuteeacutee en plus dune langue et dautre part des populations dutilisateurs linguistiquement diffeacuterents et dhorizons culturels divers ont accegraves agrave cette information disponible au bout de leurs doigts Les gouvernements les entreprises et industries agrave rayonneshyment international recherchent constamment des inforshymations dans des journaux et autres ressources Web reacutedigeacutees en langues diverses (Chen et Bao 2009) Leacutetude des technologies et des ressources facilitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les internautes y compris les utilisateurs des catalogues de bibliothegraveques agrave naviguer chercher et utiliser ces ressources multilingues textuelles ou multimeacutedias

Linformation est deacutesormais disponible sur le Web en plusieurs langues et les utilisateurs dInternet communiquent non seulement dans une lingua franca eacutetablie langlais mais aussi dans une multitude dautres langues Certains moteurs de recherche offrent agrave leurs utilisateurs les moyens dacceacuteder agrave cette information Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute dite laquo recherche traduite raquo qui permet entre autres de chercher dans dautres langues et dans la fouleacutee de traduire les documents textuels reacutesultant de leurs requecirctes

Par exemple Google a lanceacute son outil linguisshytique en mai 2007 et est maintenant identifieacute comme le moteur de recherche reacutegulier offrant le meilleur support deacutedieacute agrave linformation multilingue (Zhang et Lin 2007) Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute de laquo traduction des reacutesultats raquo (Outils linguistiques Google 2011) Toutefois ces fonctionnashyliteacutes sont encore tregraves peu reacutepandues Pourtant Oard reacuteveacutelait en 1997 que les technologies de recherche dinshyformation multilingue (RIML) pourraient consideacuterashyblement ameacuteliorer les services commerciaux en ligne tels que Dialog et LexisNexis Pour leur part Petrelli Beaulieu et Sanderson (2002) soulignaient que les traducteurs et les speacutecialistes de linformation tels que les bibliotheacutecaires de reacutefeacuterence servant dintermeacutediaires pour leurs usagers pourraient tirer un grand avantage des meacutecanismes daccegraves agrave des sources multilingues dinformation

Pour le moment ces outils linguistiques foncshytionnent en vase clos et ne sont pas systeacutematiquement offerts agrave la recherche de tous les types de documents Laccegraves aux images numeacuteriques se limite toujours agrave des reacutesultats monolingues Par exemple les images afficheacutees

2 0 8 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 2: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

DOCUMENTATION B I B L I O H H Egrave Q U E S

Bibliothegraveques et accegraves agrave linformation multilingue pour en finir avec Babel

ELAINE MENARD School of Information Studies McGill University Montreacuteal Canada elainemenardmcgillca

RESUME | ABSTRACTS | RESUMEN

La bibliothegraveque est de plus en plus confronteacutee agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue Cet article eacutevoque les deacutefis auxquels font face les bibliothegraveques agrave lheure du numeacuterique La probleacutematique de laccegraves agrave Vinforma-tion multilingue est deacutecrite de mecircme que les solutions proposeacutees par divers travaux de recherche

Libraries and Access to Multilingual Information The End of Babel

The library is being increasingly confronted by complex demands for multimedia multicultural and multilingual materials This article describes some of the challenges faced by libraries in a digital era The problems associated with the access to multilingual information are described as well as solutions proposed by various research projects

Bibliotecas y acceso a la informaciocircn multilingue para ponerle fin a Babel

La biblioteca enfrenta cada dia pedidos mas complejos en el arnbito multimedial multicultural y multilingue Este articulo evoca los desafios que enfrentan las bibliotecas en la era digital Se describe la problemacirctica del acceso a la informaciocircn multilingue asi como las soluciones propuestas a traveacutes de varios trabajos de investigaciocircn

Cette reacuteflexion a eacuteteacute preacutesenteacutee lors de la table ronde laquo Bibliothegraveques et Sciences de linformation les projets de recherche comme espaces de dialogue raquo dans le cadre des Entretiens Jacques-Cartier Lyon 24 novembre 2010 This paper was presented at the laquo Libraries and Information Sciences Research Projects as a Places of Dialogue raquo round table held at the Entretiens Jacques-Cartier in Lyon November 242010 Esta reflexion fue presentada durante la mesa redonda laquo Bibliotecas y ciencias de la informaciocircn proyectos de investigaciocircn como espacios de diacirclogo raquo en el marco de las Conversaciones en el centro Jacques-Cartier que se desarrollaron en Lyon el 24 de noviembre de 2010

La bibliothegraveque du xxie siegravecle

TRADITIONNELLEMENT la bibliothegraveque acquiert des documents sur supports imprimeacutes tels que des livres journaux cartes illustrations etc

Cette image un peu poussieacutereuse un peu suranneacutee de la bibliothegraveque a pourtant eacutevolueacute depuis quelques anneacutees Malgreacute cette conception quelque peu erroneacutee mais largement reacutepandue la bibliothegraveque ne se limite plus seulement agrave lacquisition de documents sur support papier Agrave lheure du numeacuterique leffort des biblioshythegraveques se porte maintenant sur lorganisation et la mise en valeur des collections fort diffeacuterentes La biblioshythegraveque avec lavegravenement des documents agrave contenu numeacuterique entre de plain-pied en compeacutetition avec les intervenants aussi nouveaux que diffeacuterents que sont les sites commerciaux les blogs et autres sites Web issus de reacuteseaux sociaux offrant une panoplie de contenus La bibliothegraveque doit faire face agrave de nouveaux deacutefis et sadapter agrave de nouvelles reacutealiteacutes Si elle veut survivre la bibliothegraveque doit se doter des outils neacutecessaires pour mettre en valeur de nouveaux contenus et reacutepondre aux besoins dutilisateurs appartenant agrave des communauteacutes linguistiques diverses

La bibliothegraveque a pour mission de fournir les ressources et les services documentaires requis aux fins denseignement de recherche et dactiviteacutes culturelles diverses De plus en plus les bibliothegraveques du monde entier se preacuteoccupent de la cueillette du traitement de la conservation et de la diffusion des publications numeacuteriques diffuseacutees sur Internet La bibliothegraveque doit aussi organiser ses documents de maniegravere agrave ce que ceux-ci soient accessibles localement mais eacutegaleshyment agrave distance Lorganisation preacutesuppose eacutevidemshyment la description lindexation et la classification des ressources acquises Le but premier de cette organisashytion documentaire est de permettre une exploitation et une diffusion efficaces et efficientes de cette documentashytion accessible par lensemble de la communauteacute

David Crystal (2006) un speacutecialiste des langages mentionnait que le Web est un moyen de communishycation changeant qui accueille tous les styles linguisshytiques au sein dune langue donneacutee mais eacutegalement toutes les langues La connaissance des comporteshyments linguistiques sur Internet et la mesure de leur diversiteacute constituent des questions importantes Il est toutefois difficile destimer avec preacutecision la diversiteacute

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 5

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas stricshytement par une eacutevolution technologique

mais neacutecessite un changement dans le parashydigme par lequel les individus accegravedent

et interagissent avec Vinformation ltxgtxxgtoltxgtltgtoltgtltxgtoltgtltgtltgt^

linguistique du Web Certaines statistiques annuelles rapportent reacuteguliegraverement le recul du nombre dintershynautes de langue maternelle anglaise Par exemple en 2010 on rapportait que la proportion dutilisateurs anglophones du Web neacutetait plus que de 273 compashyrativement agrave 359 en 2004 (Internet World Stats 2010) Cette mutation implique neacutecessairement une reacuteorganishysation des services offerts sur Internet y compris ceux des bibliothegraveques

Les deacutefis de la bibliothegraveque de leacutetagegravere agrave leacutecran

Avec lavegravenement du numeacuterique le document imprimeacute nest plus au centre des preacuteoccupations des bibliothegraveques laccegraves agrave dautres formes documentaires jusquici moins accessibles savegravere maintenant possible Dautres types de documents (tableaux cartes images dessins videacuteos fichiers sonores) font deacutesormais partie des collections privileacutegieacutees par les utilisateurs des bibliothegraveques Si de nombreux documents composeacutes de textes et dautres types dinformations multimeacuteshydias peuvent souvent ecirctre repeacutereacutes gracircce agrave la preacutesence de texte lieacute laccegraves agrave des documents strictement non-textuels continue de se faire plus difficilement En outre ce problegraveme se complique lorsque les documents combinent des eacuteleacutements linguistiques de diverses natures

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas strictement par une eacutevolution technologique mais neacutecessite un changement dans le paradigme par lequel les individus accegravedent et interagissent avec linformation La bibliothegraveque tradishytionnelle sest longtemps concentreacutee sur lentreposage et la conservation des eacuteleacutements physiques notamment des livres et des peacuteriodiques sur le catalogage de haut niveau de deacutetail et sur un systegraveme de navigation baseacute sur la proximiteacute physique des sujets lieacutes Par exemple les livres portant sur la religion eacutetaient regroupeacutes sur les rayons Lorganisation passive de linformation faisait en sorte que lutilisateur devait venir agrave la bibliothegraveque pour en faire usage puisque celle-ci eacutetait physiquement accessible en un seul endroit

En revanche le contenu numeacuterique des biblioshythegraveques diffegravere puisque laccegraves aux documents numeacuterishyques peut se faire de nimporte ougrave et les exigences en termes dentreposage du support physique sont eacutelimishy

neacutees Le catalogage peut exploiter le texte inteacutegral et la navigation est baseacutee sur des liens hypertextes des mots cleacutes des systegravemes de classifications ou de mise en grappes clustering) Les documents traitant dun mecircme sujet nont plus besoin decirctre physiquement situeacutes les uns pregraves des autres Gracircce agrave des moyens technologishyques de plus en plus sophistiqueacutes les utilisateurs nont plus neacutecessairement besoin de visiter la bibliothegraveque puisque laccegraves et la diffusion de linformation se fait par voie eacutelectronique Pheacutenomegravene des temps nouveaux la bibliothegraveque se trouve agrave tout endroit ougrave lutilisateur peut y avoir accegraves de la maison agrave leacutecole en passant par le bureau laeacuteroport et agrave partir de presque tous les moyens de transports terrestres et autres Il faut eacutegaleshyment constater que lavegravenement des teacuteleacutephones mobiles ordinateurs portatifs et bloc-notes eacutelectroniques a consideacuterablement modifieacute les habitudes des internautes de mecircme que le mode daccegraves au catalogues en ligne

Le catalogue de bibliothegraveque agrave lheure du numeacuterique

Un document numeacuterique se preacutesente comme un ensemble de fichiers identifieacutes par un identifiant unique Ce document quel quil soit doit ecirctre deacutecrit de maniegravere agrave ce quil soit repeacuterable par une majoriteacute dindividus Cette description comporte un ensemble de meacutetadonneacutees Sans ses meacutetadonneacutees le docushyment numeacuterique na aucune existence reacuteelle puisquil demeure inaccessible Les meacutetadonneacutees descriptives ont pour principale fonction de pourvoir une description bibliographique approfondie et deacutetailleacutee dans un format normaliseacute permettant laccegraves au document de mecircme que leacutechange avec dautres institutions Les meacutetadonshyneacutees structurelles ont pour objectif de reconstituer la structure du document cest-agrave-dire de faire connaicirctre tous les fichiers qui composent un document (textes images videacuteos sons) et deacutetablir les relations qui exisshytent entre eux Finalement les meacutetadonneacutees admishynistratives sont neacutecessaires pour la gestion des droits daccegraves (droits dauteur confidentialiteacute) et dutilisation (droits dimpression de reproduction de modification) Elles ont eacutegalement pour objectif de garantir linteacutegriteacute des fichiers et le suivi de leurs eacuteventuelles modifications et de preacuteserver les informations techniques neacutecessaires agrave la lecture des fichiers (Haynes 2004)

Tel un outil cleacute le catalogue est le point dentreacutee par excellence des bibliothegraveques Il permet de repeacuterer les documents gracircce agrave des points daccegraves divers auteurs (personnes physiques ou collectiviteacutes) sujets indices de classification ou collections Tous les types de docushyments sont deacutecrits et inclus dans le catalogue texte imprimeacute (livres peacuteriodiques etc) musique imprimeacutee et manuscrite documents iconographiques enregisshytrements sonores images animeacutees documents eacutelecshytroniques documents multisupports et multimeacutedias

2 0 6 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Interface de recherche - Catalogue IRIS (BAnQ)

Recherche simple JLAlaquoEacuteL Q poser me weamptm

copyTout O Livres CMustque QRIms O Revues et journaux G Images

CZIZZIZZIIZZZZZZIZZZ3 Gacirciumliiii CIumlIumlHIuml)

Quick search

copyAll 0 Books

F -

0 Music U Films C- Magazines and laquoewspapers

_ ~ ^ I I 1 SB

JLHecircte 0 As

C Images

lt a oueslio

documents cartographiques documents darchives et manuscrits etc

Mecircme si la recherche dans le catalogue en ligne ne donne pas neacutecessairement accegraves agrave lobjet documenshytaire en tant que tel il permet un premier contact entre lutilisateur et le document La notice bibliographique contient diffeacuterents types dinformation les meacuteta-donneacutees relatives agrave un document Plus preacuteciseacutement la notice comporte les renseignements permettant agrave lusager didentifier rapidement un document (titre ou nom du ou des auteurs) des informations destineacutees agrave le localiser avec preacutecision (la cote dun livre dans une bibliothegraveque le numeacutero de volume de fascicule et le numeacutero de la premiegravere page pour un article de peacuterioshydique) des identifiants deacutecrivant une entiteacute bibliograshyphique de faccedilon unique (un numeacutero ISBN ou ISSN un lien URL) de mecircme que des informations permettant agrave lutilisateur du catalogue de se faire une ideacutee concregravete du contenu (termes dindexation reacutesumeacute)

Lutilisateur du catalogue en ligne accegravede agrave ces informations gracircce agrave une interface offrant des options de recherche permettant la recherche simple (titre de louvrage nom de lauteur) et la recherche dite laquo avanceacutee raquo lui permettant de combiner plusieurs cleacutes daccegraves de maniegravere agrave raffiner la requecircte Lexamen des interfaces des catalogues de bibliothegraveques reacutevegravele que celles-ci varient consideacuterablement dune bibliothegraveque agrave lautre en ce qui concerne les fonctionnaliteacutes offertes Trop souvent le manque flagrant de convivialiteacute et des cleacutes de recherche offrant un vocabulaire irreacutemeacuteshydiablement hermeacutetique engendrent beaucoup dincershytitude et de frustration chez lutilisateur De plus en plus habitueacute agrave chercher avec des moteurs de recherche de type Google lutilisateur qui tente sa chance dans un catalogue de bibliothegraveque abandonnera rapidement ses recherches et se tournera vers dautres outils ougrave il se sentira deacutefinitivement plus en confiance et pourra se dire en lanccedilant sa requecircte laquo Jai de la chance raquo

Une autre difficulteacute agrave laquelle se heurte lutilisateur du catalogue est dordre linguistique Par exemple le catalogue IRIS de Bibliothegraveque et Archives nationales du Queacutebec (BAnQ 2011) offre la possibiliteacute de chercher des notices bibliographiques avec des fonctionnaliteacutes de recherche en langue franccedilaise et anglaise (Figure 1)

En plus de modifier linterface de recherche le catalogue IRIS agrave linstar de nombreux catalogues offre

Figure 2 Affichage des reacutesultats - Catalogue IRIS (BAnQ)

Titre Contes du lundi Alphonse Daueumlet preacuteface et commentaires de Catherine Eugegravene

Auteur Daudet Alphonse 18401897 [277] amp

Eacutediteur Paris Pocket 1999raquo 47411 Description xvis 364 xxxi p 18 cm Sujets Guerre franagtatlemancje 1870-1871-Romans

nouvelles etc (33] g i Paris (France^laquoHistoire-1871 fCommuna^-Romansraquo nouvelles etc [43] p i

Title Contes du lundi Alphonse Daydet preacutefaee et commentaires de Catherine Eugegravene

Author Daudet Alphonse 1840-1897 f2771 j g

Publisher Paris Pocket 1999 [4741] Description xvi 384 xxxiiicirc p 18 cm Subjects Ouerre franco-allemande 1870-1871-Romans

nouvellesraquo etc [33] amp Paris (France^Hlstolre-1871 ^Commune)-Romans nouvelles etc [43] g i

un affichage des reacutesultats dans la langue choisie par lutilisateur (Figure 2)

Une fois repeacutereacutees les notices bibliographiques preacutesentent linformation de maniegravere agrave peu pregraves uniforme et consistante gracircce agrave des regravegles de catalo-gage aussi complexes que strictes Toutefois dans la majoriteacute des catalogues en ligne cette information est afficheacutee en une seule langue la langue de creacuteation de la notice Cest le cas par exemple des vedettes-matiegravere mot ou groupe de mots indiquant le sujet sous lequel tous les eacutecrits ou autres documents traitant du mecircme thegraveme sont entreacutes et regroupeacutes (Office queacutebeacutecois de la langue franccedilaise 2011) Les vedettes-matiegravere sont tireacutes de reacutepertoires ou de listes qui nexistent souvent quen une seule langue Par conseacutequent la notice bibliograshyphique une fois afficheacutee preacutesentera linformation sujet en une seule langue dans les champs SujetsSubjects (Figure 2) Lutilisateur unilingue du catalogue se heurshytera ainsi agrave une difficulteacute importante En effet mecircme sil parvient agrave faire sa recherche gracircce aux fonctionshynaliteacutes de recherche multilingue offertes par le catashylogue lexamen des sujets demeura un mystegravere pour lui puisque ces repreacutesentations de sujets sont extraites dun reacutepertoire eacutelaboreacute dans une langue qui ne lui est pas neacutecessairement familiegravere

Accegraves agrave linformation multilingue numeacuterique

Laccegraves agrave linformation multilingue est un problegraveme de recherche pour lequel des solutions adapteacutees ne sont toujours pas mises en place En 2001 lUNESCO

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 201 1 | 2 0 7

Laccegraves agrave Vinformation multilingue numeacuterique constitue sans aucun

doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier

dans les pays non anglophones ltxgtltxxxgtoltxgtoltgtltgtltgtltgtltgtltx^

sengageait entre autres agrave laquopromouvoir la diversiteacute linguistique dans lespace numeacuterique et encourager laccegraves universel agrave travers les reacuteseaux mondiaux agrave toutes les informations qui relegravevent du domaine public raquo (UNESCO 2003) Cet engagement ferme de lUNESCO laisse deacutejagrave entrevoir un inteacuterecirct croissant envers linforshymation multilingue Toutefois dix ans plus tard cet engagement ne demeure quun pieux souhait Pourshytant selon Fluhr (2010) les applications neacutecessitant la prise en compte dinformations multilingues sont fort nombreuses veille strateacutegique commerciale scientifique brevet surveillance dopinion au niveau international partage dinformation entre socieacuteteacutes multinationales partage dinformation dans des pays plurilingues seacutecuriteacute nationale (lutte contre le terroshyrisme prolifeacuteration nucleacuteaire) etc Laccegraves agrave linformashytion multilingue numeacuterique constitue sans aucun doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier dans les pays non anglophones La question linguistique soulegraveve de nombreuses questions pouvant se reacutesumer ainsi comment les utilisateurs des catalogues en ligne peuvent-ils acceacuteder agrave des documents numeacuteriques divers dans des langues eacutetrangegraveres de maniegravere agrave en faire une utilisation efficace

La probleacutematique de la recherche dinformation multilingue nest pas nouvelle puisque dans les anneacutees 1950 les documentalistes eacutetaient deacutejagrave conscients de limportance de se preacuteoccuper de ce type dinformation (Meacutenard 2008) Comme le suggeacuterait deacutejagrave Suzanne Briet agrave cette peacuteriode

laquo Limportance de la connaissance des langues eacutetrangegraveres pour assurer lune quelconque des formes documentaires na plus besoin decirctre deacutemontreacutee Pour comprendre les documents il faut pouvoir les lire [] Ce sera le rocircle du documentaliste de mettre les documents en des langues diverses agrave la porteacutee de ses usagers raquo (1951)

La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuterishyseacutees des services patrimoniaux des museacutees des biblioshythegraveques et des archives de diffeacuterentes communauteacutes linguistiques est incommensurable Il faut mentionner que linformation multilingue est tout aussi capitale pour les entreprises qui deacutesirent demeurer compeacutetitives surtout avec leacutemergence du pheacutenomegravene de mondialisashy

tion qui magnifie la concurrence entre celles-ci (Meacutenard 2008) De plus les acteurs du commerce eacutelectronique reconnaissent progressivement la neacutecessiteacute dexploiter la langue et les traditions culturelles speacutecifiques des marcheacutes viseacutes (Hillier 2003) La communication multishylingue permet la diffusion dinformation au-delagrave des frontiegraveres des langues Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer et maicirctriser la communication multilingue Dune part linformation numeacuterique a eacuteteacute creacuteeacutee en plus dune langue et dautre part des populations dutilisateurs linguistiquement diffeacuterents et dhorizons culturels divers ont accegraves agrave cette information disponible au bout de leurs doigts Les gouvernements les entreprises et industries agrave rayonneshyment international recherchent constamment des inforshymations dans des journaux et autres ressources Web reacutedigeacutees en langues diverses (Chen et Bao 2009) Leacutetude des technologies et des ressources facilitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les internautes y compris les utilisateurs des catalogues de bibliothegraveques agrave naviguer chercher et utiliser ces ressources multilingues textuelles ou multimeacutedias

Linformation est deacutesormais disponible sur le Web en plusieurs langues et les utilisateurs dInternet communiquent non seulement dans une lingua franca eacutetablie langlais mais aussi dans une multitude dautres langues Certains moteurs de recherche offrent agrave leurs utilisateurs les moyens dacceacuteder agrave cette information Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute dite laquo recherche traduite raquo qui permet entre autres de chercher dans dautres langues et dans la fouleacutee de traduire les documents textuels reacutesultant de leurs requecirctes

Par exemple Google a lanceacute son outil linguisshytique en mai 2007 et est maintenant identifieacute comme le moteur de recherche reacutegulier offrant le meilleur support deacutedieacute agrave linformation multilingue (Zhang et Lin 2007) Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute de laquo traduction des reacutesultats raquo (Outils linguistiques Google 2011) Toutefois ces fonctionnashyliteacutes sont encore tregraves peu reacutepandues Pourtant Oard reacuteveacutelait en 1997 que les technologies de recherche dinshyformation multilingue (RIML) pourraient consideacuterashyblement ameacuteliorer les services commerciaux en ligne tels que Dialog et LexisNexis Pour leur part Petrelli Beaulieu et Sanderson (2002) soulignaient que les traducteurs et les speacutecialistes de linformation tels que les bibliotheacutecaires de reacutefeacuterence servant dintermeacutediaires pour leurs usagers pourraient tirer un grand avantage des meacutecanismes daccegraves agrave des sources multilingues dinformation

Pour le moment ces outils linguistiques foncshytionnent en vase clos et ne sont pas systeacutematiquement offerts agrave la recherche de tous les types de documents Laccegraves aux images numeacuteriques se limite toujours agrave des reacutesultats monolingues Par exemple les images afficheacutees

2 0 8 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 3: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas stricshytement par une eacutevolution technologique

mais neacutecessite un changement dans le parashydigme par lequel les individus accegravedent

et interagissent avec Vinformation ltxgtxxgtoltxgtltgtoltgtltxgtoltgtltgtltgt^

linguistique du Web Certaines statistiques annuelles rapportent reacuteguliegraverement le recul du nombre dintershynautes de langue maternelle anglaise Par exemple en 2010 on rapportait que la proportion dutilisateurs anglophones du Web neacutetait plus que de 273 compashyrativement agrave 359 en 2004 (Internet World Stats 2010) Cette mutation implique neacutecessairement une reacuteorganishysation des services offerts sur Internet y compris ceux des bibliothegraveques

Les deacutefis de la bibliothegraveque de leacutetagegravere agrave leacutecran

Avec lavegravenement du numeacuterique le document imprimeacute nest plus au centre des preacuteoccupations des bibliothegraveques laccegraves agrave dautres formes documentaires jusquici moins accessibles savegravere maintenant possible Dautres types de documents (tableaux cartes images dessins videacuteos fichiers sonores) font deacutesormais partie des collections privileacutegieacutees par les utilisateurs des bibliothegraveques Si de nombreux documents composeacutes de textes et dautres types dinformations multimeacuteshydias peuvent souvent ecirctre repeacutereacutes gracircce agrave la preacutesence de texte lieacute laccegraves agrave des documents strictement non-textuels continue de se faire plus difficilement En outre ce problegraveme se complique lorsque les documents combinent des eacuteleacutements linguistiques de diverses natures

Le passage de la bibliothegraveque traditionnelle au numeacuterique ne se caracteacuterise pas strictement par une eacutevolution technologique mais neacutecessite un changement dans le paradigme par lequel les individus accegravedent et interagissent avec linformation La bibliothegraveque tradishytionnelle sest longtemps concentreacutee sur lentreposage et la conservation des eacuteleacutements physiques notamment des livres et des peacuteriodiques sur le catalogage de haut niveau de deacutetail et sur un systegraveme de navigation baseacute sur la proximiteacute physique des sujets lieacutes Par exemple les livres portant sur la religion eacutetaient regroupeacutes sur les rayons Lorganisation passive de linformation faisait en sorte que lutilisateur devait venir agrave la bibliothegraveque pour en faire usage puisque celle-ci eacutetait physiquement accessible en un seul endroit

En revanche le contenu numeacuterique des biblioshythegraveques diffegravere puisque laccegraves aux documents numeacuterishyques peut se faire de nimporte ougrave et les exigences en termes dentreposage du support physique sont eacutelimishy

neacutees Le catalogage peut exploiter le texte inteacutegral et la navigation est baseacutee sur des liens hypertextes des mots cleacutes des systegravemes de classifications ou de mise en grappes clustering) Les documents traitant dun mecircme sujet nont plus besoin decirctre physiquement situeacutes les uns pregraves des autres Gracircce agrave des moyens technologishyques de plus en plus sophistiqueacutes les utilisateurs nont plus neacutecessairement besoin de visiter la bibliothegraveque puisque laccegraves et la diffusion de linformation se fait par voie eacutelectronique Pheacutenomegravene des temps nouveaux la bibliothegraveque se trouve agrave tout endroit ougrave lutilisateur peut y avoir accegraves de la maison agrave leacutecole en passant par le bureau laeacuteroport et agrave partir de presque tous les moyens de transports terrestres et autres Il faut eacutegaleshyment constater que lavegravenement des teacuteleacutephones mobiles ordinateurs portatifs et bloc-notes eacutelectroniques a consideacuterablement modifieacute les habitudes des internautes de mecircme que le mode daccegraves au catalogues en ligne

Le catalogue de bibliothegraveque agrave lheure du numeacuterique

Un document numeacuterique se preacutesente comme un ensemble de fichiers identifieacutes par un identifiant unique Ce document quel quil soit doit ecirctre deacutecrit de maniegravere agrave ce quil soit repeacuterable par une majoriteacute dindividus Cette description comporte un ensemble de meacutetadonneacutees Sans ses meacutetadonneacutees le docushyment numeacuterique na aucune existence reacuteelle puisquil demeure inaccessible Les meacutetadonneacutees descriptives ont pour principale fonction de pourvoir une description bibliographique approfondie et deacutetailleacutee dans un format normaliseacute permettant laccegraves au document de mecircme que leacutechange avec dautres institutions Les meacutetadonshyneacutees structurelles ont pour objectif de reconstituer la structure du document cest-agrave-dire de faire connaicirctre tous les fichiers qui composent un document (textes images videacuteos sons) et deacutetablir les relations qui exisshytent entre eux Finalement les meacutetadonneacutees admishynistratives sont neacutecessaires pour la gestion des droits daccegraves (droits dauteur confidentialiteacute) et dutilisation (droits dimpression de reproduction de modification) Elles ont eacutegalement pour objectif de garantir linteacutegriteacute des fichiers et le suivi de leurs eacuteventuelles modifications et de preacuteserver les informations techniques neacutecessaires agrave la lecture des fichiers (Haynes 2004)

Tel un outil cleacute le catalogue est le point dentreacutee par excellence des bibliothegraveques Il permet de repeacuterer les documents gracircce agrave des points daccegraves divers auteurs (personnes physiques ou collectiviteacutes) sujets indices de classification ou collections Tous les types de docushyments sont deacutecrits et inclus dans le catalogue texte imprimeacute (livres peacuteriodiques etc) musique imprimeacutee et manuscrite documents iconographiques enregisshytrements sonores images animeacutees documents eacutelecshytroniques documents multisupports et multimeacutedias

2 0 6 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Interface de recherche - Catalogue IRIS (BAnQ)

Recherche simple JLAlaquoEacuteL Q poser me weamptm

copyTout O Livres CMustque QRIms O Revues et journaux G Images

CZIZZIZZIIZZZZZZIZZZ3 Gacirciumliiii CIumlIumlHIuml)

Quick search

copyAll 0 Books

F -

0 Music U Films C- Magazines and laquoewspapers

_ ~ ^ I I 1 SB

JLHecircte 0 As

C Images

lt a oueslio

documents cartographiques documents darchives et manuscrits etc

Mecircme si la recherche dans le catalogue en ligne ne donne pas neacutecessairement accegraves agrave lobjet documenshytaire en tant que tel il permet un premier contact entre lutilisateur et le document La notice bibliographique contient diffeacuterents types dinformation les meacuteta-donneacutees relatives agrave un document Plus preacuteciseacutement la notice comporte les renseignements permettant agrave lusager didentifier rapidement un document (titre ou nom du ou des auteurs) des informations destineacutees agrave le localiser avec preacutecision (la cote dun livre dans une bibliothegraveque le numeacutero de volume de fascicule et le numeacutero de la premiegravere page pour un article de peacuterioshydique) des identifiants deacutecrivant une entiteacute bibliograshyphique de faccedilon unique (un numeacutero ISBN ou ISSN un lien URL) de mecircme que des informations permettant agrave lutilisateur du catalogue de se faire une ideacutee concregravete du contenu (termes dindexation reacutesumeacute)

Lutilisateur du catalogue en ligne accegravede agrave ces informations gracircce agrave une interface offrant des options de recherche permettant la recherche simple (titre de louvrage nom de lauteur) et la recherche dite laquo avanceacutee raquo lui permettant de combiner plusieurs cleacutes daccegraves de maniegravere agrave raffiner la requecircte Lexamen des interfaces des catalogues de bibliothegraveques reacutevegravele que celles-ci varient consideacuterablement dune bibliothegraveque agrave lautre en ce qui concerne les fonctionnaliteacutes offertes Trop souvent le manque flagrant de convivialiteacute et des cleacutes de recherche offrant un vocabulaire irreacutemeacuteshydiablement hermeacutetique engendrent beaucoup dincershytitude et de frustration chez lutilisateur De plus en plus habitueacute agrave chercher avec des moteurs de recherche de type Google lutilisateur qui tente sa chance dans un catalogue de bibliothegraveque abandonnera rapidement ses recherches et se tournera vers dautres outils ougrave il se sentira deacutefinitivement plus en confiance et pourra se dire en lanccedilant sa requecircte laquo Jai de la chance raquo

Une autre difficulteacute agrave laquelle se heurte lutilisateur du catalogue est dordre linguistique Par exemple le catalogue IRIS de Bibliothegraveque et Archives nationales du Queacutebec (BAnQ 2011) offre la possibiliteacute de chercher des notices bibliographiques avec des fonctionnaliteacutes de recherche en langue franccedilaise et anglaise (Figure 1)

En plus de modifier linterface de recherche le catalogue IRIS agrave linstar de nombreux catalogues offre

Figure 2 Affichage des reacutesultats - Catalogue IRIS (BAnQ)

Titre Contes du lundi Alphonse Daueumlet preacuteface et commentaires de Catherine Eugegravene

Auteur Daudet Alphonse 18401897 [277] amp

Eacutediteur Paris Pocket 1999raquo 47411 Description xvis 364 xxxi p 18 cm Sujets Guerre franagtatlemancje 1870-1871-Romans

nouvelles etc (33] g i Paris (France^laquoHistoire-1871 fCommuna^-Romansraquo nouvelles etc [43] p i

Title Contes du lundi Alphonse Daydet preacutefaee et commentaires de Catherine Eugegravene

Author Daudet Alphonse 1840-1897 f2771 j g

Publisher Paris Pocket 1999 [4741] Description xvi 384 xxxiiicirc p 18 cm Subjects Ouerre franco-allemande 1870-1871-Romans

nouvellesraquo etc [33] amp Paris (France^Hlstolre-1871 ^Commune)-Romans nouvelles etc [43] g i

un affichage des reacutesultats dans la langue choisie par lutilisateur (Figure 2)

Une fois repeacutereacutees les notices bibliographiques preacutesentent linformation de maniegravere agrave peu pregraves uniforme et consistante gracircce agrave des regravegles de catalo-gage aussi complexes que strictes Toutefois dans la majoriteacute des catalogues en ligne cette information est afficheacutee en une seule langue la langue de creacuteation de la notice Cest le cas par exemple des vedettes-matiegravere mot ou groupe de mots indiquant le sujet sous lequel tous les eacutecrits ou autres documents traitant du mecircme thegraveme sont entreacutes et regroupeacutes (Office queacutebeacutecois de la langue franccedilaise 2011) Les vedettes-matiegravere sont tireacutes de reacutepertoires ou de listes qui nexistent souvent quen une seule langue Par conseacutequent la notice bibliograshyphique une fois afficheacutee preacutesentera linformation sujet en une seule langue dans les champs SujetsSubjects (Figure 2) Lutilisateur unilingue du catalogue se heurshytera ainsi agrave une difficulteacute importante En effet mecircme sil parvient agrave faire sa recherche gracircce aux fonctionshynaliteacutes de recherche multilingue offertes par le catashylogue lexamen des sujets demeura un mystegravere pour lui puisque ces repreacutesentations de sujets sont extraites dun reacutepertoire eacutelaboreacute dans une langue qui ne lui est pas neacutecessairement familiegravere

Accegraves agrave linformation multilingue numeacuterique

Laccegraves agrave linformation multilingue est un problegraveme de recherche pour lequel des solutions adapteacutees ne sont toujours pas mises en place En 2001 lUNESCO

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 201 1 | 2 0 7

Laccegraves agrave Vinformation multilingue numeacuterique constitue sans aucun

doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier

dans les pays non anglophones ltxgtltxxxgtoltxgtoltgtltgtltgtltgtltgtltx^

sengageait entre autres agrave laquopromouvoir la diversiteacute linguistique dans lespace numeacuterique et encourager laccegraves universel agrave travers les reacuteseaux mondiaux agrave toutes les informations qui relegravevent du domaine public raquo (UNESCO 2003) Cet engagement ferme de lUNESCO laisse deacutejagrave entrevoir un inteacuterecirct croissant envers linforshymation multilingue Toutefois dix ans plus tard cet engagement ne demeure quun pieux souhait Pourshytant selon Fluhr (2010) les applications neacutecessitant la prise en compte dinformations multilingues sont fort nombreuses veille strateacutegique commerciale scientifique brevet surveillance dopinion au niveau international partage dinformation entre socieacuteteacutes multinationales partage dinformation dans des pays plurilingues seacutecuriteacute nationale (lutte contre le terroshyrisme prolifeacuteration nucleacuteaire) etc Laccegraves agrave linformashytion multilingue numeacuterique constitue sans aucun doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier dans les pays non anglophones La question linguistique soulegraveve de nombreuses questions pouvant se reacutesumer ainsi comment les utilisateurs des catalogues en ligne peuvent-ils acceacuteder agrave des documents numeacuteriques divers dans des langues eacutetrangegraveres de maniegravere agrave en faire une utilisation efficace

La probleacutematique de la recherche dinformation multilingue nest pas nouvelle puisque dans les anneacutees 1950 les documentalistes eacutetaient deacutejagrave conscients de limportance de se preacuteoccuper de ce type dinformation (Meacutenard 2008) Comme le suggeacuterait deacutejagrave Suzanne Briet agrave cette peacuteriode

laquo Limportance de la connaissance des langues eacutetrangegraveres pour assurer lune quelconque des formes documentaires na plus besoin decirctre deacutemontreacutee Pour comprendre les documents il faut pouvoir les lire [] Ce sera le rocircle du documentaliste de mettre les documents en des langues diverses agrave la porteacutee de ses usagers raquo (1951)

La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuterishyseacutees des services patrimoniaux des museacutees des biblioshythegraveques et des archives de diffeacuterentes communauteacutes linguistiques est incommensurable Il faut mentionner que linformation multilingue est tout aussi capitale pour les entreprises qui deacutesirent demeurer compeacutetitives surtout avec leacutemergence du pheacutenomegravene de mondialisashy

tion qui magnifie la concurrence entre celles-ci (Meacutenard 2008) De plus les acteurs du commerce eacutelectronique reconnaissent progressivement la neacutecessiteacute dexploiter la langue et les traditions culturelles speacutecifiques des marcheacutes viseacutes (Hillier 2003) La communication multishylingue permet la diffusion dinformation au-delagrave des frontiegraveres des langues Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer et maicirctriser la communication multilingue Dune part linformation numeacuterique a eacuteteacute creacuteeacutee en plus dune langue et dautre part des populations dutilisateurs linguistiquement diffeacuterents et dhorizons culturels divers ont accegraves agrave cette information disponible au bout de leurs doigts Les gouvernements les entreprises et industries agrave rayonneshyment international recherchent constamment des inforshymations dans des journaux et autres ressources Web reacutedigeacutees en langues diverses (Chen et Bao 2009) Leacutetude des technologies et des ressources facilitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les internautes y compris les utilisateurs des catalogues de bibliothegraveques agrave naviguer chercher et utiliser ces ressources multilingues textuelles ou multimeacutedias

Linformation est deacutesormais disponible sur le Web en plusieurs langues et les utilisateurs dInternet communiquent non seulement dans une lingua franca eacutetablie langlais mais aussi dans une multitude dautres langues Certains moteurs de recherche offrent agrave leurs utilisateurs les moyens dacceacuteder agrave cette information Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute dite laquo recherche traduite raquo qui permet entre autres de chercher dans dautres langues et dans la fouleacutee de traduire les documents textuels reacutesultant de leurs requecirctes

Par exemple Google a lanceacute son outil linguisshytique en mai 2007 et est maintenant identifieacute comme le moteur de recherche reacutegulier offrant le meilleur support deacutedieacute agrave linformation multilingue (Zhang et Lin 2007) Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute de laquo traduction des reacutesultats raquo (Outils linguistiques Google 2011) Toutefois ces fonctionnashyliteacutes sont encore tregraves peu reacutepandues Pourtant Oard reacuteveacutelait en 1997 que les technologies de recherche dinshyformation multilingue (RIML) pourraient consideacuterashyblement ameacuteliorer les services commerciaux en ligne tels que Dialog et LexisNexis Pour leur part Petrelli Beaulieu et Sanderson (2002) soulignaient que les traducteurs et les speacutecialistes de linformation tels que les bibliotheacutecaires de reacutefeacuterence servant dintermeacutediaires pour leurs usagers pourraient tirer un grand avantage des meacutecanismes daccegraves agrave des sources multilingues dinformation

Pour le moment ces outils linguistiques foncshytionnent en vase clos et ne sont pas systeacutematiquement offerts agrave la recherche de tous les types de documents Laccegraves aux images numeacuteriques se limite toujours agrave des reacutesultats monolingues Par exemple les images afficheacutees

2 0 8 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 4: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

Figure 1 Interface de recherche - Catalogue IRIS (BAnQ)

Recherche simple JLAlaquoEacuteL Q poser me weamptm

copyTout O Livres CMustque QRIms O Revues et journaux G Images

CZIZZIZZIIZZZZZZIZZZ3 Gacirciumliiii CIumlIumlHIuml)

Quick search

copyAll 0 Books

F -

0 Music U Films C- Magazines and laquoewspapers

_ ~ ^ I I 1 SB

JLHecircte 0 As

C Images

lt a oueslio

documents cartographiques documents darchives et manuscrits etc

Mecircme si la recherche dans le catalogue en ligne ne donne pas neacutecessairement accegraves agrave lobjet documenshytaire en tant que tel il permet un premier contact entre lutilisateur et le document La notice bibliographique contient diffeacuterents types dinformation les meacuteta-donneacutees relatives agrave un document Plus preacuteciseacutement la notice comporte les renseignements permettant agrave lusager didentifier rapidement un document (titre ou nom du ou des auteurs) des informations destineacutees agrave le localiser avec preacutecision (la cote dun livre dans une bibliothegraveque le numeacutero de volume de fascicule et le numeacutero de la premiegravere page pour un article de peacuterioshydique) des identifiants deacutecrivant une entiteacute bibliograshyphique de faccedilon unique (un numeacutero ISBN ou ISSN un lien URL) de mecircme que des informations permettant agrave lutilisateur du catalogue de se faire une ideacutee concregravete du contenu (termes dindexation reacutesumeacute)

Lutilisateur du catalogue en ligne accegravede agrave ces informations gracircce agrave une interface offrant des options de recherche permettant la recherche simple (titre de louvrage nom de lauteur) et la recherche dite laquo avanceacutee raquo lui permettant de combiner plusieurs cleacutes daccegraves de maniegravere agrave raffiner la requecircte Lexamen des interfaces des catalogues de bibliothegraveques reacutevegravele que celles-ci varient consideacuterablement dune bibliothegraveque agrave lautre en ce qui concerne les fonctionnaliteacutes offertes Trop souvent le manque flagrant de convivialiteacute et des cleacutes de recherche offrant un vocabulaire irreacutemeacuteshydiablement hermeacutetique engendrent beaucoup dincershytitude et de frustration chez lutilisateur De plus en plus habitueacute agrave chercher avec des moteurs de recherche de type Google lutilisateur qui tente sa chance dans un catalogue de bibliothegraveque abandonnera rapidement ses recherches et se tournera vers dautres outils ougrave il se sentira deacutefinitivement plus en confiance et pourra se dire en lanccedilant sa requecircte laquo Jai de la chance raquo

Une autre difficulteacute agrave laquelle se heurte lutilisateur du catalogue est dordre linguistique Par exemple le catalogue IRIS de Bibliothegraveque et Archives nationales du Queacutebec (BAnQ 2011) offre la possibiliteacute de chercher des notices bibliographiques avec des fonctionnaliteacutes de recherche en langue franccedilaise et anglaise (Figure 1)

En plus de modifier linterface de recherche le catalogue IRIS agrave linstar de nombreux catalogues offre

Figure 2 Affichage des reacutesultats - Catalogue IRIS (BAnQ)

Titre Contes du lundi Alphonse Daueumlet preacuteface et commentaires de Catherine Eugegravene

Auteur Daudet Alphonse 18401897 [277] amp

Eacutediteur Paris Pocket 1999raquo 47411 Description xvis 364 xxxi p 18 cm Sujets Guerre franagtatlemancje 1870-1871-Romans

nouvelles etc (33] g i Paris (France^laquoHistoire-1871 fCommuna^-Romansraquo nouvelles etc [43] p i

Title Contes du lundi Alphonse Daydet preacutefaee et commentaires de Catherine Eugegravene

Author Daudet Alphonse 1840-1897 f2771 j g

Publisher Paris Pocket 1999 [4741] Description xvi 384 xxxiiicirc p 18 cm Subjects Ouerre franco-allemande 1870-1871-Romans

nouvellesraquo etc [33] amp Paris (France^Hlstolre-1871 ^Commune)-Romans nouvelles etc [43] g i

un affichage des reacutesultats dans la langue choisie par lutilisateur (Figure 2)

Une fois repeacutereacutees les notices bibliographiques preacutesentent linformation de maniegravere agrave peu pregraves uniforme et consistante gracircce agrave des regravegles de catalo-gage aussi complexes que strictes Toutefois dans la majoriteacute des catalogues en ligne cette information est afficheacutee en une seule langue la langue de creacuteation de la notice Cest le cas par exemple des vedettes-matiegravere mot ou groupe de mots indiquant le sujet sous lequel tous les eacutecrits ou autres documents traitant du mecircme thegraveme sont entreacutes et regroupeacutes (Office queacutebeacutecois de la langue franccedilaise 2011) Les vedettes-matiegravere sont tireacutes de reacutepertoires ou de listes qui nexistent souvent quen une seule langue Par conseacutequent la notice bibliograshyphique une fois afficheacutee preacutesentera linformation sujet en une seule langue dans les champs SujetsSubjects (Figure 2) Lutilisateur unilingue du catalogue se heurshytera ainsi agrave une difficulteacute importante En effet mecircme sil parvient agrave faire sa recherche gracircce aux fonctionshynaliteacutes de recherche multilingue offertes par le catashylogue lexamen des sujets demeura un mystegravere pour lui puisque ces repreacutesentations de sujets sont extraites dun reacutepertoire eacutelaboreacute dans une langue qui ne lui est pas neacutecessairement familiegravere

Accegraves agrave linformation multilingue numeacuterique

Laccegraves agrave linformation multilingue est un problegraveme de recherche pour lequel des solutions adapteacutees ne sont toujours pas mises en place En 2001 lUNESCO

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 201 1 | 2 0 7

Laccegraves agrave Vinformation multilingue numeacuterique constitue sans aucun

doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier

dans les pays non anglophones ltxgtltxxxgtoltxgtoltgtltgtltgtltgtltgtltx^

sengageait entre autres agrave laquopromouvoir la diversiteacute linguistique dans lespace numeacuterique et encourager laccegraves universel agrave travers les reacuteseaux mondiaux agrave toutes les informations qui relegravevent du domaine public raquo (UNESCO 2003) Cet engagement ferme de lUNESCO laisse deacutejagrave entrevoir un inteacuterecirct croissant envers linforshymation multilingue Toutefois dix ans plus tard cet engagement ne demeure quun pieux souhait Pourshytant selon Fluhr (2010) les applications neacutecessitant la prise en compte dinformations multilingues sont fort nombreuses veille strateacutegique commerciale scientifique brevet surveillance dopinion au niveau international partage dinformation entre socieacuteteacutes multinationales partage dinformation dans des pays plurilingues seacutecuriteacute nationale (lutte contre le terroshyrisme prolifeacuteration nucleacuteaire) etc Laccegraves agrave linformashytion multilingue numeacuterique constitue sans aucun doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier dans les pays non anglophones La question linguistique soulegraveve de nombreuses questions pouvant se reacutesumer ainsi comment les utilisateurs des catalogues en ligne peuvent-ils acceacuteder agrave des documents numeacuteriques divers dans des langues eacutetrangegraveres de maniegravere agrave en faire une utilisation efficace

La probleacutematique de la recherche dinformation multilingue nest pas nouvelle puisque dans les anneacutees 1950 les documentalistes eacutetaient deacutejagrave conscients de limportance de se preacuteoccuper de ce type dinformation (Meacutenard 2008) Comme le suggeacuterait deacutejagrave Suzanne Briet agrave cette peacuteriode

laquo Limportance de la connaissance des langues eacutetrangegraveres pour assurer lune quelconque des formes documentaires na plus besoin decirctre deacutemontreacutee Pour comprendre les documents il faut pouvoir les lire [] Ce sera le rocircle du documentaliste de mettre les documents en des langues diverses agrave la porteacutee de ses usagers raquo (1951)

La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuterishyseacutees des services patrimoniaux des museacutees des biblioshythegraveques et des archives de diffeacuterentes communauteacutes linguistiques est incommensurable Il faut mentionner que linformation multilingue est tout aussi capitale pour les entreprises qui deacutesirent demeurer compeacutetitives surtout avec leacutemergence du pheacutenomegravene de mondialisashy

tion qui magnifie la concurrence entre celles-ci (Meacutenard 2008) De plus les acteurs du commerce eacutelectronique reconnaissent progressivement la neacutecessiteacute dexploiter la langue et les traditions culturelles speacutecifiques des marcheacutes viseacutes (Hillier 2003) La communication multishylingue permet la diffusion dinformation au-delagrave des frontiegraveres des langues Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer et maicirctriser la communication multilingue Dune part linformation numeacuterique a eacuteteacute creacuteeacutee en plus dune langue et dautre part des populations dutilisateurs linguistiquement diffeacuterents et dhorizons culturels divers ont accegraves agrave cette information disponible au bout de leurs doigts Les gouvernements les entreprises et industries agrave rayonneshyment international recherchent constamment des inforshymations dans des journaux et autres ressources Web reacutedigeacutees en langues diverses (Chen et Bao 2009) Leacutetude des technologies et des ressources facilitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les internautes y compris les utilisateurs des catalogues de bibliothegraveques agrave naviguer chercher et utiliser ces ressources multilingues textuelles ou multimeacutedias

Linformation est deacutesormais disponible sur le Web en plusieurs langues et les utilisateurs dInternet communiquent non seulement dans une lingua franca eacutetablie langlais mais aussi dans une multitude dautres langues Certains moteurs de recherche offrent agrave leurs utilisateurs les moyens dacceacuteder agrave cette information Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute dite laquo recherche traduite raquo qui permet entre autres de chercher dans dautres langues et dans la fouleacutee de traduire les documents textuels reacutesultant de leurs requecirctes

Par exemple Google a lanceacute son outil linguisshytique en mai 2007 et est maintenant identifieacute comme le moteur de recherche reacutegulier offrant le meilleur support deacutedieacute agrave linformation multilingue (Zhang et Lin 2007) Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute de laquo traduction des reacutesultats raquo (Outils linguistiques Google 2011) Toutefois ces fonctionnashyliteacutes sont encore tregraves peu reacutepandues Pourtant Oard reacuteveacutelait en 1997 que les technologies de recherche dinshyformation multilingue (RIML) pourraient consideacuterashyblement ameacuteliorer les services commerciaux en ligne tels que Dialog et LexisNexis Pour leur part Petrelli Beaulieu et Sanderson (2002) soulignaient que les traducteurs et les speacutecialistes de linformation tels que les bibliotheacutecaires de reacutefeacuterence servant dintermeacutediaires pour leurs usagers pourraient tirer un grand avantage des meacutecanismes daccegraves agrave des sources multilingues dinformation

Pour le moment ces outils linguistiques foncshytionnent en vase clos et ne sont pas systeacutematiquement offerts agrave la recherche de tous les types de documents Laccegraves aux images numeacuteriques se limite toujours agrave des reacutesultats monolingues Par exemple les images afficheacutees

2 0 8 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 5: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

Laccegraves agrave Vinformation multilingue numeacuterique constitue sans aucun

doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier

dans les pays non anglophones ltxgtltxxxgtoltxgtoltgtltgtltgtltgtltgtltx^

sengageait entre autres agrave laquopromouvoir la diversiteacute linguistique dans lespace numeacuterique et encourager laccegraves universel agrave travers les reacuteseaux mondiaux agrave toutes les informations qui relegravevent du domaine public raquo (UNESCO 2003) Cet engagement ferme de lUNESCO laisse deacutejagrave entrevoir un inteacuterecirct croissant envers linforshymation multilingue Toutefois dix ans plus tard cet engagement ne demeure quun pieux souhait Pourshytant selon Fluhr (2010) les applications neacutecessitant la prise en compte dinformations multilingues sont fort nombreuses veille strateacutegique commerciale scientifique brevet surveillance dopinion au niveau international partage dinformation entre socieacuteteacutes multinationales partage dinformation dans des pays plurilingues seacutecuriteacute nationale (lutte contre le terroshyrisme prolifeacuteration nucleacuteaire) etc Laccegraves agrave linformashytion multilingue numeacuterique constitue sans aucun doute le deacutefi le plus seacuterieux auquel la bibliothegraveque doit faire face en particulier dans les pays non anglophones La question linguistique soulegraveve de nombreuses questions pouvant se reacutesumer ainsi comment les utilisateurs des catalogues en ligne peuvent-ils acceacuteder agrave des documents numeacuteriques divers dans des langues eacutetrangegraveres de maniegravere agrave en faire une utilisation efficace

La probleacutematique de la recherche dinformation multilingue nest pas nouvelle puisque dans les anneacutees 1950 les documentalistes eacutetaient deacutejagrave conscients de limportance de se preacuteoccuper de ce type dinformation (Meacutenard 2008) Comme le suggeacuterait deacutejagrave Suzanne Briet agrave cette peacuteriode

laquo Limportance de la connaissance des langues eacutetrangegraveres pour assurer lune quelconque des formes documentaires na plus besoin decirctre deacutemontreacutee Pour comprendre les documents il faut pouvoir les lire [] Ce sera le rocircle du documentaliste de mettre les documents en des langues diverses agrave la porteacutee de ses usagers raquo (1951)

La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuterishyseacutees des services patrimoniaux des museacutees des biblioshythegraveques et des archives de diffeacuterentes communauteacutes linguistiques est incommensurable Il faut mentionner que linformation multilingue est tout aussi capitale pour les entreprises qui deacutesirent demeurer compeacutetitives surtout avec leacutemergence du pheacutenomegravene de mondialisashy

tion qui magnifie la concurrence entre celles-ci (Meacutenard 2008) De plus les acteurs du commerce eacutelectronique reconnaissent progressivement la neacutecessiteacute dexploiter la langue et les traditions culturelles speacutecifiques des marcheacutes viseacutes (Hillier 2003) La communication multishylingue permet la diffusion dinformation au-delagrave des frontiegraveres des langues Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer et maicirctriser la communication multilingue Dune part linformation numeacuterique a eacuteteacute creacuteeacutee en plus dune langue et dautre part des populations dutilisateurs linguistiquement diffeacuterents et dhorizons culturels divers ont accegraves agrave cette information disponible au bout de leurs doigts Les gouvernements les entreprises et industries agrave rayonneshyment international recherchent constamment des inforshymations dans des journaux et autres ressources Web reacutedigeacutees en langues diverses (Chen et Bao 2009) Leacutetude des technologies et des ressources facilitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les internautes y compris les utilisateurs des catalogues de bibliothegraveques agrave naviguer chercher et utiliser ces ressources multilingues textuelles ou multimeacutedias

Linformation est deacutesormais disponible sur le Web en plusieurs langues et les utilisateurs dInternet communiquent non seulement dans une lingua franca eacutetablie langlais mais aussi dans une multitude dautres langues Certains moteurs de recherche offrent agrave leurs utilisateurs les moyens dacceacuteder agrave cette information Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute dite laquo recherche traduite raquo qui permet entre autres de chercher dans dautres langues et dans la fouleacutee de traduire les documents textuels reacutesultant de leurs requecirctes

Par exemple Google a lanceacute son outil linguisshytique en mai 2007 et est maintenant identifieacute comme le moteur de recherche reacutegulier offrant le meilleur support deacutedieacute agrave linformation multilingue (Zhang et Lin 2007) Ces outils linguistiques fournissent aux utilisateurs une fonctionnaliteacute de laquo traduction des reacutesultats raquo (Outils linguistiques Google 2011) Toutefois ces fonctionnashyliteacutes sont encore tregraves peu reacutepandues Pourtant Oard reacuteveacutelait en 1997 que les technologies de recherche dinshyformation multilingue (RIML) pourraient consideacuterashyblement ameacuteliorer les services commerciaux en ligne tels que Dialog et LexisNexis Pour leur part Petrelli Beaulieu et Sanderson (2002) soulignaient que les traducteurs et les speacutecialistes de linformation tels que les bibliotheacutecaires de reacutefeacuterence servant dintermeacutediaires pour leurs usagers pourraient tirer un grand avantage des meacutecanismes daccegraves agrave des sources multilingues dinformation

Pour le moment ces outils linguistiques foncshytionnent en vase clos et ne sont pas systeacutematiquement offerts agrave la recherche de tous les types de documents Laccegraves aux images numeacuteriques se limite toujours agrave des reacutesultats monolingues Par exemple les images afficheacutees

2 0 8 OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 6: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

pour la requecircte laquo voiture raquo seront lensemble des images indexeacutees avec le mot laquo voiture raquo Si le chercheur dimages deacutesire eacuteventuellement augmenter ou varier les reacutesultats avec le mot eacutequivalent en anglais laquo cars raquo il lui faudra formuler une autre requecircte en anglais Et sil nest pas familier avec le mot anglais le chercheur dimage devra trouver un moyen de traduire sa requecircte laquo voiture raquo en anglais puisque le moteur de recherche ne fournit pas neacutecessairement un lien direct entre les fonctionnaliteacutes de recherche dimages et les meacutecanismes de traduction Cette gymnastique entre les options de recherche et de traduction nest pas agrave la porteacutee de tous les utilisateurs et provoque ineacutevitablement de la frustration voire mecircme du deacutecouragement La plupart des utilisateurs contishynuent donc de chercher des images numeacuteriques dans une seule langue qui les privera daccegraves agrave de veacuteritables treacutesors de ressources visuelles

La recherche dinformation multilingue (riml)

Laccegraves agrave linformation multilingue est un problegraveme de recherche qui demande toujours quon sy attarde Cette information existe dans de nombreux contextes On pensera dabord aux bibliothegraveques traditionnelles ou numeacuteriques sources privileacutegieacutees dinformation depuis toujours Comment celles-ci peuvent-elles mieux faire face aux nombreux deacutefis engendreacutes par la prolifeacuteshyration de documents en langues diverses et par une diversification accrue de leurs clientegraveles en raison dun accegraves deacutesormais quasi universel agrave leurs ressources On pensera eacutegalement aux treacutesors du Web Ainsi NETen-dances (2010) indique que la progression de lutilisashytion dInternet saccompagne ineacutevitablement dune augmentation dans la recherche dinformation (Centre francophone dinformatisation des organisations 2010) Par exemple mecircme si les Queacutebeacutecois preacutefegraverent toujours connaicirctre les actualiteacutes et les nouvelles par le trucheshyment de la teacuteleacutevision on remarque que celle-ci est en perte de vitesse au profit des journaux numeacuteriques et dInternet On peut se demander comment les intershynautes peuvent sassurer un accegraves complet et approprieacute agrave un ensemble de documents numeacuteriques en langues diverses La reacuteponse agrave ces questions se trouve sans aucun doute dans la conception le deacuteveloppement et limplantation de solutions documentaires adapteacutees agrave la diversiteacute linguistique des documents numeacuteriques accesshysibles en ligne

Sur la lanceacutee des campagnes deacutevaluation du Text REtrieval Conference (TREC) la recherche dinformashytion multilingue (RIML) a eacuteteacute abondamment eacutetudieacutee au cours des 15 derniegraveres anneacutees La RIML est un type de recherche dinformation permettant de repeacuterer un document lorsque la langue de la requecircte est diffeacuterente de la langue des documents repeacutereacutes (Oard et Diekema 1998) Deux approches sont habituellement proposeacutees en RIML La premiegravere consiste agrave traduire les documents au

Certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de documents la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) ooltxgtoltgtltxgtltgtltgtltxgtltgtoltxgtltgtlt^^

complet dans toutes les langues alors que la deuxiegraveme suppose la traduction des requecirctes dans la langue des documents agrave repeacuterer (Kishida 2005) Ces deux approshyches font geacuteneacuteralement appel agrave trois types de ressources linguistiques pour la traduction les dictionnaires bilingues ou multilingues les systegravemes de traducshytion automatique et les corpus parallegraveles ou comparashybles (Meacutenard 2008) Ces ressources linguistiques ont chacune deacutemontreacute leurs forces et leurs faiblesses Or il semble que la deacutemarche la plus prometteuse consiste agrave combiner plusieurs ressources diffeacuterentes pour la traduction (Braschler 2004)

De nombreux travaux relieacutes agrave la RIML textuelle ont eacuteteacute effectueacutes depuis quelques anneacutees (Jones 2002 Nie 2003 Petrelli et al 2004 Kishida 2007 Meacutenard 2008) Ces travaux mettent en relief plusieurs problegravemes Ainsi certains chercheurs considegraverent que peu importe la ressource linguistique utiliseacutee le principal problegraveme associeacute agrave la RIML demeure lambiguiumlteacute seacutemantique et syntaxique deacutecoulant de la traduction (Gey Kando et Peters 2005) Pendant longtemps la RIML sest surtout consacreacutee aux documents textuels Cependant on remarque depuis peu un inteacuterecirct grandissant envers les documents multilingues autres que textuels limage numeacuterique par exemple En outre certains travaux en RIML eacutetudient les systegravemes de questions reacuteponses (QR) qui recherchent dans un ensemble de docushyments la reacuteponse agrave une question poseacutee en langage naturel (par exemple quel est le premier homme agrave avoir marcheacute sur la lune ) Le meacutecanisme dextraction des reacuteponses consiste dans un premier temps agrave obtenir un court passage de texte Puis dans un second temps la reacuteponse est extraite de ce passage Pour le moment les systegravemes de QR sont surtout monolingues Toutefois agrave mesure que les moteurs de traduction sameacutelioreront les systegravemes de QR multilingues offriront des perforshymances de plus en plus inteacuteressantes Ce type de meacutecashynismes pourrait bien reacutevolutionner un jour le travail de reacutefeacuterence des bibliotheacutecaires

Dautres initiatives ont eacutegalement vu le jour Parmi celles-ci mentionnons laquo The European Library raquo (La Bibliothegraveque Europeacuteenne) qui offre dans 35 langues un accegraves aux collections des 48 bibliothegraveques nationales de lEurope Les ressources des bibliothegraveques nationales partenaires sont agrave la fois numeacuteriques (livres affiches

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 0 9

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 7: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues

ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees

deux ressources primordiales qui faciliteront Vaccegraves agrave Vinformation multilingue ltXKgt0ltXgt0ltgtltXgtltXgtltgtltgtltgtltgtltgt^^

enregistrements sonores videacuteos) et bibliographiques (European Library 2011) Le projet Europeana quant agrave lui propose six millions dobjets numeacuteriques dont des images (tableaux estampes cartes photographies et dessins) des textes (livres journaux lettres archives) des fichiers sonores (musique et collections sonores de phonogrammes bandes disques et eacutemissions de radio) et des videacuteos (films actualiteacutes et eacutemissions de teacuteleacutevishysion) provenant de sources diverses (museacutees galeries centres darchives bibliothegraveques collections audioshyvisuelles) (Europeana 2011) En outre des tentatives pour creacuteer des outils pour laccegraves sujet multilingue ont eacutegalement eacuteteacute entreprises Le projet MACS est lun des plus prometteurs Son but est dinteacutegrer les systegravemes dindexation les plus deacuteveloppeacutes et les plus utiliseacutes Library of Congress Subject Headings (LCSH) Reacutepershytoire dautoriteacutes-matiegravere encyclopeacutedique et alphashybeacutetique unifieacute (RAMEAU) et Schlagwortnormdatei (SWD) (Landry 2006) La possibiliteacute dinterconnecter ces langages matiegraveres a eacuteteacute eacutetudieacutee aux fins de fournir laccegraves multilingue aux collections des bibliothegraveques nationales Par ailleurs lavegravenement du Web seacutemantique pourrait bien signifier une avanceacutee sans preacuteceacutedent vers laccegraves agrave linformation multilingue avec entre autres le langage de repreacutesentation SKOS (Simple Knowledge Organisation System) Construit sur la base du langage RDF (Resource Description Framework) SKOS a pour principal objectif de permettre lutilisation simplifieacutee de vocabulaires structureacutes Les ressources deacutecrites sont des concepts comme des classes des proprieacuteteacutes ou des concepts utiliseacutes pour lindexation SKOS pourrait eacuteventuellement permettre par lentremise de lencodage RDF la mise en correspondance de theacutesaurus multilinshygues (W3C 2011) et par voie de conseacutequence reacutegler en tout ou en partie les problegravemes dincompatibiliteacute entre vocabulaires dindexation

Il faut toutefois constater que les projets et initiashytives deacutecrits preacuteceacutedemment demeurent tout de mecircme isoleacutes et laccegraves agrave linformation multilingue reste limiteacute agrave cause des coucircts technologiques importants et du manque de formation des catalogueurs en matiegravere de langues La plupart des utilisateurs nont encore accegraves agrave la recherche dinformation que dans leur propre langue En outre les lois reacutegissant lutilisation de linformashytion dans diffeacuterentes langues sont encore loin decirctre complegravetes particuliegraverement en ce qui concerne le droit

dauteur Langues et socieacuteteacutes se sentent encore menaceacutees par certains efforts numeacuteriques tels que le projet Google Book Search Les bibliothegraveques numeacuteriques deacutesirant offrir des ressources en ligne en plusieurs langues ne se sont toujours pas doteacutees dune ontologie ou encore dun scheacutema de meacutetadonneacutees deux ressources primordiales qui faciliteront laccegraves agrave linformation multilingue

De nouveaux outils tels que les systegravemes daccegraves agrave linformation multilingue les systegravemes de traducshytion automatique les theacutesaurus multilingues etc ont fait lobjet de nombreuses recherches Cependant les deacuteveloppements technologiques en deacutecoulant nont toujours pas complegravetement reacutesolu tous les problegravemes lieacutes agrave la diversiteacute linguistique sans parler des questions lieacutees aux communications et agrave lexclusion sociale Par exemple aucun veacuteritable meacutecanisme daccegraves agrave linforshymation multilingue (par ex un systegraveme de traduction automatique permettant de traduire les requecirctes ou les documents reacutesultant de la recherche un theacutesaurus multilingue facilitant laccegraves sujet etc) nest disponible dans la plupart des catalogues de bibliothegraveques

En outre il faut souligner que mecircme si certaines fonctionnaliteacutes permettant la recherche multilingue sont offertes aux utilisateurs ceux-ci nont pas neacutecessaishyrement le reacuteflexe de les utiliser Dans une eacutetude reacutecente nous avons demandeacute agrave 30 participants de rechercher des images agrave laide de moteurs de recherche offrant des fonctionnaliteacutes dites laquo translinguistiques raquo pour le repeacuterage dimages repreacutesentant des objets museaux (Meacutenard 2010) Les reacutesultats de notre recherche ont reacuteveacuteleacute que la majoriteacute des participants ayant effectueacute les tacircches de repeacuterage dimages nont pas vraiment utiliseacute ces fonctionnaliteacutes de recherche multilingue par exemple la possibiliteacute de rechercher par laquo langue raquo ou par laquo pays raquo En outre la possibiliteacute de seacutelectionner une interface de recherche dans diffeacuterentes langues na que rarement eacuteteacute mentionneacutee par les reacutepondants Curieusement les participants agrave leacutetude ayant accompli leurs tacircches de repeacuterage dimages et fait usage du filtre par laquo langue raquo ont tout de mecircme constateacute que celui-ci contribue au succegraves du repeacuterage Ces reacutesultats mecircme sils semblent contradictoires laissent preacutesager que le besoin dexplorer et de repeacuterer linformation peu importe la langue dans laquelle celle-ci existe est bien reacuteel et que si un veacuteritable systegraveme de repeacuterage dinforshymation donnant la possibiliteacute de repeacuterer rapidement linformation multilingue voit le jour les utilisateurs seront sans doute disposeacutes agrave en faire usage If we built it they will come

Conclusion

Nous vivons une peacuteriode fascinante de lhistoire des services offerts par les bibliothegraveques Pour la premiegravere fois il est possible pour celles-ci doffrir un accegraves vaste diversifieacute et universel agrave des collections numeacuteriques agrave leacutechelle mondiale Sappuyant sur des ressources heacuteteacute-

2 1 O OCTOBRE bull DEacuteCEMBRE 201 1 | DOCUMENTATION ET BIBLIOTHEgraveQUES

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1

Page 8: Bibliothèques et accès à l’information multilingue : pour ......Bibliotecas y acceso a la información multilingüe: para ponerle fin a Babel Elaine Ménard Volume 57, numéro

rogegravenes la bibliothegraveque traditionnelle ou numeacuterique destine son contenu agrave des populations diverses dutilishysateurs et se doit de pourvoir agrave des demandes complexes sur les plans multimeacutedia multiculturel et multilingue La valeur de linformation scientifique culturelle et peacutedagogique des nombreuses collections numeacuteriques des bibliothegraveques de diffeacuterentes communauteacutes linguisshytiques est un fait bien eacutetabli Toutefois les enjeux engenshydreacutes par la diversiteacute linguistique du Web sont toujours eacutenormes Tous les secteurs de leacuteconomie mondiale de mecircme que les populations de diverses cultures doivent maintenant composer avec la communication multilingue

Linformation numeacuterique existe en plus dune langue et des populations dutilisateurs dhorizons culturels diversifieacutes et linguistiquement distincts ont accegraves agrave cette information disponible au bout de leurs doigts Leacutetude des technologies et des ressources facishylitant les eacutechanges multilingues est donc devenue neacutecessaire afin daider les utilisateurs des bibliothegraveques agrave naviguer chercher et utiliser ses ressources multishylingues textuelles ou multimeacutedias Toutefois les outils dindexation et dinterrogation multilingue ne peuvent ecirctre creacuteeacutes que sous condition dun travail de coopeacuterashytion entre chercheurs et bibliothegraveques Beaucoup de travail reste donc agrave faire pour briser lisolement des individus et leur donner le plein accegraves agrave linformation reg

Sources consulteacutees

Bibliothegraveque et Archives nationales du Queacutebec 2011 Catalogue IRIS lthttpirisbanqqccairisaspxgt (consulteacute le 10 janvier 2011)

Braschler Martin 2004 Combination approaches for multilingual text retrieval Information Retrieval 7(12) 183-204

Briet Suzanne 1951 Quest-ce que la documentation Paris Eacuteditions documentaires industrielles et techniques

Centre francophone dinformatisation des organisations 2010 Internet source dinformation et modes de communication lthttpwwwcefrioqccaflleadmindocumentsPublication

NETendances-Voh_4_liens-basse_pdfgt (consulteacute le 12 mars 2011) Chen Jiangping et Yu Bao 2009 Cross-language search The case

of Google Language Tools First Monday 14(3) lthttpfirst-mondayorghtbincgiwrapbinojsindexphpfmarticle viewArticle2335gt (consulteacute le 10 janvier 2011)

Chu Heting 2003 Information representation and retrieval in the digital age Medford NJ Information Today

Crystal David 2006 Language and the Internet 2nd ed Cambridge Cambridge University Press

European Library 2011 Frequently Asked Questions lthttpsearch theeuropeanlibraryorg portalenindexhtmlgt (consulteacute le 10 Janvier 2011)

Europeana 2011 Page daccueil lthttpwwweuropeanaeuportalgt (consulteacute le 10 janvier 2011)

Fluhr Christian 2010 Mondialisation et information multilingue lthttpdocnuminfoje20102juilletCFluhrpdfgt (consulteacute le 12 mars 2011)

Gey Frederic C Noriko Kando et Carol Peters 2005 Cross-language information retrieval the way ahead Information Processing amp Management 41(3) 415-431

Google 2011 Outils linguistiques lthttpwwwgooglecalanguage__ tools hl=frgt (consulteacute le 10 janvier 2011)

Haynes David 2004 Metadata for information management and retrieval London Facet Publishing

Hillier Mathew 2003 The role of cultural context in multilingual website usability Electronic Commerce Research Applications 2(1) 2-14

Internet World Stats 2010 Internet users by language lthttpwww internetworldstatscom stats7htm gt (consulteacute le 10 janvier 2011)

Jones Gareth J F 2002 Cross-language information retrieval consolidating and moving forwards lthttpucdataberkeley edu 7ioisigir-2002sigir2002CLIR-i5-jonespdfgt (consulteacute le 10 Janvier 2011)

Kishida Kazuaki 2005 Technical issues of cross-language informashytion retrieval a review Information Processing amp Manageshyment 41(3) 433-455-

Landry Patrice 2006 Multilinguisme et langages documentaires le projet MACS en contexte europeacuteen Documentation et bibliothegraveques 52(2) 121-129

Meacutenard Elaine 2008 Eacutetude sur linfluence du vocabulaire utiliseacute pour lindexation des images en contexte de repeacuterage multilingue Thegravese de doctorat Montreacuteal Universiteacute de Montreacuteal lthttps papyrusbibumontrealca jspuibits-tream18662611imenard-e-these-indexation-reperage-imagespdfgt (consulteacute le 10 janvier 2011)

Meacutenard Elaine 2010 Eacutetude comparative de moteurs de recherche pour le repeacuterage dimages illustrant des objets museaux In Document numeacuteriques entre permanence et mutations Actes du 13e Colloque International sur le Document Eacutelectronique sous la direction de Madjid Ihadjadene Manuel Zacklad et Khaldoun Zreik Paris Europia production 159-172

Nie Jian-Yun 2003 Cross-language information retrieval IEEE Computational Intelligence Bulletin 2(1) 19-24

Office queacutebeacutecois de la langue franccedilaise 2011 Le grand dictionshynaire terminologique lthttpwwwgranddictionnairecomgt (consulteacute le 10 janvier 2011)

Oard Douglas W 1997 Serving users in many languages Cross-language information retrieval for digital libraries D-Lib Magazine 3(12) lthttpwwwdliborgdlib december97 oardi2oardhtmlgt (consulteacute le 10 janvier 2011)

Oard Douglas W et Anne R Diekema 1998 Cross-language inforshymation retrieval In Annual Review of Information Science and Technology 33 223-256 Medford NJ Information Today

Petrelli Daniela Micheline Beaulieu et Mark Sanderson 2002 User-participation in CLIR research In Proceedings of the Hawaii International Conference on System Science - HICSS-33 lthttpucdataberkeleyedu 7ioisigir-2oo2sigir2oo2CLIR-12-petrellipdf gt (consulteacute le 10 janvier 2011)

Petrelli Daniela et al 2004 Observing users designing clarity a case study on the user-centered design of a cross-language information retrieval system Journal of the American Society for Information Science and Technology 55(10) 923-934

UNESCO 2003 Diversiteacute culturelle et linguistique dans la socieacuteteacute de linformation lthttptinyurlcomy837negt (consulteacute le 10 janvier 2011)

W3C 2011 SKOS Simple Knowledge Organization System - Home Page lthttpwwww3org200402skosgt (consulteacute le 12 mars 2011)

Zhang Jin et Suyu Lin 2007 Multiple language supports in search engines Online Information Review 31(4) 516-532

DOCUMENTATION ET BIBLIOTHEgraveQUES | OCTOBRE bull DEacuteCEMBRE 2011 | 2 1 1