CC
BY
woo
dley
won
derw
orks
, Fl
ickr
Bibliothèques, crowdsourcing et
métadonnées sociales
Les évolutions des cataloguesENSSIB, 6-9 octobre 2014
CC B
Y-NC
DC
Smith
, Flic
kr
S’inscrire dans un écosystème où l’interaction est la norme
CC B
Y-NC
-SA
Emily
Talia
ferro
Prin
ce, F
lick
Inventer de nouvelles relations avec nos
publics
… pour enrichir nos catalogues, et les services à
nos usagers
CC B
Y fib
robl
ast,
Flick
r
CC B
Y-SA
T. K
iya,
Flic
kr
Les métadonnées ne naissent ni dans les roses ni dans les
choux
professionnelles automatiques … ou sociales !
CC
BY-
NC
-SA
mon
mim
oun,
Flic
kr
Une terminologie fluctuante…qui reflète différentes réalités
Crowdsourcing
Web collaboratifWeb participatif
Métadonnées sociales
Production participative
CC B
Y-NC
-ND
last
beas
t, Fl
ickr
De l’engagement à la participation…
Les archives participatives
Kate Theimer
Un organisme, un site ou une collection auxquels des personnes qui ne sont pas
des professionnels des archives apportent leur connaissance ou ajoutent des
contenus, généralement dans un contexte numérique en ligne. Il en résulte une
meilleure compréhension des documents d’archives.
Le musée participatif
Nina Simon
« Je définis une institution culturelle participative comme un endroit où
les visiteurs peuvent créer, partager et échanger entre eux autour des
objets culturels. »
CC B
Y-NC
ryan
cr, F
lickr
Les enjeux culturels de la participation
1
CC B
Y-ND
Jere
my
Salm
on, F
lickr
L’économie de la recommandation
Réseaux sociaux de lecture
… et dans les catalogues ?
Sur WorldCat, Possibilité d’ajouter notes, critiques et
mots-clés
Recommandations automatiques et
avis des lecteurs à la BM de Saint-
Herblain
CC B
Y-NC
-ND
jona
than
_W, F
lickrUne participation plus riche pour la
culture et le patrimoine
Sciences citoyennes
Parmi les projets de sciences citoyennes Zooniverse,
Ancient Lives (Université d’Oxford) propose la
transcription de fragments de papyrus en grec
Culture participative
La cartothèque des Archives du Lot-et-Garonne collecte
des cartes postales auprès des particuliers.
Atteindre la masse critique ?
CC B
Y-NC
-ND
Lulu
Witc
h, F
lickr
La loi de participation :« 90-9-1 »
Et à l’heure du web social ?
Sour
ce: B
BC
Gamification
La Bibliothèque nationale de Finlande a fait le choix du jeu en
ligne avec son programme collaboratif pour l’amélioration de
l’OCR DigitalKoot.
Choix des corpus
La New York Public Library propose aux gourmands de transcrire et géolocaliser des menus de restaurants
(What’s on the menu?)
Un nouvel élan pour les catalogues de
bibliothèque ?
CC B
Y-ND
Ham
pton
Uni
vers
ity, F
lickr
2
Des métadonnées sociales qui répondent mieux aux usages et
besoins des internautes
CC B
Y yo
ppy,
Flic
kr
CC-BY-SA Sylvain Machefer
Un acteur qui a modifié nos
habitudes
L’indexation de la bibliothèque
Une indexation en langage naturel (folksonomies)
La Bibliothèque du Congrès ouvre plus de 20000
photographies sur Flickr. En un an, 67000 tags ont été
ajoutés.Le tagging des usagers
Une recherche en plein texte
Grâce au projet européen Monasterium, les chercheurs
transcrivent des chartes médiévales, qu’ils peuvent
compléter d’une édition critique.
Une granularité de description plus fine
Les usagers de la bibliothèque municipale de
Lyon sont invités à identifier des photographies.
Une géolocalisation des contenus
Le Map Wraper de la New York Public Library permet
aux usagers de géoréférencer les cartes
anciennes.
L’indexation fine des documents audiovisuels
L’Institut néerlandais pour le Son et l’Image propose
à travers son projet Waisda? l’indexation
collaborative des archives de la télévision.
CC B
Y-NC
dr c
oop,
Flic
kr
Crowdsourcing : dans les catalogues ou sur les
bibliothèques numériques ?
La numérisation : des erreurs plus visibles…
CC B
Y-NC
-ND
Rust
man
, Flic
kr… mais aussi un élan pour des projets de métadonnées sociales
What’s the score at the Bodleian ?
Un catalogage collectif de partitions
Les amateurs de musique sont invités à décrire les
collections musicales de la Bodleian Library dans le
projet What’s the Score at the Bodleian?
Un catalogage collectif de manuscrits
Manuscrits islamiques de l’Université du Michigan
CC
BY-
NC
-ND
Buk
owsk
i, Fl
ickr
Bibliothèque numérique : lieu de la participation ?Catalogue : lieu de destination des métadonnées produites ?
CC B
Y Ro
bert
Cous
e-Ba
ker,
Flick
r
Quels lieux pour les projets de crowdsourcing ?
Sur une plateforme extérieure
La BnF propose dans Wikisource la
correction de l’OCR de documents
Sur une plateforme dédiée
La « Rosalipédie » est un wiki collaboratif accessible
via la bibliothèque numérique de Toulouse
Au cœur de la bibliothèque
La bibliothèque nationale d’Australie intègre son
programme de correction collaborative d’OCR sur les périodiques numérisés au
cœur même de sa bibliothèque numérique Trove.
CC B
Y-SA
e30
00, F
lickr
Comment assurer la qualité des données produites ?
Evaluation sociale et validation par des
experts
La qualité des contributions de Transcribe Bentham
(University College London) s’appuie sur une
communauté soudée autour du projet, et sur une
validation par des experts.
Automatisation des vérifications
Dans le projet Old Weather (Archives nationales du
Royaume-Uni), les relevés météorologiques des navires de
la marine royale au début du XXe s. sont transcris par deux
contributeurs.
Miser sur l’encadrement et l’entraide des contributeurs
La plateforme CORRECT (à laquelle
participe la BnF) appuie l’activité de correction sur un
réseau social.
CC
BY-
ND
rip
ples
tone
ga
rden
, Flic
kr
Quels réintégration des
données produites ?
Contribuer hors de la bibliothèques sans
réintégrer les données
La British Library a organisé deux « éditathons » avec
Wikipédia pour l’amélioration des articles la concernant sur l’encyclopédie collaborative.
CC
BY-
SA Je
nny
YE, W
ikim
edia
Com
mon
s
Afficher dans un catalogue des données
produites ailleurs
La Babelthèque permet de rapatrier les données de Babelio (critiques
d’ouvrages et suggestions de lecture) sur les notices bibliographiques correspondantes (Bibliothèque
municipale de Toulouse)
Assurer la coexistence des métadonnées sociales et professionnelles dans les
catalogues
CC B
Y-NC
Sep
hiro
ty F
Iest
a, F
lickr
Indication de la qualité des données
L’interface de What’s on the menu? (New York Public
Library) précise le degré de qualité des données
produites.
Juxtaposition des données
Calice68, le catalogue collectif des médiathèques de Haute-Alsace, indique la
source des données affichées (bibliothécaires, éditeurs, contributeurs).
CC
BY-
NC
-SA
Dav
id S
ky, s
ourc
eLe crowdsourcing comme complément de traitements
automatisés
51
Crowdsourcing et web sémantique
Les contributeurs du projet HDA-Labs (Ministère de la Culture) sont invités à indexer leurs ressources
pédagogiques en utilisant le référentiel sémantisé dbpedia.
Correction collaborative d’OCR
La plateforme CORRECT propose une interface de
correction du texte issu de l’OCR automatique.
Sour
ce :
Inte
rnet
Arc
hive
Et si le crowdsourcing devenait le moteur des institutions
culturelles ?
Pour aller plus loin…E. Bouyé, « Le web collaboratif dans les services d’archives publics : un pari sur l’intelligence et la motivation des publics », La Gazette des Archives, n°227 (2012-3).B. W. Brumfield, « Control for Crowdsourced Transcription », Collaborative Manuscript Transcription, 2012.B. Calenge, « Des publics utilisateurs aux publics collaborateurs : une fausse bonne idée ? », Bertrand Calenge : carnet de notes, 2012.E. Cavalié, « Les tags dans les OPAC : ce n’est pas parce que personne ne s’en sert que ça ne sert à rien », Bibliothèques (reloaded), 2010.L. Dujol, « Le catalogue 2.0 ou le mythe de l’usager participatif ? », La bibliothèque apprivoisée, 2009.L. Dujol, La bibliothèque, un espace de participation, 2013.O. Ertzscheid, Folksonomies et indexation sociale : le monde comme catalogue, 2008.R. Holley, “Many Hands Make Light Work: Public Collaborative OCR Text Correction in Australian Historic Newspapers”, 2009.R. Holley, “Crowdsourcing: How and Why Should Libraries Do it?”, D-Lib Magazine., vol. 16, n° 3/4, 2010.O. Le Deuff, « Folksonomies. Les usagers indexent le web », BBF (2006 - t. 51, n° 4).S. Magro, Le web participatif pour la culture, DASM, 2011.E. Manzinali, « Babelthèque à la bibliothèque de Toulouse : observations sur les OPAC 2.0. », Le Monde du livre, 2012.R. Mathis, Wikipédia et les bibliothèques : dix ans après, 2012.I. Matzen Crowdsourcing in the Arts and Humanities, 2013.P. Moirez, « Archives participatives », dans Bibliothèques 2.0 à l’heure des médias sociaux, dir. M. Amar et V. Mesguich, 2012, p. 187-197.P. Moirez, Bibliothèques, crowdsourcing, métadonnées sociales, BBF (sept. 2013).P. Moirez, Crowdsourcing et bibliothèques numériques : et si on secouait notre approche des catalogues ?, 2013.P. Moirez, J.-P. Moreux, I. Josse, Etat de l’art en matière de crowdsourcing dansLes bibliothèques numériques, 2013.L. Pommier, La science participative au service de la société, 2013.V. Puig, Organologie des savoirs et technologies contributives, 2013.M. Ridge, Tips for digital participation, engagement and crowdsourcing in museums, 2013.N. Simon, The Participatory Museum, 2010.K. Smith-Yoshimura, C. Shein, Social Metadata for Libraries, Archives, and Museums, OCLC, 2011-2012.K. Theimer, « The participatory archives », Archives Next, 2011.K. Zickuhr, K. Purcell , L. Rainie, From Distant Admirers to Library Lovers–and beyond : A typology of public library engagement in America, 2014.