57
Indexation sociale et folksonomies : le monde comme catalogue. .Olivier ERTZSCHEID. Maître de conférences en sciences de l’information Université de Nantes / IUT La Roche sur Yon http://www.affordance.info Journées ABES. Montpellier. 20 et 21 Mai 2008

Oe Abes Mai2008

  • Upload
    olivier

  • View
    10.624

  • Download
    1

Embed Size (px)

DESCRIPTION

Folksonomies et indexation sociale : le monde comme catalogue. Intervention aux journées ABES. 21 Mai 2008

Citation preview

Page 1: Oe Abes Mai2008

Indexation sociale et folksonomies : le monde comme catalogue.

.Olivier ERTZSCHEID.

Maître de conférences en sciences de l’information

Université de Nantes / IUT La Roche sur Yon

http://www.affordance.info

Journées ABES. Montpellier. 20 et 21 Mai 2008

Page 2: Oe Abes Mai2008

Le Pitch

• A l'heure du web 2.0, les technologies d'indexation sociale prennent de plus en plus de place dans le repérage, le classement, la hiérarchisation et l'accès à l'information et aux documents.

• Les pratiques professionnelles se dissolvent dans les usages amateurs.

• Quelles sont les frontières et les enjeux de cette nouvelle bibliothéconomie de masse pour la société de la connaissance ?

2

Page 3: Oe Abes Mai2008

Demandez le programme

Chapitre 1er : Définitions & ExemplesChapitre 2nd : Folksonomistes : qui sont-ils ?Chapitre 3ième : Pourquoi ça marche ?Chapitre 4ème : Quelles pratiques ?Chapitre 5ème : Quel avenir ?Chapitre 6ème : Le monde comme pan-catalogue.

Page 4: Oe Abes Mai2008

L’indexation sociale ou « Folksonomie »

Définitions & Exemples

Page 5: Oe Abes Mai2008

« Ce n’est pas sale ! »

5

Page 6: Oe Abes Mai2008

Définition

• « Folksonomies désignent – un processus de classification collaborative– par des mots-clés librement choisis– Ou le résultat de cette classification. » (Wikipédia)

6

Page 7: Oe Abes Mai2008

≠ thesaurus

• « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »

7

Page 8: Oe Abes Mai2008

≠ ontologie

• « ensemble structuré de concepts. (…) • organisés dans un graphe (…) • relations sémantiques et de composition ou d'héritage. »

8

Page 9: Oe Abes Mai2008

Folksonomie ≠ thesaurus ≠ ontologie

• « Folksonomies désignent – un processus de classification collaborative– par des mots-clés librement choisis– Ou le résultat de cette classification. »

• Vocabulaire non-normalisé, • non-structuré, • non-spécifique à un domaine, • sans relations sémantiques ou hiérarchiques.

9

Page 10: Oe Abes Mai2008

Le petit folksonomiste illustré

Source : Agnès de Saxcé BBF 2007 - Paris, t. 52, n° 4. Compte-rendu du colloque évaluation et validation de l’information.

10

Page 11: Oe Abes Mai2008

5 étapes d’indexation Web

<META>Communauté

de pratique

WebSémantique

FOLKSONOMIESCommunauté

D’usage

DUBLIN-COREOAI-PMH

Communauté Métier / Ressources

ONTOLOGIES Communauté compétences

(Outils + métier)

?

?

Standardisation

Linguistiquede corpus

GOOGLEPageRank

« Indexeurs sans le savoir »

11

Page 12: Oe Abes Mai2008

12

Page 13: Oe Abes Mai2008

13

Page 14: Oe Abes Mai2008

Dél.icie.uses folksonomies

14

Page 15: Oe Abes Mai2008

FolsonomiSTES

Martiens ? Visionnaires ?

Gourous ? Une secte ?

Indexeurs du troisième type ?

? Pour ou contre ?

Page 16: Oe Abes Mai2008

Qui indexe ?

Usagers,Consommateurs,

Producteurs, Auteurs,Novices,Experts.

Textes

Docs de travail

Articles scientifiques

Billets de blogs

Photos

Vidéos

A moi

Aux autres

A la volée En surface

En profondeur (deep tagging) En connaissance de cause

Au hasardPour moi (tags privés)

Pour les autres (tags publics)

Organiser, Partager, Chercher, RetrouverAssocier,

« Participer »

Quoi ?

Pourquoi ? Comment ? 16

Page 17: Oe Abes Mai2008

Digital Natives / Digital immigrantsLa loi de (rupert) Murdoch

• Sites pratiquant/proposant l’indexation sociale/communautaire sont – Majoritairement créés

par de jeunes entrepreneurs (start-up)

– Majoritairement utilisés par un public « jeune »

– Majoritairement rachetés par des « digital immigrants »

17

Page 18: Oe Abes Mai2008

? Avantages = Inconvénients ?

• Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite

• Intérêt d’un filtrage collaboratif• gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs)

… • Couverture documentaire totale (documents, livres, photos, couriels, cartes

géographiques …)• Conforme aux usages (onebox, oneword)

• Trop simple, trop peu d’expertise, trop d’hétérogénéité • Confusion entretenue entre pertinence (autorité) et popularité

(photos les plus vues les plus tagguées et réciproquement)• polysémie, synonymie, lemmatisation, orthographe, langue,

redondance, univers de référence (« peinture » et/ou « louvre », etc.)

• = Méta-bruit

18

Page 19: Oe Abes Mai2008

? Avantages = Inconvénients ?

• « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. »

• Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation.

• Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises.

• Mais sur les objets ? – Qui va se lancer dans une entreprise de classification

aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ?

– Doit-on décider qu’elles sont inclassables ??

19

Page 20: Oe Abes Mai2008

Pourquoi ça marche ??

« Si l'on tague "A la recherche du temps perdu", dans son édition de 1947 en 15 volumes (disponible en téléchargement ici), on trouve 442 occurrences du prénom "Odette" sur les quelques 5000 pages de l'ouvrage. Et pourtant Proust ne l'a pas appelé "A la recherche d'Odette ». (à noter qu'on ne trouve que 24 "madeleine"). Comme quoi les tags c'est de la merde. Et les taguers des branleurs. »

Commentaire d’un billet publié sur Embruns.net (blog de Laurent Gloaguen)

Page 21: Oe Abes Mai2008

Une image vaut 1000

mots (clés ?)

Graphic by Elliancet in Search Engine Land.

21

Page 22: Oe Abes Mai2008

Les raisons du succès

1. Temporalité réunifiée entre interface et indexation2. La fonction symbolique plutôt que la vocation analytique.3. Sagesse des foules4. Auto-régulation5. Faible coût cognitif6. (enfin une) Indexation orientée-tâche

1 2 3 4 5 6

22

Page 23: Oe Abes Mai2008

Les raisons du succès (1/5) : Une temporalité (ré?)unifiée entre interface et indexation

• Temps consultation ≈ temps de l’accès ≈ temps de l’indexation• Micro-temporalités successives, parfois simultanées, jamais contraintes,

sans préalables.

• Langages documentaires & formels (Thésaurus & ontologies) pour l’accès à l’information :

– Interfaces asynchrones.– Nbre textes > nbre d’indexeur = temporalité interfaçage longue– Acculturation difficile

• Folksonomies – Interface synchrone. Le temps de l’indexation est le même que celui de l’accès et du

repérage.– Nbre documents < = nbre d’indexeurs = temporalité interfaçage courte (simultanée)– Acculturation a priori.

23

Page 24: Oe Abes Mai2008

Les raisons du succès (2/5) : La fonction symbolique plutôt que la vocation analytique.

• Vocation analytique des langages documentaires & formels : – classer physiquement et/ou conceptuellement selon la nature de

l’objet– Univers de référence « construit » par l’indexeur, l’expert et l’état des

connaissances au moment de l’indexation– Approche « objective », logique ou logiciste

• Fonction symbolique Folksonomies : – Repérer sémantiquement pour accéder et/ou représenter l’objet.– Univers de référence induit par l’objet lui-même et le rapport

objet/indexeur (affordance)– Approche « subjective », empirique, « essai et erreur »

24

Page 25: Oe Abes Mai2008

Les raisons du succès (3/5) : la sagesse des foules

• « (…) N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)... » Adam Bosworth, VP ingénierie chez Google.

• Postule l’existence pour tout élément donné (texte, image, document) d’une série de mots et termes composant le plus petit lexique commun (concensus) permettant de décrire l'objet ou le document.

25

Page 26: Oe Abes Mai2008

Les raisons du succès (4/5) : un faible coût cognitif

• Marquage élimine la phase de décision (choix de la bonne catégorie)

• Dissipe la phase de paralysie d’analyse (choix du mot-clé)• Permet l’ancrage en contexte socio-cognitif immédiat.

– Google image labeller : http://images.google.com/imagelabeler/

• Hiérarchie centrée document VS anarchie centrée utilisateur MAIS …• Confirmation de l’axiomatique du memex :

– « human mind doesn’t work that way »– « association »

26

Page 27: Oe Abes Mai2008

Les raisons du succès (5/5) : Auto-régulation ?

• Golder Scott A. & Huberman Bernardo A., « The Structure of Collaborative Tagging Systems », Information Dynamics Lab, HP Labs , 2005.

• Méthodologie– Site Del.icio.us sur une période donnée (5 jours)– Corpus :

• Les plus populaires (212 URL présents dans 19422 signets)• Échantillon aléatoire de 229 usagers ayant partagé durant

période test + tous leurs signets y compris hors-période (68 668 signets)

27

Page 28: Oe Abes Mai2008

Les lois folksonomiques

• Loi de caractérisation– 7 types de tags : Thématiques (orientés sujet) / Nature de

l’objet (article, blog, livre) / Propriétaire (auteur du signet) / adjectifs de caractérisation (drôle, stupide, horreur) / auto-référence (messignets, monnom …) / orientés tâche (à lire, recherche d‘emploi)

• Loi de partage– Plus on possède (= partage), plus on taggue (avec fortes

variations selon individus)• Loi de Feedback positif

– Motifs stables dans la proportion et le choix des tags.– Plus une ressource est partagée, plus le nombre de tags la

décrivant se stabilise ainsi que leur nature.

28

Page 29: Oe Abes Mai2008

Folksonomies & Pratiques

Page 30: Oe Abes Mai2008

Librarything : la communauté comme indexeur

Site communautaire à vocation bibliothéconomique : www.librarything.comFévrier 2006: 1.5 millions de références => Juin 2006: 3.2 millions => Nov 2006: 6.2 millions => Juin 2007 : 14 millions => Mai 2008 : 26 Millions

Page 31: Oe Abes Mai2008

Le meilleur des deux mondes ?

• Indexation « standard » : – notice au format MARC, – indexation DEWEY, – LC « subjects headings »,

• Indexation sociale : – tags associés, – fiches de lecture et revues de la

communauté, – système de recommandation

31

Modèle collaboratif, auto-régul, ouvert en lecture et en écriture, « Amazon-ifié », « OPAC-ifié »

Page 32: Oe Abes Mai2008

Les musées … aussi !

• Metropolitan Museum of Art indique que :– "sur 30 oeuvres d'art indexées par les

usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée."

• Outil collaboratif de tagging à destination des musées– http://www.steve.museum/

« Nécessité fait loi. »

32

Page 33: Oe Abes Mai2008

Les musées … aussi !

• Musée McCord de Montréal.

• Usagers créent et ajoutent : – des tags pour annoter

les fonds existants, – des commentaires, – des images

personnelles,– Peuvent visionner

l'ensemble des "circuits publics".

« Nécessité fait loi. »

33

Page 34: Oe Abes Mai2008

Les bases de données scientifiques … aussi !!

hubmed.org 34

Page 35: Oe Abes Mai2008

Le catalogue … aussi !! http://orlabs.oclc.org/Identities

35

Page 36: Oe Abes Mai2008

Le moteurs … aussi !!!

• Plusieurs « écoles »– Moteurs dédiés (technorati.com)– Fonctionnalité intégrée (MyYahoo)– Illusion folksonomique (cloud.clusty.com)

36

Page 37: Oe Abes Mai2008

Les communautés scientifiques : aussi !!!

• Postgenomic.com, CiteUlike (Repérage de signets IST) …• Folksonomies présentes partout : accès, repérage, commentaire.37

Page 38: Oe Abes Mai2008

Et les bibliothèques ? Aussi !• Bibliothèque & Catalogue http://tags.library.upenn.edu/• Intégration dans SIGB (open source ou propriétaires) : Étagères virtuelles de PMB

Rapport Calhoun pour la LoC (Mars 2006)Déclencheur pour le monde des bibliothèques

www.loc.gov/catdir/calhoun-report-final.pdf

38

Page 39: Oe Abes Mai2008

Et les bibliothèques ? Aussi !!

• Library of Congress sur FlickR :– http://flickr.com/photos/library_of_congress/

• Boston Public Library sur FlickR : – http://flickr.com/photos/boston_public_library/

• Pourquoi ?– « Pour partager ces collections photographiques avec ceux qui

ne visitent pas notre site– Pour mieux comprendre en quoi l'indexation sociale pour nous

apporter des idées d'amélioration de nos services et de nos fonds

– Pour accroître notre expérience et notre implication dans des communautés web partageant des centres d'intérêts communs avec les collections de bibliothèques. »

• Source : http://www.loc.gov/rr/print/flickr_pilot_faq.html

• RÉSULTAT ??

39

Page 40: Oe Abes Mai2008

Résultat …

• 392,000 views on the photostream• 650,000 views of photos• Adding in set and collection page views, there were

about 1.1 million total views on our account• All 3,100+ photos have been viewed• 420 of the photos have comments• 1,200 of the photos have been favorited

40

En une nuit !!http://www.loc.gov/blog/?p=237

Page 41: Oe Abes Mai2008

http://flickr.com/photos/library_of_congress/alltags/

41

Page 42: Oe Abes Mai2008

42

Page 43: Oe Abes Mai2008

C’est déjà demain

Où comment

« concilier l’inconciliable » ?

43

Page 44: Oe Abes Mai2008

Intérêt « fusionnel »

• Exporter …• Vers un site collaboratif

communautaire (del.icio.us)

• Des (méta)données documentaires (HubMed)

• Fertilisation croisée• Ouverture des

catalogues http://hublog.hubmed.org/

44

Page 45: Oe Abes Mai2008

L’hybridation comme modèle ?

• Amazon : Amapedia • « Collaborative structured tagging »• Tags factuels

– TagFactuel : valeur1, Valeur2, Valeur3 ...

• Tags catégoriels– Relation « is a »– Relation « like … »– Relation « partage des attributs

essentiels »

45

Page 46: Oe Abes Mai2008

Vers des modèles hybrides

• FlickR (& bientôt) Del.icio.us : « Machine Tags »

• Nom : attribut = valeur.

• flickr:user=straup• flora:tree=coniferous• medium:paint=oil• geo:cartier="plateau mont royal"• geo:neighbourhood=geo:cartier

46

Page 47: Oe Abes Mai2008

Quel avenir ?

Penser une bibliothéconomie « à l’échelle » des transformations en

cours, et « en mouvement ».

Une bibliothéconomie de masse.

47

Page 48: Oe Abes Mai2008

Quels mouvements ?

Tectonique documentaire :

Cinq continents réunifiés

48

Page 49: Oe Abes Mai2008

Dérive des continents documentaires : le monde comme Pan-catalogue

1995

2005

2015 ?

Web public

Web privéWeb personnel

(Desktop)Web intime

(Mail)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

Web public Web privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

? Pourquoi ?

indexénon-indexé

49

Page 50: Oe Abes Mai2008

Quelle échelle ?

Celle des nouvelles cultures, des nouvelles pratiques, des nouveaux

besoins des natifs digitaux

50

Page 51: Oe Abes Mai2008

Bouillon de cultures

• Culture du fragment : Homogénéisation des savoirs• Culture de l’accès : Économie de l’attention• Culture du service, de la proximité, du « service de proximité »

• Librairie, bibliothèque, pizzéria « près de chez vous » : « caRtalogue »

• Culture de « l’économie »– d’expertise (sagesse des foules)– de temps (immédiateté)– d’argent (culture du gratuit)

• Culture de l’ouverture : Open Access, Open Archives, Open Office, Open Data …

• Culture de la synchronicité1. Accès, repérage, recherche, certification, indexation,

navigation, partage

51

Réflexion sur « l’offre » documentaireDoit intégrer cette économie de la demande

Page 52: Oe Abes Mai2008

Quelles transformations ?

Celle des pratiques

52

Page 53: Oe Abes Mai2008

Confusion des pratiques ?

chercher communiquer Tagger / indexerorganisers’orienter partager

google

talk

earth

printorkut

API’s

Web/documenet public

Web/document`privé

Web personnel(Desktop)

Web intime(Mail)

Web extime(blogs)

53

Page 54: Oe Abes Mai2008

Mathématiques bibliothéconomiques

• Années 90 : industrialisation de l’indexation (moteurs de recherche)

• Années 2000 : marchandisation de l’indexation (liens sponsorisés)

• Aujourd’hui : « indexabilité » de l’actuelle masse documentaire :

– Totale : nos mails, nos documents de travail, nos « recherches », nos amis, nos préférences sexuelles, politiques, religieuses …

– En temps réel : à la volée

– Transparente : visible par tous (surtout par les moteurs) et de partout (interopérabilité)

• Bibliothéconomie de masse = industrialisation + marchandisation + indexabilité

• Horizon de l’indexation :

– Question n’est plus celle de l’autorité (qui a autorité pour indexer)

– ni même de l’expertise (qui a compétence pour indexer)

– mais celle de l’usage (qui a besoin d’indexer)

• IL EST URGENT DE SE SAISIR DE CES OUTILS !

54

Page 55: Oe Abes Mai2008

Il y a urgence. ? Sinon ?

Modèle marchand de la bib.

55

Autarcithécaires

Bibliothèques ?

Page 56: Oe Abes Mai2008

Conclusion …

• «It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing. » – Joseph T. Tennis. Social tagging and the next stpe for

indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006.

• La communauté comme indexeur a son rôle à jouer.• Pour aller vers un juste milieu entre folksonomie

débridée et rigidité taxonomique

56

Page 57: Oe Abes Mai2008

… M

eRci …

? QuEsTioNs ?

? QuEsTioNs ?

57