Folksonomiestagaulike

Preview:

DESCRIPTION

Panorama support de l'intervention à l'urfist de Bordeaux.

Citation preview

Du tag au like

Pratiques des folksonomies et théorie de l’indexation

1

Plan

1. Retour Historique

2. Tags et Folksonomies

?

3. Forces et faiblesses

4. Quelles folksonomies

?

5. Des dispositifs avancés

6. Qui tague et pourquoi?

7. Comment taguer ?

8. Du tag au like ?

2

1. Rapide retour historique

• Histoire de l’indexation et des métadonnées

3

4

Types d’indexation et d’organisation des connaissances

Les classifications

Les vedettes-matières

Les thésauri

Le TAL

Les folksonomies?

// Ontologies

5

Métadonnées

Métadonnées type RDF (web sémantique)

Métadonnées Dublin Core

Formats Marc

Fiches cartonnées normalisées.

Premiers catalogues de bibliothèques. (Pinakes)

Tablettes d’argile (Mésopotamie)

6

Chronologie d’un succèsJanvier 2005 Technorati utilise le tracking de tags sur les blogs.

Mars 2005 - Le système de tags est un des thèmes d’actualité au sommet d'architecture de l'information à Montréal.- Article de l’architecte de l’information Clay Shirky : « Ontology is overrated ». Dans cet entretien provocateur, il prédit la fin des hiérarchies et des classifications traditionnelles.-Yahoo! achète Flickr qui permet de taguer des photos. C’est une des premières acquisitions par un grand groupe d’un site dit Web 2.0.

Août 2005 25 millions de billets de blogs seraient tagués selon Dave Siffry, le créateur de Technorati, le premier moteur de blogs.

Novembre 2005 Amazon intègre l’usage des tags et Google sort Google base qui permet également l’indexation d’articles par tags.

Décembre 2005

- Yahoo! achète Del.icio.us pour près de 30 millions de dollars. - Les folksonomies sont saluées comme une des meilleures idées de l’année 2005 par le New York Times.

[1]

7

3 grandes leçons

Les folksonomies n’ont pas révolutionné la recherche

d’information et l’indexation.

Elles recouvrent des réalités très différentes.

Elles n’ont pas remplacé les langages documentaires et les ontologies mais elles

n’ont pas disparu pour autant non plus.

8

2.Tags et Folksonomies

• De quoi parle-ton ?

9

Le pourquoi du mot

FOLK TAXONOMY FOLKSONOMY

10

Triple dimension

Dimension mnémotechnique

Dimension d’indexation

Dimension d’annotation

11

Qu’est-ce-qu’un tag?Le terme qui revient le plus souvent dans les folksonomies est celui de tag qui désigne en fait un mot-clé, une catégorie ou une métadonnée. Le mot tag signifiant en anglais : étiquette de balisage, étiquetage, fléchage, marquage, voire traçage, il est possible de rencontrer des traductions comme tagage collaboratif. Le mot tag désigne en fait un mot-clé, une catégorie ou une métadonnée.

12

Plusieurs traductions sont possibles :

étiquette de balisage étiquetage fléchage Mots-clés

•librarything

Marqueur

•(Zotéro)

traçage label

•(Gmail)

Etiquette

•(Evernote)

13

Le tag peut alors prendre toutes les formes possibles, selon le désir de l’internaute et surtout selon sa culture et sa maîtrise de la langue. Le système ne reposant sur aucun thésaurus, des mots absents du dictionnaire ou des néologismes peuvent devenir des tags.

14

Définition (Marieke & Tonkin)« Que sont vraiment les tags ? Une définition simple serait de dire que les tags sont des mots-clés, des catégories de noms, ou des métadonnées. Essentiellement, un tag est simplement un jeu de mots-clés librement choisi. Cependant, du fait que les tags ne sont pas créés par des spécialistes de l’information, ils ne suivent aucune indication formelle. Cela signifie que ces items peuvent être catégorisés avec n’importe quel mot définissant une relation entre la ressource en ligne et un concept issu de l’esprit de l’usager. Un nombre infini de mots peut être choisi, dont quelques-uns sont issus de représentations évidentes tandis que d’autres ont peu de signification en dehors du contexte de l’auteur du tag. »

15

Tag et graffs…

• Le tag numérique demeure une forme de marquage. Le mur en dur ayant été remplacé par le mur virtuel de Facebook.

• Poursuite du paradoxe du grapheur ou du tagueur ?• En effet, le but est-il qu’on remarque le mur et son

environnement ou bien s’agit-il d’une manière pour le tagueur de se mettre en avant ? Un double sens qui est également présent pour le tag numérique.

16

Débats.Beaucoup de spécialistes de l’information, comme l’architecte de l’information sur le web Louis -Rosenfeld , se montrent très critiques à l’égard des folksonomies : « Il est facile de dire que les usagers des réseaux sociaux sont parvenus à réaliser ce que les bibliothécaires n’ont pas réussi : un moyen de faire fonctionner des métadonnées dans des collections de contenu largement distribuées et non connectées les unes aux autres. Facile mais faux : les folksonomies sont clairement convaincantes en favorisant une forme de navigation basée sur la sérendipité qui peut être tout à fait utile. Mais elles ne favorisent pas la recherche et les autres types de navigation de manière aussi précise que des tags émanant de vocabulaire contrôlé par des professionnels. »

17

Clay Shirky lui répond sur un autre blog : « Le problème de l’anayse de Rosenfeld provient de son manque total de sens économique. […] L’avantage des folksonomies n’est pas qu’elles sont meilleures que les vocabulaires contrôlés, mais -qu’elles sont meilleures que rien, car les vocabulaires contrôlés ne sont pas adaptables dans la majorité des cas où un tag est requis. Construire, maintenir et améliorer un vocabulaire contrôlé revient très cher par rapport aux folskonomies, à la fois en temps de développement et pour l’usager, notamment l’usager amateur dans l’utilisation d’un système normé. »

18

Terminologie et traduction

Folskonomies, indexations collaborative libre, indexation sociale ?Problème de l’indexation? : terme qui renvoie à l’index et au processus institutionnel.

19

Un exemple de redocumentarisation

Les folksonomies s’inscrivent donc dans une « redocumentarisation » qui voit l’usager conférer un sens au document, à partir de l’usage qu’il souhaite en faire. Cela entraîne des mutations qui peuvent laisser la place aussi bien à une nouvelle souplesse documentaire qu’à des manipulations.

20

Les hashtags• Définition d’Olivier Ertzscheid :• Un hashtag est un mot-clé. Plus précisément, c’est une

fonctionnalité d’indexation liée au service de micro-blogging Twitter. Il s’agit, au sein d’un message (un tweet), d’un mot ou d’une concaténation de mots, précédée du symbole dièse (#), et permettant de l’indexer, soit pour pouvoir suivre l’ensemble des messages ainsi balisés soit pour leur ajouter un niveau de sens différent. #exemple

•Tout comme les mots-clés ou « tags » des folksonomies, les hashtags participent pleinement au processus de redocumentarisation aujourd’hui à l’œuvre sur le web.

21

3. Forces et faiblessesLe contexte du web 2.0 avec

ses forces et ses côtés obscurs

Des problèmes d’indexation

classiques

Des spécificités liés aux

environnements numériques.

22

AvantagesAdam Mathes , dans son article paru en décembre 2004, résume le problème en une phrase : « Une folksonomie représente en même temps ce qu’il y a de meilleur et de pire dans l’organisation de l’information. » Mathes montre ainsi que la force des folksonomies constitue également sa faiblesse : Sa souplesse d’utilisation et son adaptabilité infinie font que l’organisation de l’indexation par l’usager est chaotique.

23

Inconvénients et problèmesLes folksonomies suscitent par conséquent de nombreuses critiques, notamment de professionnels de l’information qui y voient parfois des similitudes avec l’emploi des métadonnées. Les folksonomies constituent également un moyen pour attirer des visiteurs sur un site par l’emploi de mots-clés détournés. Elles peuvent dès lors être source d’info-pollution, pour reprendre l’expression d’Éric Sutter , vidant de leur sens de nombreux mots-clés. Les photos recevant les mots-clés de vacances sont tellement innombrables, que cela n’a plus grand intérêt si ce n’est pour celui qui les a indexés ainsi. Le fait qu’elles ne reposent sur aucun thésaurus fiable introduit de nombreuses confusions et des polysémies dérangeantes. Il en résulte une Babel sémantique qui peut finalement aboutir à un résultat inefficace et à une grande perte de temps.

24

Forces des folksonomies

Forces

• Souplesse d’usage• Choix libres• Choix illimités bien souvent• Indexation de ressources que

des professionnels n’ont pas le temps d’indexer.

• Tracking de tags (démarche de veille)

• Permet de créer une organisation bottom-up

• « c’est mieux que rien »

Faiblesses

• Coquilles• Manque de cohérences dans

la durée• Tags trop personnels• Pas de réelle constitution d’un

index ordonné• Désorganisation liée à

l’accroissement des ressources indexées

• Tags détournés (spam-tags)

25

Problèmes du sens des mots

Synonymie Homographie

26

L’homographie

Mousse

Emulsifiant Espèce (arbre, forêt) Marin Dessert

27

Polysémie

Navire

Bateau

Paquebot

Titanic

Maquette

Naufrage

Di CaprioSource image : Jeffrey. Titanic, juillet 26, 2008. http://www.flickr.com/photos/formatc1/2720984411/. Licence CC

28

Deux types de folksonomies

Les folksonomies à portée large (broad

folksonomies)

Exemple : les signets sociaux : diigo ou

delicious/ Plusieurs usagers peuvent taguer

un même item.

Il s’agit donc de penser à la portée collective

voire collaborative des tags choisis.

Les folksonomies à portée personnelle

(narrow folksonomies)

Les items sont surtout tagués à des fins personnelles. Ex :

photos de vacances sur Flickr

Néanmoins, certaines ressources avec leurs tags restent visibles

pour tous

29

Folksonomies et veille

Récupération des flux rss

De signets de

personnes

De signets sur un sujet

Tracking de mots-clés.

30

Une alternative aux moteurs?

Logique de veille

Logique de sérendipité

Médiation

31

4.Quelles folksonomies ?

Plateformes d’images et photos

Plateformes audio et vidéos

Plateformes de partages

Plateformes de popularité

Sites d’évènements

Taguage de personnes

Cms, blogs

Messageries

Social bookmarking

Opac et bibliothèques en lignes

Réseaux sociaux

Les sites commerciaux

32

Les plateformes d’images et de photos.

La plus connue : Flickr qui permet le stockage, le taguage et le partage de ces photos. Instagram

33

Les plateformes de vidéos, podcasts et musique

Youtube (plus d’un million de tags ?, dailymotion, etc.Des groupes thématiques peuvent être également constitués mêlant à la fois des usagers et des vidéos. Usines à tags produits de façon bénévole et industrielle • Shazam emploie abusivement le terme de tags puisqu’il ne s’agit

pas de folksonomies mais de reconnaissance audio d’un morceau de musique qu’on souhaite identifier.

• Le réseau social d’Itunes, Ping permet d’ajouter et de gérer des tags. Les Itunes tags fonctionnent uniquement au sein du service et ont vocation à couvrir plusieurs champs pour décrire une musique.

Et les vidéos pornos ? La question de l’indexation en profondeur

34

Youtube

• « Un internaute utilise un texte prêtant à confusion lorsqu'il identifie de manière incorrecte ses vidéos dans le titre, les tags ou la description. Il emploie des moyens malhonnêtes et indique des informations erronées sur le contenu de la vidéo afin d'amener d'autres personnes à la visionner. L'utilisateur ayant mis en ligne la vidéo peut également s'être servi de la zone de description de la vidéo pour y insérer de nombreux tags ne correspondant pas au contenu de cette dernière, dans le but d'augmenter le nombre de visionnages. »

• Signalement et suppression de contenu. Disponible sur : http://support.google.com/Youtube/bin/answer.py?hl=fr&answer=178909

35

. Les plateformes de stockage et partage de documents

Box.net Les acteurs comme Dropbox ne les gerent pas.Slideshare :• Slideshare gère les documents au sein de catégories

prédéfinies mais permet aussi l’inclusion de tags.• Slideshare gère d’ailleurs des pages pour chaque tag, ce qui

permet notamment de réaliser une veille en récupérant les flux rss de la page du tag que l’on désire surveiller.

• Malheureusement, Slideshare gère très mal les tags qui ne sont pas uninominaux, c’est-dire des expressions comme « identité numérique » par exemple.

36

Les sites regroupant des évènements.

Il ne s’agit pas de taguer des documents véritablement mais des annonces d’évènements.

37

Les moteurs et agrégateurs de blogs et de tags.

L’ancien en déclin : Technorati.Echec du projet nectar

38

Les sites de questions-réponses

• Ce sont en fait une évolution des FAQ (frequently asked questions, foire aux questions) qui se socialisent davantage pour constituer des bases de données.

• Une des plus en vogue ces dernières années est Quora qui autorise le taguage des questions par les usagers.

• Il est alors possible de suivre des tags en récupérant par exemple le flux rss associé au tag.

39

Les plateformes de popularité.Ces plateformes dont la plus célèbre est Digg propose de voter pour les billets les plus populaires. Les tags servent à retrouver les billets les plus populaires pour un tag donné. Principale critique : les risques de manipulation de l’information qu’ils présentent.

40

Le taguage de personnes.

Le premier site était TagalagSuccès sur Facebook… et sur Google +Pratique courante sur les autres plateformes mais non associée à un profil

41

Le taguage sur l’application blog ou de type CMS

Chaque usager peut taguer le moindre message de son blog, parfois ses visiteurs peuvent également en ajouter.Pratique en baisseAtouts = nuages de tags

42

Les messageries

Labels sur Gmail

Possibilité de plusieurs labels par messages

Gmail permet de conférer à chaque label une couleur différente.

Gmail mixe les labels avec des principes d’arborescence en permettant une hiérarchie de tags.

Hélas pas de nuage de tags.

43

Les fausses folksonomies

Générées automatiquement par le TAL.Néanmoins aspect similaire.Les systèmes de tags automatisés par des robots après analyse textuelle ne sont pas de vraies folksonomies.

44

5. Des dispositifs avancés

• Le paradoxe : ceux qui tirent la quintessence des dispositifs sont des professionnels de l’information, des bibliothécaires et documentalistes.

45

Catalogues et bibliothèques

• Les tags et la bibliothèque 2.0

• Librarything, l’exemple emblématique

46

Démo-librarything

47

Le social bookmarking.le système le plus intéressant des folksonomies. Il permetde mettre en relation des personnes, de créer des groupes thématiques, de faire de la veille, etc.

48

Points forts des signets sociaux

Caractère collectif.

Identification de « folksonomistes » que l’usager perçoit comme référence ce qui permet

facilement ainsi de réaliser de la veille

collaborative.

Perspective de personnalisation de

l’information en liaison avec les agrégateurs de

flux rss.

49

Signets sociaux

Conservation en ligne

(supports de mémoire)

Consultation permanente si

connexion

Catégorisation ouverte et non unique

Possibilité de partager ses découvertes

50

Surveillance de tags

Découverte et veille sur des

usagers compétents

(tiers de recommandation)

Veille collaborative

via des groupes

Transformations des signets en billet de blog,

etc. (redocumentarisation)

51

Repérage de la ressource

(évaluation)

Décision de conservation

Description (tags,

annotation)

Autres fonctions sociales (groupes,

signalement)

Redocumentarisation ( billets de blog,

dispositifs de veille, nouvelle ressource)

52

Deli.cio.us, le pionnier

53

Ma.gnolia.com. Un cas d’ecole ,

54

Diigo, le meilleur

55

Les signets « to read »

56

Démo-Tp

• Utiliser les marqueurs de Zotéro

57

La machine tag de flickrFlickR Del.icio.us : « Machine Tags »

flickr:user=straupflora:tree=coniferousmedium:paint=oilgeo:cartier="plateau mont royal"geo:neighbourhood=geo:cartier

Nom : attribut = valeur.

58

La question sémantique

• Mieux définir le tag en lui associant une URI.

59

6. qui tague et pourquoi ?

Nous avons listé les différentes raisons qui poussent l’usager à utiliser des tags.

Source : Olivier Ertzscheid pour le schéma suivant :http://affordance.typepad.com/mon_weblo

g/files/journeeurfist.ppt

60

Qui indexe ?

Usagers,Consommateurs,

Producteurs, Auteurs,Novices,Experts.

61

Textes

Docs de travail

Articles scientifiques

Billets de blogs

Photos

Vidéos

A moi

Aux autres

A la volée En surface

En profondeur (deep tagging) En connaissance de cause

Au hasardPour moi (tags privés)

Pour les autres (tags publics)

Organiser, Partager, Chercher, RetrouverAssocier,

« Participer »

Quoi ?

Pourquoi ? Comment ?

Pour retrouver ultérieurement ses documents:

C’est la première motivation.

62

Pour collaborer et partager.

Plusieurs personnes peuvent ainsi taguer avec des mots-clés convenus d’avance pour constituer des favoris collaboratifs. La veille sur un sujet peut donc se faire ainsi à plusieurs. Il peut s’agir aussi d’un moyen pour partager des photos et des vidéos en constituant des groupes thématiques appelés chaînes sur le site français de vidéos dailymotion.[1]

[1] <http://www.dailymotion.com>

63

Pour attirer l’attention.

Ce n’est pas l’usage le plus noble puisqu’il s’agit d’attirer l’attention des autres sur les ressources taguées via notamment les systèmes de mesure de popularité et les nuages de tags (tag clouds) qui sont souvent intégrés. Des utilisateurs peuvent être alors tentés d’utiliser des spam-tags pour faire la promotion de ses propres ressources.

64

Par jeu et competition.L’usage est plus rare et ne concerne que des sites qui usent le tag comme jeu Nous songeons ici au dernier jeu d’indexation des images de Google[1] mais aussi au jeu ESP.D’autres utilisateurs jouent de manière à influer sur les nuages de tags et ce de manière collective parfois. Cela peut être également une technique pour produite du google bombing.[1] < http://images.google.com/imagelabeler/> Google n’utilise pas d’ailleurs le mot tag mais le mot label ou libellé dans sa traduction française que connaissent les utilisateurs de Gmail.

65

Pour mentionner un aspect personnel

Il peut s’agir simplement d’inscrire son propre nom à la ressource taguée notamment quand il s’agit de sa propre production. Cela peut être également un moyen d’interagir en notant sur le site de tel ou telle personnalité (rencontré, vu en concert, etc.)

66

Pour exprimer une opinion.

Des utilisateurs peuvent qualifier positivement ou négativement tel ou telle ressource. Les tags <great> sont ainsi fréquents. Il ne faut pas oublier non plus que les tags sont parfois accompagnés de commentaires notamment en ce qui concerne les marque-pages sociaux.

67

Pour le plaisir de rangerL’usager cherche à ranger ses documents de manière ordonnée. Un plaisir de ranger qui répond parfois à une vision individuelle et à des règles incompréhensibles à l’autre.[1][[1] Un peu à la manière d’Alberto Manguel : « Parfois ma bibliothèque obéissait à des règles secrètes, nées d’associations personnelles. » Alberto Manguel. Idem. p.35

68

Les folksonomistes

L’initiéMaîtrise bien les outils et sait gérer les folksonomies aussi bien de

façon personnelle mais également collaborativement pour devenir un veilleur.

Le conservateur

Souhaite garder toutes traces qu’il a jugé utiles dans l’optique de pouvoir éventuellement les retrouver ultérieurement.

Le gentleman

Utilise les systèmes de façon collaborative en prenant soin à annoter et à utiliser des tags compréhensibles par tous

Le petit contributeur

Utilise parfois les systèmes de tags de façon très irrégulière.

L’infopollueurSon objectif est de gagner en audience pour ses propres sites. Il est donc

prêt à utiliser toutes les failles pour polluer le système par des tags populaires mais qui ne correspondent pas au contenu de la ressource.

69

7. Comment bien taguer?

• Voir les conseils sur le Tp.

70

Tag literacy : quelle literacie ?

71

Littératie des tags

(tag literacy)

Maîtrise de l’information

voire culture de l’information (information

literacy)

Littératie sociale ou de participation

voire contribution

(social literacy)

Littératie ou culture

numérique (digital literacy)

72

Comment taguer?

Les erreursLes conseils car il ne peut y avoir de règles au sens strict.

73

Les erreursAvant toutes règles dans l’usage des tags, il paut parvenir à distinguer et à comprendre quels sont les mauvais tags. Ulises Mejias a établi une liste succincte des tags inefficaces : les tags mal orthographiés.les tags mal conçus, notamment les groupes de mots collés ensemble ou séparés sans utiliser l’underscore.ceux qui ne respectent pas les règles d’usage ou les conventions.les tags personnels n’ayant aucun intérêt collectif.un tag unique qui n’apparaît qu’une seule fois dans une base de données.

74

Le quiz!

• www.culturedel.info/folksoquiz.htm

75

8. Du tag au like…

76

L’homme est un tag comme un autre

Ref. O. Ertzscheid

Tags désignant des personnes :

Dans des blogs

Des réseaux sociaux.

Le Like

• Triomphe de l’impulsion quantifiée• Des formes proches (repin, retweet, +, etc;)

78

Explosion du like

• Facebook qui ne permet pas le dislike• Youtube qui permet le dislike• Pinterest

79

Vers le want

• Cette impulsion du désir marchand est également mis en avant par le site svvply.com qui produit une liste des produits les plus désirés du moment.

• https://svpply.com/

80

Une évolution

Description de l’usager

Le like décrit des goûts, des envies La somme des likes configure un profil

ImpulsionCourt-circuite le travail d’analyse Logique de captation d’attention

Dégradation de l’indexationForme appauvrie du tag Simple manifestation d’un ressenti

81

De l’indexation

De l’indexation traditionnelle À l’indexation

personnelle

82

Facebook et le like

• Le like ou le retour de Facemash?• La dispersion du like sur tout le web (sur les

blogs, les sites, etc. )• Augmentation de la zone d’influence de

Facebook• Une mesure de nos intérêts.• Un enjeu économique pour les marques

83

Google +

Réaction spontanée = Like• La question des cerclonomies• Indexation personnelle via les cercles• Nouvelles logiques affinitaires• Nouvelles autorités

84

annexes

85

Le côté obscur du web 2.0

• publicités contextuelles• publicités ciblées• Revente de données personnelles

l'exploitation commerciale des données

• Crowdsourcing = l’usage apporte la valeur ajoutée• le loisir productif

le travail gratuit

• Omniprésence de Google• yahoo, Amazon, ebay• rachat de start-up performantes• bulle économique ?

l'emprise de géants du web

• recommandations truquées• Désinformation commerciales ou politiques• Bad buzz• rumeurs

Intox

• sécurité des données• conservation des données• Surveillance des citoyens

Qui possède les données ?

• Accumulation d’infos• Redondance• désinformation• spams

Infopollutions