56
Machine tags de Flickr et folksonomies organisées Patrick Peccatte www.softexperience.com blog.tuquoque.com Laboratoire d'histoire visuelle contemporaine (Lhivic) culturevisuelle.org/dejavu/ Dispositifs d'Information et de Communication à l'Ère Numérique (DICEN) Séminaire Folksonomies et Tagging vendredi 26 mars 2010 - CNAM-Paris

Machine Tags Flickr Peccatte

Embed Size (px)

DESCRIPTION

Séminaire Foksonomies et tagging - DICEN

Citation preview

Page 1: Machine Tags Flickr Peccatte

Machine tags de Flickr et folksonomies organisées

Patrick Peccattewww.softexperience.com

blog.tuquoque.com

Laboratoire d'histoire visuelle contemporaine (Lhivic)culturevisuelle.org/dejavu/

Dispositifs d'Information et de Communication à l'Ère Numérique (DICEN)

Séminaire Folksonomies et Taggingvendredi 26 mars 2010 - CNAM-Paris

Page 2: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Sommaire

Rappels sur Flickr et les tags Fonctions Rechercher et Explorer sur les tags Définition des machine tags et (non)-relation avec RDF Premiers exemples de machine tags Fonctions Rechercher et Explorer sur les machine tags Applications simples Applications "plus évoluées" API de Flickr et machine tags Avantages et inconvénients des machine tags

Page 3: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Présentation succincte de Flickr

Flickr est un site web de partage de photos et de vidéos Appartient à Yahoo! Annonce 4,4 milliards de photos

(en fait probablement de l'ordre de 3 milliards) Chaque photo peut être décrite par un titre, une

description, des tags (75 maximum par photo), des commentaires, des notes associées à des zones de la photo

Organisation des photos par albums et classeurs Groupes d'utilisateurs réunis sur des thématiques très

variées

Page 4: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Le titulaire d'un compte Flickr a la possibilité de contrôler qui peut ajouter des tags sur ses photos

http://www.flickr.com/account/prefs/photoprivacy/?from=privacy

Page 5: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Possibilité de rechercher uniquement sur les tagshttp://www.flickr.com/search/?m=tags

Page 6: Machine Tags Flickr Peccatte

Possibilité d'explorer les tagshttp://www.flickr.com/photos/tags/

Page 7: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Possibilité d'explorer les tagshttp://www.flickr.com/photos/tags/tiger/

Page 8: Machine Tags Flickr Peccatte

Possibilité d'explorer les tags - clustershttp://www.flickr.com/photos/tags/tiger/clusters/

Les clusters sont des regroupements automatiques des tagsqui interviennent le plus souvent dans une exploration

Page 9: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Tags et machine tags L'usage massif des tags sur Flickr est souvent

reconnu comme "emblématique" des folksonomies du Web 2.0

Ces folksonomies peuvent être organisées grâce aux machine tags

Les machine tags (en français tags de programmation) sont des tags tout à fait standards :

✔ ils peuvent être écrits à la main ou à l'aide de l'API de Flickr

✔ seule différence par rapport aux tags habituels :ils suivent une syntaxe particulière

Page 10: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Machine tagsUn machine tag est un triple tag, c'est-à-dire un tag de la forme :

namespace:predicate=valueoù :

✔ namespace est un espace de nom quelconque (grosso modo, un sujet ou une classe)

✔ predicate est un prédicat (ou champ, ou propriété) qui appartient à la classe ou au sujet défini(e) par l'espace de nom

✔ value est une valeur ; comme pour les tags Flickr habituels, les guillemets sont requis si la valeur comporte un espace

(terminologie de Flickr)

Page 11: Machine Tags Flickr Peccatte

Un premier exemple(interfaces en anglais et en français)

Note : si la photo ne comporte pas de tags standards, alors les machine tasg sont affichés comme des tags (sans Show/Hide machine tags)

Page 12: Machine Tags Flickr Peccatte

Machine tags - autres représentationsstatue hauteur 9.50m

statue nature bronze

statue ville Paris

statue localisation Place de la République

statue sculpteur Léopold et Charles Morice

statue sujet allégorie de la République

Tableau

statue hauteur = 9.50mnature = bronzeville = Parislocalisation = Place de la Républiquesculpteur = Léopold et Charles Moricesujet = allégorie de la République

Arbre

Les machine tags permettent de travailler avec une folksonomieorganisée, d'introduire une structuration peu formelle dans une folksonomie

Page 13: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Machine tags entre folksonomy et taxonomyprésentation de Flickr

taxonomy

folksonomy

Page 14: Machine Tags Flickr Peccatte

Machine tags (MT) et RDF

Photo(resource) "MTvalue"

MTnamespace:MTpredicate

« Machine tags associated to a photo are much like RDF triples having that photo as its subject. The main difference is that the so-called "namespace" of the machine tag is not necessarily associated to a URI prefix. So there is no guarantee that different people will not use the same prefix with different meaning. But this was already true of plain tags, and is considered as a feature rather than a problem in the land of folksonomies :) »Wiki du W3Chttp://www.w3.org/2008/WebVideo/Annotations/wiki/FlickrMachineTags

La flèche n'est même pas un morphisme (map) au sens de la théorie des catégories : une même flèche MTnamespace:MTpredicate peut pointer sur deux MTvalue distinctes (d'où l'expression folksonomie organisée plutôt que catégorisée  !)

triple RDF ??Non, mais presque...

Page 15: Machine Tags Flickr Peccatte

Machine tags et RDF

A Performance and Scalability Metric for Virtual RDF Graphs,by Michael Hausenblas, Wolfgang Slany, Danny Ayers, 2007http://sw-app.org/pub/sfsw07-vrdfgraph.pdf

NQRDF The Poor Man's RDF

= Not Quite RDF

Page 16: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

"RDFizers"introduire de véritables namespaces

Service pour obtenir une représentation RDF des informations sur une image FlickrFlickr photo info to RDF image descriptionhttp://www.kanzaki.com/works/2005/imgdsc/flickr2rdf

✔ mais date de 2005, donc ne prend pas en compte les machines tags Flickcurl: C library for the Flickr API, by Dave Beckett

http://librdf.org/flickcurl/Comporte un utilitaire flickrdf qui génère des triples RDFà partir d'une photo Flickr :

✔ « Machine tags when they are found are scanned for xmlns:prefix=uri and then all other machine tags with that prefix turn into triples. Several prefixes are also pre-defined by the library to automatically get turned into triples without an xmlns, such as blue:, cell:, filter: and geo:. Non-machine tags are not yet interpreted. »

Page 17: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Exemples de machine tagsThe Library Of Congress / The Commons

Le projet The Commons (les Organismes publics en français) a été lancé en janvier 2008 avec la publication sur Flickr de photographies de laLibrary of Congress

Actuellement 34 institutions participent au projet Objectifs :

✔ accroître l'accès aux collections détenues par des institutions du monde entier

✔ fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections

Page 18: Machine Tags Flickr Peccatte
Page 19: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

The Library Of Congress / The Commons Machine tags utilisés par la LoC

✔ xmlns:dc=http://purl.org/dc/elements/1.1/✔ dc:identifier=http://hdl.loc.gov/loc.pnp/fsa.8b29516✔ commons:event=commonground2009

xmlns:dc : syntaxe "à la XML" (cependant, xmlns n'est pas standardisé en machine tags) -> l'espace de nom dc est bien le Dublin Core, mais le souci de rigueur ne va pas jusqu'à définir le préfixe commons ...

dc:identifier : la Library of Congress maintient le lien entre les images stockées sur Flickr et son catalogue en ligne (Prints and Photographs Online Catalog)

commons:event : l'image a été choisie en 2009 pour un événement global Common Ground regroupant plusieurs institutions -> sélection d'images par le public et projections sur les bâtiments des institutions

Page 20: Machine Tags Flickr Peccatte

dc:identifier= http://hdl.loc.gov/loc.pnp/fsa.8b29516Identifiant persistant résolu par Handle System en :

http://lcweb2.loc.gov/cgi-bin/query/h?pp/PPALL:@field(NUMBER+@band(fsa+8b29516))

Page 21: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Utilisation Les machine tags xmlns:dc et dc:identifier

sont aussi utilisés par quelques institutions du projet The Commons :

✔ Powerhouse Museum Collection✔ New York Public Library✔ Boston Public Library (très partiellement)

Ainsi que par d'autres institutions qui ne font pas partie de The Commons(MIT OpenCourseWare, etc.)

Page 22: Machine Tags Flickr Peccatte

Recherche sur les machine tags

Page 23: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Explore avec un joker sur predicate et valuehttp://www.flickr.com/photos/tags/dc:*=*

Page 24: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Explore avec un joker sur namespacehttp://www.flickr.com/photos/tags/*:user=

Page 25: Machine Tags Flickr Peccatte

Explore sur un namespace + predicate + valuehttp://www.flickr.com/photos/tags/photo:process=daguerreotype

Page 26: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Explore avec un joker sur namespace et valuehttp://www.flickr.com/photos/tags/*:*=losangeles

suppression des espaces

Page 27: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Applications simples

"Simple" :machine tags = identifiant unique (id) ou saisie manuelle des informations

Montre la variété de l'utilisation des machine tags

Nécessité de groupes ou associations qui développent un vocabulaire spécifique à leurs besoins

Page 28: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Upcoming est un calendrier d'événements et unréseau social. Appartient à Yahoo!

http://www.flickr.com/photos/tags/upcoming:*=*(+373 000 photos)

Page 29: Machine Tags Flickr Peccatte

Upcoming

Credit : Patrick H~ on Flickr, licence Creative Commons

Chaque événement est identifié par un numéro, ce qui permet d'effectuer des recherches précises sur les photos de cet événement

Page 30: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Last.fm est une webradio et un site internet proposant un système de collection de statistiques et

de recommandation de musiquehttp://www.flickr.com/photos/tags/lastfm:*=*

(+1457000 photos)

Page 31: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Last.fm

Credit : Christoph! on Flickr, licence Creative Commons

Identification des événements similaire à celui de Upcoming :autre namespace et même predicate

Page 32: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Rotocasted groupe d'amateurs de jouetshttp://rotocasted.com/

http://www.flickr.com/photos/tags/roto:*=*(+2400 photos)

Page 33: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Roto

Credit : blakewest on Flickr, licence Creative Commons

Page 34: Machine Tags Flickr Peccatte

Autres applications simples Utata - collectif de photographes et d'écrivains qui partagent un même intérêt artistique. Groupe

Flickr : plus de 18000 membres et 300000 photos.http://www.flickr.com/photos/tags/utata:*=

Typedia – encyclopédie de dessins de caractèreshttp://www.flickr.com/photos/tags/type:*=

Citizen Weather Observer Program (CWOP) Station Metadata Group vise à constituer une base de photos sur les stations météorologiques du réseau CWOP http://www.flickr.com/photos/tags/wx:*=

Burning Man - « rencontre artistique et bariolée qui se tient chaque année dans le désert du Nevada » (Wikipedia)http://www.flickr.com/photos/tags/burningman:*=

Dopplr - « service gratuit de réseau social, lancé en 2001, qui permet aux utilisateurs de calcu-ler l'empreinte carbone que leurs voyages ont produit » (Wikipedia)http://www.flickr.com/photos/tags/dopplr:*=

Foursquare - outil de réseau social, de jeu et de microblogging qui permet à l’utilisateur d'indi-quer où il se trouve et de rencontrer ses contactshttp://www.flickr.com/photos/tags/foursquare:*=

Open Plaques – plaques bleues commémoratives d'événements ou de personnalités (en Grande-Bretagne)http://www.flickr.com/photos/tags/openplaques:*=

Lego – photos de constructions en Legohttp://www.flickr.com/photos/tags/lego:*=

Page 35: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Applications "plus évoluées"

Utilisation d'automatismes ou del'API Flickr

Utilisation de Flickr en relation avec une autre application

Page 36: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Taxonomie des plantes et animauxhttp://www.flickr.com/photos/tags/taxonomy:*=*

(+78000 photos)

Page 37: Machine Tags Flickr Peccatte

Taxonomy

Credit : OliBac on Flickr, licence Creative Commons

Page 38: Machine Tags Flickr Peccatte

Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/

Page 39: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/

Page 40: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Astrometry est un groupe Flickr créé en 2007.Un programme automatique scrute le groupe et identifie

les photos astronomiques d'après les positions des étoiles et planètes environnantes sur les clichés

http://www.flickr.com/photos/tags/astrometrydotnet:*=*(+7800 photos)

Page 41: Machine Tags Flickr Peccatte

Credit : jimkster on Flickr, licence Creative Commons

Compte-rendudu robot

Astrometry.net

Machine tagsgénérés par le robot

Astrometry.net

Page 42: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Le projet AccessCeramics

accessCeramics est une collection de photos de céramiques contemporaines conçue pour être utilisée par des artistes, des enseignants, des chercheurs et le grand public

Le projet utilise les possibilités de Flickr et des réseaux sociaux tout en proposant également une interface web personnalisée

Page 43: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Le projet AccessCeramics

Les initiateurs du projet souhaitaient initialement utiliser Flickr comme un silo unique regroupant images et métadonnées accédées par une interface web utilisant l'API de Flickr

Mais les possibilités de Flickr sont apparues insuffisantes, en ce qui concerne la sécurisation des machine tags et l'impossibilité d'effectuer des recherches avec troncatures

Page 44: Machine Tags Flickr Peccatte

Le projet AccessCeramics Images sur Flickr Métadonnées saisies par l'artiste stockées dans une base de

données MySQL Machine tags générées ensuite par un 'super-utilisateur'

accessCeramics sur Flickr

Page 45: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Le projet AccessCeramics

Les métadonnées utilisées sont un mélange de :✔ Dublin Core✔ VRA Core (un standard développé par la Visual

Resource Association) Choix effectué pour simplifier le processus

d'indexation des images La plupart des valeurs de champs proviennent du

Getty Art and Architecture Thesaurus

Page 46: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

accessCeramics sur Flickrhttp://www.flickr.com/photos/tags/accessceramics:*=*

(+1300 photos)(+3000 photos dans la base)

Page 47: Machine Tags Flickr Peccatte

AccessCeramics – saisie des métadonnées sur l'application MySQL

Page 48: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Sur accessCeramics.org (base MySQL)

Page 49: Machine Tags Flickr Peccatte

Sur le groupe Flickr accessCeramicsCredit : accessCeramics guest on Flickrlicence Creative Commons

Page 50: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Autres applications "plus évoluées"

Fotopedia encyclopédie de photos en ligne mixant des contenus de Flickr, de Wikipedia et des utilisateurs.http://www.flickr.com/photos/tags/fotonauts:*=

WildlifeNearYou – site pour partager la passion de la vie sauvagehttp://www.flickr.com/photos/tags/wlny:*=*

Open Library – couvertures de livres (très peu développé...)http://www.flickr.com/photos/tags/openlibrary:*=

OpenStreetMap - projet pour créer des cartes libres du monde sous licence CC-BY-SA, en utilisant le système GPS ou d'autres données libreshttp://www.flickr.com/photos/tags/osm:*=

Page 51: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

API Flickr

Pour exécuter une action à l'aide de l'API Flickr, vous devez sélectionner une convention d'appel, envoyer une requête à son point terminal en spécifiant une méthode et des arguments, puis vous recevez une réponse formatée

Format d'envoi : REST, XML-RPC, SOAP Format de retour : REST, XML-RPC, SOAP, JSON L'API Flickr dispose de 166 méthodes ... ... dont 5 pour travailler avec les machine tags

Page 52: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

API Flickr flickr.machinetags.getNamespaces

Return a list of unique namespaces, optionally limited by a given predicate, in alphabetical order

flickr.machinetags.getPairsReturn a list of unique namespace and predicate pairs, optionally limited by predicate or namespace, in alphabetical order

flickr.machinetags.getPredicatesReturn a list of unique predicates, optionally limited by a given namespace

flickr.machinetags.getValuesReturn a list of unique values for a namespace and predicate

flickr.machinetags.getRecentValuesFetch recently used (or created) machine tags values

Ces API sont mises en œuvre par exemple avec la fonction Explore en utilisant des jokers * sur les machine tags (voir ci-dessus)

Page 53: Machine Tags Flickr Peccatte

API Flickr – Exemplehttp://www.flickr.com/services/api/explore/?method=flickr.machinetags.getPredicates

<rsp stat="ok"> <predicates namespace="statue" page="1" total="6" perpage="500" pages="1">

<predicate usage="1" namespaces="1">hauteur</predicate> <predicate usage="2" namespaces="1">localisation</predicate> <predicate usage="1" namespaces="1">nature</predicate> <predicate usage="2" namespaces="1">sculpteur</predicate> <predicate usage="3" namespaces="1">sujet</predicate> <predicate usage="1" namespaces="1">ville</predicate>

</predicates> </rsp>

Page 54: Machine Tags Flickr Peccatte

Une application : Flickr machine tag browser de Paul Mison

http://husk.org/code/machine-tag-browser.html

Navigation dans les machine tags selon les trois niveaux namespace, predicate, value

Page 55: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Lors du chargement d'une photo comprenant un mot-clé IPTC (ou XMP) observant la syntaxe d'un machine tag, celui-ci est effectivement reconnu comme un machine tag

La création des machine tags est libre et non contrôlée :✔ avantage : souple et facile✔ mais aussi inconvénient : c'est un capharnaüm

API : pas de possibilité de troncatures Problèmes de langue Accents et espaces Problème des machine tags qui demeurent dans l'index

après suppression des photos

Avantages et inconvénients des machine tags

Page 56: Machine Tags Flickr Peccatte

DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010

Merci pour votre attention