65
INHA - InVisu Paris – mercredi 12 septembre 2012 http://culturevisuelle.org/dejavu Autour des métadonnées des images numériques standards, technologies, pratiques Patrick Peccatte Chercheur associé au Laboratoire d'histoire visuelle contemporaine (Lhivic/EHESS) [email protected] Twitter: @ppeccatte Facebook: patrick.peccatte Google+: Patrick Peccatte Flickr: patrickpeccatte et photosnormandie Tumblr: dubruitausignal.tumblr.com

Inha in visu-metadonnees-12 septembre 2012

Embed Size (px)

Citation preview

Page 1: Inha in visu-metadonnees-12 septembre 2012

INHA - InVisuParis – mercredi 12 septembre 2012

http://culturevisuelle.org/dejavu

Autour des métadonnées des images numériques

standards, technologies, pratiques

Patrick PeccatteChercheur associé au Laboratoire d'histoire visuelle contemporaine

(Lhivic/EHESS)

[email protected]

Twitter: @ppeccatte

Facebook: patrick.peccatte

Google+: Patrick PeccatteFlickr: patrickpeccatte et photosnormandie

Tumblr: dubruitausignal.tumblr.com

Page 2: Inha in visu-metadonnees-12 septembre 2012

wenzday01/FlickrCreative Commons

Il était une fois...L'album de photos

Une histoireancienneet bien connue

Page 3: Inha in visu-metadonnees-12 septembre 2012

lizjones112/FlickrCreative Commons

on ajoutait des légendesaux photos...

Page 4: Inha in visu-metadonnees-12 septembre 2012

Yume Photo/FlickrCreative Commons

mais attentionau déclassement...

Page 5: Inha in visu-metadonnees-12 septembre 2012

Guanatos Gwyn/FlickrCreative Commons

la solution ?la légende au verso

Page 6: Inha in visu-metadonnees-12 septembre 2012

Mario Groleau/FlickrCreative Commons

Le système Autographicde Kodak permettait

au photographe d’ajouterdes informations écrites sur le film au moment

de l’exposition

Documenterla photo"au plus près",une préoccupationconstante

Page 7: Inha in visu-metadonnees-12 septembre 2012

Mario Groleau/FlickrCreative Commons

Photo légendée selon le procédéAutographic (Nico Redlich, 1931).

Trois-Rivières, Canada

Page 8: Inha in visu-metadonnees-12 septembre 2012

Avec le numérique...

Une métadonnée est littéralement une donnée sur une donnée✔ Dans le domaine des métadonnées [metadata], on parle de

données sur une ressource Plus précisément, c'est un ensemble structuré de

données décrivant une ressource quelconque Une métadonnée peut être utilisée à des fins

diverses…✔ la description et la recherche de ressources✔ la gestion de collections de ressources✔ la préservation des ressources

Légendes Métadonnées

Page 9: Inha in visu-metadonnees-12 septembre 2012

Métadonnées "métiers" [1/2]

Les ressources décrites par des métadonnées ne sont pas nécessairement sous forme digitale✔ un catalogue de bibliothèque ou de musée contient

aussi des métadonnées qui référencent des objets physiques

De nombreuses communautés s'intéressent aux métadonnées✔ bibliothécaires, documentalistes, archivistes,

iconographes, conservateurs de musées, …✔ …gèrent de nombreux types de ressources

Page 10: Inha in visu-metadonnees-12 septembre 2012

ressources: monographies, publications en série, articles, photos, archives, pièces de musée, séquences audio ou vidéo, etc.✔ on ne décrit pas toutes ces variétés de ressources de la même façon

apparition de standards de métadonnées "métiers"…

Métadonnées "métiers" [2/2]

IPTC/IIM (Information Interchange Model) Exif (Exchangeable Image File Format) MARC (Machine-readable cataloging) ISBD (International Standard Bibliographic Description) Dewey Decimal Classification system EAD (Encoded Archival Description) CIMI consortium (Computer Interchange of Museum Information) RKMS (Recordkeeping Metadata Schema) MPEG-7 (Multimedia Content Description Interface) ID3 (tags des fichiers audio MP3) standard "de fait " LOM (IEEE - Learning Object Metadata) SCORM (Sharable Content Object Reference Model)

bibliothèques

archives

musées

audio

éducation

catalogage (Marc) indexation (ISBD) classification (Dewey)

images

Page 11: Inha in visu-metadonnees-12 septembre 2012

Où sont les métadonnées ?

Considérons la ressource suivante :http://www.liberation.fr/medias,62

Cette ressource contient plusieurs métadonnées✔ site liberation.fr✔ page Web de la rubrique medias

Les noms informatiques sont des métadonnées✔ Plus généralement :

nom, chemin d'accès, extension, taille, attributs, date decréation, date de modification, propriétaire, droits d'accès, etc. sont des métadonnées

Mais cela ne suffit pas, d'autres informations sont nécessaires :description longue, mots-clés, copyright, etc.

nom ≈ descriptionchemin d'accès ≈ plan de classement

Page 12: Inha in visu-metadonnees-12 septembre 2012

Où sont les métadonnées ?Dans une base de données ou un fichier indépendant

associé aux données (sidecar file).Les métadonnées sont externes aux ressources.

Titre principal: El Greco, Begräbnis des Conde de OrgazDescription: El Greco, Domenikos Theotokopoulos, dit ; 1541-1614. .- 'L'Enterrement du comte d'Orgaz', v. 1586. (Saint Augustin et saint Etienne enterrent Don Gonzalo Ruyz de Toledo, Conde de Orgáz, mort en 1327). Huile sur toile, H. 4,60 ; L. 3,60. Tolède, église Santo Tomé. Année de l'évènement: 1586. Année de l'oeuvre: 1586.Mots-clés: 16E SIECLE; AME; ANGE; ART; ART ESPAGNOL; CHRIST; ENTERREMENT; ESPAGNE; GRECO, LE; HUILE SUR TOILE; INHUMATION; MANIERISME; MORT; ORGAZ, DON GONZALO RUYZ; PEINTURE; PERSONNE; ROYAUME DES CIEUX; SAINT AUGUSTIN D'HIPPONE; SAINT ETIENNE; SAINT JEAN-BAPTISTE; TABLEAU; TOLEDE; VIERGE MARIE; DEESIS, vertical

Fichier El Greco.docFichier El Greco.jpg

Page 13: Inha in visu-metadonnees-12 septembre 2012

Où sont les métadonnées ?

Dans les données elles-mêmes.Les métadonnées sont internes, "embarquées" dans les ressources numériques.

Les informations EXIF (et GPS) et IPTC/IIM des images numériques sont des métadonnéesinternes

Les métadonnées XMP peuvent êtreinternes ou externes

Page 14: Inha in visu-metadonnees-12 septembre 2012

Fichier image numérique

Où sont les métadonnées ?

Exif IPTC/IIM

GPS

Autres informations...

XMP XMP

Vignetteintégrée

exploitationcopie externe

contexte depublication

(sans métadonnées)

Page 15: Inha in visu-metadonnees-12 septembre 2012

Contexte de publication ... pas besoin de métadonnées – le cas de Google Images

Çà marche...

Page 16: Inha in visu-metadonnees-12 septembre 2012

Contexte de publication ... pas besoin de métadonnées [really ?]

Les informations du contexte de publication ne suffisent pas

Page 17: Inha in visu-metadonnees-12 septembre 2012

Contexte de publication ... pas besoin de métadonnées [really ?]

C'est mieux.Mais même avec le Sort by subject

les informations généréesà partir du contexte de publication

ne suffisent pas!

Page 18: Inha in visu-metadonnees-12 septembre 2012

Contexte de publication ... pas besoin de métadonnées [really ?]

Catégories ignorées

Page 19: Inha in visu-metadonnees-12 septembre 2012

Avantage et inconvénientdes métadonnées internes

AvantageL'échange est facilité; la ressource numérique transporte avec elle ses propres métadonnées lorsqu'elle est téléchargée, copiée, renommée, compactée, etc.

✔ Facilite l'interopérabilité, c'est-à-dire la capacité d’échanger des données entre systèmes différents

InconvénientIl est nécessaire de copier les métadonnées dans une base de données pour exploiter une grande collection de ressources numériques.

Page 20: Inha in visu-metadonnees-12 septembre 2012

● Pas besoin d'outils onéreux ou compliqués

● Sur le Web, il n'est même pas nécessaire de télécharger l'image, utiliser Jeffrey's Exif Viewer http://regex.info/exif.cgi

Exemple sur une image de Wikimedia Commonshttp://commons.wikimedia.org/wiki/File:Statue_Berthold-Brecht-Platz_(Mitte)_Berthold_Brecht.jpg

Lire les métadonnées internes des images

Page 21: Inha in visu-metadonnees-12 septembre 2012

http://regex.info/exif.cgi appliqué sur l'image

Métadonnées textuelles

Coordonnées GPS

Vignetteintégrée

Image analysée

Page 22: Inha in visu-metadonnees-12 septembre 2012

Une métadonnée n'est pas obligatoirement textuelle

Une vignette intégrée peut (parfois)fournir beaucoup d'informations.

C'est une métadonnée...

Métadonnées textuellesVignetteintégrée

Image analysée

Page 23: Inha in visu-metadonnees-12 septembre 2012

Éditeurs de métadonnéesIPTC/IIM et XMP

http://www.iptc.org/cms/site/photometadatasupportlist.html

etc.

Page 24: Inha in visu-metadonnees-12 septembre 2012

XnView (Win/Mac, gratuit)

Page 25: Inha in visu-metadonnees-12 septembre 2012

Ce que les métadonnéesne sont pas....

● Contrôle des usages et droits,DRM [Digital Rights Management]

● Tatouage invisible [watermarking]● Stéganographie: dissimuler un message dans un

autre message (en particulier une image numérique)

● Digital forensics: analyse technique des retouches, examen de l'authenticité ["diplomatique numérique"]

Page 26: Inha in visu-metadonnees-12 septembre 2012

MétadonnéesExif (et GPS)

Page 27: Inha in visu-metadonnees-12 septembre 2012

Métadonnées et images – EXIF EXIF est une abréviation de EXchangeable Image File. Ce format définit les

informations d'ordre technique contenues dans les fichiers des images.Ce sont donc des métadonnées de type interne.

Le format EXIF a été développé en octobre 1995 par le JEIDA(Japan Electronic Industry Development Association).La version 2.0 date de novembre 1997, la révision 2.1 de juin 1998 et la révision 2.2 d'avril 2002.

Ce n'est pas un standard, mais il est supporté par tous les fabricants d'APN (avec des variantes propriétaires)

Les informations EXIF concernent les paramètres de prise de vue et lesréglages de l'appareil au moment de la capture numérique :

✔ fabricant et modèle de l'appareil✔ hauteur et largeur de l'image✔ date et heure de la prise de vue✔ orientation✔ résolution, temps d'exposition, ouverture✔ présence d'un flash✔ coordonnées GPS sur certains appareils hauts de gamme récents✔ etc. [30 éléments environ]

Page 28: Inha in visu-metadonnees-12 septembre 2012

Géolocalisation des images ? Très simple...

adresse postaleLe Mont-Saint-Michel, 50116, Manche, France

latitude / longitude48° 38' 10'' N, 1° 30' 41'' W

localisation

geotags

Opérationsdocumentaireséquivalentes ?

Page 29: Inha in visu-metadonnees-12 septembre 2012

Pour exprimer en geotags cette localisation:✔ Distinguer entre localisation du sujet et localisation de la prise de vue✔ Utiliser d'autres geotags également indispensables: altitude et direction

Crédit El Guanche sur FlickrLicence Creative Commons

Le Mont-Saint-Michel et le rocher de Tombelaine vus d'avion

Géolocalisation des images ? Pas si simple...

Page 30: Inha in visu-metadonnees-12 septembre 2012

Sujet : descriptions multiplesAvant-plan et arrière-plan sont distants de 100 km environ

La tour de Tokyo (35° 41' N, 139° 46' E)et le mont Fuji (35° 21' 29" N, 138° 43' 52" E)

Crédit mafleen sur FlickrLicence Creative Commons

Géolocalisation des images ? Pas si simple...

Page 31: Inha in visu-metadonnees-12 septembre 2012

MétadonnéesIPTC/IIM

Page 32: Inha in visu-metadonnees-12 septembre 2012

Métadonnées et images – IPTC/IIM

L'IPTC (International Press and Telecommunications Council) est une organisation internationale qui développe des standards d'échange de données pour la presse

L'IPTC et la NAA (Newspaper Association of America) ont créé en 1991 le modèle global de données appelé Information Interchange Model [IIM]

Sous-ensemble de l'IIM utilisé par Adobe dès 1994 pour définir dans Photoshop les informations associées à une image

C'est ce sous-ensemble composé de 33 champs qui est communément appelé métadonnées IPTC

Page 33: Inha in visu-metadonnees-12 septembre 2012

Métadonnées IPTC = ensemble de champs textuels (Titre, Légende, Mots-clés, Copyright, etc.) stockés dans le fichier image

Chaque champ est identifié par un numéro et un nom normalisé (en anglais)

Très utilisé dans la presse et l'édition

Métadonnées et images – IPTC/IIM

Page 34: Inha in visu-metadonnees-12 septembre 2012

Métadonnées et images – IPTC/IIM

Privilégier un ensemble restreint de champs gérés par la plupart des programmes d'édition IPTC. Par exemple:

✔ n° 25, Keywords (Mots-clés) champ répétable

✔ 55, Date Created (Date de création)

✔ 80, By-line (Auteur)

✔ 90, City (Ville)

✔ 101, Country/Primary Location Name (Pays)

✔ 105, Headline (Titre)

✔ 120, Caption/Abstract (Description/Légende)le plus long champ du standard (2000 caractères maximum)

Respecter le standard en ce qui concerne la répétabilité et la longueur maximale des champs

Page 35: Inha in visu-metadonnees-12 septembre 2012

Métadonnées et images – IPTC/IIM et Exif

IPTC/IIM : métadonnées ayant trait à la sémantique de l'image et nécessitant l'intervention d'un opérateur humain pour être renseignées

EXIF : métadonnées techniques relatives à la prise de vue et fournies automatiquement par un appareil numérique Éviter de modifier

Modifiablepar définition

Page 36: Inha in visu-metadonnees-12 septembre 2012

Pratique des métadonnées IPTC/IIML'exemple des photos d'agence

Deux grandes catégories Photos d'actualités

Editorial, News✔ titre, description/légende, (parfois mots-clés)

Photos d'illustrationCreative, Illustration, Documentaire, Stocken général atemporelles✔ mots-clés, (parfois légendes)

Les historiques sont traitées comme l'éditorial

Page 37: Inha in visu-metadonnees-12 septembre 2012

Photo d'actualité ou photo historique

Champs IPTClégende (Caption/Abstract n° 120)mots-clés (Keywords n° 25)

Page 38: Inha in visu-metadonnees-12 septembre 2012

Photo d'illustration

Page 39: Inha in visu-metadonnees-12 septembre 2012

Attention à l'indexation!

Page 40: Inha in visu-metadonnees-12 septembre 2012

Attention à l'indexation!

surindexation

Page 41: Inha in visu-metadonnees-12 septembre 2012

Attention à l'indexation!

Indexation à l'aide devocabulaires contrôlés

générant des termes associésinappropriés

Page 42: Inha in visu-metadonnees-12 septembre 2012

MétadonnéesXMP

Page 43: Inha in visu-metadonnees-12 septembre 2012

Dublin Core Metadata Initiative

Le Dublin Core est un ensemble de 15 éléments de métadonnées ayant trait :✔ au Contenu

Title, Description, Subject, Source,Coverage, Type, Relation

✔ à la Propriété intellectuelleCreator, Contributor, Publisher, Rights

✔ à la VersionDate, Format, Identifier, Language

DC définit un vocabulaire de métadonnées commun à plusieurs communautés

Creator et non pas Author

Page 44: Inha in visu-metadonnees-12 septembre 2012

Le Dublin Core ne prétend pas répondre aux besoins et à la complexité de tous les métiers

Le Dublin Core est un ensemble simple et très utilisé de métadonnées, mais il n'est passuffisant

Dans la plupart des besoins professionnels, il doit être complété par d'autres schémas demétadonnées

Le Dublin Core est une norme ISO (n° 15836) Pour en savoir plus: www.dublincore.org

Dublin Core Metadata Initiative

Page 45: Inha in visu-metadonnees-12 septembre 2012

XMP – Extensible Metadata Platform

Créé par Adobe en septembre 2001 Pas réservé aux images.

Le format PDF par exemple supporte XMP Utilise une version simplifiée de RDF

(Resource Description Framework)● Développé par le W3C, base du Web sémantique

● Permet d'encoder, échanger et réutiliser des métadonnées structurées

● Peut s'exprimer en XML (sérialisation)

Utilise le schéma Dublin Core comme fondation(préfixe de l'espace de noms XML: dc:)

XMP est un standard ISO depuis mars 2012● ISO 16684-1:2012, Graphic technology – Extensible metadata platform

(XMP) specification – Part 1: Data model, serialization and core properties

Page 46: Inha in visu-metadonnees-12 septembre 2012

XMP – Extensible Metadata Platform

Les espaces de noms XMP sont des conteneurs

Source: Fotoware

Page 47: Inha in visu-metadonnees-12 septembre 2012

XMP – Extensible Metadata Platform

Les champs appartiennent à un espace de noms

Source: Fotoware

Page 48: Inha in visu-metadonnees-12 septembre 2012

XMP – Extensible Metadata Platform

Les espaces de noms permettent d'éviter les collisions

Source: Fotoware

Page 49: Inha in visu-metadonnees-12 septembre 2012

Panneaux standards sur Photoshop [ancienne version (CS) ; semblable sur les versions plus récentes]

Page 50: Inha in visu-metadonnees-12 septembre 2012

Le panneau Avancé

Organisation des métadonnéespar espaces de noms:

Dublin Core (préfixe dc)Photoshop (héritage IPTC/IIM)

etc.

Page 51: Inha in visu-metadonnees-12 septembre 2012

Ne pas utiliser des outils non XMPaprès avoir travaillé avec des outils XMP

Bien connaître vos outils dans les workflows complexes

IPTC n°120: ChatonsXMP dc:description: Chatons

Indexation avec un outil XMP

IPTC n°120: Deux chatonsXMP dc:description: Chatons

Modification à l'aide d'un outil uniquement IPTC/IIM (non XMP)

IPTC n°120: Deux chatonsXMP dc:description: Chatons

Retour à un outil XMP

Page 52: Inha in visu-metadonnees-12 septembre 2012

Perspectives ouvertes par XMPEn quoi XMP est-il plus performant que l'IIM ?

Adapté aux légendesmultilingues

Inadapté aux légendesmultilingues

XMPIPTC/IIM

Extensible et évolutifStatique

Extensibilité documentée (Namespaces)

Extensibilité non documentée (champs non standards)

Types de données et types structurés

Pas de types de données

Pas de problèmes d'accents (codage Unicode)

Problèmes d'accents

Lisible (XML)Binaire (non facilement lisible)

Page 53: Inha in visu-metadonnees-12 septembre 2012

La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata

IPTC Photo Metadata est une initiative de l'IPTC qui regroupe deux schémas XMP :IPTC Core et IPTC Extension

But définir des éléments de métadonnées dans le but de proposer une correspondance non ambiguë et une transition en douceur depuis les métadonnées IPTC/IIM (dit legacy) vers une technologie XMP

Page 54: Inha in visu-metadonnees-12 septembre 2012

La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata

IPTC Core reprend sous forme XMP la plupart des métadonnées de l'IIM (mais pas toutes). Son préfixe d'espace de noms est iptc4xmp

✔ IIM Contact n'est pas repris tel quel

IPTC Core comporte aussi des métadonnées supplémentaires par rapport à l'IIM :

✔ Structure Contact : nom, adresse, téléphone, etc.

✔ Localisation (seuls Pays, Code Pays, Ville existent en IIM)

✔ NewsCodes : sujet, scène, genre

Page 55: Inha in visu-metadonnees-12 septembre 2012

La transition du standard IPTC/IIM vers XMPIPTC Photo Metadata

IPTC Extension 1.1

Distingue entre la Localisation de la prise de vue et laLocalisation du sujet photographié

Gestion des droits : Copyright Owner, Copyright Owner Name, etc.

Informations concernant le modèle photographié :Model Age, Minor Model Age Disclosure, etc.

Informations concernant la propriété des "contenus"photographiés

Informations concernant l'œuvre ou l'objet figurant sur l'image :Artwork or Object in the Image

Page 56: Inha in visu-metadonnees-12 septembre 2012

Exemple avec Photoshop

Ajouter des panneaux (Custom panels) pour afficher et/ou modifier les métadonnées Astronomy Visualization Metadata Standard

Observer le panneau Avancé

Extensibilité XMP

Page 57: Inha in visu-metadonnees-12 septembre 2012

Panneaux standards sur Photoshop [version CS ; semblable sur les versions plus récentes]

Page 58: Inha in visu-metadonnees-12 septembre 2012

Le panneau Avancé

Page 59: Inha in visu-metadonnees-12 septembre 2012

Le panneau Avancé. Détail des informations dans l'espace de nom avm

Page 60: Inha in visu-metadonnees-12 septembre 2012

Extensibilité. Ajout de panneaux personnalisés [Custom panels]. Liste des panneaux.

Page 61: Inha in visu-metadonnees-12 septembre 2012

Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Creator.

Page 62: Inha in visu-metadonnees-12 septembre 2012

Extensibilité. Ajout panneaux personnalisés [Custom panels]. Le panneau Astro Content.

Page 63: Inha in visu-metadonnees-12 septembre 2012

Pratique des métadonnées internes des images numériques

Ne pas modifier les métadonnées Exif, à l'exception des coordonnées GPS et parfois de la date de prise de vue (si l'appareil était mal réglé)

Utiliser toujours des standards éprouvés:Dublin Core, IPTC/IIM et équivalent en XMP

Ne pas être top "ambitieux", se contenter d'un jeu de métadonnées cruciales et que l'on maîtrise

Se conformer aux pratiques documentaires habituelles et éviter la surindexation

Si vous utilisez IPTC/IIM, maintenir la cohérence avec les équivalents XMP

N'utiliser l'extensibilité XMP que s'il existe un schéma documenté et soutenu par une organisation reconnue

Page 64: Inha in visu-metadonnees-12 septembre 2012

Pour en savoir plus

Métadonnées: une initiationpeccatte.karefil.com/software/Metadata.htmLe site de l'IPTCwww.iptc.orgAdobe Extensible Metadata Platform (XMP)www.adobe.com/products/xmp/main.htmlControlled Vocabularywww.controlledvocabulary.com

Page 65: Inha in visu-metadonnees-12 septembre 2012

La légende ne deviendra-t-elle pas l’élément essentiel du cliché ?

Walter BenjaminPetite histoire de la photographie (1931)