45
Groupe Sectoriel ATC Aménagement – Transport - Construction Réunion du 24 mars 2009 Sylvie Dalbin - ATD [email protected] Métadonnées

Metadonnees et SID

  • Upload
    dalb

  • View
    2.883

  • Download
    0

Embed Size (px)

DESCRIPTION

Exposé sur les métadonnées dans le cadre des systèmes d'information documentaire (SID)

Citation preview

Page 1: Metadonnees et SID

Groupe Sectoriel ATC Aménagement – Transport - Construction

Réunion du 24 mars 2009

Sylvie Dalbin - [email protected]

Métadonnées

Page 2: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 2

Plan du support

1. Objectif et contexte

2. Ressources

3. Métadonnées

4. XML

5. Modélisation

6. Axes d’évolution

Page 3: Metadonnees et SID

1. OBJECTIF ET CONTEXTE

Page 4: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 4

Objectif : Métadonnées et SID

Métadonnées Pour la représentation et l’accès à l’information Impacts sur les Systèmes d’information documentaire (SID)

Sur les outils documentaires et informatiques, de production, gestion et recherche

Perpectives Accès à l’information

à l’ère de la Société de l’Information et du Web Prendre acte des besoins et des pratiques des Utilisateurs des SID

Mise en perspective professionnelle Synthèse du questionnaire transmis le 17/03/2009

Page 5: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 5

Synthèse - Fonctions (1)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

1. Fonctions assurées

0,00%

13,60%

31,80%

31,80%

63,60%

68,20%

72,70%

95,50%

72,70%

Autres

Gestion prod. documents

Archives

Gestion d'information metier

Produits, services

Gestion documents internes

Bibliothèque

Veille

Recherche

Page 6: Metadonnees et SID

ADéLIe (1) - un exemple

ADministration de Données locaLIsées

Système de stockage, de catalogage et de mise à disposition du patrimoine géographique du Ministère (Equip)

… sous forme de lots de données géographiques Aérodromes de Bourgogne - FICHE_2760

http://adelie.application.equipement.gouv.fr/syntheseFiche.do?fiche=2760&visu=ok&page=1

Page 7: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 7

Zones de la fiche

Export de la fiche en XML

ADéLIe (2) - site Internet

Page 8: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 8

ADéLIe (3) Patrimoine géographique

sous forme de lots de données (tableaux, cartes, statistiques, écrits, etc), stables et datés

accompagnés de métadonnées à la norme ISO 19115 - échangeables au format XML conforme à la norme ISO19139.

hébergés sur serveurs - central, local ou externe -alimentés par une application web centralisée

alimentés par des administrateurs de données localisées (ADL)

consultables à travers un moteur de recherche, accessible sur i-carré, ADER, Internet en fonction des droits d'accès

Page 9: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 9

(?)ContrôleXML

(SGBD)

Rdf - uri

Schémas de métadonnées

Ressource numérique structurée

De gros manuels

Saisie

Import/export

SGBD

MCDNotice

(bibliographique)Document

Documentation du système

ProcessSystème

informatiqueSystème

documentaireDocument

granularité modèle métier norme interopérabilitéSystème

documenté

Thèmes abordés

Utilisateur producteur / Utilisateur final

Outils documentaires et informatiques

Hie

rAujourd

’hui

Page 10: Metadonnees et SID

2. RESSOURCES

Ressources numériques structurées

Page 11: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 11

ADéLIe (4) – Données, Documents, Informations

Information géographique Une collection constituée par les besoins et

pratiques du métier (Equipement) Quelle que soit la nature et le support de

l’information tableaux, cartes, statistiques, écrits, etc

Granularité adaptée aux besoins Ici des lots regroupés par rapport à la localisation

Informations et documents numériques

Page 12: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 12

Synthèse – Informations (2)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

2. Type d'informations gérées

0,00%

13,60%

13,60%

18,20%

45,50%

45,50%

63,60%

100,00%

Autres

Objets : maquettes,...

Plans

Films/video

Donnees stat.,factuelles

Photographies

Dossiers techniques

Articles/monographies

Page 13: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 13

Synthèse - Médias (3)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

6. Médias gérés

Image animee; 9,50%

Artefacts/Objets; 9,50%

Collection donnees; 9,50%

Autres ?; 9,50%

Image fixe; 47,60%

Logiciels; 9,50%

Texte; 90,50%

Catégories du Dublin Core

Page 14: Metadonnees et SID

3. METADONNEES

Représentation documentaire métier

Page 15: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 15

ADéLIe (5) Eléments de la fiche descriptive…

Ce que l’on voit à l’écran

titre version dates (création, révision, édition), producteur des données Aperçu droits d'accès aux données résumé type de données couverture administrative système de coordonnées résolution/échelle de

référence service gestionnaire des

données, contact pour les données

Page 16: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 16

Adélie (6) … structurée

éléments de données = métadonnées

regroupés et hiérarchisés= schéma de métadonnées

=> une représentation des ressources, ici un lot de données géographiques.

Ce que l’on voit derrière l’écran

Logiciel XMLEditor ou Amaya

Page 17: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 17

Catégories de métadonnées

Catégories fréquemment citées ns4:MD_Metadata ns4:fileIdentifier ns4:language ns4:characterSet ns4:hierarchyLevel ns4:hierarchyLevelName ns4:contact ns4:dataStamp ns4:metadataStandardName ns4:metadataStandardVersion ns4:referenceSystemInfo ns4:identificationInfo ns4:distributionInfo ns4:dataQualityInfo ns4:metadataConstraints

Représentation de la ressourcecaractéristiques intrinsèques, contexte de production

ns4:referenceSystemInfo

Administration de la ressource

ns4:contact

Métadonnées structurellesns4:hierarchyLevel (contexte)

Méta-métadonnéesns4:contact

Page 18: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 18

Standardisation - Normalisation

Suivant les objets représentés La description d’une ressource

Norme bibliothéconomique telle RDA ou Onyx

La ressource elle-même DocBook d’OASIS pour les documents techniques, TEI…

Par élément de données Langue (rfc4646), contact (vCard), identifiants …

Par Métier - producteurs Secteur de l’information géographique, Secteur de la

formation : LOM, CDR, … Par Fonctions

Transports de données : METS, XMP…

Nouveaux « langages documentaires »

Page 19: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 19

Schémas imbriqués

Une ressource « OAI »…Schéma OAI-PMH

transportant des ressources LOM

Schéma LOM

Page 20: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 20

Métadonnées et Logiciels

Plusieurs jeux de métadonnées Diversité des modèles Relations entre modèles Mobilité des modèles

Complexité d’articulation entre ces schémas

Distinguer production et recherche Production en locale ? sur plusieurs systèmes ? Recherche fédérée sur d’autres ressources

Ressources à traiter et celles à intégrer au portail : quel recouvrement ?

Un point d’architecture aussi pour professionnels de l’infodoc, essentiel pour les questions d’interopérabilité et d’économie

Page 21: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 21

Synthèse - Logiciels (4)22 répondants du Groupe ATC en 3 jours, dont 15 présents à la réunion

Page 22: Metadonnees et SID

4. XML

Représentation informatique et applications de gestion et de

recherche

Page 23: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 23

XML - Langage de description Format ouvert : texte

Non propriétaire

Ajoute des informations aux métadonnées

Chaîne de caractère Localise le référentiel avec

une URI

Structuration formelle Encadre les métadonnées

Balises: < > et </ > Arbre XML

Nouveaux langages informatiques

Page 24: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 24

XML et SGBD

XML: format de transfert ou de stockage ? Débats dans la communauté informatique

SGBD : données encapsulées dans des tables, documentation externe aux fichiers véhiculés, peu souple

XML : données « ouvertes », auto-documentées grâce à RDF

Usage pour le stockage des index en recherche

Exploitation directe par les moteurs de recherche

Un point technique pour informaticiens, essentielles pour les questions d’interopérabilité et d’économie

Page 25: Metadonnees et SID

5. MODELISATION

Processus et outils

Page 26: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 26

Processus de conception

La Vie

Les Choses de la Vie

A - Représentation MétierA1 - Modéliser et formaliser le modèle métierA2 - Développer des Référentiels métier

B - Représentation InformatiqueB1 - Concevoir un modèle informatique sur la base du

modèle conceptuel métierB2 - Développer un schéma de données

Page 27: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 27

liaison entre attribut et entité ou association et entité

Classe d’entité Attribut

matériauPont A conçu

Classe d’association

Cardinalité (1-n). Ici, on suppose qu’un pont peut être conçu par 1 ou n architectes. Classe d’entités / associations : regroupement d’entités ou d’associations de même natureIdendifiant : chaque occurrence est repérée de manière unique et sans ambiguïté pour être distinguée de toutes les autresCe vocabulaire est variable en fonction de l’origine du locuteur comme objet (entité), propriété (attribut) ou valeur et relation (association)

Architecte PontA conçu

nom prénom date nom-pont lieu

fonction durée matériau

1, n 1, n

Modèle entités-associations

Identifiant Identifiant

Page 28: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 28

relation est_unterme_préféré

EntitésThésaurusConcepts

Termes

Attributsdu terme: langue, source…

Draft Schema np25964

relation terme: a_comme_définition

Diagramme UML

Page 29: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 29

Administration des métadonnées

Documenter les applications Auto-référencement ?

RDF – grâce à une syntaxe formelle permet de documenter rigoureusement les métadonnées

Documenter « écrite »  ISO 11179 (MDR) ISO 9735-2:2002 données composites

Enregistrer schémas et profils d’application Agences d’enregistrement: ISO 11179, par métiers Profils d’application

schéma + règle + système d’encodage + tableau de concordance

Page 30: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 30

Vocabulaire RDFDocumenter les métadonnées

<?xml version="1.0"?>

<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN"

"http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://www.ilrt.bristol.ac.uk/people/cmdjb/">

<dc:title>Dave Beckett's Home Page</dc:title>

<dc:creator>Dave Beckett</dc:creator>

<dc:publisher>ILRT, University of Bristol</dc:publisher>

<dc:date>2002-07-31</dc:date>

</rdf:Description>

</rdf:RDF>

Doc. XML

Doc. RDF

Doc Elements du Dublin Core

Doc schema XML du Dublin Core / RDF (espace de nom)

Elements du Dublin Core

Page 31: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 31

En résuméLangages à tous les étages

Langage : un moyen d'expression et de représentation Langage de représentation des SI

Représention graphique UML, entité-attribut-classe, Schémas XML

Langage de représentation des ressources De la notice aux schémas de métadonnées interopérables

Langages de représentation des notions Sert à alimenter les schémas de métadonnées Des listes d’autorité aux référentiels sémantiques

Langage de représentation des métadonnées RDF

Pour chacun : vocabulaire - syntaxe - sémantique

Page 32: Metadonnees et SID

6. AXES D’EVOLUTION

#1 - Des listes d’autorité aux répertoires sémantiques

#2 – Pour une convergence des modèles documentaires

#3 – Continuum et réexploitation

#4 – Plonger dans les ressources numériques

Page 33: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 33

#1 - Des lexiques contrôlés ….

PersonneGéographieGenres…

Réservoirs de vocabulairesdésambiguïsés

NomDateNaissance/Mort

IDTitreAuteurEditeurDateSupport…Descripteurs-Géographiques-Personnes-Thèmes

RépertoireDocuments

Personnes

Géographie

Lexiques contrôlés Ressource

Page 34: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 34

. … aux répertoires sémantiques

IDNomDateNaissance/MortPseudoPaysNaissance

TypePublicationGenrePublicationAireLinguistiqueEditeur …

IDTitreAuteurEditeurDateSupportGenreLieuPersonnage…

RépertoireDocuments

RépertoirePersonnes

RépertoireGéographie

RessourceRessource

PersonneGéographieGenres…

Réservoirs de vocabulairesdésambiguïsés

pouvant servir de Base de connaissance qualifiée

Page 35: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 35

#2 – Pour une convergence des modèles documentaires

biblio-doc

RM

Archives

KM

Page 36: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 36

#3 Continuum et réexploitation

Continuum - de la création à l’exploitation des ressources Métadonnées à la source : « recyclage infini » des métadonnées produites, et

non (re)création Ne pas rester à la lisière du document

biblio-doc

RM

Archives

KM

Page 37: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 37

#4 Plonger dans les ressources numériques

Etablir des schémas de représentation des contenus

Exemple : les thèses Etat de l’art Méthode proposée Expérimentation Perspective Terminologie Ressources liées (bibliographie)

Articuler les métadonnées description de la ressource description de son contenu avec des éléments de son

contexte

Contenu de la thèse (pdf)

C. Roussey - Une méthode d’indexation sémantique adaptée aux corpus multilingues, 2001

Etat de l’art

Méthode proposée

Expérimentation

Perspective

Terminologie

Ressource liée(ici un article)

Page 38: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 38

Complexité de mise en œuvre

Malgré les qualités des technologies du Web Ouverture, interopérabilité technique, normalisation,…

Difficultés de conception et de mise en œuvre

Grande mobilité : normalisation, méthodes et outils Compétences multiples à associer Contenu et systèmes ouverts S’ouvrir aux pratiques des Utilisateurs Economie des dispositifs et coût des transformations Accompagner le changement : formation

Adopter un esprit ouvert et critique sur nos pratiques

Page 39: Metadonnees et SID

Merci !

Sylvie [email protected]

Page 40: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 40

Annexe 1 - Description des métadonnées

Selon la norme ISO 11179

Page 41: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 41

Annexe 2 - Représentation fine et métadonnées composites

Représentation des langues RFC 4646 (Tags for Identifying Languages) Finalités

Accès direct aux ressources Répondre précisément aux besoins Prendre en compte les particularismes régionaux à travers

le monde Intégré à Dubin Core / ISO 15836

zh - Latn - CN [ISO 639-1] [ISO 15924] [ISO 3166]

de - CH - 1996Allemand utilisé en Suisse, écrit après la réforme de l'orthographe entamée en 1996.

Page 42: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 42

Annexe 3 – Arbre XML et schéma de métadonnées

Page 43: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 43

Page 44: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 44

Page 45: Metadonnees et SID

Sylvie DALBIN pour ADBS ATC - Réunion du 24 Mars 2009 45