View
51
Download
1
Category
Preview:
DESCRIPTION
Ouverture des données. Le projet d'établissement de l'ABES 2008-2011 , p. 4. Ouverture. « open » à toutes les sauces… Comment mesurer une vraie politique d’ouverture ? En exposant les données et en offrant des services , donner les moyens de se passer des applications ABES. - PowerPoint PPT Presentation
Citation preview
OUVERTURE DES DONNÉES
Le projet d'établissement de l'ABES 2008-2011, p. 4
Ouverture
• « open » à toutes les sauces…• Comment mesurer une vraie politique d’ouverture ?
En exposant les données et en offrant des services, donner les moyens de se passer des applications ABES
STAR comme Boîte aux lettres
Questions préalables
• Questions juridiques– Quelles données ? Quelles licences ?– Dossier complexe en cours d’instruction– Volonté d’être aussi libéral que possible
• Questions techniques– Données brutes / services– Rapidité– Simplicité– Standards
Ouvrir les données du Sudoc
• Fil RSS 2010
• Z39.50 2010
• Chargement dans Worldcat 2010-
• Référencement par les moteurs 2011
• Exposition des données bibliographiques et d’autorité en RDF 2011
• Micro Web Service Where 2011
Fil RSS du Sudoc
Merci à Etienne Cavalié
Z39.50
• Une version riche réservée aux membres du réseau sudoc
• Une version partielle et publique– Notices moins riches– Notices ISSN retirées depuis peu
Sudoc dans Worldcat
• Chantier épique– Dernier chargement : été 2010– Travail sur la synchronisation en cours• Difficulté majeure : la synchronisation des notices dépend de la synchronisation des informations sur les bibliothèques
• Conséquence : les identifiants OCLC (OCN) sont dans les notices Sudoc– Ce qui facilite l’utilisation de certains services (OCLC, Google Books, Open Library et autres)
Exposition des données bibliographiques
• URL pérennes• Pages HTML dédiées aux moteurs de recherche– sauf notices ISSN
• Pages RDF pour le Web de données– sauf notices ISSN
Des URL pour le Sudoc
PPN 012367206
URL pérenne de la notice http://www.sudoc.fr/012367206
URL pérenne de la notice en RDF http://www.sudoc.fr/012367206.rdf
http://www.sudoc.fr/012367206 renverra• soit de l’HTML• soit du RDF
en fonction du contexte (négociation de contenu)
Des pages Sudoc en HTML pour les moteurs ou les humains
• Si un humain passe par http://www.sudoc.fr/012367206, il sera renvoyé vers http://www.sudoc.abes.fr/DB=2.1/SRCH?IKT=12&TRM=012367206 (la page actuelle)
• Si c’est un moteur, on lui servira une page dédiée, pour un meilleur référencement Web
Sudoc et le Web de données
Micro Web Service Where
• Web service mono-tâche : lister les bibliothèques possédant un document
• Fonctionnement :– Requête = 1 URL avec 1 identifiant de document (PPN)– Réponse = 1 liste de bibliothèques avec libellé court et code (RCR)
• Deux formats :– XML– JSON
http://www.sudoc.fr/ppn/where/144089661
Ouvrir les données de IdRef
• URL pérennes www.idref.fr/* 2010
• Exposition des données en RDF 2010
• Micro Web Service Biblio 2011
• Enrichissement des pages HTML et RDF par le service Biblio 2011
• Web service de recherche 2011
• Brancher IdRef dans un autre site 2011
Des URL pour IdRef
PPN 026789450
URL pérenne http://www.idref.fr/026789450
URL pérenne de la notice en RDF http://www.idref.fr/026789450.rdf
URL pérenne de la notice en UNIMARC/XML
http://www.idref.fr/026789450.xml
http://www.idref.fr/026789450 renvoie• soit de l’HTML• soit du RDF
en fonction du contexte (négociation de contenu)
Micro Web Service Biblio
• Web service mono-tâche : lister les documents liés à l’autorité d’une personne, rôle par rôle.
• Fonctionnement :– Requête = 1 URL avec 1 identifiant de personne (PPN)– Réponse = 1 liste de documents, ventilée par rôle (auteur, préfacier…)
• Deux formats :– XML– JSON
http://www.idref.fr/person/docs/026789450
HTML d’IdRef enrichi par le service Biblio
REL TT en HTMLpour les intimes
RDF d’IdRef enrichi par le service Biblio
REL TT en RDFpour les intimes
Web service de recherche d’IdRef
• Objectif = intégrer la recherche sur les autorités Sudoc dans une autre application– Exemple : aide à la saisie (auto-complétion)
• Solution–Web service natif de Solr : riche et puissant–Mêmes possibilités que via l’interface Web
Exemple
• Nom = Jean Rau*
• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)
• http://www.idref.fr/Sru/Solr?wt=xml&version=2.2&start=&rows=30&indent=on&fl=id,ppn_z,affcourt_z&q=persname_t:(jean AND rau*)
Brancher IdRef sur un autre site
• Objectif : enrichir son site (ou application Web) des fonctionnalités d’IdRef– Recherche– Lien aux autorités– Création et modification de notices
• Méthode : IdRef comme popup• Solution : Javascript
– Code fourni par l’ABES– À modifier pour intégrer dans son site
Ouvrir les données de Calames
• Serveur OAI-PMH 2010
• RDF enrichi 2011
Moissonner Calames en OAI-PMH
• Format : Dublin Core, pas EAD– On perd la hiérarchie et certains niveaux
• 1er utilisateur : CERL Portal (portail du Consortium
européen des bibliothèques de recherche)
Calames et le Web de données
• Métadonnées RDFa dans les pages Calames depuis 2008
• Enrichissement 2010 : liens entre les métadonnées RDF de Calames et les autorités en RDF d’IdRef
• Moissonné en RDFa par :– Sindice (moteur de recherche RDF généraliste)– Isidore (moteur de recherche SHS du CNRS)
Ouvrir les donnéesde STAR et de theses.fr
• Serveur OAI-PMH de STAR 2010
• URL pérennes www.theses.fr/* 2010
• Exposition des données en RDF 2010 + 2011
• Web service pour interroger www.theses.fr 2011
Moissonner STAR en OAI-PMH
• Formats : Dublin Core, TEF• Sets :– Etablissements de soutenance– Domaines (classes Dewey)– Diffusable en texte intégral ou non
URL pérennes des thèses
Numéro national de thèse 2008INPL070N
URL de la page décrivant la thèse http://www.theses.fr/2008INPL070N
URL du document où qu’il soit (s’il est diffusé)
http://www.theses.fr/2008INPL070N/document
Exposition des métadonnées de thèses en RDF
• Aujourd’hui– Seulement les thèses de STAR– RDFa dans les pages HTML comme http://www.theses.fr/2008INPL070N
• Bientôt– Toutes les thèses– RDF/XML en plus à http://www.theses.fr/2008INPL070N.rdf et http://www.theses.fr/2008INPL070N.xml
Web service de recherche de www.theses.fr
• Objectifs :– Recherche fédérée par d’autres portails– Alertes– Intégration dans d’autres sites
• Solution– OpenSearch– Requête = une URL– Réponse = un flux ATOM– D’autres formats de réponse viendront
Vous êtes ici
Recommended