Transcript
Page 1: Spire : l'archive ouverte de Sciences Po

Spire

Sciences Po Institutional RepositoryJournées d’étude sur les Archives Ouvertes

Consortium Couperin, 3 avril 2009

Page 2: Spire : l'archive ouverte de Sciences Po

Qu’est ce que Spire?

Spire, Sciences Po Institutional REpository

Spire est l’acronyme de « Sciences Po Intitutional Repository », nom donné à l’Archive Ouverte de Sciences Po.

Initiée en 2005-2006 par la bibliothèque, suite à son adhésion au réseau Nereus

Accessible à l’adresse : http://spire.sciences-po.fr

2 200 références bibliographiques, principalement en économie

50% avec texte intégral

Utilise actuellement le logiciel Dspace 1.4

Sciences Po Intitutional REpository

Page 3: Spire : l'archive ouverte de Sciences Po

Qu’est ce que Spire?

Spire, Sciences Po Institutional REpository

La bibliothèque, la Direction Scientifique et la Direction des Systèmes d’information de Sciences Po développent depuis février 2008 un nouveau logiciel d’Archive Ouverte dénommé Spire.

Ce logiciel est développé en Java.

La mise en production aura lieu fin mai 2009.

Un nouveau logiciel d’Archive Ouverte

Page 4: Spire : l'archive ouverte de Sciences Po

Mais pourquoi développer un nouveau logiciel ?

Spire, Sciences Po Institutional REpository

HAL du CCSD

Dspace

Fedora

ePrint

Castor

ORI-OAI

Il existe déjà des solutions

Page 5: Spire : l'archive ouverte de Sciences Po

Mais pourquoi développer un nouveau logiciel ?

Spire, Sciences Po Institutional REpository

Résolveur de liens

Intranet

Formation en ligne

Assistance en ligne

Sitothèque

Statistiques

Numérisation de masse

Portail documentaire

N’y a t’il pas des projets plus prioritaires à la bibliothèque ? SIGB

OPAC

Site web

Accès distant

Bases de données et revues en ligne

Moteur de recherche fédéré

ERMS

Shibboleth

Page 6: Spire : l'archive ouverte de Sciences Po

Mais pourquoi développer un nouveau logiciel ?

Spire, Sciences Po Institutional REpository

Archivage de grand volume de métadonnées et de fichiers

Moteur de recherche en texte intégral

Conversion de métadonnées

Moissonnage (OAI-PMH)

Recherche (Z39.50, SRU)

Dépôt (SWORD…)

Statistiques

SOA

Quelles sont les problématiques récurrentes ?

Page 7: Spire : l'archive ouverte de Sciences Po

Mais pourquoi développer un nouveau logiciel ?

Spire, Sciences Po Institutional REpository

Peut on fusionner quelques projets ?

Archive Ouverte

Numérisation des dossiers de presse

Numérisation des ouvrages

Sitothèque

Produits documentaires

Gestion de références bibliographiques

Statistiques d’usage

Bibliométrie

Page 8: Spire : l'archive ouverte de Sciences Po

Briques technologiques

Spire, Sciences Po Institutional REpository

Stockage et recherche : JackRabbit Protocole normé Java Content Repository JCR (JSR 170)

Système de stockage et de recherche

JackRabbit est l’implémentation de Référence du protocole JCR développé par la fondation Apache

Basé sur le moteur d’indexation Lucene

Différentes stratégie de stockage des données et des fichiers binaires : disque ou base de données (Oracle, MySQL, PostgreSQL…)

Possibilité de « clusteriser » plusieurs instance de JackRabbit

Fonctionnement testé jusqu’à 500 To

Page 9: Spire : l'archive ouverte de Sciences Po

Briques technologiques

Spire, Sciences Po Institutional REpository

Conversion XML vers Java : JibX OXM : Object XML Mapping

Permet la conversion du Java vers XML (marshalling) et réciproquement (unmarshalling)

Une fois le mapping JibX développé et testé, il n’y aura plus d’erreur d’écriture et de lecture du XML.

Très bonne performance au niveau de la rapidité de conversion et de la faible consommation de mémoire.

Page 10: Spire : l'archive ouverte de Sciences Po

Briques technologiques

Spire, Sciences Po Institutional REpository

Formats de métadonnées bibliographiques MarcXML

Mods

Qualified Dublin Core

RSS

TEF

UNIMARC

AOFR

Atom

ContextObject (OpenURL)

Crossref

Dublin Core

EndNote

Marc21

Page 11: Spire : l'archive ouverte de Sciences Po

Briques technologiques

Spire, Sciences Po Institutional REpository

Formats de personnes morales ou physiques ResearcherML

Vcard

FOAF

MADS

Formats de classifications VDEX

Formats d’objets complexes METS

DIDL

ORE-OAI

SCORM

Formats de Préservation Premis

Formats de statistique Sushi

SWUP

Formats de Droit d’Auteur METS Rights

Page 12: Spire : l'archive ouverte de Sciences Po

Briques technologiques

Spire, Sciences Po Institutional REpository

Moissonnage OAI-PMH

Divers Romeo

HAL WebServices

LDAP

Recherche Z39.50 (is dead)

SRU / SRW

Dépôt SWORD

SRU Record update

Protocoles

Page 13: Spire : l'archive ouverte de Sciences Po

Modèle de données

Spire, Sciences Po Institutional REpository

Structuration des Nodes de JackRabbit Item

Correspondant à la structure des objets complexes (METS, DIDL, OAI-ORE)

Permet de stocker n’importe quel type de métadonnée (Mods, ResearcherML, Vdex, LOM, DDI….)

Permet de stocker n’importe quel type de fichier

Repository

Contient la description du Dépôt.

Classification

Mini moteur d’ontologies

Page 14: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

De Z39.50 à SRU Le protocole Z39.50 va petit à petit être remplacé par le protocole SRU.

SRU est un protocole moderne basé sur des technologies Web (HTTP, WebServices, XML)

Connexion aux catalogues de bibliothèques

Soit directement si le SIGB implémente ce protocole

Soit par le Yaz Proxy (Z39.50 vers SRU)

Connexion aux bases de données commerciales (ex JSTOR)

Récupérer les données d’autres instances de Spire, communication entre les archives.

Page 15: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

Import HAL Utilisation de 3 WebServices

Synchronisation des référentiels

Laboratoires, affiliations, collections…

Revues

Projets ANR

Récupération des publications déjà déposées dans HAL

Page 16: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

Moissonnage OAI-PMH Récupérer des publications par :

collection

identifiant

intégralité

Répliquer de façon synchrone d’autres Archives Ouvertes

Permettra la récupération les données de Spire v1 sous DSpace

Page 17: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

Enrichissement OpenURL Les résolveurs de liens peuvent permettre de compléter les métadonnées (ISSN, volume…)

Crossref permet de faire une requête OpenURL et à l’aide d’un petit paramètre de récupérer le DOI de la publication

Récupérer le texte intégral déjà en ligne

Page 18: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

Import CKB : Copyright Knowledge Base Implémentation du protocole REST de RoMEO (RoMEO API)

récupérer pour chaque éditeur sa politique de droit d’auteur dans le contexte des Archives Ouvertes

Uniquement RoMEO dans un premier temps. Le système allemand, espagnol et français par la suite…

Page 19: Spire : l'archive ouverte de Sciences Po

Import des données

Spire, Sciences Po Institutional REpository

Import LDAP Le LDAP n’est pas uniquement un système d’authentification

Il permet aussi l’identification, ie la récupération d’information sur une personne physique ou morale.

Dans nos annuaires LDAP il y a nos chercheurs et leur affiliation.

Le LDAP est une sorte de liste d’autorités synchronisées avec le système d’information de l’université (DRH, Scolarité, Recherche…)

Page 20: Spire : l'archive ouverte de Sciences Po

De Nereus à NEEO

Spire, Sciences Po Institutional REpository

Nereus Consortium européen pour les archives ouvertes en sciences économiques

Créé en 2003

Projet pilote de portail pour les économistes avec le principe du moissonnage des partenaires

NEEO Projet européen financé par la CE dans le cadre du projet eContentPlus de septembre 2007 à février 2010

16 partenaires (Oxford, LSE, Tilburg, ULB, KU Leuven, Kiel, Dauphine, Toulouse 1…)

Page 21: Spire : l'archive ouverte de Sciences Po

De Nereus à NEEO

Spire, Sciences Po Institutional REpository

Work Package 5 : Metadata et Protocol Sélection de normes pour :

les métadonnées bibliographiques : Mods

les objets complexes : DIDL (en attendant OAI-ORE)

DAI : Digital Author Identifier (sans spécification précise)

Statistique d’usage : Profile SWUP du ContextObject (OpenURL)

NEEO Admin File : description du repository, des ses institutions et de ses auteurs (avec DAI)

Normes récupérées par Driver pour l’uniformisation des Archives Ouvertes européennes

Page 22: Spire : l'archive ouverte de Sciences Po

De Nereus à NEEO

Spire, Sciences Po Institutional REpository

Work Package 5 : Metadata et Protocol Documentation technique :

http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Technical%20guidelines.pdf

http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Usage%20metadata%20guidelines.pdf

Page 23: Spire : l'archive ouverte de Sciences Po

Envoi des publications dans HAL

Spire, Sciences Po Institutional REpository

Stratégie nationale importante Besoin d’une archive ouverte de référence pour les agences de financement de la recherche afin de contrôler la présence des publications en accès libre pour les projets financés.

Regroupement des publications pour l’évaluation d’un projet ANR

Bientôt les projets européens?

Nos chercheurs et nos centres de recherches sont souvent affiliés au CNRS

Visibilité international: très bon classement dans le Web Ranking des Archives Institutionnelles

Page 24: Spire : l'archive ouverte de Sciences Po

Liens avec les données brutes : Dataset

Spire, Sciences Po Institutional REpository

Les données quali et quanti doivent être diffusées Deux formats utilisés dans les SHS:

DDI (quali : comme les enquêtes et quanti : tableau de données)

SDMX (quanti, données macros)

NEEO a sélectionnée le Dataverse Network d’Harvard

Sciences Po souhaite utiliser son serveur Nesstar pour décrire ses données, puis envoyer les notices vers Dataverse en DDI

Faire un lien des publications vers les données

Objectif de 10 datasets de 10 chercheurs différents liés à 10 publications différentes sur l’archive ouverte.

Page 25: Spire : l'archive ouverte de Sciences Po

Demo d’un logiciel en cours de développement…

Spire, Sciences Po Institutional REpository

Liens pour démo. Attention aux bugs! http://spirepprd.sciences-po.fr/backoffice/

http://spirepprd.sciences-po.fr/web/

http://spirepprd.sciences-po.fr/dissemination/oaipmh2-publications.xml?verb=ListRecords&metadataPrefix=didl&set=NEREUS:NEEO

http://spirepprd.sciences-po.fr/dissemination/adminfile.rdf.xml

Page 26: Spire : l'archive ouverte de Sciences Po

Planning

Spire, Sciences Po Institutional REpository

Si tout va bien… Livraison du lot 1 (fin mai 2009)

Lot 2: ajout de la bibliométrie (fin juin 2009)

Lot 3: numérisation des dossiers de presse (novembre 2009)

Lot 4: numérisation d’ouvrages

Lot 5: sitothèque

Lot 6: thèses en ligne

Lot 7: hébergement de produits documentaires

Lot 8: plateforme de gestion de référence bibliographique pour la communauté de Sciences Po (Etudiants, Chercheurs, …)


Recommended