View
1.962
Download
5
Category
Preview:
Citation preview
Spire
Sciences Po Institutional RepositoryJournées d’étude sur les Archives Ouvertes
Consortium Couperin, 3 avril 2009
Qu’est ce que Spire?
Spire, Sciences Po Institutional REpository
Spire est l’acronyme de « Sciences Po Intitutional Repository », nom donné à l’Archive Ouverte de Sciences Po.
Initiée en 2005-2006 par la bibliothèque, suite à son adhésion au réseau Nereus
Accessible à l’adresse : http://spire.sciences-po.fr
2 200 références bibliographiques, principalement en économie
50% avec texte intégral
Utilise actuellement le logiciel Dspace 1.4
Sciences Po Intitutional REpository
Qu’est ce que Spire?
Spire, Sciences Po Institutional REpository
La bibliothèque, la Direction Scientifique et la Direction des Systèmes d’information de Sciences Po développent depuis février 2008 un nouveau logiciel d’Archive Ouverte dénommé Spire.
Ce logiciel est développé en Java.
La mise en production aura lieu fin mai 2009.
Un nouveau logiciel d’Archive Ouverte
Mais pourquoi développer un nouveau logiciel ?
Spire, Sciences Po Institutional REpository
HAL du CCSD
Dspace
Fedora
ePrint
Castor
ORI-OAI
…
Il existe déjà des solutions
Mais pourquoi développer un nouveau logiciel ?
Spire, Sciences Po Institutional REpository
Résolveur de liens
Intranet
Formation en ligne
Assistance en ligne
Sitothèque
Statistiques
Numérisation de masse
Portail documentaire
N’y a t’il pas des projets plus prioritaires à la bibliothèque ? SIGB
OPAC
Site web
Accès distant
Bases de données et revues en ligne
Moteur de recherche fédéré
ERMS
Shibboleth
Mais pourquoi développer un nouveau logiciel ?
Spire, Sciences Po Institutional REpository
Archivage de grand volume de métadonnées et de fichiers
Moteur de recherche en texte intégral
Conversion de métadonnées
Moissonnage (OAI-PMH)
Recherche (Z39.50, SRU)
Dépôt (SWORD…)
Statistiques
SOA
Quelles sont les problématiques récurrentes ?
Mais pourquoi développer un nouveau logiciel ?
Spire, Sciences Po Institutional REpository
Peut on fusionner quelques projets ?
Archive Ouverte
Numérisation des dossiers de presse
Numérisation des ouvrages
Sitothèque
Produits documentaires
Gestion de références bibliographiques
Statistiques d’usage
Bibliométrie
Briques technologiques
Spire, Sciences Po Institutional REpository
Stockage et recherche : JackRabbit Protocole normé Java Content Repository JCR (JSR 170)
Système de stockage et de recherche
JackRabbit est l’implémentation de Référence du protocole JCR développé par la fondation Apache
Basé sur le moteur d’indexation Lucene
Différentes stratégie de stockage des données et des fichiers binaires : disque ou base de données (Oracle, MySQL, PostgreSQL…)
Possibilité de « clusteriser » plusieurs instance de JackRabbit
Fonctionnement testé jusqu’à 500 To
Briques technologiques
Spire, Sciences Po Institutional REpository
Conversion XML vers Java : JibX OXM : Object XML Mapping
Permet la conversion du Java vers XML (marshalling) et réciproquement (unmarshalling)
Une fois le mapping JibX développé et testé, il n’y aura plus d’erreur d’écriture et de lecture du XML.
Très bonne performance au niveau de la rapidité de conversion et de la faible consommation de mémoire.
Briques technologiques
Spire, Sciences Po Institutional REpository
Formats de métadonnées bibliographiques MarcXML
Mods
Qualified Dublin Core
RSS
TEF
UNIMARC
AOFR
Atom
ContextObject (OpenURL)
Crossref
Dublin Core
EndNote
Marc21
Briques technologiques
Spire, Sciences Po Institutional REpository
Formats de personnes morales ou physiques ResearcherML
Vcard
FOAF
MADS
Formats de classifications VDEX
Formats d’objets complexes METS
DIDL
ORE-OAI
SCORM
Formats de Préservation Premis
Formats de statistique Sushi
SWUP
Formats de Droit d’Auteur METS Rights
Briques technologiques
Spire, Sciences Po Institutional REpository
Moissonnage OAI-PMH
Divers Romeo
HAL WebServices
LDAP
Recherche Z39.50 (is dead)
SRU / SRW
Dépôt SWORD
SRU Record update
Protocoles
Modèle de données
Spire, Sciences Po Institutional REpository
Structuration des Nodes de JackRabbit Item
Correspondant à la structure des objets complexes (METS, DIDL, OAI-ORE)
Permet de stocker n’importe quel type de métadonnée (Mods, ResearcherML, Vdex, LOM, DDI….)
Permet de stocker n’importe quel type de fichier
Repository
Contient la description du Dépôt.
Classification
Mini moteur d’ontologies
Import des données
Spire, Sciences Po Institutional REpository
De Z39.50 à SRU Le protocole Z39.50 va petit à petit être remplacé par le protocole SRU.
SRU est un protocole moderne basé sur des technologies Web (HTTP, WebServices, XML)
Connexion aux catalogues de bibliothèques
Soit directement si le SIGB implémente ce protocole
Soit par le Yaz Proxy (Z39.50 vers SRU)
Connexion aux bases de données commerciales (ex JSTOR)
Récupérer les données d’autres instances de Spire, communication entre les archives.
Import des données
Spire, Sciences Po Institutional REpository
Import HAL Utilisation de 3 WebServices
Synchronisation des référentiels
Laboratoires, affiliations, collections…
Revues
Projets ANR
…
Récupération des publications déjà déposées dans HAL
Import des données
Spire, Sciences Po Institutional REpository
Moissonnage OAI-PMH Récupérer des publications par :
collection
identifiant
intégralité
Répliquer de façon synchrone d’autres Archives Ouvertes
Permettra la récupération les données de Spire v1 sous DSpace
Import des données
Spire, Sciences Po Institutional REpository
Enrichissement OpenURL Les résolveurs de liens peuvent permettre de compléter les métadonnées (ISSN, volume…)
Crossref permet de faire une requête OpenURL et à l’aide d’un petit paramètre de récupérer le DOI de la publication
Récupérer le texte intégral déjà en ligne
Import des données
Spire, Sciences Po Institutional REpository
Import CKB : Copyright Knowledge Base Implémentation du protocole REST de RoMEO (RoMEO API)
récupérer pour chaque éditeur sa politique de droit d’auteur dans le contexte des Archives Ouvertes
Uniquement RoMEO dans un premier temps. Le système allemand, espagnol et français par la suite…
Import des données
Spire, Sciences Po Institutional REpository
Import LDAP Le LDAP n’est pas uniquement un système d’authentification
Il permet aussi l’identification, ie la récupération d’information sur une personne physique ou morale.
Dans nos annuaires LDAP il y a nos chercheurs et leur affiliation.
Le LDAP est une sorte de liste d’autorités synchronisées avec le système d’information de l’université (DRH, Scolarité, Recherche…)
De Nereus à NEEO
Spire, Sciences Po Institutional REpository
Nereus Consortium européen pour les archives ouvertes en sciences économiques
Créé en 2003
Projet pilote de portail pour les économistes avec le principe du moissonnage des partenaires
NEEO Projet européen financé par la CE dans le cadre du projet eContentPlus de septembre 2007 à février 2010
16 partenaires (Oxford, LSE, Tilburg, ULB, KU Leuven, Kiel, Dauphine, Toulouse 1…)
De Nereus à NEEO
Spire, Sciences Po Institutional REpository
Work Package 5 : Metadata et Protocol Sélection de normes pour :
les métadonnées bibliographiques : Mods
les objets complexes : DIDL (en attendant OAI-ORE)
DAI : Digital Author Identifier (sans spécification précise)
Statistique d’usage : Profile SWUP du ContextObject (OpenURL)
NEEO Admin File : description du repository, des ses institutions et de ses auteurs (avec DAI)
Normes récupérées par Driver pour l’uniformisation des Archives Ouvertes européennes
De Nereus à NEEO
Spire, Sciences Po Institutional REpository
Work Package 5 : Metadata et Protocol Documentation technique :
http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Technical%20guidelines.pdf
http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Usage%20metadata%20guidelines.pdf
Envoi des publications dans HAL
Spire, Sciences Po Institutional REpository
Stratégie nationale importante Besoin d’une archive ouverte de référence pour les agences de financement de la recherche afin de contrôler la présence des publications en accès libre pour les projets financés.
Regroupement des publications pour l’évaluation d’un projet ANR
Bientôt les projets européens?
Nos chercheurs et nos centres de recherches sont souvent affiliés au CNRS
Visibilité international: très bon classement dans le Web Ranking des Archives Institutionnelles
Liens avec les données brutes : Dataset
Spire, Sciences Po Institutional REpository
Les données quali et quanti doivent être diffusées Deux formats utilisés dans les SHS:
DDI (quali : comme les enquêtes et quanti : tableau de données)
SDMX (quanti, données macros)
NEEO a sélectionnée le Dataverse Network d’Harvard
Sciences Po souhaite utiliser son serveur Nesstar pour décrire ses données, puis envoyer les notices vers Dataverse en DDI
Faire un lien des publications vers les données
Objectif de 10 datasets de 10 chercheurs différents liés à 10 publications différentes sur l’archive ouverte.
Demo d’un logiciel en cours de développement…
Spire, Sciences Po Institutional REpository
Liens pour démo. Attention aux bugs! http://spirepprd.sciences-po.fr/backoffice/
http://spirepprd.sciences-po.fr/web/
http://spirepprd.sciences-po.fr/dissemination/oaipmh2-publications.xml?verb=ListRecords&metadataPrefix=didl&set=NEREUS:NEEO
http://spirepprd.sciences-po.fr/dissemination/adminfile.rdf.xml
Planning
Spire, Sciences Po Institutional REpository
Si tout va bien… Livraison du lot 1 (fin mai 2009)
Lot 2: ajout de la bibliométrie (fin juin 2009)
Lot 3: numérisation des dossiers de presse (novembre 2009)
Lot 4: numérisation d’ouvrages
Lot 5: sitothèque
Lot 6: thèses en ligne
Lot 7: hébergement de produits documentaires
Lot 8: plateforme de gestion de référence bibliographique pour la communauté de Sciences Po (Etudiants, Chercheurs, …)
Recommended