32
Signalement, accès, et mise à disposition des données numériques de la recherche en SHS rechercheisidore.fr Stéphane POUYLLAU, Ingénieur de recherche au CNRS Directeur de Corpus-IR (UMS 3534) Responsable du projet ISIDORE - TGE Adonis Twitter @spouyllau – Email [email protected]

Corpus numériques et SHS : infrastructures, outils, ISIDORE

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Signalement, accès, et mise à disposition des données numériques de la recherche en SHS

rechercheisidore.fr

Stéphane POUYLLAU, Ingénieur de recherche au CNRSDirecteur de Corpus-IR (UMS 3534)

Responsable du projet ISIDORE - TGE AdonisTwitter @spouyllau – Email [email protected]

Page 2: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Adonis

- Adonis est un très grand équipement pour les sciences humaines et sociales

- Acteur de la feuille de route ESFRI (DARIAH)

- Missions 2012-2015 :

- Accès aux données et documents numérique des SHS (ISIDORE)

- Grille de services : hébergement web ; stokage de données ; Archivage à long terme (OAIS / CINES-SIAF)

- Site : www.tge-adonis.fr

- Contact : [email protected]

Page 3: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Corpus-IR

- Corpus-IR (très grande Infrastructure de Recherche) est un réseau d'équipes produisant des corpus numériques de sources :

- Équipes (UMR, EA, etc.)

- consortiums « disciplinaires » (mais pas que)

- 12 consortiums à 15 consortiums

- Financement de la production de corpus (numérisation ; documentation ; diffusion des données)

- Points clés : qualité des métadonnées ; diffusion obligatoire des métadonnées ; diffusion selon des formats ouverts et normalisés (ISIDORE ; Gallica ; Europeana)

Page 4: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Corpus-IR

- Acteur de la feuille de route ESFRI (CLARIN)

- UMS 3534 (Aix Marseille Université et CNRS)

● Paris / Marseille

- Contact : www.corpus-ir.fr

Page 5: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Des corpus... Isidore de Séville ? Mais de quoi parle-t-il ?

Page 6: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Photos : SP. 2006.

Page 7: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Photos : SP. 1999-2009.

Page 8: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Photos : SP. 2006.

Page 9: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 10: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 11: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 12: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 13: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 14: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 15: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Production de données « sources »

- Sources ? Données et matériaux numériques – souvent non édités/éditables (coûts, place, droits)

- Monde numérique (capteurs ; photos ; enregistrements ; GPS ; enquêtes en ligne ; numérisation de sauvegarde...)

- Utilisation et ré-utilisation ? Reconnaissance du travail de collecte et de création de « corpus »

- Valorisation des fonds documentaires

Page 16: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 17: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

ISIDORE et les fonds d'archives

Mettre en place l'environnement pour relier données de la recherche et publications

- Faciliter l'administration de la preuve scientifique

ISIDORE est un outil pour les communautés scientifiques

ISIDORE est un outil de signalement et d'accès

- Exposition générique des données

- Importance de la qualité des métadonnées

ISIDORE est un moteur de recherche ; un site web ; un point d'accès à des métadonnnées enrichies et reliées aux publications scientifiques

Page 18: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 19: Corpus numériques et SHS : infrastructures, outils, ISIDORE
Page 20: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

ISIDORE est un site web... avec « une »

+ de 1000 sources de données moissonnées

+ de 1.300.000 ressources indexés

Page 21: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Quelques chiffres

Début du projet : mai 2009

Ouverture : déc. 2010

Version 1 : mars 2011

Version 1.2 : déc. 2011

Version 2 : sept. 2012

+ 1.700.000 de ressources numériques : archives et corpus, actualités scientifiques publications, etc.

+ 1600 sources de données

+ 60000 visiteurs uniques / mois

Page 22: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Participer à ISIDORE ?

Page 23: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Données

Données Données

Données

RéférentielsRéférentiels

Référentiels

Fonctionnement général (1)

Page 24: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Données

Collecte(crawl)

Traitements Accès(API et facettes)

Gestion, Monitoring, Statistiques

Utilisateurs

RéférentielsNormalisés (RDF/SKOS)

SPARQL endpoint pour les producteurs de données

Fonctionnement général (2) rech

erc

heis

idore

.fr

Extension de recherche sur les catalogues de bibliothèques (SRU/SRW - Z3950)

Données

Données

Données

OAI-PMH

RDFa

RSS

Enrichissement des des métadonnées

et données(format pivot RDF)

Référentiels Référentiels

Page 25: Corpus numériques et SHS : infrastructures, outils, ISIDORE

ISIDORE

Pactols

Rameau Geonames(lieux)

Thésaurus W (SIAF)

Lexvo(langues)

RéférentielsHALSHS

(personnes,disciplines)

OpenEditionCalenda.org(catégories)

Page 26: Corpus numériques et SHS : infrastructures, outils, ISIDORE

Isidore dans le nuage du web sémantique

Page 27: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Principes du projet

- Implication des opérateurs SHS produisant des données (non-éditées, sources éditées, publications)

- Utilisation de standards internationaux

- Formats ouverts (indépendance vis à vis de fournisseurs de données)

- Mise en valeur des données, métadonnées, référentiels structurés produits par les équipes.

- Développement et mode de fonctionnement itératif

Page 28: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Aspects documentaires

- ISIDORE collecte des métadonnées et indexe le texte intégral ou les données « embarquées » (IPTC ; XMP ; MS Word ; MS Excel ; ODT ; MPEG 7)

- métadonnées (OAI-PMH + Dces / DC Terms)

- actulités (RSS ; Atom)

- données (RDFa = RDF dans une page web)

Page 29: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Aspects éditoriaux (1)

- ISIDORE collecte tous les types de données (publications ; corpus ; actualités scientifiques)

- L'important dans ISIDORE : l'information

- la question du « bibliographique »

- Annuaire des sources : http://www.rechercheisidore.fr/annuaire

- Ils participent : Open Edition ; Erudit ; Cairn ; Persee ; CCSD (HAL-SHS, MédiHAL) ; plate-forme de MSH ; UQAM ; UOH ; Cerimes ; Gallica/BNF ; ABES...

Page 30: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Aspects éditoriaux (2)

-ISIDORE affecte aux métadonnées moissonnées des identifiants pérennes (handle) ce qui permet de citer les « notices » d'ISIDORE et donc les ressources

- Si le producteur à déjà donné un id. pérenne (DOI, ark, handle, OAI)

=> ISIDORE peut ré-exposer celui du producteur

- Dans tous les cas, les handle ISIDORE sont à votre disposition (producteurs, utilisateurs)

=> C'est un service gratuit

Page 31: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

Alors ? Et vous ?

Page 32: Corpus numériques et SHS : infrastructures, outils, ISIDORE

   

En tous cas, nous vous attendons dans ISIDORE...

… et merci pour votre attention !