Les Archives Ouvertes Gabriel Gallezot Urfist paca-c

Preview:

Citation preview

Les Archives Ouvertes

Gabriel Gallezot

Urfist paca-c

Plan

• Contexte Scientifique• Points d'achoppements• Définition• Aspects Juridiques • Quelques chiffres, Exemples et Outils

de Recherche• Retour sur la diffusion de la production

scientifique• Démonstration :HAL

Contexte Scientifique

Base Bibliographiques

Banques de données

Revues, ouvrages

Colloques

Site web, page perso, blog

Liste de discussion

Editeurs, agrégateurs

Archives Ouvertes

Bibliothèques

Types de documents

Formats de documents

Accès aux documents

Usage de l’information

Rechercher: IR/épistémè

Evaluation pour la publication…Evaluation qualitative : a priori, le peer reviewing, …

•Auto-évaluation

•Collègues de labo (évaluation)

•Direction de N° (guest editor) ou d’ouvrage (sélection/évaluation)

•Comité de rédaction (sélection)

•Comité scientifique (évaluation)

•Editeur (évaluation/correction)

•Lecteur (évaluation)

… Publication pour l’évaluationEvaluation quantitative : a posteriori, la bibliométrie

• Garfield et le Science Citation Index (SCI) de l’Institute for Scientific Information (ISI)

• STM/SHS : JCR et JCR-SS.• OST (bases de l’INIST et WoS)• Classement de Shanghai (WoS)• Instances institutionnelles (CNU, Université,

ministère, …)Et … d’autres formes d’évaluation (enquête

SHS/CNRS, faculty of 1000, Citeseer, Citebase, schoolar… IRRA (RAE)

Communication scientifique modèle 70’

Source : Julie M. HurdJASIST 51(14), 2000

Points d'achoppements

… Qu’est-ce que ne va pas ? Une anomalie Post-Gutenbergienne … la « parabole » d’Harnad :

détecter les acteurs, les supports et le mode de communication/accès

1. Un jeune chercheur ayant tout juste obtenu son doctorat annonce fièrement à sa mère qu´il vient de publier son premier article. Elle lui demande combien il a été payé. Il grimace, répond : « Rien » et se lance alors dans une explication longue et compliquée...

2.Un chercheur de la même université repère cet article. Il se rend à la bibliothèque pour l´obtenir. On lui répond : « Nous ne sommes pas abonnés à cette revue, trop chère pour nous (notre budget d´abonnements, de droits, de prêt et de reproduction est déjà largement dépensé). »

3. Un étudiant, dans la même université, voit le même article cité sur le Web. Il clique sur la citation. Le site de l´éditeur demande un mot de passe : « Accès refusé : seules les institutions autorisées et ayant souscrit un abonnement ont accès à la revue. »

4. L´étudiant perd patience, s´ennuie et clique sur Napster pour mettre la main sur la version MP3 de son CD favori et se consoler ainsi de ses malheurs.

suite

5. Des années plus tard, la titularisation [recrutement universitaire] du docteur du point 1 est envisagée. Ses publications sont bonnes, mais pas assez citées ; leur « impact sur la recherche » n´est pas suffisant. Titularisation refusée.

6. Le même scénario se répète lorsqu´il essaie d´obtenir des crédits de recherche [institutions , organismes de financement]. Ses résultats scientifiques n´ont pas eu un impact suffisant. Trop peu de chercheurs les ont lus, s´en sont inspirés et les ont cités. Financement refusé.

7. Il essaie alors d´écrire un livre. Les éditeurs refusent de le publier : « On n´en vendrait pas assez d´exemplaires car il y a trop peu d´universités ayant suffisamment d´argent pour en payer le prix (leurs budgets d´achat sont limités par le coût annuel, sans cesse croissant, de leurs abonnements, droits et prêts). 

8. Il essaie de mettre ses articles sur le Web, en accès libre, afin d´augmenter leur impact [visibilité]. Son éditeur menace de le poursuivre, ainsi que son fournisseur d´accès, pour violation du copyright.

9. Il demande à son éditeur : « Qui le copyright est-il censé protéger ? » Son éditeur lui répond : « Vous ! »

Qu´est-ce qui ne va pas dans cette histoire ? Crise de l'édition scientfique Origine de l’Open Access

Pourquoi des AO ? - 1(crise de l’édition scientifique)

• Diktat du "publish or perish"• Loi du facteur d'impact (et ses biais)• Abandon du droit d'auteur à l'éditeur• Concentration des éditeurs spécialisés• Augmentation des prix des abonnements

(conséquences indirectes pour les chercheurs)

• Temps entre les résultats et leur publication• Restrictions sur ce qui peut ête publié et

comment cela peut être diffusé (modèle papier)

Coût de la documentation

http://www.arl.org/stats/annualsurveys/arlstats/arlstats06.shtml

Pourquoi des AO ? - 2(mouvement de l’Open Access)

• Accessibilité : libre accès aux textes scientifiques (archives ou revues)

• Partager les textes entre pairs

• Augmenter la visibilité des textes

• Retour au public d’un financement public

• Support de la mémoire scientifique

• Proposer des nveaux modes de circulation et de percolation des savoirs (modèles socio-cognitifs) … effet sur la recherche et la création de connaissances ?

Définition

AO késako ?

• Une archive : un réservoir ou entrepôt d'informations, de documents.

• Ouverte : accès libre et gratuit attendu. Mais « Open » concerne en particulier l'architecture technique.

• Respect du protocole OAI-PMH

• Un exemple ? > http://archivesic.ccsd.cnrs.fr/

Définition stricte et…

Un réservoir d'articles (prépublication ou postpublication) auto-archivés, en accès libre, sans barrière économique et juridique, intégrant le protocole d'interopérabilité OAI-PMH.

… observations

• L’article et plus généralement le texte n’est pas le seul type de document possible (dia suivante)

• L’auto-archivage peut s’entendre au niveau d’une institution

• Archive payante et gratuite (ex :Repec)

Les documents concernés

• Articles scientifiques• Documents numérisés• Thèses et HDR• Rapports et études• Cours• Données primaires et adjuvants à la recherche• Ouvrage• Notice bibliographique• Documents « multimédia » (audio, vidéo, …)

Typologie des Archives Ouvertes

• Archives Institutionnelles, les projets relevant d’universités, de grandes écoles, d’organismes de recherche, d’associations professionnelles.

• Les archives disciplinaires concernent les réalisations de communautés scientifiques regroupées ou non en domaines de recherche assez larges.

• Archive thématique est l’expression consacrée aux dépôts qui se focalisent sur un sujet ou un type de document singulier.

• Le moissonneur s’apparentera à une méta-archive, une collation de notices au protocole OAI-PMH qui renvoie, pour la consultation du texte intégral, à l’archive d’origine.

Un peu de vocabulaire (jargon ?)

• Preprint (prépublication) : la première version d’un texte que le chercheur soumet à un comité de lecture ou à ses pairs.

• Postprint (postpublication) : le texte évalué par le comité de lecture et prêt pour la publication

• Auto-archivage : dépôt d’un document électronique, que vous avez rédigé, dans un « réservoir » public

4 points historiques• 1991 : Création des Archives arXiv.org par P. Ginsparg

(pré-publications)

• 1999 : Le Santa Fe Meeting , OAi (Open Archive initiative). Début du protocole d’interopérabilité OAI-PMH

• 2001 : Création et lancement du logiciel EPrints.org à l'Université de Southampton (UK).

• 2002 : La Budapest Open Access Initiative (BOAI). La BOAI est à la fois une déclaration de principe, de stratégie et de soutien financier.

La suite de l’histoire sur : Open Access New http://www.earlham.edu/~peters/fos/fosblog.htmll’Inist : http://www.inist.fr/openaccess/Hèlene bosc : http://www.tours.inra.fr/prc/internet/documentation/communication_scientifique/comsci.htm (arrêt en 2006)Wiki-AO : http://urfist-apps.unice.fr/wiki_AO/index.php/Accueil

En france : un accord national • Automne 2005 : mise au point d’un protocole d’accord

national EPST / CPU pour “une approche coordonnée, au niveau national, pour l'archivage ouvert de la production scientifique »

• Signature effective juillet 2006• « permettre à la fois aux chercheurs de communiquer directement leurs

travaux à l’ensemble de la communauté internationale vers des archives ouvertes, aux institutions de recherche (universités, EPST et grandes écoles) de rassembler, d'afficher, de valoriser, de promouvoir et de pérenniser leur production scientifique et, de façon générale, à la recherche française d'améliorer sa visibilité au sein de la communauté scientifique internationale »

• Plate-forme de référence: HAL (CCSD)• Articulation central / local ; Archives Institutionnelles

virtuelles• Enjeux: "If it succeeds, it will be an enormous coup for

France, and a terrific direction-setter for the rest of the world..." (Stevan Harnad)

Aspects Juridiques

“Shakespeare” et les droits de diffusion

• Liste ROMEO/SHERPA (UK) sur la politique éditoriale (copyright) de plus de 170 éditeurs http://www.sherpa.ac.uk/romeo.php

• Elle recense les possibilités de mise sur le web (donc d’auto-archiver) des articles scientifiques par éditeurs. – Les revues blanches : celles dont les éditeurs n'ont pas de politique

formelle autorisant l'auto-archivage – les revues jaunes : autorisent l'auto-archivage des pré-publications

(avant les révisions par le comité de lecture) – les revues bleues : autorisent l'auto-archivage des post-publications

(version finale après révision) – les revues vertes : autorisent l'auto-archivage des pré- ET des

postpublications

• Liste JULIET/SHERPA (UK) politiques des “financeurs » : http://www.sherpa.ac.uk/juliet/index.php

Les Creative Commons

• Les licences Creative Commons permettent d’autoriser à l’avance le public à effectuer certaines utilisations de documents selon

les conditions exprimées par l’auteur , http://creativecommons.org/license/

• Des travaux en cours sur le Science Commons

http://sciencecommons.org/

• En France c’est le Centre d'Etudes et de Recherches de Science Administrative (CERSA, Université P2 et CNRS) qui est l'institution affiliée pour la traduction et l'adaptation des contrats Creative Commons,

http://fr.creativecommons.org/

Quelques chiffres,Exempleset Outils de Recherche

Recensement des archives ouvertes (Nov 2008)

Dans le monde: • ROAR : Registry of Open Access Repositories : 1201

archives (http://roar.eprints.org/ )• OAIster : 1034 (http://www.oaister.org/ )• OpenDOAR : 1271 (http://www.opendoar.org/ )(“OAIsation” de BdD)

En France • Selon OpenDOAR : 40 et selon ROAR 44Eléments quantitatifs (ROAR) : de 19 en décembre 2004 , 39 en Oct 2007, 42 en mars 2008, …

Des exemples :• ArXiv X, P. GINSPARG: http://xxx.lanl.gov, http://fr.arXiv.org

• Cogprints, E. HARNAD: http://cogprints.org

• ResearchIndex, Steve Lawrence et C. Lee Giles de NEC Research Institute , http://citeseer.ist.psu.edu/

• EconPapers (Economics working papers) http://econpapers.repec.org , un service de RePEc http://repec.org/

• Pastel : les thèses des élèves des grandes écoles d'ingénieurs de Paris. http://pastel.paristech.org/

• Open video Project : http://www.open-video.org/

• @rchiveSIC http://archivesic.ccsd.cnrs.fr/ et

• HAL : http://hal.ccsd.cnrs.fr/ et http://halshs.ccsd.cnrs.fr/

Des outils de recherche dédiés

• OAISTER http://www.oaister.org/

• OpenDOAR : http://www.opendoar.org

• Scientificcommons http://www.scientificcommons.org/

• Et puis aussi • Google scholar : http://scholar.google.com• Scirus : http://www.scirus.com

Retour sur la diffusion de la production scientifique

Production scientifique et Compartimentation des savoirs

D’après Swanson (1986)

• Spécialisation de la R• Évaluation de la R=> accroissement de la Pub. Sc. (données, textes, revues, etc)

Il faut :

Mieux connecter

Mieux partager

Ouvrir le spectre documentaire

KDD

Retour sur la communication scientifique

•Enregistrement public des connaissances

•Société savante

•Coût de revient min

•Echanges personnels, communautaires, publiques

•Diffusion mondiale multilatérale publique

•Effet des non déposants ?•Possibilité d'évaluation des institutions cf IRRA de RAE•Priorité à l'article => intérêt Sc. du contenu

•Dépot de pré-print et post-print•Dépot des adjuvants de la recherche•Recherche sur des champs et full text•Mémoire scientifique publique

16601665

19701989

En ref à 1963

•arXiv•OAI-PMH•Eprint.org•BOAI•Protocole•…

… les transforme ou en propose d'autres

Reprend les éléments de communication ...

(Re)penser la diffusion des connaissances

Pour une appropriation profonde du « numérique »Cf. une appropriation de l’imprimerie, impression à compte

d’auteur, 1er revue, …

(re)penserle cycle de l’info la communication scientifiquel’évaluation de la recherche

eScience un exemple : La recherche « in silico »

• Dialectique entre la technique , la production de savoir et sa diffusion

• Appropriation des technologies, pratiques informationnelles nouvelles ou renouvelées (diffusion et accès)

• Gain de productivité ? (bouclage rapide du cycle)

• Gain de créativité ? (tertiarisation documentaire)

Communication scientifique modèle 2020

Source : Julie M. HurdJASIST 51(14), 2000

Le scholar webImpact factor vs. “web” factor

• Référencement établi vs. visibilité• usage/accès aux BdD commerciales vs. usage/accès

généralisé/libre• Evaluation maîtrisée par une méthode et une entreprise

vs. une multitude d’évaluations, méthodes, projets, ...

• Publier autrement

Déjà à l’œuvre : CiteBase, Citeseer Scholar google, F1000…

De l’Open Peer Review au Peer commentary : de la levée de l’anonymat des pairs aux commentaires de la communautés (avant, après, à la place)

Science 2.0

D’autres Métriques• Citebase, 1999, rapport téléchargements/citations • Citeseer, Associations des refs, commentaires et

votes

• F1000, 2002, « groupes qualités »• IRRA (2005, Institutional Repositories and

Research Assessment), RAE Software for Institutional Repositories

• Google scholar 2004• Facteur H (Hirsch, 2005) : point de rencontre en

le nbr de publi et le nbr de fois où elles sont citées Facteur Y (Bollen, 2006), Journal status, Weighted pagerank, author rank : mesures de « réseaux » , de poids, de centralité

• …

Ce qui se met en place dans nos institutions (Univ et EPST)

• Système d’Information (SI) local (global ?) imposé par la LOLF (indicateurs d’activités)

• Ex. sur Unice : CRI/DRED système SIRIUS (ou GRAAL dans d’autre univ)

• Ex. sur l’INRA : ProdInra• Connexions des entrepôts d’informations nationaux

et locaux (AO institutionelles notamment)

Pour l’univ : ses propres indicateurs Toutes les refs peuvent êtres prises en

considération Interopérabilité des SI : constitution de BdD

disciplinaires en France, Connectivité avec d’autres BdD (HAL, …)

Un nouveau modèle de la publication Scientifique entraînera de nouveaux modes d’évaluation de la recherche ( y compris selon le principe de citation), actuellement pas beaucoup d’anticipation (d’autre lieux de publication, d’autre lieux de citations, etc...)

ISI, OST,

BdD fr, commercial

es

par citation

bases biblio

Publication

Ref biblio

archives ouvertes

institunionnelles et

disciplinaires, revues en lignes

Digital Library…

Web 2.0blog, social

bookmarking,

Social Search,

…?

par Hitpar note,

avis

Et par …. Xmetrie

ISI, OST, SI local, CCSD,

schoolar google, …

CCSD, moissonneursPlateforme revues

InextensocitebaseF1000 …

Plateforme blogsScientifiquesTrackback

En guise de conclusion

Quelques enjeux des AO

• Politique de la recherche : diffusion des connaissances, bien public, accès public, évaluation de la recherche, visibilité institutionnelle, etc.

• Qualité (curation, interopérabilité, granularité, …)

• Juridique (négociations avec éditeurs, Science commons, …)

• Insertion “locale” : ENT dans les Universités, ou autres systèmes locaux

… Vers des « archithèques » : gérer le patrimoine informationnel numérique de la communauté qu'elle sert et qui lui fournit ses moyens.

http://blogues.ebsi.umontreal.ca/jms/index.php/2006/09/04/70-reves-d-architheque

Aux chercheurs

Quand vous publiez…• Publiez où vous souhaitez (revues)

• Auto-archivez dans les archives ouvertes

• Observez attentivement les droits que vous cédez aux éditeurs

• Augmentez la visibilité de vos travaux

• Partagez vos connaissances (processualité de l’écriture ?)

• Et soutenez le mouvement...

De la nécessité d’être « Open Access » ?

– Augmentation du prix des revues et « Big Deal »

– Online or Invisible ? : (Steve Lawrence, Nature, N° 6837, p.521, 2001) http://citeseer.ist.psu.edu/online-nature01/Articles mis en ligne librement : entre 2,5 à 5,5 fois plus cités que les autres

– Liens éphémères

– Appréhender l’effet sur la création de connaissances (cycle de L’IST).

… et • Pourtant l’auto-archivage plafonne à 15-20 % de la

production (Stevan Harnad)• Une grande majorité de chercheurs approuvent l’OA

et sont prêts à accepter un mandat impératif (études britanniques et allemandes)

• La plupart des grands éditeurs scientifiques permettent l’autoarchivage

• Mouvement mondial : The European Commission, the European Research Advisory Board (EURAB) and the European Research Councils have each recently recommended adopting the policy of providing Open Access to research results. (Very similar recommendations are also being made by governmental research organisations in the United States, Canada, Australia, and Asia.)

• DRIVER Project : http://www.driver-repository.eu/ • DRIVER is a multi-phase effort whose vision and primary objective is to

establish a cohesive, pan-European infrastructure of Digital Repositories, offering sophisticated functionality ervices to both researchers and the general public.

Vos questions

Les liens du support : http://delicious.com/Gallezot_Urfist/AO-cours

Démonstration :HAL

- s’inscrire- déposer- son environnement (espace de dépôt, stat, …- chercher et s’abonner- exporter des référenceset en fonction du déroulement du stage :- créer sa page web perso- tamponner

Recommended