of 33 /33
Janvier 2006 1 Les archives ouvertes L’Archive HAL [email protected]

Janvier 2006 1 Les archives ouvertes LArchive HAL [email protected]

Embed Size (px)

Text of Janvier 2006 1 Les archives ouvertes LArchive HAL [email protected]

  • Page 1
  • Janvier 2006 1 Les archives ouvertes LArchive HAL [email protected]
  • Page 2
  • Janvier 2006 2 De quoi parle-t-on ? Mettre disposition librement toute la littrature scientifique En texte intgral (Notices bibliographiques ) Type de littrature Publications dans des revues avec ou sans comit de lecture Actes de congr s, s minaires, Livres, chapitres de livre, ouvrages, Brevets Th ses, m moires Etc. Avec les documents multi m dias associ s le cas ch ant
  • Page 3
  • Janvier 2006 3 Phrases cls, mots cls Libre accs aux rsultats de la recherche Gratuit Accessibilit Publications lectroniques E-print (preprint + postprint) Communication scientifique directe (CSD) Un circuit court entre les chercheurs pour faire connatre leur rsultats (et prendre date pour leur recherche) Auto archivage Les chercheurs dposent eux-mmes leurs articles sur des bases ouvertes Interoprabilit On met en uvre des moyens pour tenter linterconnexion des bases darticles scientifiques
  • Page 4
  • Janvier 2006 4 Dfinition de larchive ouverte Libre accs pour le dpt Identification lgre du contributeur Niveau scientifique requis, mais pas dvaluation Document sous forme numrique dans un format accessible Libre accs pour la consultation Depuis Internet, sans aucune restriction Pr-publications Ensemble des versions de larticle dont la dernire est habituellement celle accepte par la revue ventuellement article non soumis pour publication Post-publication Pr-publication laquelle on a ajout les rfrences de publication Publication dans la forme ultime soumise et accepte par la revue
  • Page 5
  • Janvier 2006 5 Les souhaits du chercheur Communiquer rapidement son travail scientifique, prendre date pour ses travaux Avoir accs immdiatement toute lactualit scientifique depuis un seul portail Bnficier dalertes automatiques dans les domaines scientifiques de son choix Pouvoir se constituer des collections scientifiques personnalises Conserver les journaux traditionnels et lvaluation par les pairs Au passage, se simplifier les tches administratives: listes de publications, rapports dactivit, candidatures des postes, etc.. Un seul dpt Des rsultats plus visibles sont des rsultats plus cits
  • Page 6
  • Janvier 2006 6 Les laboratoires, les tablissements, souhaitent Suivre ce qui se fait sur le plan scientifique dans leurs tablissements et exposer leurs production scientifique. Communiquer commodment aux collgues trangers les mmoires de thse Eviter des secrtariats surchargs de multiples saisies Obtenir automatiquement des listes de publications pour les contrats quadriennaux, les rapports un ou deux ans, etc.. Un laboratoire a souvent beaucoup dtablissements de rattachement (Universit, EPST, grande cole, etc.)
  • Page 7
  • Janvier 2006 7 Les archives ouvertes pour linstitution La russite de larchive passe par un compromis satisfaisant la fois les chercheurs mais aussi les institutions Une archive ne devrait pas tre spcifiquement institutionnelle, mais... Lincitation au dpt doit tre institutionnelle Les mta donnes recueillies sont suffisantes pour... Disposer dune vue institutionnelle Mesurer la production Aider lvaluation des chercheurs Etc. Larchive reste ouverte A tous les chercheurs quelque soit leur pays ou leur institution Larchive reste un instrument scientifique
  • Page 8
  • Janvier 2006 8 Types darchive Si, lors dun dpt ou ultrieurement, on collecte Un classement thmatique de larticle dpos Des informations spcifiques Appartenance un congrs, une revue lectronique, etc. Une information exhaustive sur les auteurs Affiliations (tablissement, universit, cole, laboratoire, quipe,) Alors larchive ouverte pourra proposer des vues Thmatiques ou disciplinaires Des collections de journaux, dactes de congrs, Institutionnelles diffrents niveaux Travaux de lquipe xxx Publications de luniversit yyy ou de ltablissement zzz
  • Page 9
  • Janvier 2006 9 Recueillir des publications et leurs mta donnes Lacteur principal du systme est le chercheur Il dtient la version lectronique de sa publication Il est le seul pouvoir donner un certain nombre dinformations sur sa publication Rsum, mots cls, classification, Le chercheur Nest pas motiv pour remplir de fastidieux formulaires de mta donnes Le choix de mta donnes restera donc le plus concis possible et le maximum dinformations sera issu de listes dautorits Reste convaincre de lopportunit de dposer dans une archive ouverte Les professionnels de la documentation Doivent accompagner le chercheur dans cette dmarche Aider au dpt et au besoin intervenir sur les mta donnes Etre soutenus par linstitution, le laboratoire,
  • Page 10
  • Janvier 2006 10 Les devoirs de linstitution Si linstitution met en place une archive, elle doit veiller A ce que le dpt darticles, assorti des rfrences bibliographiques, ne soit demand quune seule fois au chercheur Tout document administratif ncessitant un liste de publication salimentera automatiquement dans cette archive La demande de dpt doit apparatre essentiellement comme un acte scientifique Le chercheur doit ressentir larchive comme un moyen daccs aux travaux de ses collgues Linstitution doit se proccuper De larchivage long terme des documents qui lui sont confis De la disponibilit de larchive et de sa scurit De lindpendance de loprateur vis--vis des dposants Horodatage, validation, qualit des dpts
  • Page 11
  • Janvier 2006 11 ArXiv, le modle depuis plus de 10 ans Initiative de Paul Ginsparg Los Alamos (xxx) 4 000 manuscrits dposs par mois 500 000 manuscrits dposs ce jour 300 000 consultations journalires Des sites miroirs dans le monde entier Australie, Brsil, Chine, Allemagne, Inde, Isral Italie, Japon, Russie, Afrique du Sud, France Core du Sud, Espagne, Taiwan, Angleterre,
  • Page 12
  • Janvier 2006 12 Les missions du CCSD Une initiative pour des archives scientifiques ouvertes Une approche internationale : Ne pas construire une archive nationale, mais sintgrer dans le mouvement open archives Une approche essentiellement chercheur Des archives alimentes directement par les chercheurs avec, comme vocation premire, la ralisation dun outil scientifique offrant laccs au document intgral Un outil administratif indirect grce la collecte au passage de mta donnes suffisantes Une mission darchivage long terme Un accord cadre est en cours de finalisation entre les EPST franaises (INRIA, INSERM, INRA, IRD, etc. et la CPU, la CGE
  • Page 13
  • Janvier 2006 13 Sur une plate-forme unique URLS HAL http://hal.ccsd.cnrs.fr http://tel.ccsd.cnrs.fr http://halshs.ccsd.cnrs.fr http://democrite.in2p3.fr http://archive-edutice.ccsd.cnrs.fr http://hal.inria.fr/ http://hal-inserm.ccsd.cnrs.fr/ http://artxiker.ccsd.cnrs.fr/ http://etol.ccsd.cnrs.fr http://cel.ccsd.cnrs.fr http://nicod.in2p3.fr/ http://asic.ccsd.cnrs.fr/ http://hal-ens-lyon.ccsd.cnrs.fr/ Etc.
  • Page 14
  • Janvier 2006 14 Larchive ouverte HAL Statistiques 2005
  • Page 15
  • Janvier 2006 15 Rpartition par domaines scientifiques des dpts avec texte intgral en 2005
  • Page 16
  • Janvier 2006 16 Nombre de dpts en texte intgral sur lensemble de larchive
  • Page 17
  • Janvier 2006 17 Nombre de dpts en texte intgral sur HAL-SHS
  • Page 18
  • Janvier 2006 18 Nombre de dpts en texte intgral sur [email protected] (IN2P3) Une partie des donnes provient de lancienne application Dmocrite
  • Page 19
  • Janvier 2006 19 Nombre de dpts en texte intgral sur le serveur de thses en lignes TEL.
  • Page 20
  • Janvier 2006 20 Nombre de dpts en texte intgral sur larchive Edutice
  • Page 21
  • Janvier 2006 21 Dpts en texte intgral sur HAL-INRIA
  • Page 22
  • Janvier 2006 22 Ensemble des dpts, texte intgral et notices sur lensemble de larchive
  • Page 23
  • Janvier 2006 23 Questions ? http://www.ccsd.cnrs.fr [email protected]
  • Page 24
  • Janvier 2006 24 Structure de HAL
  • Page 25
  • Janvier 2006 25 Les objectifs recherchs 1 Archive multidisciplinaire oriente texte intgral Une seule base de donnes pour lensemble des disciplines Dpt du texte intgral mais aussi de notices et de rtro dpts Oriente chercheurs Autoarchivage, mais possibilit denrichissement des mta donnes par des professionnels Centralise mais Multi interfaces Prservation de lidentit Mta donnes variables au-del de la DTD minimum Environnements de dpt et de consultation personnaliss Tampons Internationale Interconnecte avec les autres systmes de rfrences ArXiv en physique / mathmatiques / informatique / biologie / PubMed Central en mdecine et biologie (2006)
  • Page 26
  • Janvier 2006 26 Les objectifs recherchs 2 Mesurabilit de la production scientifique Des laboratoires, des institutions et plus globalement, de toutes les tutelles disposition des dposants mais aussi des institutions Gnration des listes de publications dans tous formats (XML, TeX, DOC/RTF, PDF, ) Transferts vers les bases administratives Alimentation de CRAC (fiche chercheur CNRS) Alimentation de Labintel publications Prennit Archivage long terme Stabilit des URLs
  • Page 27
  • Janvier 2006 27 Texte intgral Notice bibliographique Notice bibliographique PubMed Central (2006) PubMed Central (2006) ArXiv OAI HAL IN2P3 SHS/TICE AUTRES INRA INRIA Mta donnes obligatoiresMta donnes spcifiques haLhaL EXPORTS IMPORTS
  • Page 28
  • Janvier 2006 28 OAI HAL IN2P3 SHS/TICE AUTRES INRA INRIA ? ? ? ? Rponse haLhaL EXPORTS IMPORTS
  • Page 29
  • Janvier 2006 29 OAI Mta donnes HAL IN2P3 SHS/TICE AUTRES INRA INRIA ? Rponse IN2P3 haLhaL EXPORTS IMPORTS
  • Page 30
  • Janvier 2006 30 Texte intgral Notice bibliographique Notice bibliographique OAI HAL IN2P3 TICE AUTRES INRA INRIA TEL 2005 haLhaL EXPORTS IMPORTS PubMed Central (2006) PubMed Central (2006) ArXiv
  • Page 31
  • Janvier 2006 31 Dpt Simplification 4 tapes 1. Mta donnes 2. Auteurs, laboratoires, tutelles et association 3. [tlchargement du document] 4. Rcapitulation contrle, dpt Retour en arrire possible 2 auteursmtadonnesrcapitulationfichiers
  • Page 32
  • Janvier 2006 32 Dpt Choix des tapes Lordre des tapes peut tre paramtr au niveau dune interface particulire Par exemple, on peut dcider de commencer par le tlchargement du fichier, afin den extraire automatiquement La liste dauteurs Le rsum Les rfrences bibliographiques Etc. Ces possibles automatismes dpendent fortement du niveau de structuration du document source, (donc de la discipline ?) Extraction automatique Extraction automatique auteursfichiers rcapitulationmta donnes
  • Page 33
  • Janvier 2006 33 Questions ? http://ccsd.cnrs.fr [email protected]