Janvier 2006 2 De quoi parle-t-on ? Mettre disposition
librement toute la littrature scientifique En texte intgral
(Notices bibliographiques ) Type de littrature Publications dans
des revues avec ou sans comit de lecture Actes de congr s, s
minaires, Livres, chapitres de livre, ouvrages, Brevets Th ses, m
moires Etc. Avec les documents multi m dias associ s le cas ch
ant
Page 3
Janvier 2006 3 Phrases cls, mots cls Libre accs aux rsultats de
la recherche Gratuit Accessibilit Publications lectroniques E-print
(preprint + postprint) Communication scientifique directe (CSD) Un
circuit court entre les chercheurs pour faire connatre leur
rsultats (et prendre date pour leur recherche) Auto archivage Les
chercheurs dposent eux-mmes leurs articles sur des bases ouvertes
Interoprabilit On met en uvre des moyens pour tenter
linterconnexion des bases darticles scientifiques
Page 4
Janvier 2006 4 Dfinition de larchive ouverte Libre accs pour le
dpt Identification lgre du contributeur Niveau scientifique requis,
mais pas dvaluation Document sous forme numrique dans un format
accessible Libre accs pour la consultation Depuis Internet, sans
aucune restriction Pr-publications Ensemble des versions de
larticle dont la dernire est habituellement celle accepte par la
revue ventuellement article non soumis pour publication
Post-publication Pr-publication laquelle on a ajout les rfrences de
publication Publication dans la forme ultime soumise et accepte par
la revue
Page 5
Janvier 2006 5 Les souhaits du chercheur Communiquer rapidement
son travail scientifique, prendre date pour ses travaux Avoir accs
immdiatement toute lactualit scientifique depuis un seul portail
Bnficier dalertes automatiques dans les domaines scientifiques de
son choix Pouvoir se constituer des collections scientifiques
personnalises Conserver les journaux traditionnels et lvaluation
par les pairs Au passage, se simplifier les tches administratives:
listes de publications, rapports dactivit, candidatures des postes,
etc.. Un seul dpt Des rsultats plus visibles sont des rsultats plus
cits
Page 6
Janvier 2006 6 Les laboratoires, les tablissements, souhaitent
Suivre ce qui se fait sur le plan scientifique dans leurs
tablissements et exposer leurs production scientifique. Communiquer
commodment aux collgues trangers les mmoires de thse Eviter des
secrtariats surchargs de multiples saisies Obtenir automatiquement
des listes de publications pour les contrats quadriennaux, les
rapports un ou deux ans, etc.. Un laboratoire a souvent beaucoup
dtablissements de rattachement (Universit, EPST, grande cole,
etc.)
Page 7
Janvier 2006 7 Les archives ouvertes pour linstitution La
russite de larchive passe par un compromis satisfaisant la fois les
chercheurs mais aussi les institutions Une archive ne devrait pas
tre spcifiquement institutionnelle, mais... Lincitation au dpt doit
tre institutionnelle Les mta donnes recueillies sont suffisantes
pour... Disposer dune vue institutionnelle Mesurer la production
Aider lvaluation des chercheurs Etc. Larchive reste ouverte A tous
les chercheurs quelque soit leur pays ou leur institution Larchive
reste un instrument scientifique
Page 8
Janvier 2006 8 Types darchive Si, lors dun dpt ou
ultrieurement, on collecte Un classement thmatique de larticle dpos
Des informations spcifiques Appartenance un congrs, une revue
lectronique, etc. Une information exhaustive sur les auteurs
Affiliations (tablissement, universit, cole, laboratoire, quipe,)
Alors larchive ouverte pourra proposer des vues Thmatiques ou
disciplinaires Des collections de journaux, dactes de congrs,
Institutionnelles diffrents niveaux Travaux de lquipe xxx
Publications de luniversit yyy ou de ltablissement zzz
Page 9
Janvier 2006 9 Recueillir des publications et leurs mta donnes
Lacteur principal du systme est le chercheur Il dtient la version
lectronique de sa publication Il est le seul pouvoir donner un
certain nombre dinformations sur sa publication Rsum, mots cls,
classification, Le chercheur Nest pas motiv pour remplir de
fastidieux formulaires de mta donnes Le choix de mta donnes restera
donc le plus concis possible et le maximum dinformations sera issu
de listes dautorits Reste convaincre de lopportunit de dposer dans
une archive ouverte Les professionnels de la documentation Doivent
accompagner le chercheur dans cette dmarche Aider au dpt et au
besoin intervenir sur les mta donnes Etre soutenus par
linstitution, le laboratoire,
Page 10
Janvier 2006 10 Les devoirs de linstitution Si linstitution met
en place une archive, elle doit veiller A ce que le dpt darticles,
assorti des rfrences bibliographiques, ne soit demand quune seule
fois au chercheur Tout document administratif ncessitant un liste
de publication salimentera automatiquement dans cette archive La
demande de dpt doit apparatre essentiellement comme un acte
scientifique Le chercheur doit ressentir larchive comme un moyen
daccs aux travaux de ses collgues Linstitution doit se proccuper De
larchivage long terme des documents qui lui sont confis De la
disponibilit de larchive et de sa scurit De lindpendance de
loprateur vis--vis des dposants Horodatage, validation, qualit des
dpts
Page 11
Janvier 2006 11 ArXiv, le modle depuis plus de 10 ans
Initiative de Paul Ginsparg Los Alamos (xxx) 4 000 manuscrits dposs
par mois 500 000 manuscrits dposs ce jour 300 000 consultations
journalires Des sites miroirs dans le monde entier Australie,
Brsil, Chine, Allemagne, Inde, Isral Italie, Japon, Russie, Afrique
du Sud, France Core du Sud, Espagne, Taiwan, Angleterre,
Page 12
Janvier 2006 12 Les missions du CCSD Une initiative pour des
archives scientifiques ouvertes Une approche internationale : Ne
pas construire une archive nationale, mais sintgrer dans le
mouvement open archives Une approche essentiellement chercheur Des
archives alimentes directement par les chercheurs avec, comme
vocation premire, la ralisation dun outil scientifique offrant
laccs au document intgral Un outil administratif indirect grce la
collecte au passage de mta donnes suffisantes Une mission
darchivage long terme Un accord cadre est en cours de finalisation
entre les EPST franaises (INRIA, INSERM, INRA, IRD, etc. et la CPU,
la CGE
Page 13
Janvier 2006 13 Sur une plate-forme unique URLS HAL
http://hal.ccsd.cnrs.fr http://tel.ccsd.cnrs.fr
http://halshs.ccsd.cnrs.fr http://democrite.in2p3.fr
http://archive-edutice.ccsd.cnrs.fr http://hal.inria.fr/
http://hal-inserm.ccsd.cnrs.fr/ http://artxiker.ccsd.cnrs.fr/
http://etol.ccsd.cnrs.fr http://cel.ccsd.cnrs.fr
http://nicod.in2p3.fr/ http://asic.ccsd.cnrs.fr/
http://hal-ens-lyon.ccsd.cnrs.fr/ Etc.
Page 14
Janvier 2006 14 Larchive ouverte HAL Statistiques 2005
Page 15
Janvier 2006 15 Rpartition par domaines scientifiques des dpts
avec texte intgral en 2005
Page 16
Janvier 2006 16 Nombre de dpts en texte intgral sur lensemble
de larchive
Page 17
Janvier 2006 17 Nombre de dpts en texte intgral sur
HAL-SHS
Page 18
Janvier 2006 18 Nombre de dpts en texte intgral sur
[email protected] (IN2P3) Une partie des donnes provient de lancienne
application Dmocrite
Page 19
Janvier 2006 19 Nombre de dpts en texte intgral sur le serveur
de thses en lignes TEL.
Page 20
Janvier 2006 20 Nombre de dpts en texte intgral sur larchive
Edutice
Page 21
Janvier 2006 21 Dpts en texte intgral sur HAL-INRIA
Page 22
Janvier 2006 22 Ensemble des dpts, texte intgral et notices sur
lensemble de larchive
Page 23
Janvier 2006 23 Questions ? http://www.ccsd.cnrs.fr
[email protected]
Page 24
Janvier 2006 24 Structure de HAL
Page 25
Janvier 2006 25 Les objectifs recherchs 1 Archive
multidisciplinaire oriente texte intgral Une seule base de donnes
pour lensemble des disciplines Dpt du texte intgral mais aussi de
notices et de rtro dpts Oriente chercheurs Autoarchivage, mais
possibilit denrichissement des mta donnes par des professionnels
Centralise mais Multi interfaces Prservation de lidentit Mta donnes
variables au-del de la DTD minimum Environnements de dpt et de
consultation personnaliss Tampons Internationale Interconnecte avec
les autres systmes de rfrences ArXiv en physique / mathmatiques /
informatique / biologie / PubMed Central en mdecine et biologie
(2006)
Page 26
Janvier 2006 26 Les objectifs recherchs 2 Mesurabilit de la
production scientifique Des laboratoires, des institutions et plus
globalement, de toutes les tutelles disposition des dposants mais
aussi des institutions Gnration des listes de publications dans
tous formats (XML, TeX, DOC/RTF, PDF, ) Transferts vers les bases
administratives Alimentation de CRAC (fiche chercheur CNRS)
Alimentation de Labintel publications Prennit Archivage long terme
Stabilit des URLs
Page 27
Janvier 2006 27 Texte intgral Notice bibliographique Notice
bibliographique PubMed Central (2006) PubMed Central (2006) ArXiv
OAI HAL IN2P3 SHS/TICE AUTRES INRA INRIA Mta donnes obligatoiresMta
donnes spcifiques haLhaL EXPORTS IMPORTS
Page 28
Janvier 2006 28 OAI HAL IN2P3 SHS/TICE AUTRES INRA INRIA ? ? ?
? Rponse haLhaL EXPORTS IMPORTS
Page 29
Janvier 2006 29 OAI Mta donnes HAL IN2P3 SHS/TICE AUTRES INRA
INRIA ? Rponse IN2P3 haLhaL EXPORTS IMPORTS
Page 30
Janvier 2006 30 Texte intgral Notice bibliographique Notice
bibliographique OAI HAL IN2P3 TICE AUTRES INRA INRIA TEL 2005
haLhaL EXPORTS IMPORTS PubMed Central (2006) PubMed Central (2006)
ArXiv
Page 31
Janvier 2006 31 Dpt Simplification 4 tapes 1. Mta donnes 2.
Auteurs, laboratoires, tutelles et association 3. [tlchargement du
document] 4. Rcapitulation contrle, dpt Retour en arrire possible 2
auteursmtadonnesrcapitulationfichiers
Page 32
Janvier 2006 32 Dpt Choix des tapes Lordre des tapes peut tre
paramtr au niveau dune interface particulire Par exemple, on peut
dcider de commencer par le tlchargement du fichier, afin den
extraire automatiquement La liste dauteurs Le rsum Les rfrences
bibliographiques Etc. Ces possibles automatismes dpendent fortement
du niveau de structuration du document source, (donc de la
discipline ?) Extraction automatique Extraction automatique
auteursfichiers rcapitulationmta donnes