Upload
avery-gosset
View
112
Download
6
Embed Size (px)
Citation preview
Une anomalie post-gutenbergienne
Qu´est-ce qui ne va pas dans cette histoire ?
1. Un jeune chercheur ayant tout juste obtenu son doctorat annonce fièrement à sa mère qu´il vient de publier son premier article.
Elle lui demande combien il a été payé.
Il grimace, répond : « Rien » et se lance alors dans une explication longue et compliquée...
2. Un chercheur de la même université voit une référence à cet article.
Il se rend à la bibliothèque pour l´obtenir.
On lui répond :
«Nous ne sommes pas abonnés à cette revue, trop chère pour nous (notre budget d´abonnements, de droits, de prêt et de reproductionest déjà largement dépensé). »
3. Un étudiant, dans la même université, voit le même article cité sur le Web.
Il clique sur la citation. Le site de l´éditeur demande un mot de passe :
« Accès refusé : seules les institutions autorisées et ayant souscrit un abonnement payable d´avance ont accès à la revue. »
4. L´étudiant perd patience, s´ennuie et clique sur Napster pour mettre la main sur la version MP3 de son CD pirate favori et seconsoler ainsi de ses malheurs.
5. Des années plus tard, la titularisation du docteur du point 1 est envisagée.
Ses publications sont bonnes, mais pas assez citées ; leur« impact sur la recherche » n´est pas suffisant.
Titularisation refusée.
6. Le même scénario se répète lorsqu´il essaie d´obtenir des crédits de recherche.
Ses résultats scientifiques n´ont pas eu un impact suffisant. Trop peu de chercheurs les ont lus, s´en sont inspirés et les ont cités.
Financement refusé.
7. Il essaie alors plutôt d´écrire un livre. Les éditeurs refusent de le publier :
« On n´en vendrait pas assez d´exemplaires car il y a trop peu d´universités ayant suffisamment d´argent pour en payer le prix(leurs budgets d´achat sont limités par le coût annuel, sans cesse croissant, de leurs abonnements, droits et prêts). »
8. Il essaie de mettre ses articles sur le Web, en accès libre pour tous, afin d´augmenter leur impact.
Son éditeur menace de le poursuivre, ainsi que son fournisseur d´accès, pour violation du copyright.
9. Il demande à son éditeur :
« Qui le copyright est-il censé protéger? »
Son éditeur lui répond :
« Vous ! »
Qu´est-ce qui ne va pas dans cette histoire ?
(Et pourquoi la mère du jeune docteur dont les gens ne peuvent voler les oeuvres qu'il a données gratuitement, et alors même qu´il souhaiterait qu´ils le fassent, se retrouve-t-elle dans la même galère que la mère du musicien dont l´oeuvre en accès payant peut être volée, et l´est de fait, bien qu´il ne le veuille pas ?)
Résoudre l´anomalie :
Comment quelques distinctions essentielles plus quelques actions simples permettraient un retour à la raison
1. Cinq distinctions post-
gutenbergiennes essentielles : • 1.1. Distinguer les textes en accès payant des textes en accès
libre
• 1.2. Distinguer les revenus (provenant de la vente des publications) de l´impact (provenant de l´utilisation des publications)
• 1.3. Distinguer entre la protection que donne le copyright contre le vol de la qualité d´auteu(plagiat) et la protection que donne le copyright contre le vol du texte (piratage)
• 1.4. Distinguer l´auto-publication (à compte d´auteur) de l´auto-archivage (de recherches publiées après évaluation par des pairs)
• 1.5. Distinguer les prépublications non évaluées des
publications après évaluation
2. Ce qui est optimal et inéluctable pour
les chercheurs
• la totalité du corpus des textes évalués mis en ligne
• sur l´ordinateur de chaque chercheur, partout • 24 heures sur 24 • tous les articles interconnectés par citation • entièrement recherchables, navigables, récupérables
• gratuitement, pour tous, pour toujours
3. Deux catégories utiles, une nouvelle
distinction et un nouvel allié
3.1. Abonnements, droits d´accès, paiement à la carte : les obstacles à l´accès et à l´impact
3.2. Contrôle de qualité et certification : évaluation par les pairs
3.3. Séparer (a) la fourniture de services de contrôle de la qualité de (b) la fourniture d´accès aux publications électroniques [et (c) aux compléments en option]
3.4. Interopérabilité : l´initiative des Archives ouvertes
4. La proposition subversive
4.1. Suffit pour libérer l´intégralité du corpus
évalué, immédiatement et pour toujours :
I. Les universités installent et enregistrent des archives électroniques compatibles avec les normes des Archives ouvertes (http://www.eprints.org)
II. Les auteurs auto-archivent leurs prépublications avant évaluation et leurs publications après évaluation dans les archives électroniques de leurs universités respectives
III. Les universités subventionnent, là où c´est nécessaire, une première vague de démarrage de l´auto-archivage par procuration
IV. Le corpus en accès libre est libéré en ligne de toutes les limitations d´accès et d´impact
4.2. Suite hypothétique : V. Les utilisateurs préféreront-ils la version libre ?
VI. Les revenus d´abonnements pour les éditeurs diminueront-ils, les économies d´abonnements pour les bibliothèques augmenteront-ils ?
VII. Les éditeurs limiteront-ils leur activité à la fourniture du service du contrôle de la qualité plus d´éventuels compléments en option ?
VIII. Les coûts du contrôle de la qualité seront-ils pris en charge par l´université agissant en tant qu´institution d´auteurs et puisant dans ses économies d´abonnement réalisées en tant qu´institution de lecteurs ?
5. Problèmes du copyright post-
gutenbergien
Les questions suivantes portant sur le copyright digital ne concernent que la littérature en accès payant :
5.1. Protéger la propriété intellectuelle (droits d´auteur)
5.2. Empêcher une utilisation abusive
5.3. Empêcher le vol de texte (piratage)
La question suivante portant sur le copyright digital concerne toute la littérature, celle en accès libre et celle en accès payant :
5.4. Prévenir le vol de la qualité d´auteur (plagiat)
La question suivante portant sur le copyright digital ne concerne que la littérature en accès libre :
5.5. Garantir le droit de l´auteur de donner ses textes en accès libre
6. Comment contourner légalement un copyright restrictif
(la strategie pretirage & «corrctions»)
• 6.1. Auto-archiver la prépublication avant évaluation
• 6.2. Soumettez la prépublication pour évaluation (révision, etc.)
• 6.3. Après acceptation, essayez d´établir un accord de transfert de copyright qui permette l´auto-archivage
• 6.4. Si 6.3. réussit, auto-archivez la publication évaluée
• 6.5. Si 6.3. ne réussit pas, archivez les « corrigenda »
7. Ce que vous pouvez faire maintenant pour libérer en
ligne la littérature scientifique 7.1. Chercheurs : auto-archivez tous vos articles présents, à venir (et
passés)
7.2. Universités : installez les archives électroniques ; rendez-les obligatoires ; aidez au démarragedes auteurs
7.3. Bibliothèques : entretenez les archives électroniques de l´université ; aidez au démarrage desauteurs
7.4. Étudiants : Gardez le cap ! Surfez ! Le futur est optimal, inéluctable - et il vous appartient !
7.5. Éditeurs de revues : soyez réalistes et acceptez l´auto-archivage et préparez-vous à distinguer les coûts indispensables du service de contrôle de la qualité (qui incomberont aux institutions d´auteurs) des coûts des suppléments en option (qui incomberont aux institutions de lecteurs)
7.6. Gouvernement/société : prescrivez à l´échelle mondiale un archivage public de la recherche publique
Psycoloquy 1989 -
• Online homologue of BBS
• Authors still timid• Sponsored by APA• Indexed by ISI/APA
since 2000 -• Still waiting for its
time to come...
Scholarly Skywriting 1990
Harnad, S. (1990) Scholarly Skywriting and the Prepublication Continuum of Scientific Inquiry. Psychological Science 1: 342 - 343 (reprinted in Current Contents 45: 9-13, November 11 1991).
Harnad, S. (1991) Post-Gutenberg Galaxy: The Fourth Revolution in the Means of Production of Knowledge. Public-Access Computer Systems Review 2 (1): 39 - 53
Harnad, S. (1992) Interactive Publication: Extending American Physical Society's Discipline-Specific Model for Electronic Publishing. Serials Review, Special Issue on Economics Models for Electronic Publishing, pp. 58 - 61.
eprints.org 2000 -
• Generalization of CogPrints
• OAI-compliant• Eprint-archive-
creating software• Will distributed
institutional self-archiving do it at last…?
Sunday October 28, 2000
2www.eprints.org
Cross-Discipline Self-Archiving through
Distributed Archives
… or changing this ...
arXiv submission rates - linear growth only
30% now, another decade to reach 100%
Sunday October 28, 2000
4www.eprints.org
… into this ...
Upward curvilinear growth in archiving to catch up with paper-based research.100% of papers archived, across all disciplines (at least 20K refereed journals or 2 million refereed papers annually)
Time
DepositRates Dis
ciplin
es
Sunday October 28, 2000
11www.eprints.org
Everyone gains: not just the Have-nots but the Harvards too
Impact Access
Have-not Have-not
HarvardHarvard
financial firewalls
Sunday October 28, 2000
7www.eprints.org
The Global Research Database
Sunday October 28, 2000
14www.eprints.org
Multiple Updates by LANL Subfield(based on LANL meta-data)
adap-orgastro-ph
chao-dyncomp-gas
cond-matcs
gr-qchep-ex
hep-lat
mathmath-ph
nlinnucl-ex
nucl-thpatt-sol
physicsquant-ph
solv-int
hep-thhep-ph
0 5000 10000 15000 20000 25000
No. of Papers with Updates
No Updates 1 Update 2 Updates 3 Updates 4 Updates
Citation Linking & Scientometric Analysis
Sunday October 28, 2000
8www.eprints.org
Searches ranked by author/paper citation/download impact
Number of times a Paper is Read
• Average of 10 hits per paper per year from the UK mirror, for the papers first year.
• 140 hits per paper per year assuming all 14 mirrors have equal traffic.
• The arXiv main site receives 14.5 times as many hits as the UK mirror
• Estimated 145 hits per paper per year on the main site.
• Estimated total of nearly 300 hits per paper per year.
Are papers downloaded then cited or cited then downloaded?(2)
• If all these time differences are plotted the above graph is produced.
What came first the Citation or the Download
0
1000
2000
3000
4000
5000
6000
7000
-300 0 300 600 900 1200 1500 1800 2100 2400 2700
Age of Paper at Download minus Age of Paper at Citation
Frequency
Citation Latencies
• The raw data show that the latency of the citation peak has been reducing over the period of the archive
Frequency of Citation Latencies: 1992-1999
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
0 12 24 36 48 60 72 84 96
Time Difference/Months
Citations
99 98 97 96 95 94 93 92
The “New Paper Rush”
• Users subscribe to an email alerting service that informs them of new papers.
Age of paper against number of downloads
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
0 2 4 6 810 12 14 16 18 20 22 24 26 28 30
Age of Paper (days)
Number of Downloads
hep-th
0
25
50
75
100
125
150
175
200
199107 199201 199207 199301 199307 199401 199407 199501 199507 199601 199607 199701 199707 199801 199807 199901 199907 200001
Papers
With J-R With J-R/Report Report Unknow n
Article Embryology
• Papers with a journal reference [J-R] cross papers without a J-R at an age of 13 months, suggesting a time difference of 13 months between pre-print and post-print
Paper Impact
• The papers were split into three sets based on the number of citations to them.
• There are an equal number of citations to the papers in the low, medium and high sets.
Author Impact Quartiles
• High impact authors update more than medium or low
• High and medium impact authors deposit more papers than low
Quartile Total % Total Citations PapersCitations/Aut
hor/PaperDeposits
Mean Updates/Author
High 25% 798 2.09% 240,092 2,732 0.11 6,720 0.48Med 50% 9,262 24.20% 733,272 37,318 0.00212 93,671 0.37Low 25% 28,211 73.71% 251,925 67,951 0.000131 165,971 0.27
Citation Quality
• Papers generally cite papers of like impact (2 underway).
High
Medium
Low
LowMedium
High
0
20000
40000
60000
80000
100000
120000
140000
No of Citations
Dest. Impact
Source Impact
Do Papers Cite Papers of Like Impact
Histogram of Citations per Paper(author impact) 30,000 papers were by authors w ith no citation
1386534 6072 5863
9627
30807
13668 11527
6784
3105
1797121 24925717047814441
2060
0
5000
10000
15000
20000
25000
30000
35000
40000
No citations 1 Citation 2/3 Citations 4/5/6Citations
7/8/9/10Citations
11 or moreCitations
Papers
High (2.53%) Medium (34.55%) Low (62.92%)
Citation Spread
• A small number of papers receive a very large number of citations
How Paper Impact Effects Usage
• Higher impact papers have a longer download life expectancy.
All Papers
0
0.0005
0.001
0.0015
0.002
0.0025
0109218 327436545654763872 981
1090119913081417152616351744185319622071218022892398
Age of paper (days)
Frequency Density
High (2.0%) Medium (7.7%) Low (46.5%) Unknown (39.6%)
What is the correlation between citations and downloads?
• There is a significant positive correlation between citations and downloads for high impact papers.
Download type r nAll Papers 0.11155 63671
High Impact Papers (2.0%) 0.27293 1981Medium Impact Papers (7.7%) 0.01288 5937
Low Impact Papers (46.5%) -0.01412 30163