44
Une anomalie post-gutenbergienne

Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Embed Size (px)

Citation preview

Page 1: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Une anomalie post-gutenbergienne

Page 2: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Qu´est-ce qui ne va pas dans cette histoire ?

Page 3: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

1. Un jeune chercheur ayant tout juste obtenu son doctorat annonce fièrement à sa mère qu´il vient de publier son premier article.

Elle lui demande combien il a été payé.

Il grimace, répond : « Rien » et se lance alors dans une explication longue et compliquée...

Page 4: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

2. Un chercheur de la même université voit une référence à cet article.

Il se rend à la bibliothèque pour l´obtenir.

On lui répond :

«Nous ne sommes pas abonnés à cette revue, trop chère pour nous (notre budget d´abonnements, de droits, de prêt et de reproductionest déjà largement dépensé). »

Page 5: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

3. Un étudiant, dans la même université, voit le même article cité sur le Web.

Il clique sur la citation. Le site de l´éditeur demande un mot de passe :

« Accès refusé : seules les institutions autorisées et ayant souscrit un abonnement payable d´avance ont accès à la revue. »

Page 6: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

4. L´étudiant perd patience, s´ennuie et clique sur Napster pour mettre la main sur la version MP3 de son CD pirate favori et seconsoler ainsi de ses malheurs.

Page 7: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

5. Des années plus tard, la titularisation du docteur du point 1 est envisagée.

Ses publications sont bonnes, mais pas assez citées ; leur« impact sur la recherche » n´est pas suffisant.

Titularisation refusée.

Page 8: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

6. Le même scénario se répète lorsqu´il essaie d´obtenir des crédits de recherche.

Ses résultats scientifiques n´ont pas eu un impact suffisant. Trop peu de chercheurs les ont lus, s´en sont inspirés et les ont cités.

Financement refusé.

Page 9: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

7. Il essaie alors plutôt d´écrire un livre. Les éditeurs refusent de le publier :

« On n´en vendrait pas assez d´exemplaires car il y a trop peu d´universités ayant suffisamment d´argent pour en payer le prix(leurs budgets d´achat sont limités par le coût annuel, sans cesse croissant, de leurs abonnements, droits et prêts). »

Page 10: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

8. Il essaie de mettre ses articles sur le Web, en accès libre pour tous, afin d´augmenter leur impact.

Son éditeur menace de le poursuivre, ainsi que son fournisseur d´accès, pour violation du copyright.

Page 11: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

9. Il demande à son éditeur :

« Qui le copyright est-il censé protéger? »

Son éditeur lui répond :

« Vous ! »

Page 12: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Qu´est-ce qui ne va pas dans cette histoire ?

(Et pourquoi la mère du jeune docteur dont les gens ne peuvent voler les oeuvres qu'il a données gratuitement, et alors même qu´il souhaiterait qu´ils le fassent, se retrouve-t-elle dans la même galère que la mère du musicien dont l´oeuvre en accès payant peut être volée, et l´est de fait, bien qu´il ne le veuille pas ?)

Page 13: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Résoudre l´anomalie :

Comment quelques distinctions essentielles plus quelques actions simples permettraient un retour à la raison

Page 14: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

1. Cinq distinctions post-

gutenbergiennes essentielles : • 1.1. Distinguer les textes en accès payant des textes en accès

libre

• 1.2. Distinguer les revenus (provenant de la vente des publications) de l´impact (provenant de l´utilisation des publications)

• 1.3. Distinguer entre la protection que donne le copyright contre le vol de la qualité d´auteu(plagiat) et la protection que donne le copyright contre le vol du texte (piratage)

• 1.4. Distinguer l´auto-publication (à compte d´auteur) de l´auto-archivage (de recherches publiées après évaluation par des pairs)

• 1.5. Distinguer les prépublications non évaluées des

publications après évaluation

Page 15: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

2. Ce qui est optimal et inéluctable pour

les chercheurs

• la totalité du corpus des textes évalués mis en ligne

• sur l´ordinateur de chaque chercheur, partout • 24 heures sur 24 • tous les articles interconnectés par citation • entièrement recherchables, navigables, récupérables

• gratuitement, pour tous, pour toujours

Page 16: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

3. Deux catégories utiles, une nouvelle

distinction et un nouvel allié

3.1. Abonnements, droits d´accès, paiement à la carte : les obstacles à l´accès et à l´impact

3.2. Contrôle de qualité et certification : évaluation par les pairs

3.3. Séparer (a) la fourniture de services de contrôle de la qualité de (b) la fourniture d´accès aux publications électroniques [et (c) aux compléments en option]

3.4. Interopérabilité : l´initiative des Archives ouvertes

Page 17: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

4. La proposition subversive

Page 18: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

4.1. Suffit pour libérer l´intégralité du corpus

évalué, immédiatement et pour toujours :

I. Les universités installent et enregistrent des archives électroniques compatibles avec les normes des Archives ouvertes (http://www.eprints.org)

II. Les auteurs auto-archivent leurs prépublications avant évaluation et leurs publications après évaluation dans les archives électroniques de leurs universités respectives

III. Les universités subventionnent, là où c´est nécessaire, une première vague de démarrage de l´auto-archivage par procuration

IV. Le corpus en accès libre est libéré en ligne de toutes les limitations d´accès et d´impact

Page 19: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

4.2. Suite hypothétique : V. Les utilisateurs préféreront-ils la version libre ?

VI. Les revenus d´abonnements pour les éditeurs diminueront-ils, les économies d´abonnements pour les bibliothèques augmenteront-ils ?

VII. Les éditeurs limiteront-ils leur activité à la fourniture du service du contrôle de la qualité plus d´éventuels compléments en option ?

VIII. Les coûts du contrôle de la qualité seront-ils pris en charge par l´université agissant en tant qu´institution d´auteurs et puisant dans ses économies d´abonnement réalisées en tant qu´institution de lecteurs ?

Page 20: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

5. Problèmes du copyright post-

gutenbergien

Page 21: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Les questions suivantes portant sur le copyright digital ne concernent que la littérature en accès payant :

5.1. Protéger la propriété intellectuelle (droits d´auteur)

5.2. Empêcher une utilisation abusive

5.3. Empêcher le vol de texte (piratage)

La question suivante portant sur le copyright digital concerne toute la littérature, celle en accès libre et celle en accès payant :

5.4. Prévenir le vol de la qualité d´auteur (plagiat)

La question suivante portant sur le copyright digital ne concerne que la littérature en accès libre :

5.5. Garantir le droit de l´auteur de donner ses textes en accès libre

Page 22: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

6. Comment contourner légalement un copyright restrictif

(la strategie pretirage & «corrctions»)

Page 23: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

• 6.1. Auto-archiver la prépublication avant évaluation

• 6.2. Soumettez la prépublication pour évaluation (révision, etc.)

• 6.3. Après acceptation, essayez d´établir un accord de transfert de copyright qui permette l´auto-archivage

• 6.4. Si 6.3. réussit, auto-archivez la publication évaluée

• 6.5. Si 6.3. ne réussit pas, archivez les « corrigenda »

Page 24: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

7. Ce que vous pouvez faire maintenant pour libérer en

ligne la littérature scientifique 7.1. Chercheurs : auto-archivez tous vos articles présents, à venir (et

passés)

7.2. Universités : installez les archives électroniques ; rendez-les obligatoires ; aidez au démarragedes auteurs

7.3. Bibliothèques : entretenez les archives électroniques de l´université ; aidez au démarrage desauteurs

7.4. Étudiants : Gardez le cap ! Surfez ! Le futur est optimal, inéluctable - et il vous appartient !

7.5. Éditeurs de revues : soyez réalistes et acceptez l´auto-archivage et préparez-vous à distinguer les coûts indispensables du service de contrôle de la qualité (qui incomberont aux institutions d´auteurs) des coûts des suppléments en option (qui incomberont aux institutions de lecteurs)

7.6. Gouvernement/société : prescrivez à l´échelle mondiale un archivage public de la recherche publique

Page 25: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Psycoloquy 1989 -

• Online homologue of BBS

• Authors still timid• Sponsored by APA• Indexed by ISI/APA

since 2000 -• Still waiting for its

time to come...

Page 26: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Scholarly Skywriting 1990

Harnad, S. (1990) Scholarly Skywriting and the Prepublication Continuum of Scientific Inquiry. Psychological Science 1: 342 - 343 (reprinted in Current Contents 45: 9-13, November 11 1991).

Harnad, S. (1991) Post-Gutenberg Galaxy: The Fourth Revolution in the Means of Production of Knowledge. Public-Access Computer Systems Review 2 (1): 39 - 53

Harnad, S. (1992) Interactive Publication: Extending American Physical Society's Discipline-Specific Model for Electronic Publishing. Serials Review, Special Issue on Economics Models for Electronic Publishing, pp. 58 - 61.

Page 27: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

eprints.org 2000 -

• Generalization of CogPrints

• OAI-compliant• Eprint-archive-

creating software• Will distributed

institutional self-archiving do it at last…?

Page 28: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

2www.eprints.org

Cross-Discipline Self-Archiving through

Distributed Archives

… or changing this ...

arXiv submission rates - linear growth only

30% now, another decade to reach 100%

Page 29: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

4www.eprints.org

… into this ...

Upward curvilinear growth in archiving to catch up with paper-based research.100% of papers archived, across all disciplines (at least 20K refereed journals or 2 million refereed papers annually)

Time

DepositRates Dis

ciplin

es

Page 30: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

11www.eprints.org

Everyone gains: not just the Have-nots but the Harvards too

Impact Access

Have-not Have-not

HarvardHarvard

financial firewalls

Page 31: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

7www.eprints.org

The Global Research Database

Page 32: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

14www.eprints.org

Multiple Updates by LANL Subfield(based on LANL meta-data)

adap-orgastro-ph

chao-dyncomp-gas

cond-matcs

gr-qchep-ex

hep-lat

mathmath-ph

nlinnucl-ex

nucl-thpatt-sol

physicsquant-ph

solv-int

hep-thhep-ph

0 5000 10000 15000 20000 25000

No. of Papers with Updates

No Updates 1 Update 2 Updates 3 Updates 4 Updates

Citation Linking & Scientometric Analysis

Page 33: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Sunday October 28, 2000

8www.eprints.org

Searches ranked by author/paper citation/download impact

Page 34: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Number of times a Paper is Read

• Average of 10 hits per paper per year from the UK mirror, for the papers first year.

• 140 hits per paper per year assuming all 14 mirrors have equal traffic.

• The arXiv main site receives 14.5 times as many hits as the UK mirror

• Estimated 145 hits per paper per year on the main site.

• Estimated total of nearly 300 hits per paper per year.

Page 35: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Are papers downloaded then cited or cited then downloaded?(2)

• If all these time differences are plotted the above graph is produced.

What came first the Citation or the Download

0

1000

2000

3000

4000

5000

6000

7000

-300 0 300 600 900 1200 1500 1800 2100 2400 2700

Age of Paper at Download minus Age of Paper at Citation

Frequency

Page 36: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Citation Latencies

• The raw data show that the latency of the citation peak has been reducing over the period of the archive

Frequency of Citation Latencies: 1992-1999

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

0 12 24 36 48 60 72 84 96

Time Difference/Months

Citations

99 98 97 96 95 94 93 92

Page 37: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

The “New Paper Rush”

• Users subscribe to an email alerting service that informs them of new papers.

Age of paper against number of downloads

0

5000

10000

15000

20000

25000

30000

35000

40000

45000

50000

0 2 4 6 810 12 14 16 18 20 22 24 26 28 30

Age of Paper (days)

Number of Downloads

Page 38: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

hep-th

0

25

50

75

100

125

150

175

200

199107 199201 199207 199301 199307 199401 199407 199501 199507 199601 199607 199701 199707 199801 199807 199901 199907 200001

Papers

With J-R With J-R/Report Report Unknow n

Article Embryology

• Papers with a journal reference [J-R] cross papers without a J-R at an age of 13 months, suggesting a time difference of 13 months between pre-print and post-print

Page 39: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Paper Impact

• The papers were split into three sets based on the number of citations to them.

• There are an equal number of citations to the papers in the low, medium and high sets.

Page 40: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Author Impact Quartiles

• High impact authors update more than medium or low

• High and medium impact authors deposit more papers than low

Quartile Total % Total Citations PapersCitations/Aut

hor/PaperDeposits

Mean Updates/Author

High 25% 798 2.09% 240,092 2,732 0.11 6,720 0.48Med 50% 9,262 24.20% 733,272 37,318 0.00212 93,671 0.37Low 25% 28,211 73.71% 251,925 67,951 0.000131 165,971 0.27

Page 41: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Citation Quality

• Papers generally cite papers of like impact (2 underway).

High

Medium

Low

LowMedium

High

0

20000

40000

60000

80000

100000

120000

140000

No of Citations

Dest. Impact

Source Impact

Do Papers Cite Papers of Like Impact

Page 42: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

Histogram of Citations per Paper(author impact) 30,000 papers were by authors w ith no citation

1386534 6072 5863

9627

30807

13668 11527

6784

3105

1797121 24925717047814441

2060

0

5000

10000

15000

20000

25000

30000

35000

40000

No citations 1 Citation 2/3 Citations 4/5/6Citations

7/8/9/10Citations

11 or moreCitations

Papers

High (2.53%) Medium (34.55%) Low (62.92%)

Citation Spread

• A small number of papers receive a very large number of citations

Page 43: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

How Paper Impact Effects Usage

• Higher impact papers have a longer download life expectancy.

All Papers

0

0.0005

0.001

0.0015

0.002

0.0025

0109218 327436545654763872 981

1090119913081417152616351744185319622071218022892398

Age of paper (days)

Frequency Density

High (2.0%) Medium (7.7%) Low (46.5%) Unknown (39.6%)

Page 44: Une anomalie post-gutenbergienne. Qu´est-ce qui ne va pas dans cette histoire ?

What is the correlation between citations and downloads?

• There is a significant positive correlation between citations and downloads for high impact papers.

Download type r nAll Papers 0.11155 63671

High Impact Papers (2.0%) 0.27293 1981Medium Impact Papers (7.7%) 0.01288 5937

Low Impact Papers (46.5%) -0.01412 30163