35
Livre et numérique : A l’Ouest, quoi de nouveau ? Journée d’étude du 01 Juin 2007 Dans le cadre des « Polyphonies du livre » Université de Nantes / IUT de La Roche sur Yon http://livreetnumerique.wordpress.com

Moteur de recherche et chaîne du livre

  • Upload
    olivier

  • View
    4.633

  • Download
    3

Embed Size (px)

DESCRIPTION

Livre et numérique : moteurs de recherche et chaîne du livre

Citation preview

Page 1: Moteur de recherche et chaîne du livre

Livre et numérique : A l’Ouest, quoi de nouveau ?

Journée d’étude du 01 Juin 2007Dans le cadre des « Polyphonies du livre »

Université de Nantes / IUT de La Roche sur Yonhttp://livreetnumerique.wordpress.com

Page 2: Moteur de recherche et chaîne du livre

Moteurs de recherche et chaîne du livre. Vers un « dé »-chaînement des passions ?

Olivier Ertzscheid / Maître de Conférences

- Sciences de l’information et de la communication -

IUT La Roche sur Yon. Université de Nantes.

Mél : [email protected]

Site : http://www.affordance.info

Page 3: Moteur de recherche et chaîne du livre

? Quels enjeux pour la chaîne du livre ?

« Livre et numérique ? »– Environnement socio-technique qui cadre et définit en

creux certaines de ses pratiques de lecture • Quelle économie des contenus numériques ?• Quel meilleur accès possible à ce type de contenus ?• Quel public-lecteur ?

Place de chacun des acteurs. Nouvelle écologie

– des pratiques, des usages, – des modes de lecture à l’heure du numérique.

Page 4: Moteur de recherche et chaîne du livre

Les forces en présence

L’existant• Editeurs, libraires, bibliothèques, auteurs

– En ligne ou non– Ce que chacun met en ligne :

• Auteurs : leurs textes• Editeurs, libraires, bibliothèques : leur catalogue

Les nouveaux entrants– Moteurs de recherche

• Google, Yahoo (OCA), MSN

Page 5: Moteur de recherche et chaîne du livre

La nouvelle économie.

Théorie de la longue traîne : « The long tail »

• 20% des produits ne représentent plus 80% du C.A.

• Amazon réalise plus de la moitié de son C.A. sur des produits qui sont au fond de son catalogue.

• Intérêt ? – contraintes de stockage

différentes– choix beaucoup plus vaste. – exploiter un fond de

catalogue qu'elles sont les seules à pouvoir proposer.

Une culture du gratuit– Une envie du moindre coût– http://isbn.nu/0714540536 – http://isbn.nu/2253010693– Un même ouvrage :

• de 8 à 20 $. • Livré de 3 jours à 8 semaines.

– Quid de la loi Lang ???

Page 6: Moteur de recherche et chaîne du livre
Page 7: Moteur de recherche et chaîne du livre
Page 8: Moteur de recherche et chaîne du livre

… L’HISTOIRE …Comment et pourquoi Google

en vînt à s’intéresser aux livres. Et comment le monde du livre

en fût tout bouleversé.

Page 9: Moteur de recherche et chaîne du livre

Chapitre 1er

« Genèse d’une trilogie »

Page 10: Moteur de recherche et chaîne du livre

Google et les livres

• Fusée à 3 étages : – 1. Google Scholar :

• Revues, articles

– Google Books• 2. Projet Bibliothèque

– Ouvrages en bibliothèques

• 3. Partners Program– Partenariat avec éditeurs

Page 11: Moteur de recherche et chaîne du livre

Google Scholar

articles et ouvrages scientifiques– Enorme potentiel de données « ouvertes »

• Archives ouvertes, institutionnelles, etc…• Travail de « visibilité » : moteur incontournable de « La

recherche »• Données et textes « structurés » (Métadata, DublinCore,

OAI-PMH)

• Contents :– projet Muse : 270 revues éditées par près de 40

éditeurs http://muse.jhu.edu/– Bibliothèques (catalogues – Sudoc)

• Pas contents :– Editeurs (Elsevier, etc …).– Thompson : ISI : marché mondial de la citation

Page 12: Moteur de recherche et chaîne du livre

Google Books (volet bibliothèque)

• Google Projet Bibliothèque– Annonce partenariat avec bibliothèques pour numériser gratuitement leur

fonds et les rendre accessibles en texte intégral si copyright dépassé.– La clé aux marchands du temple ?

• Problèmes : – Les (faux) problèmes

• hégémonie américaine– Les (vrais) problèmes

• Modèle marchand de la bibliothèque ?– Financé par publicité : Que devient l’accès raisonné ?– « laisser les utilisateurs et les chercheurs décider par eux-

mêmes, par leurs choix, de la hiérarchie. »– Risques : ouvrages les plus consultés, pas de roulement du

fonds, ouvrages oubliés, nouvelle forme d’enfer ?• Aucune « lisibilité » du fonds documentaire (chiffres hautement

fantaisistes)• Eugénisme documentaire …

Page 13: Moteur de recherche et chaîne du livre

Eugénisme documentaire

• Google a le droit de "faire des copies de sa copie et de les distribuer ou de les vendre (y compris et sans limitation à ses "syndication partners"")

– TRADUIRE : Google ne facture aucun coût à l'usager final, mais s'autorise toute marchandisation possible sur des copies de copies.

• L'université, pour la copie qui lui est remise, doit – "s'engager à ne pas le revendre à d'autres tiers" (normal), – "empêcher le téléchargement de tout ou partie de l'oeuvre à des fins commerciales, y compris

des copies en mode image disponibles sur le site de l'université" (ce que Google s'autorise pour lui-même ...), et elle doit enfin s'assurer que "sa copie digitale ne soit pas téléchargée ou disséminée auprès d'un large public" TRADUIRE : Tout le « traffic » de consultation pour téléchargement passera par Google.

– QUI DECIDE DE CE QU’EST « UN LARGE PUBLIC » ???

• Au final le marché de dupe est le suivant : – chacun des 2 partenaires reçoit "sa" copie– Mais le marchand (Google) s'ouvre tous les droits sur la sienne et les copies de la sienne

(impression, téléchargement, revente ...) – et impose au bibliothécaire un usage fermé et stérile de la sienne (pas de revente ni de

cession, pas de téléchargement depuis les sites universitaires, etc.).

• Plus d’infos sur « Contrat californien et eugénisme documentaire »• http://affordance.typepad.com/mon_weblog/2006/09/contrat_califor.html

Page 14: Moteur de recherche et chaîne du livre

• En tout 13 bibliothèques partenaires dont (hors Etats-Unis): – Espagne : Université Complutense Madrid, Bibliothèque nationale de

Catalogne, Barcelone– Angleterre : Oxford, Harvard– Allemagne– Suisse– Belgique (francophone et néerlandophone)

• Le syndrôme du petit village gaulois ?

?

Page 15: Moteur de recherche et chaîne du livre

Google Books sous le capot

• (Source : http://www.lessig.org/blog/archives/003292.

shtml)• Corpus : 18 millions d’ouvrages

– 16 % : Domaine public• Accès texte intégral

– 9 % : Copyright. In Print• Accès selon desiderata des auteurs/éditeurs

– 75 % : Copyright (USA : 1923) Mais « out of print »

• Extraits (snippets)

Page 16: Moteur de recherche et chaîne du livre

Full-View (16 %)

Domaine public

Accès texte intégral

+ téléchargement

Page 17: Moteur de recherche et chaîne du livre

Limited Preview (9 %)

• Volet éditeur

• Accord passé

• 20 % texte

Page 18: Moteur de recherche et chaîne du livre

« Snippet view » (75 %)

• Pas d’accord• Pas d’ayants-droit• Règle de l’Opt-out• Données bibliographiques• Mot-clé en contexte

Page 19: Moteur de recherche et chaîne du livre

Chapitre Second

« La Bataille de l’édition »

Page 20: Moteur de recherche et chaîne du livre

Le dilemme des éditeurs

• En être ou non ? IL LE FAUT – Question est de savoir comment …

• Sept. 2005 : procès Authors Guild• Oct. 2005 : procès AAP• Argument officiel :

– « massive copyright infringement »– Opt-Out illégal.

• Position Google (vrai) : si « usage équitable » (‘fair-use’), pas besoin de permission (Opt-In).

• question des USAGES : – Google Book Search : fair-use or not fair-use ?

Page 21: Moteur de recherche et chaîne du livre

Google Book$ ?• Aujourd’hui :

– Usager : gratuit Mais identification • Stratégie « portail » :

– monétisation des accès et des consultations– Public captif

– $ : • Liens contextuels• Liens vers éditeurs/libraires en ligne MAIS• Constitution d’un catalogue propriétaire (Google)

• Demain ???– Vidéo à la demande => Livres à la demande ? Au chapitre ?– Service de paiement sécurisé en ligne– Flou artistique augmenté par changements de stratégie et contradictions

(apparentes) : « Aucun enregistrement, ni impression, ni sauvegarde pour l’usager … »

Page 22: Moteur de recherche et chaîne du livre

GoogleZone

Page 23: Moteur de recherche et chaîne du livre

Chapitre Troisième

« Plus on est de fous … »

Page 24: Moteur de recherche et chaîne du livre

Open Content Alliance(http://www.opencontentalliance.org/)

http://www.openlibrary.org/

• « a group of cultural, technology, nonprofit, and governmental organizations »

• build a permanent archive of multilingual digitized text and multimedia content.

• accessible through – Internet Archive– Yahoo!

• Une philosophie et des services différents

• Adobe• MSN• Yahoo!• Une trentaine

d’universités,de musées et d’archives

• HP Labs• Internet Archive• Johns Hopkins

University Libraries• National Archives

(United Kingdom)• Xerox Corporation

Page 25: Moteur de recherche et chaîne du livre

MSN Book Search

• MSN ?????– MSN Book Search. Rien n’est visible pour

l’instant– 7 novembre 05 : British Library pour la

numérisation de 10 000 ouvrages.• Quelle analyse ?

– stratégie d'isolement de Google ? – Impossibilité (ou inutilité) de rattraper

l'avance pris par les deux autres projets ?– « Dissuasion » numérique

• Renforcer les crispations.

Page 26: Moteur de recherche et chaîne du livre

Chapitre Quatrième

« Et les libraires dans tout ça ? »

Page 27: Moteur de recherche et chaîne du livre

• Les petits– Label « libraire indépendant » ?– Portail de la librairie indépendante ?– Affiliation commerciale avec Google

• Libraire près de chez vous

• Les gros– Sauramps (Montpellier) + Ombres Blanches (Toulouse) + Mollat

(Bordeaux) • 160 000 titres en stock physique cumulés

– Négociation avec Google depuis l'automne dernier. – Permettre une remontée quotidienne de leur fonds auprès du

moteur pour l'affichage de liens sponsorisés vers lesdits sudistes

• Les saumons– Édition de l’Eclat (Michel Valensi)

Page 28: Moteur de recherche et chaîne du livre

? Réflexions ? Pour ouvrir le débat

… et l’appétit

Ou comment à quelque chose malheur est bon.

Grâce (à cause) de Google on n’aura jamais autant …

Page 29: Moteur de recherche et chaîne du livre

(on n’aura jamais autant …)Questionné l’irréductible légèreté du livre

• dans :– Son rapport avec l’individualité consciente qui

le feuillette• lecture fragmentaire.

– Son rapport avec l’inscription qu’il recueille• lecture numérique

– Son rapport à un héritage culturel partagé• économie des savoirs du livre. • Google Books : tête de gondole comme seul modèle

bibliothéconomique :-((

Page 30: Moteur de recherche et chaîne du livre

(on n’aura jamais autant …) Porté le numérique en débatculture, économie et politique

• Mise en ligne de la culture : – débat culturel, économique ET politique

• « les dimensions collectives de la production, circulation, consommation des savoirs sont en voie de différenciation accélérée. » Jean Max Noyer

• « le financement de Google par la publicité (...) s'appuie aussi sur le métier de Google, sur une activité de quasi-bibliothécaire : la création puis la vente de mots-clés. Son thesaurus est un thesaurus » Alain Giffard

Page 31: Moteur de recherche et chaîne du livre

(on n’aura jamais autant …) Interrogé les « modèles »

• Aujourd’hui : – Relative richesse et diversité des modèles

• ModèleS de bibliothèque numérique

– Yahoo, MSN, Google … mais aussi … – Gallica : http://gallica.bnf.fr/Presentation.htm– Bibliothèque électronique de lisieux : http://www.bmlisieux.

com/– Bibliothèque Universelle : http://abu.cnam.fr/ – Projet Gutenberg : http://www.gutenberg.org/

• ModèleS de librairies numériques (petits et gros)

• Demain ??????????????????

Page 32: Moteur de recherche et chaîne du livre

Une équation et quelques inconnues de taille

• « Bien mal acquis » … reste acquis !– Les textes disponibles seront numérisés.– le livre sera numérique – le livre ne sera pas QUE numérique.

• Quelle sera la part du numérique dans les pratiques et les modalités d’appropriation du livre ?

• Rien n’est réglé mais quelques indices :– Massification des accès– Modernisation des dispositifs de lecture

Page 33: Moteur de recherche et chaîne du livre

Les « métiers du livre »

• On connaît position : – Des bibliothèques

• Pour & Contre – ( = « pour mais à condition que d’autres modèles existent »)– ( = « donnez-nous les MOYENS ($$) d’être contre »)

– Des éditeurs• Contre. Contre. Contre. Mais … « Il faut en être »

– Des auteurs• S’expriment peu. Désintermédiation. Les éditeurs « portent »

(pour l’essentiel) leur parole. Donc quand même plutôt contre.

– Des chercheurs• De plus en plus « Pour »

– (Google Scholar) et phénomène de l’auto-publication

– Des (gros) libraires• POUR.

Page 34: Moteur de recherche et chaîne du livre

Bon d’accord mais demain ??• Un moteur de recherche n’est

– NI une librairie, – NI une bibliothèque, – NI un éditeur.

• MAIS … le CATALOGUE est la convergence – De métiers : biblio, édition, librairie – De pratiques & des missions : Conservation, diffusion, accès,

recherche• OR aujourd’hui Google c’est :

– Le catalogue– + Le fonds numérisé– + Le public captif – + L’adéquation aux nouveaux usages– + Les outils de monétisation de services à l’usager (et aux

partenaires : Adwords, Adsense, Payment Corp)– + L’infrastructure et la technologie de recherche

• Qu’est-ce qui l’empêche de devenir libraire ? Editeur ? Bibliothécaire ?

Page 35: Moteur de recherche et chaîne du livre

PréambulePourquoi cette histoire ?

• Livres Hebdo : 20 Janvier 2006– « Google aurait numérisé des centaines d’ouvrages

français, sans aucune autorisation des maisons d’éditions. »

– « Les oeuvres "pillées" appartiendraient aux éditeurs Gallimard, Grasset, Hachette ou Fayard, et antérieures à 1970, les auteurs étant Albert Camus, Paul Valéry, André Malraux, André Gide ou André Breton. »