113
Le Web 2.0 pour la veille et la recherche d'information Exploitez toutes les ressources du Web Social Juin 2007 White Paper DIGIMIND www.digimind.com Digimind Services – White Paper|0

Le Web 2.0 pour la veille et la recherche d'information

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Le Web 20 pour la veille et la recherche dinformation Exploitez toutes les ressources du Web Social

Juin 2007

Whi

te P

aper

DIGIMIND

wwwdigimindcom Digimind Services ndash White Paper|0

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avertissement

Ce document a eacuteteacute reacutealiseacute par la socieacuteteacute Digimind

Le contenu de ce document est proteacutegeacute par le droit drsquoauteur Il peut ecirctre reproduit

en partie agrave la condition de citer Digimind comme auteur et drsquoindiquer lrsquoadresse

httpwwwdigimindcom Pour toute information compleacutementaire vous pouvez

contacter Digimind par mail agrave lrsquoadresse contactdigimindcom ou par teacuteleacutephone au

01 53 34 08 08

copy Digimind Digimind Services ndash White Paper |1

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Sommaire

AVERTISSEMENT 1

AVANT PROPOS 4 Web 20 4

QUEST-CE QUE LE WEB 20 5

Preacuteambule 5

Deacutefinition du web 20 6

Les 7 principes du Web 20 8

Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9

GLOSSAIRE DU WEB 20 12

LES TECHNOLOGIES DU WEB 20 15

LES FAMILLES DAPPLICATIONS DU WEB 20 18

Typologie 18

Comment identifier un site Web 20 23

LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24

Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73

copy Digimind Digimind Services ndash White Paper |2

Le Web 20 pour la veille et recherche dinformation DIGIMIND

a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082

Exemple dune recherche et veille via le Web 20 84

LES LIMITES DU WEB 20 86

La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88

Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91

CONCLUSION 92

A PROPOS DES AUTEURS 96

WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102

DANS LA MEME COLLECTION 104

NOTES 105

copy Digimind Digimind Services ndash White Paper |3

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avant propos

Web 20

La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de

personnes sont capables de lexpliquer preacuteciseacutement

Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des

Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui

nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce

concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur

recherche et de leur veille informationnelle

copy Digimind Digimind Services ndash White Paper |4

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avertissement

Ce document a eacuteteacute reacutealiseacute par la socieacuteteacute Digimind

Le contenu de ce document est proteacutegeacute par le droit drsquoauteur Il peut ecirctre reproduit

en partie agrave la condition de citer Digimind comme auteur et drsquoindiquer lrsquoadresse

httpwwwdigimindcom Pour toute information compleacutementaire vous pouvez

contacter Digimind par mail agrave lrsquoadresse contactdigimindcom ou par teacuteleacutephone au

01 53 34 08 08

copy Digimind Digimind Services ndash White Paper |1

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Sommaire

AVERTISSEMENT 1

AVANT PROPOS 4 Web 20 4

QUEST-CE QUE LE WEB 20 5

Preacuteambule 5

Deacutefinition du web 20 6

Les 7 principes du Web 20 8

Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9

GLOSSAIRE DU WEB 20 12

LES TECHNOLOGIES DU WEB 20 15

LES FAMILLES DAPPLICATIONS DU WEB 20 18

Typologie 18

Comment identifier un site Web 20 23

LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24

Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73

copy Digimind Digimind Services ndash White Paper |2

Le Web 20 pour la veille et recherche dinformation DIGIMIND

a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082

Exemple dune recherche et veille via le Web 20 84

LES LIMITES DU WEB 20 86

La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88

Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91

CONCLUSION 92

A PROPOS DES AUTEURS 96

WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102

DANS LA MEME COLLECTION 104

NOTES 105

copy Digimind Digimind Services ndash White Paper |3

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avant propos

Web 20

La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de

personnes sont capables de lexpliquer preacuteciseacutement

Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des

Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui

nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce

concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur

recherche et de leur veille informationnelle

copy Digimind Digimind Services ndash White Paper |4

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Sommaire

AVERTISSEMENT 1

AVANT PROPOS 4 Web 20 4

QUEST-CE QUE LE WEB 20 5

Preacuteambule 5

Deacutefinition du web 20 6

Les 7 principes du Web 20 8

Les eacutevolutions par rapport au Web 10 le rocircle de linternaute 9

GLOSSAIRE DU WEB 20 12

LES TECHNOLOGIES DU WEB 20 15

LES FAMILLES DAPPLICATIONS DU WEB 20 18

Typologie 18

Comment identifier un site Web 20 23

LES APPLICATIONS WEB 20 POUR LA VEILLE ET LA RECHERCHE DINFORMATIONS 24

Les types dapplications 24 I Partager et collaborer 24 a Les Bookmarks sociaux 24 b Le Multimeacutedia photos et videacuteos 30 c Partage de cv et reacuteseaux sociaux35 d Les sites dactualiteacutes collaboratives recommandation et notation38 II Rechercher Collecter 42 a La recherche de blogs et de flux RSS42 b La recherche par tags48 c La recherche de personnes et dinformations entreprises 54 d Les moteurs de recherche humains56 e les moteurs de recherche collaboratifs59 f La verticalisation par la personnalisation du peacuterimegravetre de recherche62 g Lenrichissement de bases de donneacutees faccedilon Web20 65 h Conserver et exploiter lhistorique de vos recherches et navigations67 i Les mash-up 69 III Diffuser73

copy Digimind Digimind Services ndash White Paper |2

Le Web 20 pour la veille et recherche dinformation DIGIMIND

a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082

Exemple dune recherche et veille via le Web 20 84

LES LIMITES DU WEB 20 86

La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88

Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91

CONCLUSION 92

A PROPOS DES AUTEURS 96

WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102

DANS LA MEME COLLECTION 104

NOTES 105

copy Digimind Digimind Services ndash White Paper |3

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avant propos

Web 20

La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de

personnes sont capables de lexpliquer preacuteciseacutement

Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des

Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui

nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce

concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur

recherche et de leur veille informationnelle

copy Digimind Digimind Services ndash White Paper |4

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

a Les Blogs et le flux RSS 73 b Les Wikis 74 IV Surveiller 78 a La deacutetection du flux RSS 78 b La mise en surveillance79 c Pourquoi une veille via le RSS 81 V Carte des outils et ressources Web 2082

Exemple dune recherche et veille via le Web 20 84

LES LIMITES DU WEB 20 86

La participation 86 I Une participation heacuteteacuterogegravene 86 Une minoriteacute participativehellip 86 Wikipedia un faux modegravele collaboratif 87 II Une participation damateurs 88

Le web 10 reste neacutecessaire 89 Le mail reacutesiste 89 Une population souvent isoleacutee et non repreacutesentative 90 Des domaines mal couverts 91

CONCLUSION 92

A PROPOS DES AUTEURS 96

WEBOGRAPHIE BIBLIOGRAPHIE 98 Sites web wikis et blogs98 Articles 101 Ouvrages 102

DANS LA MEME COLLECTION 104

NOTES 105

copy Digimind Digimind Services ndash White Paper |3

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avant propos

Web 20

La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de

personnes sont capables de lexpliquer preacuteciseacutement

Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des

Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui

nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce

concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur

recherche et de leur veille informationnelle

copy Digimind Digimind Services ndash White Paper |4

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Avant propos

Web 20

La notion de Web 20 est tregraves souvent employeacutee mais finalement peu de

personnes sont capables de lexpliquer preacuteciseacutement

Lobjectif de ce document est de deacutemocratiser le concept de Web 20 aupregraves des

Knowledge Workers Il sadresse aux diffeacuterents collaborateurs de lentreprise qui

nutilisent pas encore ou peu les diffeacuterentes applications regroupeacutees sous ce

concept Les sensibiliser agrave ces outils pourra ameacuteliorer la pertinence de leur

recherche et de leur veille informationnelle

copy Digimind Digimind Services ndash White Paper |4

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quest-ce que le Web 20

PREAMBULE

Pour certains le Web 20 nest qun gadget un pur pheacutenomegravene de mode qui ne

meacuterite pas que lon sy attarde Pourtant une eacutevolution importante a bien eu lieu sur

le web quelque soit le nom que lon lui donne

Ainsi en 2006 un metteur en scegravene a choisi de diffuser son long meacutetrage Autumn1

gratuitement et ce uniquement sur internet via le service Google Video2 Il navait

pas trouveacute de distributeur capable dexploiter son film dans plus de 30 salles En mai

2007 plus de 920 000 internautes avaient deacutejagrave vu Autumn sur le service de partage

de videacuteos de Google

Fin 2005 pour le compte de la prestigieuse revue scientifique Nature des experts

ont compareacute des documents publieacutes sur Wikipedia lencyclopeacutedie collaborative en

ligne reacutealiseacutee par des internautes volontaires et beacuteneacutevoles avec ceux de la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche

Cette eacutetude a abouti agrave une formidable controverse comment une encyclopeacutedie

reacutealiseacutee par des non-speacutecialistes peut-elle remettre en cause les ouvrages

classiques

Il se passe donc bien quelque chose de nouveau via ce web nouvelle geacuteneacuteration ougrave

linternaute devient actif et collaboratif Mais tellement dacteurs et dapplications se

reacuteclament de ce web 2 que lon a vite limpression de naviguer en Terra Incognita

Certains nheacutesitent dailleurs pas agrave repreacutesenter ce nouveau web via une carte

dexplorateur 3

Aussi agrave travers ce document plongeons dans le Web 20 pour mieux lexploiter

lors de recherche dinformation et de veilles

copy Digimind Digimind Services ndash White Paper |5

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La carte des communauteacutes virtuelles Par Randall Munroe DR

DEFINITION DU WEB 20

Comment deacutefinir de faccedilon preacutecise ce que recouvre cette notion parfois floue

Depuis plusieurs mois le blog collectif Dessine moi le Web 20 4 propose agrave des

universitaires informaticiens philosophes entrepreneurs de donner leur propre

vision du pheacutenomegravene et eacutechanger ideacutees et points de vue La diversiteacute et la richesse

des contributions illustrent la difficulteacute agrave donner une deacutefinition exhaustive de ce

concept agrave geacuteomeacutetrie variable mecirclant agrave la fois des aspects techniques et sociaux

Une vision reacuteductrice du Web 20 consisterait agrave nrsquoy voir que la mutualisation de

contenus produits et mis en ligne par les utilisateurs eux-mecircmes ou agrave reacutesumer

lrsquoengouement actuel agrave un effet de mode passager Depuis la premiegravere confeacuterence

Web 20 en 2004 le concept srsquoest concreacutetiseacute agrave travers de nombreuses

expeacuterimentations ou le deacuteveloppement de nombreux services largement utiliseacutes

Nous tenterons dans ce document de brosser un panorama des enjeux usages et

technologies lieacutes agrave cette notion aussi encenseacutee que controverseacutee

copy Digimind Digimind Services ndash White Paper |6

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plusieurs auteurs srsquoaccordent sur lrsquoideacutee selon laquelle le web 20 ne constitue pas

une rupture technologique ni hellip sociale Il srsquoagirait plutocirct drsquoun retour aux sources

drsquoune renaissance du web tel qursquoil a eacuteteacute conccedilu agrave lrsquoorigine les utilisateurs srsquoeacutetant

entre temps approprieacutes les modes de creacuteation et de diffusion

Pour Paul Graham5 pionnier de lrsquoInternet et fondateur de la socieacuteteacute Viaweb en

1995 le web 20 est le web comme il a eacuteteacute conccedilu pour ecirctre utiliseacute Les tendances que

nous distinguons sont simplement la nature inheacuterente du web qui eacutemerge des mauvaises

pratiques qui lui ont eacuteteacute imposeacutees pendant la bulle Internet

Le web creacuteeacute au deacutebut des anneacutees 90 par Tim Berners Lee comportait deacutejagrave en

germe bien des eacuteleacutements du web 20 mutualisation des connaissances eacutechange

travail collaboratif interactiviteacute intelligence collective hellip Ce nrsquoest sans doute pas

un hasard si Dale Dougherty lrsquoun des pegraveres fondateurs de la formule 20 fut lui

aussi lrsquoun des pionniers du web et notamment le fondateur de GNN le premier

portail financeacute par la publiciteacute

Naissance du concept

Crsquoest au cours de lrsquoeacuteteacute 2004 que le terme de web 20 apparaicirct pour la premiegravere

fois lors drsquoune seacuteance de brainstorming Dale Dougerthy co-fondateur de la

socieacuteteacute drsquoeacutedition OrsquoReilly et Craig Cline de MediaLive reacutefleacutechissent agrave des thegravemes

eacutemergents en vue drsquoune confeacuterence agrave venir Le journaliste John Battelle co-

fondateur du magazine Wired se joint un peu plus tard au duo et la premiegravere

confeacuterence Web 20 a lieu en octobre 2004 Lrsquoexpression 20 est utiliseacutee agrave ce

propos pour marquer lrsquoeacutemergence drsquoune nouvelle eacutetape dans la courte histoire du

web eacutetape caracteacuteriseacutee par un changement des regravegles et une modification des

modegraveles de revenus Le volet social sera deacuteveloppeacute plus tardivement par Tim

OReilly lors de la deuxiegraveme confeacuterence Web 20 en octobre 2005

Les nouveaux produits et services associeacutes au web 20 vont ainsi repositionner

lrsquointernaute au cœur du systegraveme Des techniques de publications simples et souples

comme les blogs les plates-formes collaboratives de type Wiki offrent des

possibiliteacutes accrues de production diffusion et consommation des contenus

Lrsquointernaute devient ainsi co-creacuteateur de nouvelles applications en ligne initiant

souvent de faccedilon collective ou communautaire de nouvelles formes de relations

numeacuteriques Selon lrsquoexpression drsquoHubert Guillaud6 le web devient non plus une

aventure technologique mais bien une aventure humaine

copy Digimind Digimind Services ndash White Paper |7

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES 7 PRINCIPES DU WEB 20

Le texte de Tim OrsquoReilly paru en 2005 7 sous le titre Qursquoest ce que le web 20

deacutegage sept principes cleacutes du Web 20 en voici un petit reacutesumeacute

1 Le web vu comme une plate-forme de services

On passe dune collection de sites web agrave une plateforme informatique agrave part

entiegravere fournissant des applications web aux utilisateurs

2 Consideacuterer les internautes comme co-deacuteveloppeurs des applications On passe ainsi

de la notion de logiciel produit agrave celle de logiciel service

3 Le service srsquoameacuteliore quand le nombre drsquoutilisateurs augmente

Le Web 20 met agrave profit lrsquoeffet de la longue traicircne (ou long tail en anglais)

populariseacute par le magazine Wired les produits qui sont lrsquoobjet drsquoune faible

demande ou qui nrsquoont qursquoun faible volume de vente peuvent collectivement

repreacutesenter une part de marcheacute eacutegale ou supeacuterieure agrave celle des best-sellers si les

canaux de distribution peuvent proposer assez de choix Les utilisateurs du Web

20 disposent de donneacutees uniques difficiles agrave recreacuteer et dont la richesse srsquoaccroicirct

avec lrsquoaugmentation du nombre des utilisateurs

4 La richesse est dans les donneacutees Toutes les applications web drsquoimportance sont

lieacutees agrave une base de donneacutees speacutecialiseacutee OrsquoReilly envisage un mouvement des

donneacutees libres srsquoopposant peu agrave peu agrave lrsquounivers des donneacutees proprieacutetaires

5 Tirer parti de lrsquointelligence collective crsquoest le principe mecircme adopteacute par

lencyclopeacutedie en ligne Wikipedia et drsquoautres sites similaires Pour Tim OrsquoReilly

lrsquoimplication des utilisateurs dans le reacuteseau est le facteur-cleacute pour la supreacutematie sur le

marcheacute

6 Mettre en place des interfaces souples et leacutegegraveres fondeacutees sur les nouveaux

standards et protocoles du Web Le logiciel se libegravere du PC Une autre des

caracteacuteristiques du web 20 est le fait qursquoil nrsquoest plus limiteacute agrave la plate-forme PC

mais vise notamment les objets nomades teacuteleacutephone portable PDA ou lecteur

portatif audio

copy Digimind Digimind Services ndash White Paper |8

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LES EVOLUTIONS PAR RAPPORT AU WEB 10 LE ROLE DE LINTERNAUTE

En quoi le Web 20 se distingue-t-il de la vague preacuteceacutedente On a vu que lrsquoune des

caracteacuteristiques majeures du pheacutenomegravene est lrsquoappropriation des contenus et des

modes de diffusion par les internautes eux-mecircmes via des applications souples et

leacutegegraveres

Paul Graham eacutevoque le principe de deacutemocratie du Web 20 cest-agrave-dire la

superposition au reacuteseau technique drsquoun reacuteseau humain qui participe agrave la creacuteation et

agrave lrsquoenrichissement de contenus et services Lrsquointernaute deviendrait ainsi

consommrsquoacteur agrave lui de produire publier diffuser indexer partager des

contenus de tous types

Web 10 Web 20

Leaders du web Entreprises marchands Internautes

Profil de linternaute Passif Actif

Interactiviteacute perccedilue Seacutelection et lecture dinformation

Seacutelection lecture et publication de donneacutees

Uniteacute de recherche Mot-cleacute Tag

Du Web 1 vers le Web 2 Source ZDNet 8

Pour autant les internautes vont-ils devenir tous acteurs de ce processus Selon un

article de Charles Arthur dans The Guardian 9 pour un groupe de 100 personnes si

lrsquoune creacutee du contenu 10 seulement vont interagir en apportant commentaires et

ameacuteliorations les autres se contentant drsquoune consommation passive Ce constat

obtenu via des retours drsquoexpeacuterience sur des sites collaboratifs illustre la regravegle des

11089 selon laquelle plus de 80 des contenus produits proviennent drsquoun

nombre tregraves restreint drsquoutilisateurs

Tendance confirmeacutee par les chiffres preacutesenteacutes lors de la Web 20 Expo en avril 2007

et repris dans Internetactu 10 selon la socieacuteteacute de mesure drsquoaudience Hitwise11

016 des internautes qui passent sur YouTube y placent des films - alors qursquoils

eacutetaient encore 05 agrave le faire en juillet 2006 seulement 02 des visiteurs de

Flickr y publient des photos La seule exception agrave cette faible participation provient

copy Digimind Digimind Services ndash White Paper |9

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de Wikipedia ougrave 46 des visiteurs contribuent agrave lrsquoenrichissement de

semblent en effet

voir eacutecrit des textes longs (en un nombre reacuteduit drsquointerventions) tandis que les

eacutediteursrdquo les plus actifs qui forment le noyau des wikipeacutediens nettoient corrigent

lective fondeacutee sur des actions agrave faible niveau drsquoexigence

(lire enregistrer un signet tagger commenter) de lrsquointelligence collaborative

caracteacuteriseacutee par des formes de participations plus actives et intenses eacutecrire

collaborer modeacutererhellip

lrsquoencyclopeacutedie

Jimmy Wales fondateur de Wikipedia estime qursquoun nombre restreint de

contributeurs et eacutediteurs font lrsquoessentiel du travail alors qursquoun nombre consideacuterable

de lecteurs apportent peu de modifications Le wikipeacutedien Aaron Swartz nuance

ce point de vue un grand nombre de contributeurs occasionnels

a

ldquo

mais sans apporter eacutenormeacutement de texte

Le Web 20 et tout particuliegraverement la blogosphegravere semble suivre la loi de la

participation eacutedicteacutee par Ross Mayfield preacutesident de la socieacuteteacute Social Text sous le

nom de Power law of participation12 Cette loi baseacutee sur lrsquoobservation des

pratiques et des seuils de participation aux dispositifs communautaires constate que

la participation srsquoamenuise agrave mesure que les formes de participation se

complexifient Le scheacutema ci-dessous qui rappelle celui de la Longue Traicircne

distingue lrsquointelligence col

Power Law of Participation par Ross Mayfield CC

copy Digimind Digimind Services ndash White Paper |10

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Le cabinet Forrester deacutetaille enc

de la participation figurant dans son eacutetude Social Technographics 13 la grille compte

6 eacutechelons correspondant aux niveaux de particip

les inactifs (52 )

les spectateurs (33 ) consommateurs de contenus texte ou multimeacutedia (blogs

videacuteos mis en ligne par les utilisateurs podcasts)

ore davantage les niveaux drsquoimplication dans la grille

ation

les menuisiers (19 ) utilisateurs de reacuteseaux sociaux

es collecteurs (15 ) utilisent des flux RSS et taggent les pages web

les critiques (19 ) postent des commentaires sur les blogs des avis et critiques

les creacuteateurs (13 ) publient des contenus en ligne (blogs videacuteos)

l

copy Digimind Digimind Services ndash White Paper |11

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Glossaire du Web 20

Pour mieux comprendre les concepts utiliseacutes dans lunivers du Web 20 nous vous

proposons ce glossaire des termes essentiels

Tags mot clef sous forme drsquo eacutetiquette que les utilisateurs peuvent apposer sur

un document numeacuterique (texte photo videacuteo) de faccedilon agrave en deacutecrire le contenu Le

tagging introduit une part de subjectiviteacute par rapport agrave lrsquoindexation automatique

effectueacutee par les moteurs Les tags peuvent eacutegalement ecirctre extraits

automatiquement drsquoun texte en fonction de leur freacutequence drsquooccurrence

Nuage de tags preacutesente les tags correspondant agrave un site (ou agrave plusieurs) en les

regroupant sur un mecircme espace et leur attribuant une taille variable suivant la

freacutequence dutilisation ou drsquooccurrence Cela donne une vision drsquoensemble des

principales theacutematiques Le site Tagcrowdcom14 permet de geacuteneacuterer un nuage de

tags agrave partir drsquoun texte

Folksonomie (traduit eacutegalement parfois par potonomie peuplonomiehellip)

Ce mot valise contraction de folk (peuple) et taxonomie deacutesigne une forme de

classification collaborative deacutecentraliseacutee spontaneacutee baseacutee non pas sur un

vocabulaire controcircleacute et standardiseacute mais sur des termes choisis par les utilisateurs

eux-mecircmes intituleacutes tags Lrsquoobjectif eacutetant de faciliter lrsquoindexation des contenus

ainsi que la recherche drsquoinformation

Blogs journal personnel disponible sur le web Peut ecirctre tenu par un particulier

un chercheur un journaliste un salarieacute drsquoentreprise ou plus rarement par un groupe

de personne (entreprise collectiviteacutehellip) Le blog a pour objet de diffuser des billets

geacuteneacuteralement lieacutes agrave lrsquoactualiteacute et preacutesenteacutes par ordre chronologique alors qursquoun

wiki est destineacute agrave la mutualisation des connaissances Un blog peut preacutesenter des

contenus multimeacutedias photo (photoblog) son ou videacuteo (vblog vlog)hellip

Blogosphegravere la biosphegravere des blogs Ce mot valise deacutesigne la communauteacute

des blogs ou encore lrsquoensemble des auteurs de blogs La blogosphegravere est largement

interconnecteacutee les trackbacks situeacutes sur la plupart des blogs permettant de lier

copy Digimind Digimind Services ndash White Paper |12

Le Web 20 pour la veille et recherche dinformation DIGIMIND

deux articles traitant de sujets connexes Lrsquoeacutelite des blogueurs particuliegraverement

influents peut ecirctre qualifieacutee ironiquement de blogeoisie

Blogroll ou blogoliste liste de liens vers drsquoautres blogs preacutesenteacutes par lrsquoauteur

drsquoun blog On peut syndiquer sur une mecircme page des billets venant de ces blogs via

les formats RSS

RSS lrsquoacronyme signifie selon les versions Really Simple Syndication (RSS 20) RDF

Site Summary (RSS 09 10 et 11) ou encore Rich Site Summary (RSS 091) Ce

format de syndication permet drsquoextraire automatiquement dun site web ou drsquoun

blog du contenu reacuteguliegraverement mis agrave jour Un fichier RSS est un simple fichier texte

au format XML comportant la description syntheacutetique du contenu Ce format a eacuteteacute

creacuteeacute en 1999 par Netscape On peut srsquoabonner gratuitement agrave plusieurs flux RSS agrave

partir drsquoun lecteur on-line ou installeacute sur le PC

Atom Format normaliseacute de syndication de contenu Web baseacute sur le XML qui

permet la syndication de contenu entre diffeacuterentes ressources Web Concurrent

de RSS Le format Atom a eacuteteacute creacuteeacute dans le but de simplifier les diffeacuterents formats

RSS existants La diffeacuterence entre les deux formats reacuteside surtout dans lemploi de

balises XML diffeacuterentes Les deux formats sont geacuteneacuteralement lus par les

agreacutegateurs

Wiki Site web dynamique dont tout visiteur peut modifier les pages agrave loisir Le

terme vient la langue hawaiumlenne (wikiwiki = rapide) Un wiki a pour objectif de

mutualiser des connaissances et est organiseacute autour drsquoun plan de classement Les

contributeurs drsquoun wiki sont geacuteneacuteralement anonymes

Crowdsourcing Litteacuteralement approvisionnement par la foule Le

crowdsourcing consiste agrave utiliser la creacuteativiteacute lintelligence et le savoir-faire dun

grand nombre dinternautes pour creacuteer des contenus participer agrave lrsquoalimentation

drsquoun site Cette participation des utilisateurs agrave la creacuteation des contenus repreacutesente

une forme drsquoexternalisation (outsourcing) et permet de reacuteduire les coucircts en se

basant sur un systegraveme de beacuteneacutevolat ou de micropaiement

Reacuteseaux sociaux de nombreux sites de social networking ou reacuteseautage social

sont apparus avec la vague du Web 20 Ils permettent de mettre en relation des

personnes partageant les mecircmes centres drsquointeacuterecirct personnels ou professionnels

Ces reacuteseaux peuvent devenir de veacuteritables communauteacutes en ligne les plus fameux

eacutetant les sites Friendster ou Myspace ou bien dans la sphegravere professionnelle

copy Digimind Digimind Services ndash White Paper |13

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linkedin ViadeohellipLa plupart des reacuteseaux sont ouverts certains fonctionnent sur le

mode de la cooptation

Podcasts issu de la combinaison des termes iPod (dApple) et broadcasting ce

terme deacutesigne le fait de rendre disponible en ligne un fichier audio au format

numeacuterique Ce fichier peut-ecirctre teacuteleacutechargeacute directement sur un ordinateur ou un

peacuteripheacuterique via un flux de diffusion Equivalent franccedilais baladodiffusion

Lrsquoutilisateur peut ainsi se composer une liste de lecture agrave la carte Pour les fichiers

videacuteo on emploi le terme de videacuteocast

AJAX (Asynchronous JavaScript And XML) meacutethode informatique de

deacuteveloppement dapplications Web permettant deacuteconomiser de la bande passante

en ne rechargeant pas une page entiegravere alors que seuls certains eacuteleacutements ont besoin

de lecirctre mais en ne rafraicircchissant que ces eacuteleacutements de la page Cela permet de

produire des contenus dynamiques et reacuteactifs en ne neacutecessitant que peu drsquoappels au

serveur heacutebergeant la page AJAX est une combinaison de plusieurs technologies

HTML CSS Javascript XMLhellipDe nombreux sites web 20 sont deacuteveloppeacutes en

AJAX

API Interface de programmation permettant agrave un utilisateur de deacutevelopper des

applications conviviales De nombreux sites classiques ou Web 20 proposent des

API pour inteacutegrer automatiquement leur contenu agrave dautres sites

Mashup ou Mash up application web composite mixant plusieurs sources ou

plusieurs contenus pour fournir un nouveau produit ou service Le terme se traduit

en franccedilais par remixage ou mosaiumlque Exemple de mashup la visualisation des

reacutesultats des eacutelections preacutesidentielles franccedilaises via Google Earth qui mixe les cartes

Google et les chiffres du Ministegravere de lInteacuterieur

Long tail (longue traicircne) Cette expression est utiliseacutee en statistiques et peut

srsquoappliquer au marketing Des produits rares ou qui font lrsquoobjet drsquoune faible

demande peuvent collectivement repreacutesenter une part de marcheacute eacutegale ou

supeacuterieure agrave celle des best-sellers si les canaux de distribution peuvent proposer

assez de choix Le caractegravere virtuel du web permet de geacuteneacuterer une longue seacuterie de

marcheacutes de niche heacuteteacuterogegravenes (exemple e-bay) par opposition aux grands

marcheacutes homogegravenes et grand public du monde reacuteel

copy Digimind Digimind Services ndash White Paper |14

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les technologies du Web 20

Mettons dabord les choses au point le Web 20 nest pas une (r)eacutevolution ou un

concept de dimension technologique

Ses applications sappuient sur des technologies deacutejagrave existantes reacutepondant aux doux

noms dAjax Soap REST RSS Perl Python PHP Ruby ou GreaseMonkey Lobjectif de

ce document nest pas de deacutevelopper ce volet technologique Nous en eacutevoquerons

seulement les grandes caracteacuteristiques pour mieux comprendre les enjeux

Le Web 2 repose notamment sur les interfaces utilisateurs dites riches qui

permettent des possibiliteacutes daffichage de configuration et de maniement plus

puissantes que les pages html classiques du Web 1 que ce soit pour le

deacuteveloppeur ou lutilisateur final

Tim Berners Lee co-inventeur du web remarque en fait ce Web 20 utilise les

standards qursquoont produit tous ces gens qui travaillent sur le Web 10 le Document

object model HTML et SVG (Scalable Vector Graphics) HTTPhellip Le Web 20

construit des services en srsquoappuyant sur les standards du web ainsi que sur JavaScript

(hellip)

Pour se structurer en reacuteseau de bases de donneacutees et services collaboratifs le web

20 utilise donc des technologies matures acircgeacutees de 5 agrave 10 ans pour la plupart

Leacutevolution nest pas tant dans la technologie elle-mecircme que dans la faccedilon de mixer

ces technologies pour apporter des services et une ergonomie nouvelle agrave

lutilisateur

Ainsi lAjax (voir glossaire) que lon cite souvent agrave propos des technologies phares

du Web 2 nest pas un nouveau langage mais un nouveau concept qui utilise les

standards XHTML et CSS DOM (Document Object Model) pour laffichage

dynamique XML et XSLT pour leacutechange de donneacutees ainsi que la reacutecupeacuteration de

donneacutees asynchrones via XMLHttpRequest JavaScript integravegre et combine tout ces

langages Le terme Ajax a eacuteteacute apporteacute par Jesse James Garrett de lrsquoagence web

Adaptive Path

copy Digimind Digimind Services ndash White Paper |15

Le Web 20 pour la veille et recherche dinformation DIGIMIND

LAjax permet notamment de ne recharger que certains eacuteleacutements dune page plutocirct

que la page entiegravere Lors de modifications sur une page seuls les nouveaux

eacuteleacutements se rafraicircchissent eacuteconomisant ainsi des ressources du temps et de la

bande passante Lun des preacutecurseurs grand public dans lutilisation de cette

technologie fut A9 le moteur de recherche dAmazon il neacutetait pas neacutecessaire de

recharger la page agrave chaque fois que lon ajoutait de nouvelles sources et moteurs agrave

interroger 15

Greasemonkey est eacutegalement baseacute sur des scripts Cette extension pour le

navigateur Mozilla Firefox va encore plus loin dans le pouvoir accordeacute agrave linternaute

en exeacutecutant des scripts ce plug-in 16 permet de modifier lapparence des pages

web visiteacutees dy ajouter des fonctions (boutons case agrave cocher suppression des

publiciteacutes) Lutilisateur avanceacute peut mecircme eacutecrire ses propres scripts ou

teacuteleacutecharger des scripts mis agrave la disposition de tous

Le Web 2 est en fait une sorte de web lego qui permet dinnover via lassemblage

de briques les technologies de base sont multiples il est possible de creacuteer de

nouvelles applications agrave valeur ajouteacutee en les assemblant diffeacuteremment ou plus

rationnellement

Les mash-up un mixage de plusieurs applications (voir glossaire) en est une des

illustrations les plus visibles avec les mashups on agreacutege le contenu eacutemanant de

plusieurs sites afin de creacuteer un site nouveau On utilise alors souvent lobjet XML

lAJAX du cocircteacute de linternaute les RSS et les API (Web Services) des sites mixeacutes

LAPI nest donc pas seulement un dieu eacutegyptien Pour faire simple on peut dire

que cest une interface de programmation mise agrave disposition des internautes

(avertis) pour deacutevelopper des applications Une application pourra alors acceacuteder agrave

des programmes systegraveme pour envoyer recevoir ou extraire des donneacutees Ainsi

Google publie lAPI de Google Maps qui est utiliseacute par de nombreux deacuteveloppeurs

pour creacuteer des applications deacuteriveacutees du service de cartographie de Google par

exemple la carte de suivi du teacutelescope spatial Hubble la meacuteteacuteo dans le monde 17

Le rocircle du RSS (voir glossaire) est par ailleurs preacutepondeacuterant Ce format qui

permet dexporter et lire des donneacutees dactualiteacutes au format XML se retrouve dans

quasiment toutes les applications dites Web 2 et peut en constituer lemblegraveme sinon

la caracteacuteristique majeure avec les tags Il permet de surveiller les flux de nouvelles

informations issues de sites dactualiteacutes de blogs de moteurs de recherchehellipbref

de tout site web qui propose un contenu qui se renouvelle Le RSS va aussi servir agrave

exporter des bookmarks sociaux que sont les tags ou les favoris par exemple

copy Digimind Digimind Services ndash White Paper |16

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Si le Web 2 nest pas une reacutevolution technologique en soit la relative simpliciteacute de

mise en place de ces techniques et leurs coucircts de programmation reacuteduits expliquent

le tregraves fort deacuteveloppement que connaissent toutes ces applications Par ailleurs la

baisse constante du coucirct dheacutebergement et de bande passante a faciliteacute la diffusion

de ce web nouvelle geacuteneacuteration

Mais il subsiste des effets de seuil Des applications gigantesques comme Flickr de

Yahoo offrant lheacutebergement et le partage de photos impliquent la gestion de

vastes bases de donneacutees et des infrastructures de stockage importantes Seules de

grandes firmes comme Yahoo Inc Google Microsoft ou AOL par exemple peuvent

se deacutepartir efficacement de ce type de contraintes

copy Digimind Digimind Services ndash White Paper |17

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les familles dapplications du Web 20

TYPOLOGIE

Les familles drsquoapplications Web 20 sont nombreuses et diverses de nouveaux

services apparaissent quotidiennement (sans garantie de peacuterenniteacutehellipet bien souvent

de faccedilon redondante) Sans preacutetendre dresser une liste exhaustive des nombreuses

possibiliteacutes on peut deacutegager une typologie des applications selon diffeacuterents

domaines drsquoactiviteacute Les applications speacutecifiquement deacutedieacutees agrave la veille et agrave la

recherche dinformation seront deacuteveloppeacutees dans la partie suivante

Bureautique en ligne

Courant 2006 Google a lanceacute successivement plusieurs logiciels collaboratifs en

ligne un outil de gestion drsquoagendas (Google Calendar 18) un tableur (Google

Spreadsheet) et enfin apregraves le rachat de la socieacuteteacute Writely un traitement de texte

(Google Docs) 19 Ces logiciels permettent de creacuteer modifier partager et publier en

ligne des documents sur un espace de stockage Depuis plusieurs mois on assiste agrave

une veacuteritable deacuteferlante de logiciels de bureautique en ligne deacutesigneacutes parfois sous le

terme de web office RallyPoint AjaxWrite (pour Firefox uniquement) ZohoWriter

ThinkfreehellipOutre la gratuiteacute lrsquointeacuterecirct de ces logiciels concurrents de la suite

Microsoft Office est leur disponibiliteacute sur toute machine connecteacutee au reacuteseau et tout

systegraveme drsquoexploitation Attention toutefois aux questions de sauvegarde de

compatibiliteacute de synchronisation des donneacutees et enfin de confidentialiteacutehellip

Emploi

Les blogs constituent un bon moyen pour promouvoir son CV mettre en avant

expeacuterience et compeacutetences et faciliter les eacutechanges Des jobblogs verticaux

speacutecialiseacutes par secteur ou reacutegion connaissent un grand succegraves (voir par exemple

ceux du site et moteur Moovement20) Le networking professionnel est eacutegalement agrave

la mode agrave travers des sites comme Linkedin (creacuteeacute en 2003 aux Etats-Unis) Viadeo

(ex Viaduc drsquoorigine franccedilaise) ou Xing (ex OpenBC agrave vocation europeacuteenne) Le

principe est de tirer parti des reacuteseaux de connexions sociales virtuelles afin

copy Digimind Digimind Services ndash White Paper |18

Le Web 20 pour la veille et recherche dinformation DIGIMIND

drsquoidentifier des salarieacutes ou employeurs potentiels mais aussi drsquoeacutetoffer son reacuteseau de

clients partenaires fournisseurshellip

Lrsquoe-cooptation (Cooptin Jobmeeters 21) met le reacuteseau au cœur de la deacutemarche de

recrutement via un systegraveme de prime de cooptation et peut aider les demandeurs

agrave identifier les offres du marcheacute cacheacute

Commerce en ligne

Le client est roi et le Web 20 permet de rehausser son niveau de participation sur

les sites marchands On peut ainsi tagger ou annoter des reacutefeacuterences drsquoouvrages dans

le catalogue Amazon Gracircce agrave des sites comme Zlio ou la Shoposphegravere de Yahoo22

les internautes peuvent recommander agrave leur entourage des produits et

serviceshellipen touchant une commission sur les ventes reacutealiseacutees Des guides drsquoachat

et comparateurs de prix comme Ciao integravegrent les avis de consommateurs et

drsquoexperts Le site Wantuno (inspireacute de lrsquoameacutericain Woot) innove dans le domaine

de la vente eacuteveacutenementielle en vendant un seul produit nouveau high tech par jour

annonceacute en podcast videacuteo agrave des internautes preacutevenus par flux RSS23 Certains

analystes voient lrsquoavenir du commerce eacutelectronique dans le concept de CtoB

(Consumer to Business) inverse du BtoChellip

Geacuteolocalisation

Google Maps a eacuteteacute lrsquoun des premiers services de geacuteolocalisation en srsquoappuyant sur

lrsquooutil de recherche pour localiser sur des cartes des services de proximiteacute

(commerces station servicehellip) La version 2 du site Geacuteoportail de lrsquoIGN disponible

depuis fin mai 2007 srsquoenrichit de nouveaux services pratiques et citoyens (accegraves au

cadastre visualisation des zones agrave risquehellip) Google Earth fait lrsquoobjet de partenariats

avec la NASA ou le programme des Nations Unies pour lrsquoenvironnement La

geacuteolocalisation peut srsquoadapter eacutegalement au partage de photos (Yahoo Maps et

Flickr ou le projet Pikeo chez Orange)24

Recherche drsquoinformations

Des agreacutegateurs de meacutedia comme Digg ou Wikio laissent une large place agrave

lrsquointernaute pour tagger ou recommander par vote les articles issus de meacutedias

classiques ou blogs On suivra eacutegalement lrsquoactualiteacute en syndiquant des flux RSS agrave

travers des agreacutegateurs comme Netvibes ou Newsgator Les grands moteurs (Google

Custom Search Yahoo Search Builder MSN Live search Macros) offrent des options de

copy Digimind Digimind Services ndash White Paper |19

Le Web 20 pour la veille et recherche dinformation DIGIMIND

creacuteation de moteurs personnalisables effectuant des recherches sur des bouquets

de sources preacuteseacutelectionneacutees par lrsquoutilisateur On peut mutualiser les connaissances agrave

travers des wikis collaboratifs geacuteneacuteralistes (Wikipedia) ou speacutecialiseacutes Enfin le projet

de moteur collaboratif Wikiasari qui doit aboutir courant 2007 aura recours aux

mecircmes technologies libres que la ceacutelegravebre encyclopeacutedie ainsi qursquoagrave un reacuteseau humain

ou communauteacute de confiance qui validera les reacutesultats de la recherche

Les actualiteacutes sur Wikio sites de presse blogs et navigation par tags (agrave droite)

Diffusion drsquoactualiteacutes

Pour Pierre Chappaz fondateur du site Wikio les blogueurs ne sont pas journalistes

mais ils peuvent apporter une vraie expertise sur certains sujets quils connaissent et il

serait dommage de sen priver Selon lui les meacutedias 20 ne seront plus des canaux

exclusifs de diffusion mais producteurs de contenu et des marques Deacutesormais le

scoop nrsquoest plus lrsquoapanage des seuls journalistes aux Etats-Unis une jurisprudence

donne droit depuis 2006 aux blogueurs de proteacuteger leurs sources au mecircme titre

que les journalistes professionnels Des centaines de blogs politiques ont fleuri sur le

web certains drsquoentre eux se reacuteveacutelant particuliegraverement influents On parlera de

journalisme citoyen agrave propos de sites comme Agoravox ou de lrsquo alleacutee

numeacuterique Rue 89 lanceacutee en mai 2007 par drsquoanciens journalistes du quotidien

Libeacuteration Ces nouveaux meacutedias en ligne marient les communications venant de

journalistes professionnels experts et internautes

copy Digimind Digimind Services ndash White Paper |20

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Loisirs

On retrouve ici la notion de filtrage collaboratif baseacute sur un systegraveme de

recommandations et drsquoeacutevaluations par les utilisateurs Ces recommandations

peuvent concerner les livres les destinations de voyage la musique la videacuteohellipet

proviennent de lrsquoanalyse de comportements drsquoachats des internautes et de leurs

eacutevaluations de produits Le moteur drsquoanalyse preacutedictive Criteo 25 a ainsi lanceacute en

feacutevrier 2007 un service de recommandations automatique de blogs apregraves avoir

utiliseacute sa technologie pour lrsquoeacutevaluation de videacuteos

La participation des internautes peut aller jusqursquoau financement et agrave la production

drsquoœuvres artistiques le projet A swarm of angels permet drsquoaider agrave la creacuteation de

films qui seront distribueacutes sous licence creative commons et diffuseacutes via les reacuteseaux

peer-to-peer

Partage de documents multimeacutedia

Il srsquoagit sans doute drsquoune des applications les plus reacutepandues du Web 20 Les grands

acteurs du web ont largement investi ce domaine Google a racheteacute en 2006 le site

de partage de videacuteo Youtube Yahoo de son cocircteacute avait racheteacute le site de partage de

photos Flickr Les favoris peuvent eacutegalement ecirctre mutualiseacutes via des services en

ligne comme Delicious (groupe Yahoo) ou Blogmarks De nombreux services de

partages de photos videacuteo ou podcasts se sont deacuteveloppeacutes reacutecemment on peut

citer parmi eux les sites franccedilais DailyMotion ou la banque drsquoimages Fotolia Podemus

ou Radioblog figurent parmi les sites communautaires de podcasts

Enseignement et recherche

Henry Jenkins26 professeur au MIT imagine des uniteacutes drsquoenseignement conccedilues

sur les modegraveles YouTube ou Wikipedia des deacutepartements qui ldquopermettraient le

deacuteploiement rapide drsquoexpertises disperseacutees et la reconfiguration des champsrdquo De

nouveaux usages apparaissent dans le paysage eacuteducatif mais attention lagrave encore agrave

lrsquoillusion de faciliteacute selon le philosophe Fernando Savater laquo Internet neacuteduque pas il

neacutecessite mecircme une eacuteducation preacutealable raquo Olivier Ertzcheid dans son blog Affordance 27 distingue plusieurs eacuteleacutements caracteacuteristiques drsquoune science 20 et notamment

la possibiliteacute drsquoannoter et commenter des publications scientifiques (notamment les

collections Open Acess Plos One28) ou de nouveaux modes drsquointerrogation des

bases de donneacutees (interface Hubmed sur la base meacutedicale Medline)

copy Digimind Digimind Services ndash White Paper |21

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Marie France Blanquet29 maicirctre de confeacuterence en sciences de lrsquoinformation

distingue le travail coopeacuteratif du travail collaboratif En matiegravere drsquoapprentissage le

travail coopeacuteratif reacutealiseacute par chaque eacutequipe contribue agrave une œuvre collective ougrave le

rocircle de chacun est deacutefini de faccedilon claire Lrsquoapprentissage collaboratif reacutesulte du

travail individuel soutenu par des activiteacutes de groupe ou drsquoeacutequipes de faccedilon souple

et ouverte Ce type de travail se base sur les capaciteacutes de communication et

drsquointeraction de chacun Lrsquoeacutecriture collective des articles composant lrsquoencyclopeacutedie

Wikipeacutedia en est un exemple

Plusieurs expeacuterimentations drsquousage des blogs et podcasts ont eacuteteacute tenteacutees agrave

lrsquoUniversiteacute A Lyon II des eacutetudiants ont pu enregistrer des cours sur un Ipod pour

diffusion en podcast sur leurs blogs A lrsquoUniversiteacute Catholique de Lille les eacutetudiants

de Jean-Paul Pinte30 chargeacute de lrsquoinnovation peacutedagogique doivent alimenter

reacuteguliegraverement un blog Pour ce chercheur speacutecialiste de la veille en eacuteducation le

renouveau des meacutethodes drsquoenseignement se traduit par le rocircles des Enseignants

Connecteurs et eacutetudiants proneacutetaires

Bibliothegraveques

La bibliothegraveque 20 place elle aussi lrsquoutilisateur au centre et ce agrave travers plusieurs

types drsquoexpeacuterimentations de lrsquoutilisation des logiciels de messagerie instantaneacutee

pour eacutechanger avec les utilisateurs agrave lrsquointeacutegration de tags pour enrichir les

catalogues en passant par des interfaces de consultation simplifieacuteeshellip De

nombreux blogs de bibliotheacutecaires (Bibliobsession 31) permettent de suivre lrsquoeacutetat de

lrsquoart La bibliothegraveque de lrsquoUniversiteacute drsquoAlbany est alleacutee jusqursquoagrave publier un manifeste

du bibliotheacutecaire 20 32

copy Digimind Digimind Services ndash White Paper |22

Le Web 20 pour la veille et recherche dinformation DIGIMIND

COMMENT IDENTIFIER UN SITE WEB 20

Est-ce que le site sur lequel vous naviguez ou lapplication que vous utilisez est

Web 20 Quelle importance pourrait-on reacutepondrehellipToutefois un site de cette

geacuteneacuteration offrira plus de possibiliteacutes agrave vous lutilisateur Pour reconnaicirctre un tel

site quelques caracteacuteristiques sont agrave retenir

- le type de site il appartiendra agrave lune des grandes familles citeacutees plus haut il sera

blog bookmark ou reacuteseau social mashup ou page personnalisable bref il permet

de partager et de diffuser du contenu aiseacutement Le site peut ecirctre lui-mecircme une

application Web 2 ou en inteacutegrer des briques Exemple un site Corporate qui

heacuteberge des blogs de ses salarieacutes etou diffuse son actualiteacute via un fils RSS

- le rocircle de lutilisateur le site Web 2 vous permet de participer de personnaliser

et de collaborer vous pouvez en effet ajouter des commentaires eacutecrire un billet

lire un flux RSS noter (voter) ou annoter un article teacuteleacutecharger ou uploader des

images des videacuteos eacutecouter un podcast Ces sites proposent souvent des interfaces

personnalisables couleurs style organisation de laffichage du contenuhellip

- la navigation elle est plutocirct simplifieacutee par rapport aux sites de premiegravere

geacuteneacuteration Les menus sont plus leacutegers un flux RSS est toujours proposeacute et un

nuage de tags est souvent preacutesent

- le testeur cest vous non content de faire apporter une partie de son contenu par

linternaute un service Web 20 fait en plus souvent tester ses applications agrave ses

utilisateurs et est donc freacutequemment en version becircta (voire alpha) une becircta

publique ou priveacutee (linternaute fait alors partie dun petit cercle dinitieacutes dans le

secret des dieux)

copy Digimind Digimind Services ndash White Paper |23

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les applications Web 20

pour la veille et la

recherche dinformations

LES TYPES DAPPLICATIONS

Pour le veilleur et le chercheur dinformation les applications du Web 20 sont

riches tant dans les possibiliteacutes offertes par leurs interfaces que dans le contenu

diffuseacute Mieux connaicirctre ces services permettra de trouver davantage dinformation

(ou autrement) de gagner du temps de mieux partager voire decirctre plus visible sur

le web

Vous laurez compris le web 20 se fonde essentiellement sur la notion de partage

de participation et de collaboration entre les individus Ce nest pas forceacutement

toujours facile possible voire autoriseacute dans le monde professionnel Mais partager

cest aussi agrave terme pouvoir recevoirhellip

I Partager et collaborer

a Les Bookmarks sociaux

Les bookmarks sociaux sont une des applications les plus caracteacuteristiques du Web 2

et en sont preacutecurseurs Apparus en 2004 ces services vous offrent la possibiliteacute de

partager vos bookmarks cest-agrave-dire vos favoris Ainsi apregraves enregistrement le plus

souvent gratuit vous pouvez mettre en ligne tout ou partie de vos favoris (titre

copy Digimind Digimind Services ndash White Paper |24

Le Web 20 pour la veille et recherche dinformation DIGIMIND

adresse et description dune page ou site) et les rendre potentiellement accessibles

aux internautes du monde entier et du moins aux utilisateurs de ce service Vous

avez la possibiliteacute de garder ces favoris priveacutes en ne les partageant quavec vos

proches ou seulementhellipvous-mecircme

Ces applications sont au deacutepart tregraves simples et proposent ensuite suivant les sites

plus ou moins de perfectionnements il suffit dajouter le nom et ladresse (url) de la

page web qui vous inteacuteresse assortis des commentaires de votre choix Ces

adresses web sont rattacheacutees agrave un espace qui vous est personnel auquel vous

acceacutedez en vous identifiant Cet espace personnel est identifiable via une adresse

preacutecise Par exemple sur Delicious33 (de Yahoo) lun des services de bookmarks

sociaux les plus utiliseacutes lurl deacutesignant mes favoris est httpdeliciousslide68 En

naviguant sur Delicious vous pouvez acceacuteder aux favoris mis en ligne par des

collaborateurs amis ou inconnus qui partagent les mecircmes inteacuterecircts et passions que

vous Leurs pages sont eacutegalement identifieacutees par une url unique

Lajout dadresse

Lajout dadresse seffectue en se connectant directement sur le site de

bookmarking social ou plus pratique via une barre ou un bouton deacutedieacutes qui

inteacutegreacutes agrave votre navigateur facilitent lajout du site que vous ecirctes en train de visiter

Vous pouvez eacutegalement trouver des icocircnes sur des pages web vous proposant

dajouter un contenu un site agrave votre service de social bookmaking Peut-ecirctre avez-

vous deacutejagrave rencontreacute ces icocircnes agrave la fin dun billet de blog par exemple (voir

illustration ci-dessous) Ils permettent alors dajouter ladresse du billet agrave un ou

plusieurs services de bookmarks sociaux ainsi quagrave des services dactualiteacutes

collaboratives (nous en reparlerons plus bas)

copy Digimind Digimind Services ndash White Paper |25

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ce blog propose via des icocircnes lajout de ce billet dans les favoris de Delicious ou les services sociaux dactualiteacutes

Lorsque vous ajoutez une adresse vous lui attribuez des tags (voir glossaire) cest-agrave-

dire un ou plusieurs mots cleacutes de votre choix qui vont caracteacuteriser expliquer

contextualiser eacutetiqueter le favori et donc lidentifier de maniegravere simple pour vous et

tous les visiteurs Cest une information qui vient sajouter agrave la traditionnelle

description du site Cest donc vous qui choisissez votre propre mode de

classement de hieacuterarchisation et de labellisation (et non plus un service qui vous

propose de ranger vos ressources dans des cateacutegories preacutedeacutefinies) Cette possibiliteacute

fait partie de ce que lon appelle la folksonomie agrave savoir une taxonomie (science du

classement) populaire en quelque sorte

Ainsi vous pouvez ajouter ladresse du site portail NanotechNow

httpwwwnanotech-nowcom consacreacute aux nanotechnologies et y adjoindre les

tags nano nanotehnologies sciences science research mais aussi pourquoi

pas qualiteacute excellent pour donner votre opinion

copy Digimind Digimind Services ndash White Paper |26

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Des favoris consacreacutes agrave la Chine dans Delicious A droite les tags associeacutes agrave ces bookmarks Les tags

Sur une application typique de social bookmarking (type delicious) il est possible

de rechercher sur le titre des favoris de tous les autres utilisateurs et aussi sur

leurs tags Ainsi en cliquant sur le tag Nanotech vous obtiendrez la liste de tous

les favoris que les internautes ont classeacutes sous ce label Cest lagrave lun des principaux

inteacuterecircts la possibiliteacute de rechercher sur le nom des eacutetiquettes textuelles deacutefinies

par les internautes eux-mecircmes Mais tous les internautes nont pas la mecircme logique

de classement et il est fort possible de passer agrave coteacute de favoris inteacuteressants mais

eacutetiqueteacutes selon un mot auquel vous nauriez jamais penseacute De plus un mecircme mot

peut avoir plusieurs sens ou ecirctre employeacute diffeacuteremment selon les individus

Delicious a reacutesolu ndashpartiellement- ce problegraveme en offrant la possibiliteacute de deacutecrire

ses tags cest agrave dire de les expliquer (par orange je parle de la couleur ou de la

production dagrumes en Floride) Cest donc un deacutebut de seacutemantique appliqueacute agrave

cette folksonomie Quoiquil en soit le problegraveme du sens des mots employeacutes par

les creacuteateurs de contenu concerne lensemble du web Lorsque vous ne trouvez

pas un site via une requecircte sur un outil de recherche et que ce site existe pourtant

bel et bien cest souvent parce que vous nemployez pas les mecircmes mots cleacutes que

ceux utiliseacutes par le creacuteateur du site dans son texte

Les tags peuvent eacutegalement sappliquer agrave des photos (Flickr) agrave des projets

(43Things) ou des videacuteos (YouTube DailyMotion) Ils peuvent servir aussi agrave eacutetiqueter

et cateacutegoriser les billets dun blog

copy Digimind Digimind Services ndash White Paper |27

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les communauteacutes

Lautre atout des bookmarks sociaux pouvoir constituer et se connecter avec

une communauteacute de speacutecialistes Par speacutecialiste on deacutesignera simplement un

internaute qui centre ses recherches sur les mecircmes sujets que vous quil soit

amateur ou professionnel

Exemple Votre domaine ce sont les biotechnologies En entrant la requecircte

Biotechnologies sur le moteur de recherche de Delicious vous obtenez une liste

de plusieurs milliers de favoris Pour chacun dentre eux est indiqueacute le nombre de

personnes qui ont sauvegardeacute cette mecircme adresse En seacutelectionnant lun de ces

utilisateurs vous pouvez deacutecouvrir un internaute qui comme vous reacuteguliegraverement

ajoute des adresses de sites deacutedieacutes ou connexes aux biotech Il ne vous reste plus

quagrave mettre en surveillance ce membre de delicious Il disposera en effet de sa

propre adresse XML Exemple httpdeliciousrssvantive98 Vous serez alors

averti degraves lors que cet utilisateur ajoute un favori agrave sa page

La valeur des outils de social bookmarking est encore plus probante lorsquils sont

deacutedieacutes agrave des communauteacutes de pratiques ou agrave des secteurs dactiviteacutes bien preacutecis

Plusieurs initiatives ont deacutejagrave eacuteteacute mises en ligne34 On peut citer Connotea eacutediteacute par

la ceacutelegravebre revue Nature et donc destineacute agrave un public scientifique Lors de la mise en

favoris ce service extrait automatiquement les reacutefeacuterences bibliographiques

lorsquelles sont issues de sites tels que Nature Science ou PubMed Plus ancien

CiteUlike est baseacute sur le mecircme principe mais est compatible avec davantage de

revues scientifiques encore Snipitron est lui deacutedieacute aux chercheurs eacutetudiants et

professionnels Ici vos bookmarks font partie dun projet qui seacutecoule dans le temps

concernant une recherche ou une tacircche preacutecise

Linteacuterecirct des bookmarks sociaux est donc dabord dans lutilisation de la

communauteacute afin de trouver des sources pertinentes Ce type doutil reacutevegravele toute

sa puissance lorsquun utilisateur proche de vous en terme de domaines de veille a

eacuteteacute identifieacute Vous pouvez donc alors lutiliser comme collaborateur virtuel mais

aussi rechercher parmi les sources jugeacutees pertinentes par un groupe dutilisateurs

identifier des leaders de veille ou juger de la populariteacute dune source (combien de

fois a-t-elle eacuteteacute mise en favoris Ce nombre de sauvegardes neacutetant quun indicateur

parmi dautres) Si vous ne partagez pas ces outils restent toutefois un tregraves bon

moyen de meacutemoriser et cateacutegoriser vos favoris en un point unique daccegraves

copy Digimind Digimind Services ndash White Paper |28

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Quel service

Il existe plusieurs dizaines de services de bookmarks sociaux Ils proposent des

fonctionnaliteacutes plus ou moins sophistiqueacutees Un des critegraveres essentiels de choix est

leur succegraves En effet leur force repose en grande partie sur le nombre de favoris

dutilisateurs partageacutes agrave moins de freacutequenter des bookmarks deacutedieacutes agrave des

communauteacutes tregraves cibleacutees Dautre part la rapiditeacute du service et la pertinence de

son moteur de recherche sont aussi des paramegravetres importants

Delicious qui appartient agrave Yahoo est lun des plus connus et des plus utiliseacutes Yahoo

MyWeb2 rassemble eacutegalement une grande communauteacute ainsi que Furl ou encore

Blogmarks et Blinklist35 Certains de ces sites au-delagrave de larchivage de ladresse

proposent de conserver une copie inteacutegrale dune page web Dautres vous

suggegraverent des sites similaires agrave ceux que vous avez mis dans vos favoris Cette

similariteacute se base notamment sur les favoris ajouteacutes par les autres utilisateurs La

recherche par similariteacute (ou par suggestion en fonction de vos habitudes de

navigation) offerte par des services comme Yoono StumbleUpon ou Similicious 36 est

une meacutethodologie de recherche particuliegraverement inteacuteressante Nous en reparlerons

plus loin

Pour choisir preacuteciseacutement votre service de bookmarks sociaux vous pouvez vous

aider de ces ressources 37

- le site Irox propose un tableau comparatif de pregraves de 20 services

- le blog de Robin Good offre une seacutelection inteacuteressante de bookmarks sociaux

- la page Free Bookmark Managers affiche une liste dune quarantaine de logiciels et

utilitaires deacutedieacutes au partage et agrave la gestion de vos favoris (bookmarks) en ligne via

accegraves distant en local ou sur serveur Attention tous ne sont pas sociaux cest-agrave-

dire baseacutes sur le partage

copy Digimind Digimind Services ndash White Paper |29

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b Le Multimeacutedia photos et videacuteos

Le partage de vos ressources ne se limite pas au texte et adresse de sites Il est

eacutegalement possible de partager vos photos et videacuteos

Les images

Flickr 38 racheteacute par Yahoo Inc en 2005 est lapplication type de partage dimages

voire mecircme larcheacutetype du service Web 20 ce site permet de mettre en ligne ses

photos de les partager avec ses proches ses collegravegues ou de les laisser en accegraves

priveacute

Il est possible dutiliser un moteur pour rechercher agrave travers les millions de photos

mises en ligne par les autres utilisateurs

Flickr na pas de points communs avec les nombreuses applications Web 2 en becircta agrave

linterface artisanale Sur le service de Yahoo la puissante interface en fait un outil

tregraves simple agrave utiliser Ainsi via le menu Organize vous pouvez acceacuteder agrave une

veacuteritable table de montage virtuelle pour organiser vos photos

copy Digimind Digimind Services ndash White Paper |30

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur Flickr A droite les noms dutilisateurs et les tags associeacutes aux photos

Comme sur les bookmarks sociaux la recherche peut seffectuer sur le titre ou la

description mais aussi sur les tags chaque internaute qui partage ses photos leur

attribue des mots cleacutes pour les deacutefinir les expliquer les contextualiser voire donner

son opinion

Chaque liste de reacutesultats chaque photo est accompagneacutee par ses tags Ceux-ci

permettent aussi daffiner ou deacutelargir votre recherche lorsque vous en seacutelectionnez

un Il est possible de rechercher sur les photos les utilisateurs mais aussi sur les

groupes En effet la notion de communauteacute est eacutegalement importante Les

groupes rassemblent les utilisateurs qui partagent les mecircmes centres dinteacuterecirct

photographiques Des forums de discussions sont inteacutegreacutes agrave ces groupes

permettant dentrer en contact direct avec certains membres

copy Digimind Digimind Services ndash White Paper |31

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Par exemple le groupe The Eyes Have It 39 rassemble les utilisateurs (et donc leurs

photos) autour du thegraveme de la communication visuelle des secteurs pharmacie et

biotech

Que peut trouver le veilleur sur un service de photos tel que Flickr

Finalement la mecircme chose que sur les bookmarks sociaux tout ce que les

membres ont voulu partager des photos du dernier salon automobile de Detroit 40

ou de la convention annuelle des industries cosmeacutetiques dAmeacuterique du Nord La

veille concurrentielle ou la veille image sur votre propre socieacuteteacute est eacutegalement

inteacuteressante Ainsi une recherche (full text) sur la socieacuteteacute peacutetroliegravere Exxon affiche

plus de 1400 photos relatives aux stations services aux puits de peacutetrole aux

raffineries aux employeacutes aux manifestions de contestataires ou aux publiciteacutes

deacutetourneacutees

Comme avec le social bookmarking vous pouvez vous attacher agrave suivre les

membres qui partagent les mecircmes centres dinteacuterecirct que vous ou votre organisation

apregraves seacutelection de la page de lutilisateur la mise en surveillance de son flux RSS

permet decirctre averti degraves que cette personne ajoute de nouvelles photos

Dautres services permettant le partage de photos existent Toutefois ils ne vont

pas aussi loin que Flickr dans la logique Web 20 Le service PhotoBucket 41 est le

grand concurrent de Flickr mais avec une approche plus grand public Flickr est

davantage freacutequenteacute par des internautes avertis des professionnels et des

passionneacutes de photographie En ce sens le service de Yahoo sera donc plus

inteacuteressant pour le veilleur

Squidoo 42 est en quelque sorte un annuaire de bookmarks perfectionneacute une

rencontre de services sociaux comme Delicious et Flickr Squidoo vous permet en

effet de creacuteer une page de liens dans un domaine qui vous passionne et de la

structurer en rubriques agreacutementeacutees de photos

Linterface simple rend possible la creacuteation rapide de pages speacutecialiseacutees (appeleacutees

lensgtobjectifs lentilles) et de les rendre visible agrave tout un chacun On trouve par

exemple plusieurs lens consacreacutees aux nanotechnologies43 Chaque lens est

accompagneacutee de tags connexes agrave son sujet

Vous pouvez rechercher ces pages gracircce agrave un moteur de recherche un reacutepertoire

par cateacutegories un nuage de tags (exemple le tag Marketing 44) ou mecircme parcourir

le Top100

copy Digimind Digimind Services ndash White Paper |32

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La videacuteo

Via les services YouTube ou DailyMotion le partage de videacuteos en ligne est plus

meacutediatiseacute que les services de photos Notamment parce que le leader Google a

racheteacute YouTube en octobre 2006 geacuteneacuterant un buzz sans preacutecegravedent au sein des

blogs et de la presse traditionnelle (Mainstream medias)

YouTube 45 et ses concurrents Web 20 fonctionnent agrave peu pregraves de maniegravere

eacutequivalente agrave Flickr sans en atteindre toutefois sa clarteacute ergonomique

Tout ces sites de videacuteos vont permettre drsquouploader (charger vers le site) et

partager vos videacuteos (converties automatiquement au format FlashVideo) et aussi

bien sucircr de rechercher parmi les videacuteos des autres utilisateurs

Sur ces applications on retrouve de nombreuses caracteacuteristiques du Web 2 les

videacuteos classeacutees par cateacutegories sont accompagneacutees de tags qui aident agrave les

contextualiser et les deacutecrire en plus du titre et de la description renseigneacutes par

lutilisateur Un fils RSS permet de surveiller lajout de videacuteos dans une cateacutegorie ou

par un utilisateur deacutefini A linstar des billets dun blog les internautes peuvent

commenter les videacuteos De plus les videacuteos sont noteacutees ce qui impacte ensuite leur

place dans le classement et donc leur visibiliteacute

Ces services contiennent des favoris inteacutegreacutes ougrave lon peut sauvegarder ses videacuteos

preacutefeacutereacutees Il est possible de partager sa videacuteo par mail ou messagerie instantaneacutee

de la poster sur son blog Dailleurs de nombreux blogueurs utilisent les services de

type YouTube (ou Flickr pour la photo) pour stocker leurs fichiers multimeacutedias trop

volumineux pour les heacutebergeurs de blogs La notion de groupe comme sur Flickr

est preacutesente des communauteacutes rassemblent des utilisateurs autour de grandes

theacutematiques lieacutees par exemple agrave la politique aux sports et aux voyages

YouTube a de nombreux concurrents aux fonctions tregraves proches Impossible de

tous les mentionner Mais on peut retenir cependant le franccedilais DailyMotion 46 tregraves

populaire dailleurs neacute quelques semaines avant YouTube Citons eacutegalement Yahoo

Videos AOL Videos Revver Grouper (de Sony) Metacafe SoapBox (de Microsoft)

Zudeo Wideo MySpace Vimeo 47Certains de ces services proposent du contenu

amateur ainsi que des films professionnels issus des networks de TV et de cineacutema

Mais les plus petits services se cantonnent aux videacuteos envoyeacutees par linternaute que

celles-ci aient dailleurs eacuteteacute copieacutees ou non

copy Digimind Digimind Services ndash White Paper |33

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche sur DailyMotion

Quel contenu agrave usage professionnel le veilleur peut espeacuterer trouver sur ces

plateformes Essentiellement des videacuteos consacreacutees agrave des socieacuteteacutes et individus

Ainsi si je reacuteitegravere ma recherche sur la socieacuteteacute peacutetroliegravere Exxon jobtiens des videacuteos

sur des manifestations des mareacutees noires le reacutechauffement climatique des

actualiteacutes boursiegraveres des retransmissions de procegraves des deacutetournements de

publiciteacutehellipLa recherche de videacuteos saverra particuliegraverement utile pour une veille

Image Produits ou concurrentielle Le contenu de videacuteos est eacutegalement souvent

tregraves politique agrave partir de la campagne des eacutelections preacutesidentielles franccedilaises de

2007 la diffusion de videacuteos sur les hommes et femmes politiques est devenue une

veacuteritable arme Autre aspect inteacuteressant la possibiliteacute de deacutecouvrir de nombreux

extraits de videacuteos de documentaires sur des sujets extrecircmement varieacutes eacutecologie

industrie socieacuteteacute consommation

Le contenu de ces services de videacuteos est donc agrave limage du net heacuteteacuterogegravene mais

potentiellement riche

copy Digimind Digimind Services ndash White Paper |34

Le Web 20 pour la veille et recherche dinformation DIGIMIND

c Partage de CV et reacuteseaux sociaux

Termineacute le temps ou seules les personnes agrave qui vous transmettiez votre CV ou

votre carte de visite pouvaient prendre connaissance de votre identiteacute et de votre

parcours professionnel Via les plateformes de reacuteseaux sociaux le push fait place au

pull de plus dans une optique de cooptation et de recommandation il y est

possible de mettre son CV en ligne sous format hypertexte et de demander agrave

rentrer en relation avec des proches de votre reacuteseau immeacutediat Les plateformes de

reacuteseaux sociaux sont nombreuses certaines sont agrave vocation geacuteneacuteraliste dautres

uniquement deacutedieacutees aux actifs dautres encore reacuteserveacutees agrave une communauteacute

(eacutetudiants lyceacuteens anciens eacutelegraveves passionneacutes de voyages)

Ces applications repreacutesentent un marcheacute conseacutequent puisque pour les seuls USA

on preacutevoit un chiffre daffaires des reacuteseaux sociaux de 25 milliards de dollars agrave

lhorizon 2011 contre 350 millions en 200648 La France est domineacutee par la

plateforme Viadeo (ex-Viaduc)49 Ce service leader lanceacute en 2004 compte plus de

750 000 profils Dans les autres pays cest LinkedIn 50 qui domine geacuteneacuteralement

avec plus de 9 millions dutilisateurs dans 135 pays

Une recherche sur Viadeo

copy Digimind Digimind Services ndash White Paper |35

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les fonctionnaliteacutes

Que trouve-t-on sur ces sites Notamment des profils de personnes en activiteacute ou

en recherche demploi ainsi que des hubs regroupant des utilisateurs autour dun

mecircme centre dinteacuterecirct toujours la notion de communauteacutes de pratiques propre au

Web 20 Sur ces services tout est penseacute pour creacuteer du lien social Le profil

individuel se constitue dun CV enrichi de nombreux liens vers ses employeurs ses

amis ses reacuteseaux professionnels et associatifs ses travaux et publications Les hubs

regroupent les personnes autour de secteurs meacutetiers associations danciens eacutelegraveves

pays reacutegions Par exemple sur Viadeo saffichent les hubs Analyse Veille

Strateacutegique amp Concurrentielle Intelligence Eco Blogs amp Bloggers Editeurs de

Logiciels Profession documentaliste and co mais aussi Grande distribution

Oceacuteanie ou Normes meacutethodes et outils Dans ces hubs des forums organisent les

discussions des membres autour de theacutematiques deacutefinies Un moteur de recherche

permet de trouver des profils selon un secteur une fonction une reacutegion Une fois

un profil identifieacute il faut demander agrave entrer en relation avec lui Cela sera dautant

plus facile et rapide sil est peu eacuteloigneacute de votre propre reacuteseau de contacts

La veille

Linteacuterecirct pour le professionnel de linformation est double il peut augmenter sa

visibiliteacute et celle de certains de ses projets services publications thegraveses ou articles

Dautre part il peut rechercher des donneacutees sur des personnes et entreprises ou

identifier un expert Comme sur dautres services Web 20 il est facile de se

constituer une communauteacute dutilisateurs partageant ses centres dinteacuterecirct que lon

visitera reacuteguliegraverement Ainsi sur Viadeo une recherche sur le secteur Agro-

alimentaire avec le mot cleacute veilleur 1 affiche plus de 50 reacutesultats avec les fonctions

entreprises et synthegraveses de parcours des membres Vous pouvez alors entrer en

relation avec ces personnes ou tout simplement collecter des donneacutees sur celles-ci

et leurs reacuteseaux Ces sites sont dailleurs devenus un outil essentiel pour certaines

fonctions commerciaux pour la prospection recruteurs journalistes

ethellipresponsables de casting pour eacutemissions TV

1 Certaines fonctionnaliteacutes avanceacutees sont payantes

copy Digimind Digimind Services ndash White Paper |36

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les autres reacuteseaux

Parmi les autres services de reacuteseaux sociaux outre LinkedIn davantage tourneacute agrave

linternational il existe assez utiliseacutes en France 6nergiesnet et Xing (ex Open BC)51

Les reacuteseaux ciblant plus particuliegraverement les jeunes (FaceBook MySpace) peuvent

eacutegalement ecirctre utiliseacutes MySpace feacutedegravere plus particuliegraverement des professions de la

communication de la publiciteacute et des meacutetiers multimeacutedias

Le reacuteseau FaceBook52 est original ce site nord-ameacutericain est preacutecurseur dun social

networking tregraves segmenteacute reacuteserveacute aux eacutetudiants et aux lyceacuteens Au deacutepart les

membres devaient sinscrire obligatoirement via lemail de leur universiteacute afin de

garantir lauthenticiteacute des profils et donc le seacuterieux de la communauteacute Depuis

FaceBook sest ouvert aussi aux entreprises Ainsi ce site capte tregraves tocirct les futurs

actifs et les fideacutelise

Des ressources

Certaines ressources peuvent vous aider agrave identifier les plateformes de reacuteseaux

sociaux professionnels utiles pour vos recherches Le wiki List of social networking

websites liste de nombreuses plateformes de reacuteseaux sociaux 53 et le site Link n

Rank cateacutegorise des sites de social networking 54

copy Digimind Digimind Services ndash White Paper |37

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les sites dactualiteacutes collaboratives recommandation et notation

Ces sites recouvrent en fait diffeacuterents types dapplications

- Les Digg Like Ces services qui sinspirent tous du preacutecurseur Digg55 recueillent des actualiteacutes

proposeacutees par les internautes Le principe apregraves enregistrement un formulaire

simple vous permet de poster lactualiteacute de votre choix susceptible dinteacuteresser les

autres internautes son titre son url sa description Il faut aussi choisir une

cateacutegorie Par exemple Technologies Sciences Monde Affaires Divertissement Ces

cateacutegories peuvent ecirctre subdiviseacutees en theacutematiques plus fines Lactualiteacute si elle est

valideacutee par les modeacuterateurs apparaicirctra alors en ligne Elle sera noteacutee par les autres

internautes qui votent pour elle selon son inteacuterecirct Les actualiteacutes disposant du plus

grand nombre de points se placent alors en haut du classement

La cateacutegorie Sciences sur Digg A gauche les nombres de votes

Ces sites affichent les principales caracteacuteristiques du Web 20 interface eacutepureacutee

possibiliteacute de laisser des commentaires fils RSS pour surveiller les nouvelles

actualiteacutes classement des articles les plus lus les mieux noteacutes possibiliteacute denvoyer

par mail ou de bloguer un article et bien sucircr forte contribution de linternaute Sur

certains sites leacutetiquetage des articles via le systegraveme de tags est proposeacute

copy Digimind Digimind Services ndash White Paper |38

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Linteacuterecirct est de pouvoir positionner certaines informations les unes par rapport aux

autres et connaicirctre la populariteacute dune actualiteacute ou dun sujet (entreprise personne)

abordeacute (la critique de mon produit est-elle tregraves populaire ) Cest une approche

alternative aux agreacutegateurs de news de type Google Actualiteacutes ou Yahoo Actualiteacutes

qui hieacuterarchisent les news avec de puissants algorithmes mais sans recourir agrave

lhumain Ainsi Google Actualiteacutes preacutecise La seacutelection et le positionnement des

articles de cette page ont eacuteteacute reacutealiseacutes automatiquement par un programme

informatique

En outre sur ces services de type Digg linformation nest pas brute linternaute

qui poste lactualiteacute peut selon son expertise y apporter un commentaire de

valeur Linformation peut ecirctre commenteacutee (en plus du vote) par les autres

internautes Comme de nombreux blogueurs les utilisateurs des Digg Like jouent

aux journalistes ou tout simplement donnent leur opinion

Lorsquil sagit dactualiteacutes concernant le produit ou le service dune socieacuteteacute ces

commentaires positifs ou non sont une veacuteritable manne pour de nombreux

professionnels de linformation veilleurs marketeurs chargeacutes deacutetudes et autres

analystes qui vont pouvoir recueillir agrave moindre frais des informations sur leur

nouveau produit leurs clients ou ceux de la concurrence

Digg est lun des sites les plus copieacutes du Web 20 Sil reste la reacutefeacuterence dautres

applications tregraves largement inspireacutees tirent leur eacutepingle du jeu En France Scoopeo

Fuzz et TapeMoi offrent eux aussi des services dactualiteacutes collaboratives On peut

eacutegalement citer Rojo le canadien Niouz lespagnol Meneames le reacuteseau de sites

BlogMemes 56 Mecircme Netscape pionnier du navigateur web a lanceacute un portail

sinspirant du systegraveme de notation de Digg

On peut reprocher agrave ce type de site de favoriser les cateacutegories techniques et

scientifiques faisant la part belle aux contributions des geeks et autres accrocs du

net grands utilisateurs de services Web 2 Toutefois les sites comme Blogmemes ou

Netscape diffusent davantage dactualiteacutes agrave teneur eacuteconomique et sociale

- Les mix actualiteacutes contributions des internautes

Wikio57 est un service dorigine franccedilaise (creacuteeacute par le fondateur de Kelkoo) agrave

lintersection de Google Actualiteacutes et de Digg En effet Wikio mixe les articles issus

de sites dactualiteacutes de blogs avec des contributions des internautes On peut

prendre connaissance des informations de diffeacuterentes maniegraveres

copy Digimind Digimind Services ndash White Paper |39

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- En naviguant via les theacutematiques (France International Politique Economie

Finance Santeacute Science hellip) ou via le nuage de tags dynamiques qui se modifient en

fonction de la rubrique ou vous vous situez

- En recherchant via le moteur

- En sabonnant aux flux RSS agrave chaque cateacutegorie et agrave chaque tag correspond son

flux RSS De mecircme lorsque vous lancez une requecircte via le moteur vous pourrez

surveiller ces reacutesultats via un flux RSS

- les plateformes de contributeurs indeacutependants

La deacutefiance et la volonteacute dindeacutependance vis-agrave-vis des grands meacutedias traditionnels de

la presse eacutecrite et audio-visuelle se sont traduites degraves 2001 par la creacuteation massive

de blogs Les blogueurs sont-ils et peuvent-ils simproviser journalistes Ce deacutebat

qui promet decirctre sans fin est inteacuteressant De nombreux blogueurs (mais pas la

majoriteacute) sont devenus de veacuteritables experts dans leur domaine agrave force deacutecriture

de lecture et danalyses quotidiennes Ainsi les mainstream medias invitent

maintenant dans leurs colonnes et plateaux les blogueurs les plus talentueux

Ces blogueurs experts ou professionnels ne constituent pas les seuls creacuteateurs

dactualiteacutes alternatives

Des initiatives de plateformes dactualiteacutes eacutecrites par des non professionnels ont

aussi vu le jour Agoravox58 est lun des premiers portails de journalisme citoyen

lanceacute par Joeumll de Rosnay et Carlo Revelli 59 en mai 2005 Agoravox permet aux

internautes de proposer leurs articles pour commenter reacutefleacutechir agrave des sujets

dactualiteacutes si possible avec une approche et un regard diffeacuterents des meacutedias

traditionnels Le format des contributions est multimeacutedia Le site explique Tout le

monde peut devenir reacutedacteur drsquoAgoraVox Il nrsquoest pas neacutecessaire de savoir eacutecrire avec

un style journalistique affirmeacute Chacun drsquoentre nous peut devenir une sorte de capteur

en temps reacuteel de ce qui se passe dans notre entourage en fournissant des articles des

images des extraits videacuteo ou audio Ce qui est important crsquoest de pouvoir teacutemoigner

drsquoun eacuteveacutenement auquel vous avez assisteacute ou que vous avez deacutecouvert en faisant des

recherches Il poursuit Pourquoi devenir reacutedacteur Tout simplement pour faire

entendre votre voix et pour relater des faits que vous avez identifieacutes et qui ne vous

paraissent pas ecirctre suffisamment repris dans les meacutedias traditionnels voire ignoreacutes ou

censureacutes

Agoravox encourage donc agrave utiliser son style personnel Il convient de sinscrire pour

devenir reacutedacteur Les articles doivent toutefois obeacuteir agrave une politique eacuteditoriale60

Un comiteacute de reacutedaction valide ensuite les contributions

copy Digimind Digimind Services ndash White Paper |40

Le Web 20 pour la veille et recherche dinformation DIGIMIND

En quelques mois Agoravox a prouveacute que de simples internautes pouvaient ecirctre

aussi bon reacutedacteurs et experts en fonction de leurs profession passion et

centres dinteacuterecirct agrave linstar des blogueurs professionnels

Agoravox na pas la vocation dun agreacutegateur dactualiteacutes de type Digg Wikio ou

Google News Cest une sorte de quotidien qui privileacutegie les articles de fond et

lanalyse Bien sucircr des reacutedacteurs stars eacutecrivent reacuteguliegraverement et leurs articles

sont attendus Mais ce ne sont pas les rubriqueurs traditionnels des autres meacutedias

Comme sur les autres sites Web 20 le lecteur peut attribuer une note dinteacuterecirct agrave

chaque article et poster un commentaire Enfin leacutetonnante technologie

ReadSpeaker 61 permet de retranscrire automatiquement tous les textes en version

audio

Agoravox nest pas le seul exemple de site de journalisme citoyen Le portail

OhMyNews 62 initiative coreacuteenne est baseacute sur le mecircme principe Lanceacute en feacutevrier

2000 le reacuteseau international OhMyNews reacuteunit plus de 40 000 reacutedacteurs

Pour le veilleur ces sites dactualiteacutes collaboratives constituent des sources

dinformations alternatives avec une partie de lactualiteacute issue des organes et

agences de presse et lautre partie provenant des internautes Dautre part ces

nouveaux meacutedias permettent de deacutecouvrir et surveiller des experts voire des

leaders dopinion

Un article sur Agoravox A droite une preacutesentation de son auteur En haut la possibiliteacute de voter et

commenter larticle

copy Digimind Digimind Services ndash White Paper |41

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Rechercher Collecter

Doreacutenavant tout internaute peut creacuteer et publier sa propre information

Lidentification des sources dinformation et de linformation elle-mecircme est devenue

complexe car elles sont de plus en plus morceleacutees et atomiseacutees Il convient

dutiliser une large palette doutils de recherche pour collecter les donneacutees en

provenance des blogs des bookmarks et reacuteseaux sociaux Pour faciliter la

collecte il est en outre possible de verticaliser la recherche et de faire appel agrave des

humains Par ailleurs dautres outils permettent darchiver ses deacutemarches de

requecirctes et de navigation

a La recherche de blogs et de flux RSS

Le volume de blogs est en constante croissance sur le net Le nombre de blogs a

litteacuteralement exploseacute sur toute la planegravete Estimeacute agrave 70 millions agrave leacuteteacute 2005 ils sont

eacutevalueacutes agrave plus de 120 millions en mars 2007 Technorati lun des moteurs de

recherche de blogs les plus utiliseacutes mesure en 2007 un doublement du nombre de

blogs tous les 320 jours 120 000 blogs seraient ainsi creacuteeacutes chaque jour 63

Europe

33

Afrique 15 000

Ameacuterique du Nord

33

Ameacuterique du Sud

1

Asie

55

5 Australie 790 000

copy Digimind Digimind Services ndash White Paper |42

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombre de blogs en milliers et millions (la Russie est inteacutegreacutee dans lAsie) Estimation DIGIMIND Services 64

Les fils RSS omnipreacutesents A chaque blog correspond son flux RSS ce format qui permet dextraire et de

surveiller tout nouveau contenu qui parait sur le blog Si un vrai blog implique

toujours un flux RSS un flux RSS ninduit pas forceacutement un blog En effet le RSS et

son concurrent Atom sont preacutesents sur de plus en plus de type de meacutedias et outils

internet degraves lors que leur contenu est appeleacute agrave se modifier reacuteguliegraverement

On pourra donc trouver des flux RSS sur

-les blogs

-les sites de presse et dactualiteacute Exemple Les Echos Libeacuteration La Tribune Le

Figaro)

-les sites de revues et magazines speacutecialiseacutes Exemple La revue Nature propose ses

fils RSS concernant ses publications speacutecialiseacutees par domaines Science fait de

mecircme65

-les sites corporate des entreprises page dactualiteacutes catalogues produits (Ex Air

Liquide)

-les reacutesultats de moteurs de recherche de blogs Tous proposent des flux RSS

permettant de surveiller une requecircte (Technorati Google Blog Search Feedster

IceRockethellip)

-les pages de reacutesultats de moteur de recherche web Certains de ces moteurs

geacutenegraverent un flux RSS permettant de surveiller lapparition de nouveaux reacutesultats

pour une requecircte donneacutee

MSN Search (devenu Live Search66) le proposait depuis janvier 2005 et chaque page

de reacutesultats offrait une icocircne orange en bas de page permettant dobtenir des fils

RSS Cette icocircne RSS a disparu sur Live Search mais les flux RSS sont toujours lagrave (ils

sont deacutetectables automatiquement avec un navigateur Firefox Maxthon IE7 ou

votre lecteur RSS Attensa ou RSS Bandit par exemple)

Depuis peu Yahoo Search Web 67 offre lui aussi un fils RSS sur ses reacutesultats lagrave

encore deacutetectable via un lecteur ou navigateur (cela fonctionne uniquement pour le

Yahoo US)

copy Digimind Digimind Services ndash White Paper |43

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-les moteurs dactualiteacutes La majoriteacute des portails qui agregravegent des flux dactualiteacutes

proposent des flux RSS Exemple Google Actualiteacutes Yahoo Actualiteacutes Topix MSN

Actualiteacutes Wikiohellip 68

-les Newsgroups Usenet (groupes de discussion) Les fils RSS sont en effet aussi

preacutesents sur Google Groupes (ou Google Groups) ce qui rend plus aiseacute la surveillance

des discussions Chaque groupe (Google ou Usenet) affiche un fils RSS ou Atom 69

(et ce quelque soit la langue) signaleacute par le logo orange RSS en bas de page

-certains forums web Exemple Forum Mobiles 70

-certaines listes de diffusion elles peuvent ecirctre surveilleacutees via labonnement agrave leur

flux RSS Cela eacutevite lengorgement de votre boicircte mail Exemple la liste Veille sur

Yahoo Groupes 71 dispose dun flux RSS

-les bookmarks sociaux Delicious Yahoo MyWeb2 Blogmarks 72hellipLe fils RSS

permet decirctre alerteacute de lajout de nouveaux favoris pour un tag ou un utilisateur

deacutefinis

-les plateformes de partage de photos Exemple Flickr PhotoBucket 73

-les services de partage de videacuteos comme YouTube DailyMotion 74 pour ecirctre alerteacutes

des nouveauteacutes

-de tregraves nombreux sites offrant un contenu qui se renouvelle

copy Digimind Digimind Services ndash White Paper |44

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Veille Corporate La Tribune propose des flux RSS segmenteacutes par socieacuteteacutes

Le veilleur via ces flux RSS pourra surveiller de nombreuses sources

dinformations Par ailleurs au-delagrave des blogs introspectifs dadolescents dont peu

preacutesentent un inteacuterecirct pour les professionnels certains types de blogs peuvent se

reacuteveacuteler utiles

-Le blog dactualiteacute et dopinion preacutesentant reacuteflexions et critiques de journalistes et

internautes

-Le blog theacutematique eacutediteacute par des passionneacutes experts professionnels consultants

et techniciens

-Le blog dentreprise outil de communication externe ou interne agrave linitiative des

salarieacutes ou des dirigeants

copy Digimind Digimind Services ndash White Paper |45

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les outils pour trouver des blogs et flux RSS Sur ces moteurs la recherche seffectue par mots cleacutes classiques ou par tags comme

sur Technorati par exemple Le contenu indexeacute (blogs et flux) est tregraves heacuteteacuterogegravene

Aussi lutilisation de la recherche avanceacutee sur ces outils est souvent neacutecessaire En

effet un blog peut avoir abordeacute la theacutematique deacuteveloppement durable 1 seule fois

parmi ses 4500 billets Il conviendra donc alors de centrer sa recherche sur le titre

du blog ou son url

Les moteurs

Certains moteurs sont deacutedieacutes agrave la recherche de blogs Cest en fait un abus de

langage Ces moteurs se focalisent sur la recherche de flux RSS mais ne peuvent

faire la diffeacuterence entre un flux provenant dun grand journal et celui dun blog

Ainsi le moteur Technorati classe parmi les blogs les plus populaireshellipLe Figaro

Pour mener une recherche efficace il conviendra dutiliser plusieurs moteurs Car

comme pour la recherche web ougrave il ne faut pas se limiter agrave Google au risque de

manquer pregraves de 85 des reacutesultats75 la recherche sur les blogs neacutecessite lemploi

de plusieurs outils76 En voici quelques-uns

gt Google Blog Search Recherche de blogs Google applique sa technologie puissante

aux flux RSS et blogs Linterface est notamment disponible en franccedilais et en anglais

Le moteur est doteacute de fonctions de recherche avanceacutee (recherche sur le titre le

billet recherche par ancienneteacutehellip)

gt Ask Blog amp Flux Ce moteur permet de rechercher parmi les blogs les flux XML

(RSS ou Atom) Et aussi de sabonner agrave un blog ou un flux RSS

gt Feedster Ce moteur recense plus de 900 000 sources et 5000 sont rajouteacutees

chaque jour

gt BlogPulse Indexe plus de 46 millions de blogs

gt Technorati Ce moteur rafraicircchit son index toutes les 5 agrave 15 minutes et

recherche parmi plus de 70 millions de blogs (en avril 2007 77) ou sites proposant

des flux RSS Il est possible de rechercher par mots cleacutes ou par tags

gt Sphere va prendre en compte plusieurs variables pour mieux chercher parmi la

blogosphegravere

- comme pour le contenu web classique les reacuteseaux de liens entrants et sortants

- la qualiteacute de ces liens

copy Digimind Digimind Services ndash White Paper |46

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- les internautes agrave lorigine de ces liens (simple commentateurs ou leaders dopinion)

3 moteurs web integravegrent la recherche sur les blogs au sein de leur recherche

avanceacutee 78

gt Yahoo Search

Pour centrer sa recherche sur les flux RSS et les blogs il convient drsquoaller dans la

recherche avanceacutee (agrave droite de la boite de requecircte) puis dans le menu deacuteroulant

Format de fichiers et de seacutelectionner le format RSSXML

gt Exalead

Apregraves avoir effectueacute votre recherche il suffit de cliquer sur le bouton RSS jaune

dans la fenecirctre Preacuteciser la recherche Au sein des reacutesultats de recherche le flux

RSS est disponible via licocircne RSS Simple et propre

gt Microsoft MSN Live Search

MSN a ameacutelioreacute les interfaces de son moteur pour restreindre la recherche sur les

fils RSS Apregraves laffichage de votre page de reacutesultats vous pouvez affiner votre

recherche gracircce au bouton Flux (ou Feed en anglais) Ce bouton est accessible via

le menu Plus Au sein des reacutesultats de recherche sont alors disponibles lurl du flux

le cache et un lien pour sinscrire au fils RSS

Au-delagrave de ces moteurs speacutecialiseacutes il peut ecirctre beacuteneacutefique de tenter une recherche

sur un moteur Web (Google ou Yahoo Search par exemple) de type blog OR RSS

[votre sujet] Exemple blogs sur les teacuteleacutecoms Cela vous permettra non pas de

chercher au sein des blogs mais de trouver dautres blogs

Les reacutepertoires 79

Comme pour le web un certain nombre dannuaires entendent recenser les blogs

et fils RSS Attention comme la blogosphegravere est tregraves mouvante et en constante

croissance ces guides sont par nature non exhaustifs et leur mise agrave jour reacuteguliegravere

est difficile

gt Blogarama Ce reacutepertoire recense plus de 49 000 blogs classeacutes par cateacutegories

gt RSS Network indexe plus de 150 000 fils RSS

gt RSSFeeds Reacutepertorie plus de 119 000 fils organiseacutes en cateacutegories

copy Digimind Digimind Services ndash White Paper |47

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La recherche par tags

Nous lavons vu avec la Folksonomie linternaute peut deacutesormais mettre en place et

partager sa propre classification via les tags Lutilisateur affecte leacutetiquette de son

choix agrave ses favoris images videacuteos Lavantage est indeacuteniable cest linternaute qui

deacutefinit son eacutetiquette et non plus un organisme Mais les inconveacutenients sont

nombreux difficile gestion des singulierspluriels problegraveme de synonymes de

signification (que deacutesigne cet internaute par ce tag) dhomonymes de polyseacutemie

dheacuteteacuterogeacuteneacuteiteacute plusieurs tags peuvent designer les mecircmes documents

Toutefois lapproche par tag facilite la recherche dune part en ajoutant une couche

seacutemantique aux documents web et dautre part en permettant une navigation par

concepts de plus en plus abandonneacutee compte tenu de la deacutesertion progressive des

cateacutegories des grands reacutepertoires web par les internautes

De plus on peut tagger pratiquement tout type de contenu web Ainsi les sites 43

Things et son eacutequivalent franccedilais 36 Trucs 80 proposent aux internautes de lister

leurs objectifs expeacuteriences ou projets Chacun de ces projets est taggeacute via un ou

plusieurs mots cleacutes

Les moteurs et meacutetamoteurs de tags

Les moteurs

La plupart des applications de social bookmarking ou de partage de fichiers images

ou videacuteos permettent donc de tagger leur contenu Sur certaines le moteur de

recherche interne rend possible en plus de la recherche sur le full text une

recherche centreacutee sur les tags Cest le cas sur Flickr vous pouvez rechercher au

choix sur le titre et la description des images ou sur les tags associeacutes deacutefinis par les

utilisateurs qui ont placeacute leurs photos

Un outil comme Delicious tag search 81 va vous permettre deffectuer des

recherches via un ou plusieurs tags sur le service de social bookmarking Delicious

Pour la recherche de blogs ou flux RSS le moteur Technorati propose une

recherche classique sur les mots cleacutes contenus dans les billets mais aussi une

copy Digimind Digimind Services ndash White Paper |48

Le Web 20 pour la veille et recherche dinformation DIGIMIND

recherche par tags82 En effet leacutediteur dun blog peut tagger chacun de ses billets

via des mots cleacutes qui les cateacutegorisent Ces mots ou tags seront repris par lindex du

moteur Ainsi la recherche du mot pollution parmi les tags affiche un billet sur le

reacutechauffement climatique Si ce billet est bien cateacutegoriseacute par son auteur dans une

rubriquepollution (parmi dautres) il ne contient pas ce mot dans son texte

toutefois en relation avec le concept de pollution Clairement une recherche

classique sur le seul texte des billets naurait pas rameneacute ce billet ou du moins pas

dans les premiers reacutesultats Autre inteacuterecirct Technorati vous propose des tags

associeacutes Ainsi pour pollution il affiche environment politics global warming science

china energy news air climate climate change autant de mots cleacutes pour eacutelargir ou

affiner vos requecirctes

Le moteur SearchLess 83 offre une approche originale il associe la recherche par

mots cleacutes agrave la recherche par tags Ainsi si vous effectuez une requecircte avec le mot

intelligence vous pouvez preacuteciser par le tag CIA Les reacutesultats seacutelectionneront

donc le mot intelligence sur des contenus (billets de blogs par exemple) taggeacutes CIA

par lutilisateur lui-mecircme on est alors sucircr que les 2 concepts sont intimement lieacutes

Meacutetamoteurs

Des meacutetamoteurs 84 permettent de rechercher sur les diffeacuterents types de contenu

sociaux bookmarks images videacuteos

Ainsi Tag Central agreacutege de nombreux formats web taggeacutes En lui indiquant un

tag il affiche des reacutesultats provenant agrave la fois de Flickr Smugmug (photos)

Technorati (blogs) Blogmarks Connotea Furl delirious (bookmarks sociaux) ou

encore 43Things (listes de projets)

Zewol outil de meacuteta syndication francophone permet de rechercher parmi les tags

(Flickr delicious) mais aussi sur les actualiteacutes (Google News Ask Actualiteacutes

Yahoo Actualiteacutes) les blogs (Technorati IceRocket Google Blog Search Ask

Blogshellip) le buzz (Tapemoi Scoopeo Wikipedia) les videacuteos (Google Videos

Podscope Video Daily Motion) et un mix (Furl Echonimo actualiteacutes Plazoo

Feed24) Concregravetement cest une bonne approche de recherche globale sur de

nombreuses ressources de type Web 20

Il est toujours possible de traquer la preacutesence ou lapparition dun mot clef sur le

web via la mise en surveillance du flux RSS de la requecircte

Ketoag est un outil qui permet dinterroger de nombreux services sociaux

copy Digimind Digimind Services ndash White Paper |49

Le Web 20 pour la veille et recherche dinformation DIGIMIND

(Delicious Furl Diig Wikio Blinklist) mais eacutegalement des moteurs de recherche

(Google Blog Search) Par ailleurs vous pouvez geacuteneacuterer pour chaque requecircte un

flux RSS mais aussi un fichier OPML (format permettant lagreacutegation et leacutechange de

listes de flux RSS)

Gnosh est un meacutetamoteur qui recherche parmi les moteurs web les moteurs de

blogs et les outils de partage de favoris De plus une recherche sur longlet People

vous permet de rechercher parmi les favoris des internautes inscrits agrave la

communauteacute Gnosh

Exalead recherche sur Wikipedia A droite le nuage de tags

Les nuages de tags

Ces nuages regroupent un ensemble de tags dans un mecircme espace en affectant agrave

chacun une taille variant selon leur populariteacute (freacutequence dutilisation ou de requecircte

sur ces mots) ou la densiteacute darticles auxquels ils se reacutefeacuterent (deacutepecircches dactualiteacutes

par exemple)

Les nuages de tags sont devenus agrave la mode car ils permettent une navigation facile

tregraves visuelle au sein dun site dune base de donneacutee ou des reacutesultats dun moteur

Ils apportent une grille de lecture suppleacutementaire agrave des sites dont les menus sont

souvent surchargeacutes ou le contenu atomiseacute

copy Digimind Digimind Services ndash White Paper |50

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Nombreuses sont les applications qui utilisent le nuage de tags pour optimiser la

navigation et mettre en valeur leur contenu le partage de videacuteos (DailyMotion) les

bookmarks sociaux (Delicious MyWeb2 de Yahoo) ou les services dactualiteacutes

collaboratives comme Wikio Certains moteurs comme Exalead ont eacutegalement

choisis dafficher des nuages de tags au sein de leurs pages de reacutesultats Dans ce cas

il sagit dune aide agrave laffinage des requecirctes un clic sur un tag va afficher une

nouvelle page de reacutesultat prenant ce mot en compte

Zibb85 moteur de recherche vertical deacutedieacute au Business to Business utilise aussi le

nuage de tags pour visualiser clairement les mots cleacutes de theacutematiques connexes les

plus freacutequents agrave votre requecircte

Dautres sites plus classiques ont eacutegalement choisi lapproche du nuage de tag pour

rendre leur navigation plus attractive et leurs rubriques plus visibles Ainsi le site

Ecrans 86(du journal Libeacuteration) affiche en bas agrave droite un nuage de tags mettant en

valeur son contenu tregraves touffu

Certains outils proposent de geacuteneacuterer des nuages de tags pour des sites ou moteurs

nen disposant pas

Google Tag Cloud Maker 87 est un script pour Firefox qui permet dafficher un nuage

de tags agrave droite des reacutesultats de Google plus un mot est freacutequent dans les reacutesultats

de votre recherche plus la taille dun tag est importante

Newzingo 88 extrait des mots de Google News pour constituer un nuage

doccurrences parmi les termes de lactualiteacute Plus le terme est gros plus les articles

relatifs agrave ce terme sont nombreux Techzingo reacutealise le mecircme process mais cette

fois les cibles sont des meacutedias de reacutefeacuterence dans le High Tech et le logiciel

Slashdot Diggcom et TheRegister

Un nuage de tags sur lInternet Movie Database une maniegravere de naviguer parmi tous les mots cleacutes associeacutes aux films

copy Digimind Digimind Services ndash White Paper |51

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La qualification du contenu par les utilisateurs (rdquofolksonomierdquo) est une reacuteelle valeur

ajouteacutee Les moteurs de recherche font reposer une grande part de lrsquoeffort sur

lrsquoutilisateur final une page de reacutesultats de Google doit ecirctre eacutevalueacutee souvent

interpreacuteteacutee par linternaute La folksonomie fait elle reposer lrsquoeffort de filtrage sur

lrsquoutilisateur initial celui qui va rechercher et appliquer ses propres ldquotagsrdquo Parce

quen amont 1743 personnes ont taggeacute une page avec un groupe de mots cleacutes

lrsquoutilisateur final lors de sa requecircte reccediloit une page de reacutesultats souvent tregraves

pertinente

Sur un moteur classique cest agrave lutilisateur dimaginer ses mots cleacutes pour affiner sa

recherche Sur les bookmarks sociaux de type Delicious les internautes qui

partagent leurs ressources ont deacutejagrave preacutepareacute ce travail daffinage via leurs tags

Prenons le cas dune recherche extrecircme car geacuteneacuterant de la synonymie la requecircte

Jaguar Sur Googlecom on me propose certes des mots cleacutes connexes pour

affiner mais tous sont lieacutes agrave la voiture Sur Delicious les tags afficheacutes sont relatifs agrave

la voiture mais aussi au systegraveme dexploitation agrave un groupe de musique et agrave lanimal

Pouvoir rechercher parmi les tags classifications eacutemanant de lutilisateur peut ecirctre

particuliegraverement inteacuteressant lorsquune recherche classique par mots cleacutes sur le

contenu des documents sest aveacutereacutee infructueuse ou geacutenegravere des reacutesultats peu

pertinents

Le tagging une pratique quotidienne

Selon une enquecircte meneacutee en deacutecembre 2006 par le Pew Internet amp American Life

Project 28 dutilisateurs des internautes ameacutericains ont taggeacute ou cateacutegoriseacute en

ligne des contenus tels que des photos des billets dans des blogs des articles

drsquoactualiteacutehellipSur une base journaliegravere 7 des utilisateurs drsquoInternet pratiquent le

tag en ligne

Ce systegraveme de laquo taxonomie populaire raquo pourrait-il constituer une alternative aux

outils de recherche traditionnels par mots cleacutes Il convient de distinguer les

usages professionnels des usages grand public Olivier Le Deuff 89 reprend dans

son eacutetude sur les Folksonomies la distinction effectueacutee par Thomas Vander

Wal entre les folksonomies eacutetroites (narrow folksonomies) et geacuteneacuterales (broad

folksonomies) Selon Olivier Le Deuff cette distinction est importante car les

premiegraveres sont surtout utiliseacutees dans un objectif individuel tandis que les secondes

privileacutegient lrsquoaspect collectif et collaboratif du partage drsquoinformation Ainsi les sites

de partages de favoris comme delicious ou Connotea sont plutocirct des

folksonomies geacuteneacuterales puisqursquoun mecircme site peut ecirctre partageacute par plusieurs

utilisateurs et recevoir le mecircme tag Ce type de folksonomies srsquoappuyant sur des

copy Digimind Digimind Services ndash White Paper |52

Le Web 20 pour la veille et recherche dinformation DIGIMIND

reacuteseaux sociaux ne fait pas que classer de lrsquoinformation et la partager Il met en

relation des usagers qui partagent les mecircmes centres drsquointeacuterecirct Lrsquousager indexeur

devient agrave son tour un peu indexeacute et mis en relation agrave la fois avec drsquoautres mots-

cleacutes drsquoautres sites et drsquoautres usagers

Il est clair que dans le domaine de lrsquoinformation professionnelle ou speacutecialiseacutee le

manque duniformisation des folksonomies qursquoelles soient geacuteneacuterales ou agrave vocation

plus eacutetroite pose les limites de ce systegraveme Les outils drsquoindexation et de

classification traditionnels ont en effet eacuteteacute creacuteeacutes pour des corpus structureacutes aux

limites clairement deacutefinies et srsquoadressent agrave des utilisateurs experts drsquoun domaine

ou de la recherche drsquoinformation Lrsquoabsence de hieacuterarchisation et de controcircle

constitue agrave la fois le point fort et le point faible de la folksonomie La barriegravere des

langues pourra constituer eacutegalement un obstacle les tags eacutetant parfois meacutelangeacutes

dans un mecircme site sans distinction De plus comme le note Cyril Fievet 90 la

pratique du tagging nrsquoest pas uniforme drsquoun site agrave lrsquoautre Sur Technorati les tags

indexeacutes sont ceux choisis par les blogueurs et fonction du contenu qursquoils ont eux-

mecircmes publieacute Sur delicious en revanche ce sont les internautes qui taguent le

contenu des pages qursquoils conservent dans leurs signets raquo

Il convient eacutegalement drsquoecirctre vigilant quant agrave une utilisation laquo frauduleuse raquo des

tags destineacutee uniquement agrave garantir la populariteacute drsquoun blog comme cela a pu

ecirctre le cas avec les meacuteta-donneacutees incorporeacutees dans le code source drsquoune page

html

Eacutelie Francis et Odile Quesnel preacutesentent dans la revue Documentaliste Sciences

de lrsquoinformation les quatre modes drsquoindexation et de classification sur le web la

classification personnelle lrsquoindexation par lrsquoauteur lrsquoindexation par lrsquoutilisateur et la

classification globale Et srsquointerrogent sur lrsquoavenir de lrsquoindexation collaborative agrave la

croiseacutee de la qualiteacute (liberteacute diversiteacute enrichissement) et de la deacutesinformation

(subjectiviteacute manque de coheacuterence)

Il nrsquoen reste pas moins que folksonomie et indexation classique ne srsquoopposent pas

neacutecessairement et constituent des moyens de description de contenus adapteacutes agrave

des contextes diffeacuterents Stephen Lee creacuteateur du site Guten Tag voit dans la

folksonomie une sorte de web seacutemantique du pauvre peu oneacutereux agrave mettre en

place mais dont le succegraves reposera sur une seacuterie de bonnes pratiques collectives

Lrsquointeacuterecirct de ce systegraveme reacutesidera non pas dans la capaciteacute agrave trouver une reacuteponse agrave

une question preacutecise mais plutocirct agrave deacutecouvrir des sources originales et peu connues

ou de localiser des experts drsquoun domaine pointu Les tags les plus rares et preacutecis

pourront entre autres trouver leur application dans le domaine de la veille mettant

copy Digimind Digimind Services ndash White Paper |53

Le Web 20 pour la veille et recherche dinformation DIGIMIND

en œuvre la seacuterendipiteacute ou lrsquoart de favoriser le hasard pour des deacutecouvertes

heureuses

Laissons la conclusion sur ce point agrave lrsquoAssociation des Professionnels de

lrsquoInformation et de la Documentation (ADBS) qui estime dans sa newsletter que

Le foisonnement des propositions de mots-cleacutes aboutirait agrave un reacutesultat plus efficace

quune indexation reacutealiseacutee par un vocabulaire contraint Cette affirmation semble

ecirctre deacutemontreacuteehellip pour linstant

c La recherche de personnes et dinformations entreprises

La recherche de donneacutees sur les personnes physiques ou morales seffectuait

jusquici principalement en interrogeant les bases de donneacutees dinformations leacutegales

et financiegraveres gratuites ou payantes Linterrogation de service tel que Societecom

Infogreffe ou Yahoo Finance est bien sucircr encore neacutecessaire Mais il faut compter

maintenant avec les reacuteseaux sociaux professionnels qui eux aussi rassemblent des

donneacutees sur les entreprises ou les individus

Linteacuterecirct des reacuteseaux sociaux

Que peuvent-il apporter par rapport aux services classiques dinformations

dentreprises Dabord comme expliqueacute preacuteceacutedemment ils sont ouverts agrave tous

Les informations y figurant ne sont plus le seul fait de leacutediteur du site et ne sont pas

uniquement constitueacutees par les fichiers de donneacutees leacutegales publieacutees par les

organismes officiels comme le Greffe du Tribunal de Commerce en France Sur les

reacuteseaux sociaux centreacutes sur les personnes le contenu est inteacutegralement ameneacute par

linternaute qui affiche son CV deacutetailleacute ses publications ses oeuvres (textes ou

multimeacutedias) Linteacuterecirct est eacutevident des personnes peu visibles auparavant parce

que ne faisant pas partie des dirigeants dentreprises (geacuterant fondateur membre du

conseil) sont maintenant accessibles et donc requecirctables par les internautes On

peut donc collecter des informations sur un cadre de RampD dune socieacuteteacute de

teacuteleacutecoms concurrente ou sur le management eacutetonnant de telle entreprise de

plasturgie citeacutee dans le CV dun employeacute de passagehellip

A linstar des blogs linformation preacutesente sur les reacuteseaux sociaux ne tient plus du

discours ou des donneacutees officielles puisque cest linternaute qui communique sur sa

vie et son entreprise

copy Digimind Digimind Services ndash White Paper |54

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacuterer leacuteparpillement de linformation

Dautres plateformes de social networking mixent linformation collecteacutee sur le web

avec les contributions des utilisateurs (agrave linstar de Wikio pour les actualiteacutes) Ainsi

le service ZoomInfo 91 permet de rechercher des socieacuteteacutes et des personnes en

parcourant des milliers de donneacutees extraites du web mais aussi en provenance de

profils dindividus et dentreprises renseigneacutes par les socieacuteteacutes ou les employeacutes eux-

mecircmes Aussi cohabitent des informations sur des entreprises coteacutees avec des

donneacutees de firmes non coteacutees des fiches de cadres du top management et des

conseils dadministration avec des CV demployeacutes plus fonctionnels

Le franccedilais Ziki 92 utilise aussi des informations collecteacutees sur le web cest une

sorte dannuaire perfectionneacute qui indexe et archive non pas les donneacutees

signaleacutetiques mais les contenus produits par une personne agrave partir du moment ougrave ils

disposent dun flux RSS (billets de blogs photo Flickr favoris Delicioushellip) Ziki ne

permet pas de creacuteer du contenu propre mais agregravege des donneacutees eacutelaboreacutees par un

mecircme individu auparavant eacuteparpilleacutees sur linternet Bref vous ameacuteliorez votre

visibiliteacute et facilitez la recherche de vos productions sur le net en creacuteant un point

unique daccegraves

La recherche sur tous ces reacuteseaux sociaux implique souvent linterrogation

fastidieuse apregraves inscription de plusieurs dizaines de sites

Aussi certains outils 93 proposent une meacutetarecherche en lanccedilant une mecircme

requecircte sur plusieurs services de social networking Stalkerati recherche le nom

dune personne sur les reacuteseaux Friendster et FaceBook Plus complet et ciblant

davantage les reacuteseaux professionnels YoName recherche les noms sur MySpace

LinkedIn Friendster Windows Live Spaces Bebo Digg ou Xanga

Le moteur de recherche de personnes Wink scrute les reacuteseaux sociaux MySpace

Bebo Friendster LinkedIn Live Spaces et autres De plus avec cet outil il est

possible de creacuteer son propre profil et de le connecter agrave des reacuteseaux sociaux

Attention toutefois si vous ecirctes un utilisateur recherchant des donneacutees en franccedilais

la nature des reacutesultats est plutocirct tourneacutee vers le monde anglophone

Ces reacuteseaux sociaux ne sont pas suffisants pour une recherche professionnelle

complegravete A linstar des blogs face agrave la presse traditionnelle ils constituent un

compleacutement inteacuteressant aux bases de donneacutees officielles

copy Digimind Digimind Services ndash White Paper |55

Le Web 20 pour la veille et recherche dinformation DIGIMIND

d Les moteurs de recherche humains

Apregraves ecirctre apparus sur le net agrave la fin des anneacutees 90 les services de questions-

reacuteponses avaient laisseacute la place aux algorithmes tout puissants des moteurs de

recherche de type Google Mais les robots et programmes ont tous besoin dune

intervention humaine pour geacuterer la qualiteacute et la pertinence des reacutesultats

Ainsi tous les grands moteurs majeurs ne font pas confiance agrave leurs seuls

algorithmes Les employeacutes de Yahoo sont mis agrave contribution pour surveiller la

qualiteacute des reacutesultats fournis par le moteur Chez Google et MSN Search des

process deacutevaluation humaine avaient eacuteteacute identifieacutes agrave travers les sites

EvalGooglecom et MSN HRS notamment

La revanche de lhumain

Au-delagrave de ce rating humain sur les reacutesultats de moteurs de recherche de

nombreux services depuis 2 ans mettent agrave disposition des experts en chair et en

os Cest alors un veacuteritable mode collaboratif qui se met en place lorsque le produit

est bien penseacute Cest la cas de Yahoo Answers (Yahoo Questions Reacuteponses en

France) 94 Ce service gratuit de questions reacuteponses lanceacute fin 2005 permet agrave

linternaute de poser une question dans un formulaire Chaque membre de la

communauteacute Yahoo (agrave savoir tout ceux qui disposent dun compte Yahoo) peut

jouer le rocircle dexpert Yahoo propose aussi le service (eacutegalement gratuit) Ask

Yahoo qui propose de reacutepondre agrave vos questions mais cette fois via un groupe

dexperts seacutelectionneacutes par Yahoo Inc Yahoo Answers a certes une orientation

initiale grand public mais des questions un peu techniques voire scientifiques

trouvent reacuteponse En effet parmi tous les contributeurs agrave Yahoo Answers figurent

des meacutetiers et expertises tregraves diverses du fait de son audience importante Il y

cohabite des types de questions varieacutes Quels sont les groupes strateacutegiques de

lindustrie mondiale du jouet Quelles sont les donneacutees eacuteconomiques du marcheacute de

lassurance vie collective en France

Autre point inteacuteressant le service est deacuteployeacute dans de nombreux pays (Etats-Unis

Royaume-Uni Canada Australie Inde Espagne Breacutesil Argentine Mexique Italie

Allemagne Singapour Taiwan Coreacutee du Sud Hong Kong Japon Chinehellip) Aussi il

est possible de localiser certaines questions et de beacuteneacuteficier parfois dune

expertise pays

Lune des raisons du succegraves du service de Yahoo tient au fait de baser les questions

et reacuteponses sur la contribution dinternautes volontaires Chacun participe

constitue un vrai reacuteseau et peut surtout se valoriser en devenant expert dans son

copy Digimind Digimind Services ndash White Paper |56

Le Web 20 pour la veille et recherche dinformation DIGIMIND

domaine de compeacutetences ou sa passion Il est mecircme possible de creacuteer sa propre

communauteacute qui rassemblera vos amis mais aussi vos experts preacutefeacutereacutes qui

reacutepondent agrave vos questions et centres dinteacuterecirct Le pool de reacutepondants nest donc

pas limiteacute agrave une liste restreinte et il sauto-entretient Dautre part les experts

seacutevaluent entre eux et seacutelectionnent parmi une liste si neacutecessaire ce quils

considegraverent comme la meilleure reacuteponse agrave une question

Une question sur Yahoo Answers

Sur ce marcheacute des Questions-Reacuteponses Google a eacutechoueacute notamment parce quil a

seacutepareacute formellement demandeurs et contributeurs limitant ainsi fortement laspect

collaboratif Le Service Google Answers 95 permettait de poser des questions agrave des

experts Mais lagrave ougrave des services concurrents comme Yahoo Answsers Lycos IQ

copy Digimind Digimind Services ndash White Paper |57

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Windows Live QnA96 sont gratuits Google Answers eacutetait un service payant faisant

appel agrave un reacuteseau de 800 experts Aussi Google Answers apregraves 4 ans dactiviteacute a

fermeacute Les questions ne sont deacutesormais plus accepteacutees mais laccegraves aux archives des

questions-reacuteponses est maintenu

Par ailleurs les reacuteseaux sociaux eacutevoqueacutes plus haut ont bien compris la puissance des

communauteacutes pour faire office de speacutecialistes Ainsi avec LinkedIn Answers la

plateforme de reacuteseaux sociaux LinkedIn sest lanceacutee elle aussi dans le service de

QuestionsReacuteponses

Ne pas oublier les services Web 10

Lorsque lon parle de Web 20 on eacutevoque rarement ces services de Questions-

Reacuteponses au profit de sites plus technologiques Pourtant nous sommes ici dans la

logique des bookmarks sociaux partager ses connaissances faire beacuteneacuteficier les

autres de son savoir et en retour profiter de lexpertise de la communauteacute

Comme la plupart des applications Web 2 la seule utilisation des services QR ne

suffit pas Elle doit venir en compleacutement de recherches parallegraveles via dautres outils

Ainsi pour la veille linscription agrave des listes de diffusion permet aussi de poser des

questions agrave des experts ou passionneacutes De plus il subsiste des services dexpert

traditionnels qui sils ne mettent pas laccent sur la collaboration permettent

didentifier des compeacutetences parfois tregraves pointues Certaines ressources

reacutepertorient des milliers dexperts quil faudra ensuite contacter personnellement

pour beacuteneacuteficier de leur conseil Cest le cas du site Expertscom qui identifie des

experts dans des domaines allant de lacoustique agrave la biochimie en passant par

lindustrie peacutetroliegravere97

copy Digimind Digimind Services ndash White Paper |58

Le Web 20 pour la veille et recherche dinformation DIGIMIND

e les moteurs de recherche collaboratifs

Nous lavons vu certains services dactualiteacutes collaboratives proposent des reacutesultats

issus dun mixage entre contribution des internautes et collecte de nouvelles sur le

web Cette approche de mixiteacute se met peu agrave peu en place pour les moteurs de

recherche web En effet les modegraveles algorithmiques ou humains preacutesentent tout 2

leurs limites en terme de pertinence de fiabiliteacute et dexhaustiviteacute

Aussi de plus en plus de projet de moteur mixtes agrave savoir proposant des reacutesultats

web conjointement agrave des reacutesultats etou seacutelections issus dhumains voient le jour

Du web donc mais avec une forte dose de cerveaux humains

Wikiasari

Celui qui fait le plus parler de lui est le projet de Jimmy Wales le co-fondateur de

lencyclopeacutedie Wikipedia Baptiseacute Wikiasari 98 (combinaison de wiki rapide en

hawaiumlen et asari recherche fouilleacutee en japonais) le projet vise agrave creacuteer un outil de

recherche ougrave les internautes pourront influer sur les reacutesultats en notant leur

pertinence etou en en proposant de nouveaux selon leur expertise

Ce type de moteur sinscrit donc agrave lopposeacute doutils comme Google aux algorithmes

automatiques dont les robots sont souvent trompeacutes par des manipulations de

webmasters (spamdexing par exemple)

Cet outil qui devrait voir le jour courant 2007 sappuie sur des infrastructures Open

Source existantes comme Nutch ou Lucent

Cest un projet particuliegraverement inteacuteressant Comme sur lencyclopeacutedie ouverte

Wikipedia ougrave des milliers de contributeurs construisent et alimentent louvrage sur

ce moteur des reacuteseaux de centaines dinternautes pourront apporter leur savoir

pour ameacuteliorer la pertinence des reacutesultats Ce nest plus seulement la puissance de

calcul de machines qui sera mise agrave contribution mais aussi la puissance de la

communauteacute

Derriegravere le projet Wikiasari il y a de gros moyens financiers et humains

lexpeacuterience de la fondation Wikipedia et le potentiel de trafic que pourra apporter

lencyclopeacutedie ouverte Fin 2006 Comscore a en effet classeacute Wikipedia comme le

6egraveme site le plus visiteacute au monde avec 1719 millions de visiteurs uniques au mois

de novembre On peut donc y croire

copy Digimind Digimind Services ndash White Paper |59

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une recherche de sites similaires sur Yoono

Decipho Yoono

Certes lideacutee dun moteur de recherche collaboratif nest pas nouvelle Reacutecemment

on peut citer le lancement du moteur Decipho ou en mars 2006 celui de Yoono

Mecircme si les approches diffegraverent ces outils font tous la part belle agrave lrsquoapport de

chaque utilisateur dans le traitement des reacutesultats

Decipho 99 est un moteur baseacute sur la technologie de Askcom lun des 4 moteurs les

plus utiliseacutes aux USA Linternaute creacuteeacute ses propres cateacutegories de reacutesultats

partageables avec les autres Il peut eacutegalement tagger les reacutesultats afin deacutetiqueter

un site Aussi lors dune requecircte on peut preacuteciser les mots cleacutes classiques avec des

tags On beacuteneacuteficie alors de tous les tags mis en place par la communauteacute des

utilisateurs Un curseur permet de deacutefinir la proportion de cateacutegorisation des

autres utilisateurs agrave prendre en compte dans sa recherche

Le franccedilais Yoono 100 propose une autre deacutemarche encore loutil fonde ses reacutesultats

sur la mutualisation des connaissances des internautes par le partage des favoris Le

copy Digimind Digimind Services ndash White Paper |60

Le Web 20 pour la veille et recherche dinformation DIGIMIND

moteur utilise les favoris que sa communauteacute dutilisateurs a accepteacute de partager

Lors dune requecircte les reacutesultats sont classeacutes par populariteacute agrave savoir selon le

nombre de fois ougrave une page a eacuteteacute mise en favoris par les utilisateurs Une logique

proche de Delicious mais avec Yoono lajout de favoris est automatique De plus

loutil affiche les utilisateurs qui comme vous ont reacutefeacuterenceacute des sites sur la

politique veacuteneacutezuelienne par exemple De cette maniegravere vous pouvez identifier des

passionneacutes ou experts partageant vos domaines de preacutedilections Les reacutesultats ne

sont plus baseacutes sur les seuls algorithmes mais sur lexpeacuterience et la capacitation des

autres utilisateurs

Les initiatives de moteurs collaboratifs plus ou moins inteacuteressantes sont multiples

Foox est un moteur baseacute sur des communauteacutes dinteacuterecirct et sur Webzzle lutilisateur

preacutecise les concepts qui linteacuteressent afin de contextualiser les mots-cleacutes choisis 101

Humains ou algorithmes

Certes le mode collaboratif ne remplacera pas totalement la recherche

algorithmique Les 2 sont compleacutementaires Lune permet dameacuteliorer la pertinence

de prendre en compte des concepts des contextes du sens et non plus simplement

des chaicircnes de caractegraveres Lautre vise lexhaustiviteacute en indexant des milliards de

pages Web Aujourdhui et en attendant le Web seacutemantique ainsi que la recherche

dite naturelle 102 toutes deux grandes quecirctes du monde de linternet seul lapport

de communauteacutes dhumains permet dinjecter un peu de sens agrave une recherche

Mais de son cocircteacute la recherche coopeacuterative comporte bien entendu des risques de

subjectiviteacute

Sur les moteurs de recherche la coopeacuteration peut prendre une autre forme via le

peacuterimeacutetrage des sites agrave interroger la construction dun moteur sur mesure en

quelque sorte Cest la verticalisation de la recherche

copy Digimind Digimind Services ndash White Paper |61

Le Web 20 pour la veille et recherche dinformation DIGIMIND

f La verticalisation par la personnalisation du peacuterimegravetre de recherche

Lune des grandes faiblesses des moteurs de recherche web agrave large eacutechelle (Google

Exalead Yahoo MSNhellip) est le bruit geacuteneacutereacute par certaines requecirctes Lorsque vous

tapez puma le moteur ne sait pas agrave priori si vous vous inteacuteressez aux vecirctements

de sport agrave lanimal ou aux heacutelicoptegraveres Or si vous ne reacutealisez des recherches que

dans laeacuterospatiale vous devrez souvent deacutesambiguiumlser par vos mots cleacutes ce qui

engendre une perte de temps voire de reacutesultats si vos requecirctes deviennent trop

restrictives

Certains moteurs ou meacutetamoteurs clusteacuterisent (cateacutegorisent) les reacutesultats en les

rassemblant par groupes (grappes) dans de petits dossiers Cette deacutemarche avait

eacuteteacute initieacutee par le moteur Northern Light en 1998 Ainsi tous les reacutesultats relatifs aux

chaussures Puma sont regroupeacutes dans une mecircme valise ceux eacutevoquant lanimal

dans une autre Mais cette solution nest pas complegravetement satisfaisante car elle

seffectue agrave posteriori une fois votre requecircte lanceacutee Le bruit nest pas eacutelimineacute mais

simplement circonscrit dans des sortes de cateacutegories poubelle

Pour beacuteneacuteficier dune deacutemarche agrave priori il convient dutiliser des outils de

recherche verticaux cest-agrave-dire speacutecialiseacutes dans un secteur dactiviteacute une fonction

un type dinformation ou de meacutedias

Face aux problegravemes de pertinence des moteurs geacuteneacuteralistes de plus en plus de

moteurs verticaux voient le jour Ainsi le seul domaine meacutedical a vu apparaicirctre ces

20 derniers mois les moteurs SearchMedica Medstory MedWorm ou encore Medgle 103

Mais si votre secteur de preacutedilection nest pas couvert par un moteur speacutecialiseacute

Cest lagrave quintervient un autre type de moteur collaboratif agrave qui lon peut indiquer le

peacuterimegravetre des sites sur lesquels effectuer la recherche Sur les moteurs classiques

les algorithmes peuvent placer en prioriteacute des reacutesultats sans inteacuterecirct pour vous A

force de navigation et de veille dans votre secteur vous connaissez certainement

10 20 100 sites que vous jugez incontournables et indispensables pour vos

recherches

2 solutions techniques existent

- les outils agrave peacuterimegravetre de recherche personnalisable (adaptable scope)

Ils utilisent les index des moteurs geacuteneacuteralistes (Yahoo ou Google) et restreignent le

scope de leur recherche aux pages des sites que vous avez choisis Ainsi des outils

comme Rollyo Swicki Yahoo Search Builder Google Custom Search 104 vous

demandent dindiquer une liste de sites sur lesquels vous allez limiter votre

recherche Lors dune requecircte les reacutesultats proviendront uniquement des sites de

votre choix Pratique

copy Digimind Digimind Services ndash White Paper |62

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Mais ces outils preacutesentent une limite de taille ils ne prennent en compte que les

pages indexeacutees par Google ou Yahoo Conseacutequence si la reacuteponse pertinente agrave

votre requecircte figure au sein dune page non indexeacutee par le moteur geacuteneacuteraliste vous

nobtenez pas de reacutesultats

De plus en ninterrogeant que lindex dun ou 2 moteurs vous manquerez

obligatoirement de nombreuses informations puisque le nombre de reacutesultats

communs entre les moteurs diminue constamment105

Les pages non indexeacutees par les moteurs geacuteneacuteralistes constituent une part du web

invisible106 et sont plus nombreuses que lon ne croit Ainsi si jinterroge le moteur

interne du site de la prestigieuse revue scientifique The Lancet 107 avec la requecircte

Diabetes jobtiens plus de 2800 reacutesultats Si jeffectue cette mecircme requecircte sur

Google en restreignant ma recherche au site The Lancet (via la syntaxe

sitehttpwwwthelancetcom) jobtienshellip1 reacutesultat Sur Yahoo Search guegravere

mieux 9 reacutesultats Pourquoi Parce que les technologies de ces moteurs ne

permettent pas dindexer correctement tous les sites

La constitution de bouquets de moteurs speacutecialiseacutes sur Digimind Finder

- les outils agrave moteurs personnalisables

La solution pour beacuteneacuteficier des reacutesultats de moteurs internes non indexeacutes par des

Google ou Yahoo est dutiliser un outil permettant dexploiter directement les

moteurs des sites qui vous inteacuteressent et ce sans avoir agrave passer par les index de

moteurs geacuteneacuteralistes Cest le cas du Finder108 mis au point par Digimind un

copy Digimind Digimind Services ndash White Paper |63

Le Web 20 pour la veille et recherche dinformation DIGIMIND

meacutetamoteur qui permet de plugger nimporte quel moteur de son choix et de

linterroger ensuite Il est donc alors simple de se constituer des bouquets de

moteurs speacutecialiseacutes dans votre secteur dactiviteacute De plus cet outil indexe en temps

reacuteel les reacutesultats et les documents retourneacutes par les moteurs interrogeacutes Cela

permet daffiner ensuite vos reacutesultats en interrogeant cet index au contenu

speacutecialiseacute via une recherche avanceacutee Avec le Finder cest donc lutilisateur final qui

constitue sa propre seacutelection de moteurs

copy Digimind Digimind Services ndash White Paper |64

Le Web 20 pour la veille et recherche dinformation DIGIMIND

g Lenrichissement de bases de donneacutees faccedilon Web20

Nous avons vu que les bookmarks sociaux permettaient de mutualiser les

ressources et pour certains autour de communauteacutes deacutedieacutees comme les

scientifiques Avant lapparition des applications Web 20 ont eacuteteacute constitueacutees de

nombreuses bases de donneacutees professionnelles Celles-ci jusquici noffraient pas

aux groupes dutilisateurs la possibiliteacute dinteragir de commenter et deacutechanger

Aussi de plus en plus de grandes bases de donneacutees se dotent dinterfaces

collaboratives et ergonomiques pour laisser plus de place agrave la contribution

PubMed

Cest le cas de lune des plus grandes bases du domaine meacutedical PubMed 109 Cette

immense base bibliographique a vu naicirctre deux initiatives110 pour ameacuteliorer son

interface de recherche

- Avec PubMed Interact la recherche integravegre de lAjax et permet de pondeacuterer via

des curseurs les critegraveres de sources dancienneteacute de nombre de reacutesultats de date

de publication de liens avec le mapping du MeSH (le theacutesaurus de la base) de

filtrage via des cateacutegories Vous pouvez ensuite annoter et attribuer une note de

pertinence agrave vos reacutesultats afficher labstract des articles ou leur texte complet

supprimer des reacutesultats ou encore afficher les articles lieacutes On retrouve donc

lessentiel des fonctionnaliteacutes de lactuel PubMed mais avec une convivialiteacute et

ergonomie Web 20 et donc une plus grande accessibiliteacute

-Hubmed est une autre interface alternative qui ajoute des fonctionnaliteacutes agrave PubMed

application de ses propres tags aux reacutesultats de recherche historique des recherches

clusteacuterisation des reacutesultats visualisation sous forme graphique creacuteation simplifieacutee

de fils RSS avec les mots de votre requecircte suggestion de termes connexes

visualisation de vos mots cleacutes dans larborescence Mesh Le tout est deacuteveloppeacute en

Ajax notamment permettant une navigation plus fluide et plus rapide Parmi toutes

ces fonctions la possibiliteacute de tagger les reacutesultats est tregraves novatrice on peut ainsi se

deacutepartir de la taxonomie de la base via sa propre folksonomie

copy Digimind Digimind Services ndash White Paper |65

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les nombreux reacuteglages de filtres sur linterface PubMed Interact

LUSPTO

LUSPTO 111 est la base des brevets ameacutericains (United States Patent and Trademark

Office)

Cette veacuteneacuterable institution a en projet une plateforme de brevets sociale agrave la

maniegravere dun Digg (cf les services dactualiteacutes collaboratives) les internautes

pourront commenter les brevets en ligne et les eacutevaluer via un systegraveme de notation

Les brevets les mieux noteacutes remonteront alors en haut de classement

copy Digimind Digimind Services ndash White Paper |66

Le Web 20 pour la veille et recherche dinformation DIGIMIND

h Conserver et exploiter lhistorique de vos recherches et navigations

Le chercheur dinformation sur le net perd souvent ses nerfs quand il ne retrouve

plus ce quil a deacutejagrave collecteacute quelque semaines auparavant ou lorsquil lui est

impossible de se souvenir quelle requecircte agrave geacuteneacutereacute ce fameux reacutesultat remarquable

cette veacuteritable peacutepitehellip

Google a reacutesolu partiellement ces problegravemes de meacutemoire Mais comme souvent

cela ne va pas sans certains sacrifices

Via son service Historique Web112 (ex Historique de recherche) vous pouvez apregraves

enregistrement gratuit

- meacutemoriser les requecirctes effectueacutees sur le moteur ainsi que les reacutesultats cliqueacutes

- enregistrer votre navigation sur les pages web

Il est alors possible deffectuer des requecirctes sur et agrave linteacuterieur des pages que vous

avez visiteacutees dans le passeacute (sur le texte les images les videacuteos)

Google affiche donc deacutesormais vos requecirctes la date et lheure de la recherche les

reacutesultats cliqueacutes mais aussi les reacutesultats de recherches qui nrsquoont pas geacuteneacutereacute de clics

Par ailleurs ce service va encore plus loin dans la personnalisation et lanalyse de

votre recherche

Avec la fonction Tendances saffichent vos requecirctes les plus courantes vos sites les

plus visiteacutes les reacutesultats que vous avez le plus cliqueacutes

Plus puissante la fonction Eleacutements inteacuteressants ougrave Google vous propose des

requecirctes et des pages web en relation avec vos habitudes de recherche113

En outre si vous activez cet historique Google lutilisera aussi pour agrave moyen

terme personnaliser vos recherches en fonction de vos centres dinteacuterecirct Le

moteur explique

Vos reacutesultats personnaliseacutes seront baseacutes sur vos recherches preacuteceacutedentes ainsi que les

reacutesultats de recherche et les titres agrave la une sur lesquels vous avez cliqueacute

Dans les premiers temps la diffeacuterence ne sera peut-ecirctre pas notable mais agrave mesure

que votre historique de recherches seacutetoffera les reacutesultats obtenus seront de plus en plus

personnaliseacutes

Dailleurs si vous reacutealisez de nombreuses recherches sur Google avec une

connexion agrave votre compte Google activeacutee vous devriez voir safficher de temps agrave

autre ce type de message Nouveau activez votre historique de recherche pour

personnaliser vos reacutesultats

copy Digimind Digimind Services ndash White Paper |67

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ces reacutesultats personnaliseacutes apprenant selon vos inteacuterecircts permettent de reacutepondre

en partie agrave la probleacutematique de deacutesambiguiumlsation lors de requecirctes sur des

homonymes Ce sont les exemples classiques de lavocat (fruit ou juriste ) de

jaguar (voiture ou animal ) ou de puma (articles de sports animal ou heacutelicoptegravere

)

Cocircteacute vie priveacutee tout votre surf part sur les serveurs de Google Aussi vous

pouvez (devez) mettre en pause lenregistrement de votre navigation lorsque cela

vous apparaicirct adeacutequat

Lhistorique de vos requecirctes et de vos reacutesultats sur Google

copy Digimind Digimind Services ndash White Paper |68

Le Web 20 pour la veille et recherche dinformation DIGIMIND

i Les mash-up

Les mash-up sont certainement les nouveauteacutes engendreacutees par les technologies

dites Web 20 les plus spectaculaires Mixage de plusieurs applications provenant

de plusieurs sites (souvent deux) ils permettent de creacuteer un service nouveau et ce

agrave partir de la mise en relation voire du croisement des donneacutees des applications

dorigines En franccedilais Wikipedia parle dapplications composites 114 Ainsi en

mixant la liste des socieacuteteacutes ougrave il fait bon travailler eacutetablie par le magazine Fortune et

une carte des USA issue de Google Maps on obtient une carte qui localise toutes

ces entreprises De mecircme si on meacutelange les donneacutees dun site de meacuteteacuteo agrave une

carte de France le reacutesultat est une carte des tempeacuteratures et des neacutebulositeacutes en

quasi temps reacuteel 115

Concregravetement comment cela fonctionne-t-il Chacune des applications

communique et eacutechange des informations via des API (voir glossaire) Ainsi Yahoo

Maps ou Google Maps ont ouvert leurs interfaces de programmation agrave tous les

deacuteveloppeurs

Les exemples sont tregraves nombreux car les Mashups ont rapidement connu un vif

succegraves aupregraves des deacuteveloppeurs et internautes avertis qui parviennent agrave maicirctriser le

code et les API Les Mashups de cartographie ne sont pas les seules possibiliteacutes mais

ce sont les plus freacutequents tant la geacuteolocalisation est attrayante pour les

professionnels comme pour linternaute novice Nous allons explorer quelques

mashups pour mieux comprendre leur inteacuterecirct

Les mashups cartographiques les plus courants mixent des cartes et des donneacutees

provenant de services sociaux comme Flickr le service de partage de photo de

Yahoo Inc Cest le cas de Tagmaps116 qui affiche en temps reacuteel sur une carte les tags

associeacutes aux photos de lieux mise en ligne sur Flickr Le Mashup Flickrvision 117 fait

encore plus simple il affiche les photos agrave lemplacement de la ville dorigine de

linternaute qui a posteacute limage lagrave aussi en temps reacuteel

Donneacutees statiques et temps reacuteel

Au-delagrave de certains mixages un peu gadget certains Mashups sont vraiment

inteacuteressants pour la surveillance de donneacutees ou la collecte dinformations En effet

on peut trouver deux grands types de visualisation celle de donneacutees statiques (une

liste dadresse dentreprises geacuteolocaliseacutees) et celle dinformations eacutevoluant en

temps reacuteel Cest le cas par exemple du Mashup SpaceCraft Tracking 118 qui permet

copy Digimind Digimind Services ndash White Paper |69

Le Web 20 pour la veille et recherche dinformation DIGIMIND

de visualiser la trajectoire sur le globe terrestre de la navette spatiale ou du

teacutelescope Hubble

Souvent le Mashup exploite des donneacutees de reacutepertoires douvrages de services

publics pour les rendre plus compreacutehensives attrayantes bref plus accessibles 119

- HealthMap rassemble des donneacutees de santeacute publique et des actualiteacutes issues de

plusieurs sources (Google News OMS European Centre for Disease Prevention and

Controlhellip) afin de reacutealiser une carte des maladies infectieuses dans le monde Cette

carte se met agrave jour au fur et agrave mesure de lactualisation des informations

Linteractiviteacute permet de zoomer sur un pays et de seacutelectionner des pathologies en

particulier

-BioDiesel Station Maps affiche sur une carte les stations services ameacutericaines qui

deacutelivrent des biocarburants

-Kartametro superpose le reacuteseau du meacutetro moscovite agrave la carte de la ville On y

visualise aussi les correspondances avec les bus

-Wikimapia mixe les informations relatives agrave des lieux de Wikipedia agrave une carte

Google Maps Reacutesultat la plupart des noms de villes sites ou monuments sont

cliquables et pointent vers les articles de lencyclopeacutedie

Le Mashup HealthMap ici des actualiteacutes sur les maladies infectieuses en Asie geacuteolocaliseacutees

copy Digimind Digimind Services ndash White Paper |70

Le Web 20 pour la veille et recherche dinformation DIGIMIND

-GlobaI Incident Maps affiche sur un planisphegravere les eacuteveacutenements lieacutes au terrorisme

ou les risques agrave partir des informations de sites speacutecialiseacutees mises agrave jour en continu

-Enfin un parfait exemple de visualisation et de surveillance deacuteveacutenements en temps

reacuteel DartMaps indique lemplacement des trains de banlieue de Dublin

Mais certains Mashup en minoriteacute certes nexploitent pas de donneacutees

cartographiques Cest le cas de Delexaorg 120 un outil qui mixe les bookmarks

sociaux de Delicious aux donneacutees statistiques dAlexa Delexa va en effet afficher les

tags de Delicious associeacutes aux statistiques de freacutequentation des 50 000 premiers

sites web US fournis par Alexa (agrave partir des donneacutees transmises par les barres

doutils Alexa installeacutees par les internautes) Un tel outil est inteacuteressant notamment

pour se familiariser avec les tags et Delicious mais surtout pour deacutecouvrir quels

sont les sites dinfluence et populaires dans un secteur On peut eacutegalement observer

la correacutelation ou non entre nombre de tags et donneacutees de freacutequentation Alexa

Cocircteacute moteur de recherche les mashups Molu et Gnosh fournissent des

meacutetamoteurs reacutealiseacutes agrave partir du mixage de dizaines doutils de recherche121

Des ressources

Comment trouver des mashups Comme pour de nombreuses informations sur le

web des annuaires speacutecialiseacutes 122 sont apparus Ils reacutepertorient aussi bien des API agrave

destination des deacuteveloppeurs que des mashups WebMashup auto-proclameacute Open

Directory for Mashups et Web 20 APIs en liste des centaines ProgrammableWeb

lun de sites de reacutefeacuterence dans le domaine en propose plus de 1800 sous la forme

dun reacutepertoire et eacutegalement dune matrice permettant de visualiser clairement le

croisement de deux applications ou plus Mashup Feed liste aussi des mixages

populaires

Des blogs sont eacutegalement centreacutes sur ces pratiques Google Maps Mania123 recense

de nombreux Mashups cartographiques

Ces Mashups sont un beau symbole de ce web nouvelle geacuteneacuteration on ne lit plus

seulement de linformation statique de maniegravere passive Deacutesormais on est agrave la fois

fournisseur et spectateur en temps reacuteel des contributions de communauteacutes Le tout

copy Digimind Digimind Services ndash White Paper |71

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gracircce agrave des interfaces reacutealiseacutees par des deacuteveloppeurs agrave partir de code ouverts de

grandes socieacuteteacutes Le succegraves est notamment provoqueacute par la possibiliteacute de mixage

entre des donneacutees du monde reacuteel et des informations ou fichiers posteacutes sur le net

Les internautes peuvent donc maintenant se rassembler par centres dinteacuterecirct mais

eacutegalement par proximiteacute geacuteographique Je recherche un speacutecialiste de linformation

sur les biocarburants situeacutes agrave moins de 10 km de chez moi

Par ailleurs on peut imaginer agrave terme des applications meacutelangeant les donneacutees de

centaines de fichiers et bases de donneacutees On en est certes aux preacutemisses mais le

mashup Alkemis 124 en est deacutejagrave un bon exemple il affiche sur une carte de New

York des donneacutees provenant dA9 OpenSearch Delicious Flickr Google Maps et

Yahoo Traffic Reacutesultat la possibiliteacute de visualiser en une seule interface un eacutetat du

trafic routier via des cameacuteras de surveillance la meacuteteacuteo les actualiteacutes locales ou les

liens Delicious en rapport avec la villehellip

copy Digimind Digimind Services ndash White Paper |72

Le Web 20 pour la veille et recherche dinformation DIGIMIND

III Diffuser

Avec lapparition des applications collaboratives et des plateformes de blogs la

faciliteacute de publication sur le web sest accrue Tout individu mecircme sans

connaissances techniques peut publier et diffuser son propre contenu sur un blog

un wiki et via des fils RSS

a Les Blogs et le flux RSS

Il suffit de 5 minutes pour sinscrire agrave une plateforme de blogs et commencer agrave

eacutecrire Ces plateformes proposent des services de bases gratuits et des

fonctionnaliteacutes plus avanceacutees neacutecessitant un abonnement Ces services qui

permettent de creacuteer maintenir et heacuteberger votre blog sont nombreux Parmi les

prestataires de qualiteacute on peut citer Blogger (qui appartient agrave Google) TypePad et

Vox (de la socieacuteteacute SixApart) Overblog Viablog Haut et Fort ou BlogSpirit 125 Bien

dautres socieacuteteacutes proposent des services de creacuteation et dheacutebergement126 Des

comparatifs sont disponibles en ligne127

Nous lavons vu le format RSS permet de diffuser tregraves facilement le contenu de son

blog utilisant le XML (un html eacutepureacute) langage natif du blog chaque carnet web

comporte un fils RSS permettant aux visiteurs de sabonner agrave vote blog et de

recevoir instantaneacutement toute nouvelle publication actualiteacutes billets podcast ou

videacuteos Par ailleurs des services comme Feedburner128 permettent de rendre

compatibles vos flux RSS avec la majoriteacute des lecteurs RSS outils dont nous

reparlerons plus loin

La creacuteation de sites internet classiques sest elle aussi consideacuterablement simplifieacutee

un outil tel que Google Page Creator129 permet de creacuteer un site simple en 1 heure

Des sites plus sophistiqueacutes sont eacutegalement abordables sans avoir agrave connaicirctre une

ligne de programmation de html gracircce au perfectionnement des eacutediteurs dits

WYSIWYG ce que vous voyez quand vous construisez votre page est ce que vous

obtiendrez en ligne

Les outils Web 20 permettent agrave des speacutecialistes journalistes ou salarieacutes de diffuser

leur contenu Il y a encore 2 ans ils eacutetaient pour la plupart eacutecarteacutes de la publication

web faute de bagage technique

copy Digimind Digimind Services ndash White Paper |73

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Depuis le deacuteveloppement des blogs agrave partir de lautomne 2001 il est possible pour

tout internaute de diffuser sa propre information Au-delagrave des blogs dadolescents

et autres carnets intimes le web regorge de blogs agrave tendance professionnelle

corporate produits marketing experts politiques ressources humaines Cest

autant de sources potentielles quil faut exploiter afin de capter des sources

primaires de qualiteacute Le volume des blogs publieacutes et maintenus chaque jour est lui

aussi en constante augmentation

Le White Paper Blogs et RSS des outils pour la veille strateacutegique deacuteveloppe les

aspects inteacuteressants des blogs pour le professionnel de linformation130

b Les Wikis

Le wiki est finalement diffeacuterent du blog de par sa nature et son utilisation Selon

Wikipedia le Wiki est un site Web dynamique permettant agrave tout individu den

modifier les pages agrave volonteacute Il permet de communiquer et diffuser des informations

rapidement de structurer cette information pour permettre dy naviguer

commodeacutement (Wiki vient du terme hawaiien wiki wiki =rapide ou informel)

Lagrave ougrave le blog sera adapteacute agrave la diffusion dactualiteacute et de contenu se renouvelant

freacutequemment le wiki sera davantage deacutedieacute agrave du texte plus statique mais neacutecessitant

ou pouvant senrichir de la collaboration de plusieurs personnes Ainsi les articles

dune encyclopeacutedie ou les fiches correspondants aux diffeacuterentes phases dun projet

impliquant de nombreux collaborateurs pourront ecirctre reacutealiseacutees sous forme de

Wiki

Sur un blog laffichage du contenu est anteacute-chronologique (le plus reacutecent en haut)

sur un wiki il est structureacute en rubriques larchitecture comme le contenu pouvant

ecirctre modifieacutes agrave tout moment par les participants Ceux-ci peuvent beacuteneacuteficier de

droits daccegraves et de modification hieacuterarchiseacutes

Les versions anteacuterieures ainsi que les modifications sont accessibles via une rubrique

Historique Sur un blog le visiteur peut collaborer mais uniquement via ses

commentaires Sur un wiki tout collaborateur autoriseacute peut modifier le texte

comme le titre et lorganisation des rubriques

Par ailleurs la prise en main dun wiki et de ses syntaxes denrichissement et

modification demande un peu de pratique et nest pas aussi simple que le

maniement dun blog Le wiki est un des outils ideacuteaux pour la gestion de projet

Certaines entreprises les utilisent en tant que tel (parfois en parallegravele avec les blogs)

pour eacuteviter des eacutechanges des recherches et un archivage via les mails fastidieux

copy Digimind Digimind Services ndash White Paper |74

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Geacutereacute via des droits daccegraves gradueacutes il peut alors se reacuteveacuteler comme un outil tregraves

simple agrave manier et agrave sapproprier Ces wikis seront eacutevidemment reacuteserveacutes agrave

lentreprise en accegraves priveacute

Exemples de wikis publics

gt Wikipedia131

Le wiki le plus connu est Wikipedia lencyclopeacutedie collaborative gratuite dont le

contenu est creacuteeacute et maintenu par des milliers dinternautes beacuteneacutevoles Chacun est

libre de creacuteer un article modifier ceux des autres ou les commenter En mai 2007

lencyclopeacutedie proposait plus de 7 millions darticles dans 192 langues et dialectes

dont plus de 500 000 en franccedilais Wikipedia jouit dune populariteacute et dun succegraves

tregraves important Google indexe de nombreux articles de Wikipedia agrave tel point quil

est rare deffectuer une recherche sur le moteur sans voir safficher une deacutefinition

issue de lencyclopeacutedie Selon la socieacuteteacute de mesure daudience Comscore en janvier

2007 Wikipedia eacutetait le 9egraveme site US le plus visiteacute (derriegravere les sites Yahoo

premiers puis les sites Time Warner Microsoft Google eBay Fox Interactive

Amazon et Ask) 6 groupes eacuteditant un moteur geacuteneacuteraliste (Google Ask Microsoft

Yahoo Amazon et AOL) occupent le top10 US Mais cest la premiegravere fois quun

site collaboratif truste les premiegraveres places des sites les plus visiteacutes

Wikipedia comme tout service leader est tregraves critiqueacute Notamment sur la

possibiliteacute pour tout un chacun de modifier et de creacuteer des articles pouvant

entraicircner des risques de diffamation ou de vandalisation 132 Mecircme si ces risques

sont reacuteels nous le verrons dans la partie consacreacutee aux limites du Web 20 il ne

faut pas pour autant se focaliser sur ces problegravemes

Par ailleurs on a souvent mis en cause la qualiteacute des articles du contenu eacutemanant

dinternautes pas forceacutement qualifieacutes ou experts et donc par nature douteux Or

une eacutetude commandeacutee par la Revue Nature agrave remis en cause ce type de ressenti

des experts ont compareacute 42 documents publieacutes sur Wikipedia et sur la ceacutelegravebre

Encyclopaedia Britannica Reacutesultat la qualiteacute des deux sources est assez proche133

Seulement 8 erreurs seacuterieuses comme des mauvaises interpreacutetations de concepts

ont eacuteteacute repeacutereacutees dans les articles analyseacutes 4 pour chaque encyclopeacutedie Des

erreurs factuelles omissions ou fausses descriptions ont eacutegalement eacuteteacute deacutetecteacutees

162 dans Wikipedia et 123 dans lEncyclopaedia Britannica

Le succegraves et limportance de Wikipedia nont pas eacutechappeacute aux moteurs de

recherche qui sont plusieurs agrave secirctre speacutecialiseacutes dans la recherche sur lencyclopeacutedie

Ainsi WikiSeek 134 est un moteur lanceacute deacutebut 2007 qui recherche sur le contenu de

Wikipedia Il indexe le contenu en crawlant les pages en profondeur et aspire

eacutegalement le contenu des liens preacutesents sur les pages de lencyclopeacutedie

copy Digimind Digimind Services ndash White Paper |75

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Plus eacutelaboreacute le moteur franccedilais Exalead 135 enrichit consideacuterablement la recherche

dans lencyclopeacutedie en ligne Cette fonctionnaliteacute est accessible en cliquant sur

longlet Wikipedia Il est eacutevidemment possible de rechercher des articles par mots

cleacutes mais aussi daffiner par langue via le nuage de tags dynamique ( les eacutetiquettes

correspondent agrave des emplacements geacuteographiques personnes ceacutelegravebres noms

drsquoorganisations termes lieacutes agrave votre requecircte ou cateacutegories de Wikipedia)

WikiMindmap 136 recherche sur Wikipedia et affiche les reacutesultats sous forme de

MindMap (cartes heuristiques) Il est alors possible de naviguer dans larborescence

des termes

WikiMindMap

gt Citizendium 137 Lanceacute fin 2006 Citizendium est une initiative de Larry Sanger co-fondateur de

Wikipedia avec Jimmy Wales Citizendium est eacutegalement une encyclopeacutedie Mais

jugeant la communauteacute Wikipedia senseacutee srsquoauto-reacuteguler dysfonctionnelle Larry

Singer integravegre dans Citizendium des proceacutedures de seacutelection des articles par des

experts et refuse aux contributeurs la possibiliteacute de lrsquoanonymat misant ainsi sur la

responsabilisation Le collegravege dexperts a le dernier mot concernant la veacuterification

des articles le but eacutetant dobtenir une encyclopeacutedie contenant le moins derreurs

possible Citizendium est structureacutee en grandes cateacutegories acadeacutemiques

correspondant agrave des groupes de travail Sciences naturelles Sciences Humaines

Arts Sciences Humaines Divertissement Arts appliqueacutes et Sciences

copy Digimind Digimind Services ndash White Paper |76

Le Web 20 pour la veille et recherche dinformation DIGIMIND

gt Alacrawiki 138

AlacraWiki est un guide deacutedieacute aux socieacuteteacutes du secteur de linformation eacutediteurs et

bases de donneacutees La rubrique Alacra Industry Spotlights est particuliegraverement

remarquable elle fournit des analyses et commentaires sur les sites dinteacuterecirct pour

une trentaine de secteurs industriels Le wiki offre des informations sur les

agreacutegateurs de contenu les bases de donneacutees et les meilleurs blogs deacutedieacutes au

secteur de linformation on-line Alacra propose aussi un blog et un fils RSS

Alacra Wiki

gt Les fils RSS 139

Sur cette page de wiki vous trouverez agrave peu pregraves tout sur le RSS

La norme comment utiliser les fils RSS des articles une seacutelection dagreacutegateurs

mixer des fils RSS entre eux mesurer lactiviteacute des fils RSS creacuteer un fil RSS

gtWikidweb 140

Wikidweb est un Wiki qui propose un reacutepertoire de sites web (et non de wikis)

Aussi vous pouvez y participer selon les fonctionnaliteacutes courantes du format wiki

vous avez ainsi la possibiliteacute dy ajouter vos propres sites mais eacutegalement de

modifier les entreacutees des autres internautes (urls texte) ou de les commenter

copy Digimind Digimind Services ndash White Paper |77

Le Web 20 pour la veille et recherche dinformation DIGIMIND

IV Surveiller

Nous lavons vu dans la partie Recherche de blogs et de flux RSS les flux RSS sont

preacutesents sur de nombreux formats du net et vont permettre de surveiller les

nouveauteacutes apparaissant sur les blogs les sites corporate les sites de presse dans

les reacutesultats de moteurs de recherche dactualiteacutes de blogs web dans les

newsgroups sur certains forums web sur certaines listes de diffusion les

bookmarks sociaux les sites de partage de photos et de videacuteoshellipbref sur de tregraves

nombreux sites classiques et ressources collaboratives de type 20

Ces flux RSS peuvent ecirctre inteacutegreacutes agrave votre process de veille en deux clics via des

outils simples gratuits ou payants mais plus puissants

a La deacutetection du flux RSS

Pour pouvoir mettre en surveillance le flux RSS (RSS Feed en anglais) il faut dabord

le trouver Or il nest pas toujours aiseacute de mettre la main sur ces petits logos

oranges ou les liens RSS Abonnez-vous Syndiquez ce flux qui pointent vers les

flux RSS parfois cacheacutes dans les meacuteandres des pages web

Des icocircnes signalant la preacutesence de flux RSS

Certains navigateurs permettent de deacutetecter automatiquement les flux lorsquils

sont preacutesents sur une page web Une icocircne vous avertira alors et dans la plupart

des cas affichera ladresse du ou des flux disponibles sur la page Plusieurs formats

de flux peuvent coexister les diffeacuterentes versions du RSS (090 091 092 10 20)

et le format ATOM concurrent mais offrant les mecircmes fonctionnaliteacutes

Internet Explorer 7 Opera Firefox permettent de deacutetecter les flux Cest aussi le cas

de Maxthon une puissante interface de navigation qui vient se greffer sur

larchitecture dInternet Explorer 141

copy Digimind Digimind Services ndash White Paper |78

Le Web 20 pour la veille et recherche dinformation DIGIMIND

b La mise en surveillance

Quelque soit laspect de la page qui contient votre flux RSS (xml rdf interface

Feedburner) il convient de copier et coller ladresse (url) dans loutil qui va vous

servir agrave lire ce flux et agrave ecirctre alerteacute degraves lors quune nouveauteacute apparaicirct

4 grands types doutils peuvent ecirctre utiliseacutes (du plus simple au plus sophistiqueacute)

- Les navigateurs web

Les navigateurs citeacutes preacuteceacutedemment outre la deacutetection du flux RSS permettent de

sy abonner et de les lire Les flux sintegravegrent alors dans un menu lateacuteral ou dans la

page principale Cest simple mais deacutepourvu de fonctions avanceacutees de tri ou

dorganisation

- Les lecteurs (ou agreacutegateurs) de flux RSS

Ce sont les outils deacutedieacutes aux fils RSS Comme de nombreuses applications ces

lecteurs sont soit disponibles en ligne soit agrave installer localement sur votre PC

- Exemples de lecteurs RSS en ligne Bloglines Pluck Newsgator

- Exemples de lecteurs RSS installeacutes RSS Reader Amphetadesk Newsgator (sintegravegre

agrave Outlook) FeedDemon

Le lecteur Bloglines exploite de maniegravere astucieuse la logique communautaire

lorsque vous ecirctes abonneacute agrave un flux RSS vous pouvez visualiser les autres abonneacutes

(ceux qui ont accepteacute de rendre leur abonnement public) Un clic sur leur nom

affiche tous les fils RSS auxquels ils ont souscrits un moyen rapide de deacutecouvrir

dautres ressources pertinentes collecteacutees par des internautes proches de vos

centres dinteacuterecirct

Les lecteurs RSS sont tregraves nombreux Pour mieux les distinguer certains blogs ou

sites proposent des comparatifs142

copy Digimind Digimind Services ndash White Paper |79

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La communauteacute sur Bloglines les abonneacutes au flux RSS du blog Voip Weblog

- Les pages personnalisables

Ce sont des pages web geacuteneacuteralement organiseacutees en onglets et boicirctes permettant

dorganiser et de ranger ses flux par cateacutegories et ce dans un mecircme espace Ces

services sont ergonomiques et ideacuteaux pour lire dun coup doeil le maximum de flux

Les plus connus sont NetVibes PageFlakes ou Webwag

Outre la lecture de flux RSS ces pages offrent la possibiliteacute dinteacutegrer des services

de meacuteteacuteo mail bloc-notes et des flux provenant de service sociaux comme les

bookmarks ou les reacuteseaux damis

Certains blogs fournissent des listes et comparatifs de ces services143

- Les progiciels de veille inteacutegreacutes

Face agrave labondance des flux RSS et blogs des applications de veille inteacutegreacutee comme

Digimind Evolution 144 donnent la possibiliteacute de filtrer les RSS via lapplication de

requecirctes diffeacuterentes sur chaque fils RSS

On peut ainsi seacutelectionner les informations agrave remonter via des requecircte simples ou

plus complexes (booleacuteens parenthegraveses troncatures et opeacuterateurs de proximiteacute) agrave

longueur illimiteacutee En outre il est possible de surveiller jusquagrave 10 000 flux RSS

quotidiennement

Les boutons inteacutegreacutes

Certains sites vont vous simplifier la tacircche ils affichent sur leurs pages agrave coteacute de

leurs flux des boutons qui permettent dajouter directement le flux agrave votre lecteur

copy Digimind Digimind Services ndash White Paper |80

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ainsi le service dactualiteacutes Wikio ou le moteur Ask Blogs amp Flux proposent tous

deux des boutons vers Bloglines MyYahoo Google Reader Newsgator et Ask Blog

Les fichiers OPML

LOPML (Outline Processor Markup Language) est un format deacuteveloppeacute en XML qui

permet leacutechange dinformations structureacutees entre applications fonctionnant sur des

OS et environnement diffeacuterents Exemple les abonnements dun internaute agrave un

ensemble de flux RSS entre un navigateur Firefox et Internet Explorer de MacOS agrave

Windows XP

Des agreacutegateurs RSS comme Bloglines NewsGator ou Rojo offrent la possibiliteacute

dexporter lensemble de vos flux RSS favoris ou ceux dautres abonneacutes au format

OPML pour les importer ensuite dans votre agreacutegateur

Share your OPML145 est comme son nom lindique un portail qui vous permet de

partager vos flux RSS au format OPML Ce service liste des centaines de fichiers

OPML

c Pourquoi une veille via le RSS

Faire une veille via les fils RSS preacutesente des inteacuterecircts notables

- Lhyper-segmentation le choix des fils RSS rend possible une seacutelection fine de

linformation Ainsi sur le site du Figaro on peut choisir lactualiteacute internationale

nationale les sciences et meacutedecine eacutevitant ainsi decirctre submergeacute par linformation

superflue Sur La Tribune on peut seacutelectionner un flux par socieacuteteacute

Certains blogs proposent mecircme des flux RSS permettant aux choix de surveiller les

commentaires ou uniquement les billets

- Un gain de temps inutile de se connecter au site au blog ou au moteur de

recherche pour visualiser ses nouveauteacutes

- Lanonymat labonnement agrave un flux RSS contrairement agrave une newsletter ou agrave une

liste de diffusion est anonyme

- La consultation aiseacutee vos fils RSS via une lecture sur un agreacutegateur en ligne sont

accessibles de nimporte quel PC connecteacute agrave linternet ougrave que vous soyez

copy Digimind Digimind Services ndash White Paper |81

Le Web 2

copy Digimin

0 pour la veille et recherche dinformation DIGIMIND

d Digimind Services ndash White Paper

V Carte des outils et ressources Web 20

gt Page suivante

|82

wwwdigimindcom Digimind Services ndash White Paper|83

Carte des outils et ressources Web 20 - DIGIMIND Services 2007

Le Web 20 pour la veille et recherche dinformation DIGIMIND

EXEMPLE DUNE RECHERCHE ET VEILLE VIA LE WEB 20

Cas drsquoeacutecole Nous avons agrave mener une recherche et une veille sur le

deacuteveloppement des smartphones ou teacuteleacutephones multimeacutedias haut de gamme Des

sites de type 20 pourront se reacuteveacuteler compleacutementaires de sites classiques (sites

drsquoentreprises portails associations professionnelleshellip) pour deacutetecter les tendances

et sujets eacutemergents

Une premiegravere recherche via lrsquoencyclopeacutedie Wikipedia permettra drsquoobtenir une

premiegravere deacutefinition du sujet et drsquoidentifier les principaux mots cleacutes ainsi que des

liens vers des sites pertinents

Etape suivante nous pourrons eacutelargir notre recherche en identifiant des sites

similaires aux sites trouveacutes preacuteceacutedemment via les suggestions fournies par des

moteurs collaboratifs tels que Yoono ou Similicious

Une recherche sur le tag Smartphone dans des sites de social bookmarking

comme Delicious nous permettra eacutegalement drsquoidentifier les pages plus ou moins

populaires taggeacutees par les contributeurs du site ainsi que drsquoautres tags en relation

avec notre sujet

Explorons ensuite les avis drsquoexperts plus ou moins autoriseacutes que lrsquoon trouvera dans

les meacuteandres de la blogosphegravere gracircce agrave des moteurs de blogs comme Technorati

Blogpulse ou Google Blog Search

La recherche pourra srsquoeffectuer via les tags ou le texte inteacutegral des billets On

pourra ensuite parcourir les blogrolls des auteurs les plus pertinents afin drsquoidentifier

drsquoautres sources

La lecture des blogs fournira non seulement des avis de speacutecialistes ou journalistes

mais aussi des avis plus ou moins critiques de consommateurs ou utilisateurs de

smartphoneshellip

Il conviendra toutefois de rester vigilant quant agrave lrsquoeffet pot de miel de certains

blogs ougrave les contributions des internautes se reacutevegravelent ecirctre de simples messages

publicitaires deacuteguiseacutes (voir agrave ce sujet la mise en garde du site UFC Que choisir146)

Pour recueillir les derniegraveres informations drsquoactualiteacute on pourra utiliser un

agreacutegateur tel que Wikio ou Digg et creacuteer un flux RSS agrave partir drsquoune requecircte sur les

copy Digimind Digimind Services ndash White Paper |84

Le Web 20 pour la veille et recherche dinformation DIGIMIND

tags preacuteceacutedemment identifieacutes Wikio propose des raccourcis pour inteacutegrer ce flux

au sein de plusieurs lecteurs RSS du marcheacute (Netvibes Newsgator Google Reader

etc)

Les reacuteseaux sociaux professionnels permettront eacutegalement drsquoidentifier des acteurs

importants du domaine dans les sphegraveres universitaires ou de lrsquoentreprise

La communauteacute 20 srsquoexprimera eacutegalement sur les grands portails consacreacutes aux

nouvelles technologies Crsquoest le cas par exemple du portail ZDNet qui permet aux

utilisateurs de commenter les articles ou de les ajouter directement agrave leur profil

Delicioushellip Les commentaires ou les trackbacks pointant sur un article pourront

constituer un preacutecieux compleacutement drsquoinformations

Afin de mener une veille reacuteguliegravere sur le sujet on syndiquera les flux RSS provenant

des diffeacuterents sites ou blogs identifieacutes Pourquoi ne pas eacutegalement creacuteer agrave partir de

ce bouquet de sources personnaliseacutees un moteur sur mesure conccedilu gracircce agrave Rollyo

ou Yahoo Search Builder

copy Digimind Digimind Services ndash White Paper |85

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Les limites du Web 20

LA PARTICIPATION

I Une participation heacuteteacuterogegravene

Nous lavons deacutejagrave eacutevoqueacute tout le monde ne participe pas de la mecircme maniegravere sur

les applications du Web 20

Une minoriteacute participativehellip

Bill Tancer de la socieacuteteacute de mesure daudience Hitwise reacutevegravele dans une eacutetude147

que sur les sites type Web 20 les internautes regardent mais participent peu

Seulement 016 des visiteurs du site YouTube viennent y partager leurs videacuteos

Les 9984 restant ne font que regarder Idem pour le site de partage de photos

de Yahoo Flickr seulement 02 des visites conduisent agrave la publication de photos

Wikipedia est lexception sur lencyclopeacutedie collaborative gratuite 46 des

visites correspondent agrave une modification des articles

Sur ces sites on est donc encore loin de la regravegle de la 11089 eacutedicteacutee par Charles

Arthur dans The Guardian148 Il estime que sur le net sur un groupe de 100

personnes si une creacutee du contenu 10 vont interagir (commentaires

ameacuteliorations) et les 89 restant ne feront que le lire et regarder Le journaliste

lillustre via des exemples quantifieacutes avec YouTube Wikipedia ou Yahoo Groups

Most Web 20 Users Are Really Just Couch Potatoes Bruce Nussbaum compare

mecircme les internautes Web 20 aux spectateurs de TV passifs et affaleacutes dans leurs

canapeacutes149

Mais parallegravelement les sites de type Web 20 ont vu leur audience grimper

de668 en 2 ans reacutevegravele leacutetude Hitwise Cela repreacutesente 12 du trafic web aux

USA contre 2 il y a seulement 2 ans

Les sites de partage de photos sont parmi les plus populaires Flickr bien sucircr mais

aussi PhotoBucket qui repreacutesente agrave lui seul 41 du trafic des sites de photos en

ligne

copy Digimind Digimind Services ndash White Paper |86

Le Web 20 pour la veille et recherche dinformation DIGIMIND

hellipdautant plus que la forme de participation se complexifie

Dapregraves le cabinet Forrester les internautes sont nombreux sur les actions agrave faible

niveau dexigence (lire enregistrer un signet commenter) mais beaucoup moins sur

des participations plus actives (eacutecrire collaborer) 150

Wikipedia un faux modegravele collaboratif

On cite souvent lencyclopeacutedie Wikipedia en exemple cest lun des emblegravemes les

plus forts et les plus lus du Web 20 Son mode de fonctionnement est

caracteacuteristique voire symptomatique du web collaboratif Mais le process de

Wikipedia serait finalement tregraves classique avec une hieacuterarchie de contributeurs

sorte de cadres disposant de nombreux droits eacutecrivant la majoriteacute des articles

Cest lanalyse de Lionel Barbe du CNRS151 Il explique que si le principe de liberteacute

de publication sur Wikipedia reste valable il est de moins en moins commun car

la plupart des entreacutees basiques ne precirctant pas agrave discussion ont deacutejagrave eacuteteacute effectueacutees

Lrsquoeacutetude des laquo logs raquo historiques montre que la creacuteation de nouvelles entreacutees qui

correspondent agrave de nouvelles pages articles dans la Wikipedia Francophone ne

concerne qursquoenviron 3 agrave 4 des opeacuterations Par comparaison cette proportion tombe

agrave 2 pour la version anglaise de Wikipedia qui contient plus de 1 million drsquoarticles A

lrsquoinverse la proportion monte entre 8 et 10 pour des Wikipedias ayant moins de

100 000 articles comme la Wikipedia en Lituanien et bien drsquoautres

Selon lui on assiste agrave un effet de professionnalisation de lencyclopeacutedie [hellip] les

plus gros contributeurs que nous consideacutererons comme eacutetant les 5 des individus

eacuteditant le plus drsquoarticles eacuteditent entre 85 et 95 du contenu total de lrsquoencyclopeacutedie

Au fur et agrave mesure ces gros contributeurs acquiegraverent des privilegraveges comme le statut

drsquoadministrateur qui leur permettent non seulement de participer mais aussi de

surveiller et le cas eacutecheacuteant censurer le contenu eacutediteacute par les autres contributeurs et de

participer aux grandes lignes de lrsquoorganisation de Wikipedia

Cette analyse a toutefois eacuteteacute battue en bregraveche par Aaron Swartz dans une petite

eacutetude 152 En mesurant non pas le nombre drsquointerventions de chaque contributeur

mais la quantiteacute de texte produit par chacun la reacutealiteacute est diffeacuterente les

contributeurs occasionnels eacutecriraient des textes longs en peu dinterventions tandis

que les eacutediteurs actifs reacutealiseraient un travail tenant davantage de la maintenance

(correction veacuterification suppression) mais sans apporter beaucoup de texte

copy Digimind Digimind Services ndash White Paper |87

Le Web 20 pour la veille et recherche dinformation DIGIMIND

II Une participation damateurs

Tout internaute peut-il simproviser journaliste expert commentateurhellip

Michel Fingerhut 153 voit dans le succegraves dune encyclopeacutedie comme Wikipedia une

manifestation du web comme heacutegeacutemonie de lrsquoamateurisme et comme encouragement

agrave lrsquoextreacutemisme ideacuteologique et au communautarisme

Les contenus creacuteeacutes et diffuseacutes sont-ils de qualiteacute Le Web 20 devient une

plateforme qui stimule la creacuteativiteacute et la production de contenu par cela mecircme

qursquoelle en permet la diffusion (avec indice de notorieacuteteacute) On assiste agrave une libeacuteration

de talents qui peuvent enfin se reacuteveacuteler parallegravelement agrave des productions

caracteacuteriseacutees par un certain amateurisme et lrsquoabsence de veacuteritable ambition

creacuteatrice Car comme sur lensemble de linternet sur ce Web 20 le pire cocirctoie le

meilleur

Par ailleurs toujours en prenant lexemple de Wikipedia un certain nombre de

pheacutenomegravenes se reacutevegravelent tout de mecircme preacuteoccupants

Si leacutetude reacutealiseacutee pour le magazine Nature reacutevegravele que la qualiteacute des articles de

lencyclopeacutedie est presque au niveau de celle de lEncyclopaedia Britannica certains

articles de Wikipedia relegravevent de la deacutesinformation ou de la propagande

- larticle Droits de lHomme en Iran154 a ainsi eacuteteacute tregraves controverseacute en effet cet

article tregraves long de plus de 20 pages se preacutesente davantage comme une apologie du

reacutegime iranien quune analyse argumenteacutee des droits de lhomme dans ce pays Or

certainement au nom du principe de neutraliteacute qui reacutegit Wikipedia cet article

tendancieux a eacuteteacute classeacute comme article de qualiteacute 155

- le cas Seigenthaler 156 en mai 2005 un contributeur publie anonymement sur

Wikpedia un article sur John Seigenthaler Sr un eacutecrivain ceacutelegravebre aux USA Or ce

billet mentionne que leacutecrivain a eacuteteacute directement impliqueacute dans les assassinats de

John et Bob Kennedy en preacutecisant toutefois que rien na jamais eacuteteacute prouveacute Cette

information est tout simplement fausse Mais larticle nest deacutecouvert (par un ami de

John Seigenthaler) et corrigeacute que 4 mois plus tard mettant agrave mal la creacutedibiliteacute de

lencyclopeacutedie A la suite de cette affaire largement relayeacutee par les meacutedias

ameacutericains le fondateur de Wikipedia a rigidifieacute les regravegles de publication concernant

les tout nouveaux contributeurs

Certes sur les milliers darticles mis en ligne par Wikipedia ces dysfonctionnements

restent heureusement minoritaires mais ils reacutevegravelent tout de mecircme certaines limites

du tout collaboratif et la neacutecessiteacute de regravegles de publication emprunteacutees aux meacutedias

classiques

copy Digimind Digimind Services ndash White Paper |88

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Lagreacutegation de petites choses faciles

Elles ont tendance agrave dominer le contenu du Web 20 La faciliteacute de publication le

rythme des blogs qursquoil convient drsquoalimenter freacutequemment peut entrer en conflit

avec le temps de la recherche et de la reacuteflexion Souvent les thegravemes traiteacutes ne

peuvent degraves lors ecirctre que des sujets du quotidien des opinions non reacutefleacutechies non

argumenteacuteeshellipOn peut donc craindre agrave linstar du mode de diffusion sur dautres

meacutedias quinteacutegreacute agrave un reacuteseau social noteacute eacutevalueacute agrave la recherche de notorieacuteteacute et de

visibiliteacute le creacuteateur de contenu ait tout inteacuterecirct agrave aller dans le sens de son audience

produire du divertissant plus agrave mecircme de lui garantir un succegraves immeacutediat

Par ailleurs des opinions peuvent-elles se transformer en jugement pertinent par

lrsquoeffet de leur agreacutegation Lrsquoagreacutegation drsquoune quantiteacute importante drsquoavis peut elle

vraiment deacutepasser lrsquoimpreacutecision des avis pris indeacutependamment Peut-on sans une

harmonisation des critegraveres drsquoappreacuteciation atteindre un jugement collectif fiable Les

tendances qui ressortent risquent en effet de se limiter souvent au reflet de

lrsquoopinion majoritaire

Mais leacutevocation de ces limites ne doit pas occulter toutes les contributions matures

produites par des internautes soucieux dapporter un contenu veacuteritablement

constructif Les billets et les commentaires de nombres de blogs politiques franccedilais

en 2007 en sont une parfaite illustration

LE WEB 10 RESTE NECESSAIRE

Le mail reacutesiste

Nous lavons vu au cours de la description des applications pour la veille les services

Web 20 ne sont pas suffisants en soit pour la recherche dinformation De plus

bien que ses possibiliteacutes soient tregraves puissantes lutilisation du Web 20 reste encore

marginale agrave leacutechelle de tous les internautes Une eacutetude du cabinet Pew Internet 157

montre que lactiviteacute internet dominante sur une journeacutee type dun ameacutericain reste

tout simplement le mail 53 des internautes lutilisent Ils sont 38 agrave utiliser un

moteur de recherche Par contre ils ne sont que 8 agrave creacuteer des blogs et 26 agrave

partager des photos et videacuteos cette collaboration multimeacutedia eacutetant de loin lactiviteacute

la plus courante du Web 2

copy Digimind Digimind Services ndash White Paper |89

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Une enquecircte en ligne de lUniversiteacute dOxford reacutealiseacutee aupregraves de 1469 personnes

(une majoriteacute deacutetudiants) fin 2006 deacutetaille les usages du Web 20 158 Elle reacutevegravele elle

aussi que les applications de ce web nouvelle geacuteneacuteration sont encore peu connues

et peu utiliseacutees La majoriteacute des reacutepondants na jamais employeacute ou jamais entendu

parleacute des fils RSS ou des applications de Social Bookmarking comme Delicious

Aussi linfluence grandissante du Web 20 ne doit pas masquer les usages

traditionnels du web qui restent majoritaires

Une population souvent isoleacutee et non repreacutesentative

Lage

Si de nombreuses applications sociales apportent un reacuteel progregraves il faut tempeacuterer

la nature de certains contenus issus du mode collaboratif celui-ci nest en effet pas

repreacutesentatif des internautes puisque le public du Web 20 est une population plutocirct

jeune

Ainsi leacutetude Pew Internet reacutevegravele que laudience de Wikipedia aux USA eacutetait en aoucirct

2006 agrave 47 situeacutee dans la tranche des 18-34 ans Les plus de 45 repreacutesentaient

28 Sur le site dEncarta lencyclopeacutedie de Microsoft plus traditionnelle (Web 10)

la part des plus de 45 ans atteint 33

Des communauteacutes isoleacutees structureacutees en icircles Les communauteacutes actuelles du Web 20 sont souvent renfermeacutees sur elles-mecircmes

les statistiques sur les liens pointant vers les blogs et sur les liens preacutesents dans les

billets reacutevegravelent que les blogueurs se lient et se lisent beaucoup entre eux

Lrsquointernaute Web 20 aurait donc tendance agrave senfermer sur lui-mecircme et autour

dindividus feacutedeacutereacutes en communauteacutes focaliseacutes sur les mecircmes centres drsquointeacuterecirct que

lui

Par ailleurs lhyper segmentation et le ciblage des nouvelles rendu possible par le

flux RSS notamment peut conduire agrave favoriser ces microcosmes communautaires

Parcourir un journal papier peut favoriser davantage louverture la prise de recul et

la mise en perspective des diffeacuterentes informations que la lecture de flux aux

theacutematiques tregraves speacutecialiseacutees

Les diffeacuterentes communauteacutes par reacuteflexe et de par la nature des applications Web

20 qui se dupliquent mais ne se connectent pas ont tendance agrave peu communiquer

entre elles Ainsi les liens entre reacuteseaux sociaux sont rares Peu de personnes

copy Digimind Digimind Services ndash White Paper |90

Le Web 20 pour la veille et recherche dinformation DIGIMIND

enregistreacutes sur LinkedIn iront eacutegalement sinscrire sur Viadeo ou FaceBook

Latomisation des donneacutees sur des dizaines dapplications reste eacutegalement un vrai

problegraveme

Des domaines mal couverts

Certaines theacutematiques vont ecirctre surrepreacutesenteacutees au deacutetriment dautres au

traitement beaucoup plus confidentiel car boudeacutees par les internautes producteurs

volontaires dinformation Les ingeacutenieurs techniciens et jeunes eacutetant fortement

repreacutesenteacutes parmi les blogueurs les theacutematiques high tech sont tregraves largement

couvertes par les blogs par exemple dans le domaine de la RFID (Identification par

Radio Freacutequence) on compte plus de 100 blogs idem pour la VoIP (Voix sur IP) A

linverse si vous travaillez dans le secteur des machines outils ou de la plasturgie il

vous sera difficile de trouver du contenu sur la blogosphegravere

Tous les secteurs ne sont donc pas eacutegaux en volume sur le net et davantage encore

sur la blogosphegravere et sur les autres applications collaboratives ougrave tout internaute

peut publier son propre contenu et ougrave certaines tranches dacircges et cateacutegories

professionnelles ne sont pas bien repreacutesenteacutees

copy Digimind Digimind Services ndash White Paper |91

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Conclusion

Le Web 20 ce mot qui geacutenegravere eacutenormeacutement de buzz deacutecrits et de blogs

speacutecialiseacutes nest-il quun terme marketing un courant de mode 159 Il est probable

que bientocirct on ne lemploiera plus pour deacutesigner ces nouvelles applications qui

seront devenues la norme Toutefois ce terme sorte de parapluie conceptuel qui

recouvre les diffeacuterentes tendances du web nouvelle geacuteneacuteration a le meacuterite de

mettre un nom simple sur un courant du net novateur

Le Web 20 nest pas une reacutevolution ou une rupture technologique mais plus

certainement une eacutevolution qui permet de replacer lutilisateur au centre des

reacuteseaux Cela nest certes pas tregraves nouveau Usenet lun des plus anciens

protocoles de linternet bien anteacuterieur au WWWeb offrait du contenu en ligne

creacuteeacute par linternaute via les Newsgroups degraves les anneacutees 1980

Mais les progregraves technologiques ont permis dintensifier cette tendance et de

deacutemocratiser laccegraves agrave la creacuteation de contenu en ligne et agrave sa diffusion au plus grand

nombre Potentiellement tout internaute peut maintenant diffuser ses publications

tant les outils sont devenus simples

Le Web 20 tend agrave sinseacuterer au cœur du quotidien de chacun en lui apportant des

services novateurs reacuteellement utiles et qui rendent possible lrsquoapparition de

nouveaux usages Ainsi les mash-up qui srsquoappuient sur la geacuteolocalisation ouvrent

des possibiliteacutes inenvisageables jusquici On peut mecircme imaginer agrave terme une

superposition de ces cartes dynamiques agrave la vision reacuteelle dun pieacuteton ou dun

automobiliste Le Web 20 est en perpeacutetuelle eacutevolution ses capaciteacutes drsquoinnovation

sont tregraves fortes car elles reposent souvent sur des recombinaisons audacieuses de

lrsquoexistant hybridant applications et services dans un systegraveme de deacuteveloppement

open source hellipLrsquoinnovation est aussi innovation de postures (prendre la parole

consommer du contenu amateurhellip) qui parfois challengent lrsquoordre eacutetabli et

redistribuent les pouvoirs La position des acteurs du Web 10 ou des meacutedias

classiques pourrait se trouver de plus en plus remise en question lagrave ougrave les

internautes tendent agrave se placer en experts

copy Digimind Digimind Services ndash White Paper |92

Le Web 20 pour la veille et recherche dinformation DIGIMIND

La place de lhumain

Si celle-ci est devenue preacutepondeacuterante il est toutefois difficile de saffranchir

dorganisations un tant soit peu hieacuterarchiseacutees lautoreacutegulation voir Wikipedia ayant

ses limites

En outre la question de la consommation de contenu et de sa qualification sur

lrsquointernet devient cruciale La pertinence des votes de tous les internautes est

discutable ou du moins le fait qursquoils puissent agrave eux seuls qualifier et eacutevaluer la

qualiteacute Par ailleurs que repreacutesente exactement un vote une adheacutesion au contenu

agrave la forme aux ideacutees aux eacutecrits dun ami agrave une ideacutee avec laquelle je suis en

deacutesaccord mais qui agrave le meacuterite dexister

Finalement il faut continuer agrave normer organiser coordonner

reacutegulerhellipnotamment pour eacuteviter les diffamations ou la deacutesinformation Pour ce qui

est du contenu et de sa qualiteacute les critiques eacutemises agrave lrsquoencontre de Wikipeacutedia nous

incitent agrave eacutetudier de plus pregraves les initiatives qui hybrident les interventions

drsquoamateurs avec les compeacutetences de professionnels

Nous sommes passeacutes en 10 ans dun contenu geacuteneacutereacute par quelques internautes pour

la masse agrave un contenu de masse agrave destination de la masse (Evertybody to

Everybody) Cela ne peut guegravere se deacutevelopper sans des meacutecanismes qui replacent

les internautes les plus speacutecialiseacutes dans des processus de validation dune

information devenue pleacutethorique

Les donneacutees personnelles

Simpliciteacute reacuteactiviteacute personnalisation souplesse mutualisationhellipfont partie des

avantages les plus appreacuteciables du web 20 Mais cette liberteacute de publication et de

diffusion nrsquoest elle pas parfois illusoire Les utilisateurs doivent rester vigilants face

aux problegravemes de confidentialiteacute seacutecuriteacute et traccedilabiliteacute de lrsquoinformation160 Des voix

srsquoeacutelegravevent pour deacutenoncer les risques lieacutes agrave la maicirctrise des donneacutees personnelles ou

au respect des droits drsquoauteurs A noter que les licences Creative Commons161

permettent de mieux deacutefinir les contours de cette liberteacute agrave partir de contrats

flexibles de droit dauteur Ce systegraveme Creative Commons donne la possibiliteacute

gratuitement et simplement aux titulaires de droits de choisir et drsquoexprimer les

conditions drsquoutilisation de leurs œuvres agrave travers onze possibiliteacutes Quant aux

utilisateurs ils nrsquoont pas agrave neacutegocier systeacutematiquement une autorisation avant toute

utilisation ou reacuteutilisation

copy Digimind Digimind Services ndash White Paper |93

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Un autre problegraveme reacuteside aussi dans lrsquoeacuteparpillement des donneacutees dans des sites

diffeacuterents ou parfois redondants Il srsquoagira donc de deacutefinir les objets (livre

personne CD photoshellip) agrave partir drsquoun identifiant Cette bataille pour savoir qui

geacuterera ces donneacutees de base telles que la position geacuteographique les espaces de noms et

le code unique de chaque produit a deacutejagrave commenceacute estime Tim OReilly 162

Les perspectives deacutevolution vers un Web 3

Le web actuel est destructureacute et la classification et lrsquoorganisation de son contenu

posent problegraveme La recherche de nouveaux modes de recherche et de

structuration est une sorte de quecircte du graal que de nombreux experts et

entreprises poursuivent

La folksonomie repose sur une ideacutee originale qui sous tend toute lrsquoideacuteologie Web

20 celle de lrsquointelligence collective et de la deacutecentralisation Mais les limites de la

folksonomie appeleacutee aussi web seacutemantique du pauvre remettent en question

lrsquoaffirmation selon laquelle lrsquointelligence collective et la libeacuteralisation totale du

fonctionnement du web 20 sont une solution viable

Aussi la neacutecessiteacute drsquoun Web seacutemantique 163 fiable se fait de plus en plus urgente

Cette nouvelle phase de deacuteveloppement du Web permettrait drsquoameacuteliorer

lrsquoexploitation des informations par les utilisateurs en obtenant une information

organiseacutee normaliseacutee de faccedilon agrave rendre le web compreacutehensible aux machines pour

faciliter lrsquoexploitation par les utilisateurs

Dans un article paru dans le New York Times en novembre 2006 John Markoff

imagine un web 30 selon le principe drsquoajout dune couche de sens tout en haut du

web existant pour en faire un guide au lieu drsquoun simple catalogue Pour lrsquoauteur

nous sommes en train de passer dun web de documents connecteacutes agrave un web de

donneacutees connecteacutees

Le web seacutemantique offrira un langage commun permettant aux donneacutees de

renvoyer agrave des objets du monde reacuteel dune faccedilon identique Le projet Freebase

lanceacute par la start up Metaweb illustre cette approche il a pour objectif de faciliter

la recherche et le partage drsquoinformations agrave travers une base de connaissances

communes structureacutees via des meacutetadonneacutees permettant de deacutecrire chaque

eacuteleacutement drsquoinformation Ces eacuteleacutements seraient relieacutes entre eux par un systegraveme de

relations Tim OrsquoReilly deacutefinit le projet comme la machine agrave creacuteer les synapses du

cerveau global

Il srsquoagirait de creacuteer en quelque sorte un Google du web seacutemantique un reacutepertoire global

drsquoinformations structureacutees intelligibles et exploitables autant par des machines que par

copy Digimind Digimind Services ndash White Paper |94

Le Web 20 pour la veille et recherche dinformation DIGIMIND

des humains -et donc capables drsquoextraire et drsquointerpreacuteter les relations entre des donneacutees

pour par exemple reacutepondre agrave des requecirctes par des solutions plutocirct que des listes de

document 164

La veille

Dans cet univers le chercheur dinformations et le veilleur doiventhellipgarder la tecircte

froide la forte meacutediatisation du Web 20 ne doit pas masquer la pertinence doutils

plus traditionnels Les diffeacuterentes applications Web 20 nous lavons vu suffisent

rarement pour mener agrave bien une collecte dinformation Certes les bookmarks

sociaux apportent un contenu seacutelectionneacute par linternaute mais on ne peut se

deacutepartir des moteurs de recherche web classiques La surveillance des flux RSS

permet decirctre alerteacute sur de nombreux sujets mais la majoriteacute des sites web restent

encore deacutepourvus de ces fils Les tags apportent une veacuteritable souplesse agrave

lutilisateur mais la taxonomie des bibliothegraveques ou des reacutepertoires web- pour ne

citer que ces lieux- reste essentielle pour se repeacuterer agrave travers des milliers de

ressources

Le Web 20 pour la recherche et la veille nen est quagrave ses balbutiements Aussi

avant quil ne digegravere complegravetement par enrichissement les ressources et les

applications Web 10 il convient de faire coexister ces 2 web dans les pratiques

Le Web 20 apporte une richesse essentielle lrsquoexpression drsquoindividus porteurs

drsquoideacutees et de faculteacutes susceptibles drsquoapporter des changements de re-questionner

lrsquoordre eacutetabli eacuteleacutements indispensables agrave lrsquoeacutevolution de la culture agrave condition de ne

pas oublier que des volonteacutes ambitieuses doivent intervenir pour canaliser les

initiatives sans les eacutetouffer et leur insuffler une veacuteritable ambition Voilagrave tout

lenjeuhellip

copy Digimind Digimind Services ndash White Paper |95

Le Web 20 pour la veille et recherche dinformation DIGIMIND

A propos des auteurs DIGIMIND SERVICES

Digimind Services accompagne les plus grandes entreprises pour la conception la

mise en œuvre et le deacuteploiement de projets de veille qui reposent sur la solution

Digimind Evolution apportant agrave ses clients un retour sur investissement de plus de

600 et ce degraves la premiegravere anneacutee Les meacutethodologies proprieacutetaires du

deacutepartement conseil ainsi que son expertise des probleacutematiques et sources

drsquoinformations sur plus de 20 secteurs drsquoactiviteacute deacuteveloppeacutee aupregraves de ses clients

depuis de nombreuses anneacutees permet aux entreprises drsquoanticiper les changements

de leur environnement pour prendre les meilleures deacutecisions sur leur marcheacute

Le conseil Digimind porte sur tous les aspects du workflow de veille ciblage

strateacutegique collecte des informations traitement et analyse exploitation et

diffusion gestion de projet conseil organisationnel et gestion du changement

formations et support fonctionnel et technique

CHRISTOPHE ASSELIN

Issu drsquoun cabinet drsquoeacutetudes de marcheacute B2B et speacutecialiseacute depuis 1997 dans la mise en

place de systegravemes de veille (e-Franceorg Ecole Militaire) Christophe Asselin allie

une connaissance approfondie des secteurs eacuteconomiques et une parfaite maicirctrise

des outils de recherche sur internet et des solutions avanceacutees de veille Expert

reconnu il eacutedite le site httpwwwintelligence-centercom et le blog

httpinfluxjouebcom tout deux consacreacutes agrave la recherche dinformation

Speacutecialiste de la veille internet chez Digimind il accompagne les clients dans la mise

en place de leur dispositif de veille (expression des besoins deacutefinition de plans de

veille sourcing architecture parameacutetrage formation accompagnement) Il

intervient ainsi aupregraves de socieacuteteacutes dans diffeacuterents secteurs les teacuteleacutecoms avec

France Telecom RampD lrsquoindustrie pharmaceutique avec Sanofi Aventis Roche

Pharma Expanscience ainsi quAlstom Transport Veolia Environnement et des

reacutefeacuterences confidentielles dans le secteur des biotechnologies de leacutenergie des

teacuteleacutecoms de limprimerie de la deacutefense du conseilhellip

copy Digimind Digimind Services ndash White Paper |96

Le Web 20 pour la veille et recherche dinformation DIGIMIND

[Merci au Service Marketing agrave Malaiac wwwmalaiacnet et agrave Elsa Bonier eacutetudiante

en Master 2 Management des innovations en communication agrave Paris XIII pour leur

fructueuse collaboration]

VERONIQUE MESGUICH

Apregraves avoir fondeacute et co-dirigeacute pendant six ans un cabinet speacutecialiseacute en veille

technologique Veacuteronique Mesguich dirige lrsquoInfothegraveque du Pocircle Universitaire

Leacuteonard de Vinci Elle enseigne eacutegalement la maicirctrise de linformation strateacutegique

dans plusieurs eacutetablissements denseignement supeacuterieur et anime reacuteguliegraverement

des sessions de formation continue autour de la meacutethodologie de recherche

avanceacutee et de veille sur Internet

Veacuteronique Mesguich est lrsquoauteur avec Armelle Thomas de lrsquoouvrage Net

recherche le guide pour trouver lrsquoinformation utile dont la deuxiegraveme eacutedition est

parue en mars 2007 aux eacuteditions de lrsquoADBS

copy Digimind Digimind Services ndash White Paper |97

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Webographie Bibliographie

Sources dinformation sur le Web 20

Sites web wikis et blogs

Reacutepertoires et classement de services et socieacuteteacutes Web 20 - 20 Websites http20websitescom - Web 20 Magazine Top 100 Web 20 Sites httpweb2magazineblogspotcom200701thanks-for-web-2html - Web 20 Magazine The Best Web 20 Software of 2006 httpweb2socialcomputingmagazinecomthe_best_web_20_software_of_2006htm - Complete List of Web 20 Products and Services httpwwwlistiblecomlistcomplete-list-of-web-2-0-products-and-services - The Complete Web 20 Directory httpwwwgo2web20net - FredCavazzanet le meilleur du Web 20 httpwwwfredcavazzanetindexphp20051212986-le-meilleur-du-web-20 - Web 20 Directory 1200+ Web 20 Sites in 50+ categories httpweb2econsultantcomindexhtml

- Top 25 Web 20 Search Engines httpoedborglibraryfeaturestop-25-web20-search-engines

- 25 start-ups Web 20 prometteuses httpmoneycnncom20070221magazinesbusiness2nextnet_introbiz2

copy Digimind Digimind Services ndash White Paper |98

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Blogs et sites speacutecialiseacutes - Le groupe de travail Web20 francophone httpwwwweb20workgroupfr

- Web 20 Work Group httpweb20workgroupcom - Dessine-moi le Web 20 httpwwwdeuxzerocom - FredCavazzanet httpwwwfredcavazzanet

- TechCrunch en franccedilais httpfrtechcrunchcom - TechCrunch httpwwwtechcrunchcom

- Le web 20 cest pas du buzz httpweb2rulesblogspotcom

- Mashable France httpfrmashablecom - Mashable httpmashablecom - AccessoWeb httpblogaccessowebinfo - Web 20 Magazine httpweb2magazineblogspotcom - Reacutevolution Web 20 en Live httpwwwwebdeuxinfo

- ReadWriteWeb httpwwwreadwritewebcom - Web 20 Innovations httpweb2innovationscom - Web 20 Summit httpwwwweb2concom

- Original Signal (agreacutegateur de flux RSS) httpwwworiginalsignalfr - Whats Web 20 (agreacutegateur de flux RSS) httpwwwwhatsweb20comaggregatorfrom=100

- Le blog de Bloxx Communiquons avec le Web 20 httpblogbloxxfr

copy Digimind Digimind Services ndash White Paper |99

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- FrenchWeborg Le blog des professionnels franccedilais du Web 20 httpwwwfrenchweborg

- Blog Web 20 et Marketing httpwwwvincentabrycom - Le Web 20 en Action httpleweb2blogspotcom - aYsoon 20 httpblogaysooncom Emmanuel de Taillac httpemmanueldetaillacfr - NiouMedia httpnioumediacom - 2803 httpwww2803com - Web 2 francophone (Wiki) httpweb2frcomAccueil

Blogs et sites avec un axe Web 20

- Publishing 20 httppublishing2com - Social-Computing httpwwwsocial-computingcom - Ecosphere httpecospherewordpresscom - inFLUX httpinfluxjouebcom - Benoit Descary httpdescarycom - Jean Michel Billaut httpbillauttypepadcomjm - Blog francophone des TIC httpwww2607fr 20Minutes Top 50 tech et meacutedias httpwww20minutesfrarticle15087620070410-Blogs-Top-50-tech-et-mediaphp - Intruderstv httpnewintruderstvintruders_fr

copy Digimind Digimind Services ndash White Paper |100

Le Web 20 pour la veille et recherche dinformation DIGIMIND

- Jeff Clavier Sans Accent httpsansaccentsofttechvccom - Demain tous journalistes httpbenoit-raphaelblogspotcom

- Collectif louvre-boicircte Initiatives sur le partage dinformation httplouvre-boiteviablogacom

- Zero seconde httpzerosecondeblogspotcom

Articles

Introduction au Web 20

- Web 20 lrsquoarticle de OrsquoReilly reacutesumeacute pour les faineacuteantshellip httpwwwexpressionsbe20051101web-20-resume-pour-les-faineants

- Dossiers Web 20 - Journal Du net httpwwwjournaldunetcomdossiersweb20

- Avis des managers le Web 20 agrave la loupe httpwwwjournaldunetcomsolutions0603diaporamaavis-managers-web21shtml

- Les entreprises face aux deacutefis du Web 20 httpwwwjournaldunetcomsolutions0704070413-entreprises-web-201shtml

-The Machine is Using Us Transcription (videacuteo) httpmediatedculturesnetksudiggp=78

- The New Wisdom of the Web httpwwwmsnbcmsncomid12015774sitenewsweek

- Quest-ce que Web 20 httpwww01netcomarticle294819html

- Approaching a definition of Web 20 httpsocialsoftwareweblogsinccom20050929approaching-a-definition-of-web-2-0

- Fonctionnement de lrsquoentreprise classique vs entreprise 20 httpalbancornilletfreefrakwindexphp20061002fonctionnement-de-lentreprise-classique-vs-entreprise-20

- Meacutedias traditionnels et acteurs du Web 20 vers la cohabitation ou la convergence des acteurs de lrsquoinformation et du divertissement httpwwwscribdcomdoc50818These-sur-le-Web-2-Cabanis

copy Digimind Digimind Services ndash White Paper |101

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Ajax

- LAjax en 5 questions httpwwwjournaldunetcomsolutions0602060208_qr-ajaxshtml - Ajax et Moteurs 20 httpwwwmoteurzinecomarchives2006moteurzine127html2

Les Mashups

- Les Mashups applications Web composites tregraves Web 20 httpwwwjournaldunetcomsolutions0606060628-qr-mashup-hybrideshtml

- Le modegravele eacuteconomique des Mashups httpwwwinternetactunetp=6285 Bookmarks sociaux Social search

- Le Social Bookmarking au secours de la pertinence de la recherche drsquoinformation httpwwwgillesbalmissecomv2spipphparticle171 - Whats the Big Deal With Social Search httpsearchenginewatchcomshowPagehtmlpage=3623153

- Whos Who in Social Search httpsearchenginewatchcomshowPagehtmlpage=3623173

Ouvrages

- Web 20 - Les internautes au pouvoir - Jean-Franccedilois Gervais httpwwwdunodcompagesouvragesficheouvrageaspid=50701

- Les reacuteseaux sociaux Pivot de lrsquointernet 20 - Alain Lefebvre httpwwwcluster21comfrbookreviewlivre_les_reseaux_sociaux - Web 20 (R)eacutevolutions et nouveaux services dInternet - Jean-Noeumll Anderruthy httpwwwamazonfrWeb-2-0-C3A9volutions-nouveaux-dInternetdp2746034972ref=sr_1_18402-7140143-8118507ie=UTF8amps=booksampqid=1178118687ampsr=8-18 - Web 20 The Future of the Internet and Technology Economy and How Entrepreneurs Investors Executives amp Consumers Can Take Ad httpwwwamazoncomWeb-2-0-Technology-Entrepreneurs-Execenablersdp1587622009ref=sr_1_6103-0331542-4028646ie=UTF8amps=booksampqid=1178118732ampsr=1-6

- La Longue Traicircne La nouvelle eacuteconomie est lagrave - Chris Anderson httpwwwamazonfrLongue-TraC3AEne-nouvelle-C3A9conomie-

copy Digimind Digimind Services ndash White Paper |102

Le Web 20 pour la veille et recherche dinformation DIGIMIND

estdp2744062693ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180542516ampsr=1-1 - The Geospatial Web How Geobrowsers Social Software and the Web 20 are Shaping the Network Society httpwwwamazoncomGeospatial-Web-Geobrowsers-Information-Processingdp1846288266ref=sr_1_28103-0331542-4028646ie=UTF8amps=booksampqid=1178118760ampsr=1-28 - Les Wikis espaces de lintelligence collective - Jeacuterocircme Delacroix httpwwwamazonfrWikis-JC3A9rC3B4me-Delacroixdp2952051445ref=sr_1_1403-1740173-8750801ie=UTF8amps=booksampqid=1180544723ampsr=8-1 - Pro Web 20 Mashups Remixing Data and Web Services httpwwwamazonfrPro-Web-2-0-Mashups-Remixingdp159059858Xref=sr_1_4403-1740173-8750801ie=UTF8amps=english-booksampqid=1180542751ampsr=8-4 - Web 20 et Web avanceacute - Alexandre Boni Nicolas Stemart httpwwwamazonfrWeb-2-0-avancC3A9-Alexandre-Bonidp2742967281

copy Digimind Digimind Services ndash White Paper |103

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Dans la mecircme collection

White Paper Blogs et RSS des outils pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique Christophe Asselin Consultant Veille Strateacutegique Digimind

White Paper

Cateacutegorisation automatique de textes

White Paper

Benchmark des solutions de veille strateacutegique

White Paper

Evaluer le Retour sur Investissement dun logiciel de veille Edouard Fillias Consultant Veille Strateacutegique Digimind

gt A teacuteleacutecharger sur httpwwwdigimindfrserviceswhite_paperhtm

copy Digimind Digimind Services ndash White Paper |104

Le Web 20 pour la veille et recherche dinformation DIGIMIND

Notes 1 httpwwwguimfrblog200612le_film_autumn_html httpwwwlemondefrwebarticle01-02-65186536-8751060html 2 httpvideogooglefrvideoplaydocid=724218352255575783 3 Map of online communities par Randall Munroe httpwwwxkcdcomc256html 4 httpwwwdeuxzerocom 5 httpwwwpaulgrahamcombiohtml httpfrwikipediaorgwikiPaul_Graham 6 Qursquoest ce que le web 20 Hubert Guillaud Internet Actu 29 mai 2005 httpwwwinternetactunetp=6144 7 httpwwworeillynetcompubaoreillytimnews20050930what-is-web-20html httpweb2rulesblogspotcom200601what-is-web-20-par-tim-oreilly-versionhtml 8 httpwwwzdnetfractualitesinternet0390207743933447900htm 9 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 10 httpwwwinternetactunetp=7035 11 httpwwwhitwisecomdatacenter 12 httprosstypepadcomblog200604power_law_of_pahtml 13 httpblogsforrestercomcharleneli200704forresters_new_html 14 httpwwwtagcrowdcom 15 You Say You Want a Web Revolution httpwwwwiredcomsciencediscoveriesnews20050868403 16 httpsaddonsmozillaorgfrfirefoxaddon748 httpwwwjournaldunetcomdeveloppeurtutorielout050525-greasemonkey-presentationshtml 17 Mashups Google Maps httpwwwmibazaarcomextrasfortune100html httpwwwweatherbonkcomweatherindexjsp httpgmapstommanganusspacecraft_trackinghtml 18 httpwwwgooglecomcalendar 19 httpdocsgooglecom 20 httpwwwmoovementfr 21 httpwwwcooptincomfrWEBhomeaspx httpwwwjobmeeterscomfraccueilindexphp 22 httpwwwzliocom httpshoppingyahoocomshoposphere

copy Digimind Digimind Services ndash White Paper |105

Le Web 20 pour la veille et recherche dinformation DIGIMIND

23 httpwwwciaofr httpwwwwantunocom 24 httpmapsgooglefr httpwwwgeoportailfr httpearthgooglefr httpmapsyahoocom httpwwwflickrcom httpwwwzdnetfractualitesinternet0390207743936635400htm 25 httpwwwcriteocom 26 From Youtube to Youniversities Henry Jenkins 16 feacutevrier 2007 httpwwwhenryjenkinsorg200702from_youtube_to_youniversityhtml 27 httpaffordancetypepadcom 28 httpwwwplosoneorghomeaction 29 Web collaboratif web coopeacuteratif web 20 quelles interrogations pour lrsquoenseignant documentaliste Marie France Blanquet 12 janvier 2007 httpeprofsdocscrdp-aix-marseillefrIMGrtfintervention-MF-Blanquetrtf 30 httpveillepedagogiquebloglemondefr 31 httpbibliobsessionfreefrdotclear 32 httpliblogsalbanyedulibrary20200611a_librarians_20_manifestohtml 33 httpdelicious 34 httpwwwconnoteaorg httpwwwciteulikeorg httpwwwsnipitroncom 35 httpdelicious httpwwwblinklistcom httpblogmarksnet httpwwwfurlnet httpfrbetabookmarksyahoocom httpmyweb2searchyahoocom 36 httpwwwstumbleuponcom httpsimilicious httpwwwyoonocomindexjsp 37 Social bookmarks charts version 35 httpwwwiroxdefile_download3 httpwwwroxomaticde856 Social Bookmarking Services And Tools The Wisdom Of Crowds That Organizes The Web httpwwwmasternewmediaorgnews20061201social_bookmarking_services_and_toolshtm Free Bookmark Managers

copy Digimind Digimind Services ndash White Paper |106

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwfeedbuscombookmarks 38 httpwwwflickrcom 39 httpwwwflickrcomgroupstehipool 40 httpwwwflickrcomphotostagsnorthamericaninternationalautoshow 41 httpphotobucketcom 42 httpwwwsquidoocom 43 httpwwwsquidoocomnanotechRev 44 httpwwwsquidoocomtagsmarketing 45 httpwwwyoutubecom 46 httpwwwdailymotioncom 47 Une seacutelection de moteurs de recherche videacuteo et de services de partage et teacuteleacutechargement de videacuteos httpcasselinfreefrfrenchvideoshtm 48 httpwwwemarketercomArticleaspxid=1004918 49 httpwwwviadeocom 50 httpwwwlinkedincom 51 httpwww6nergiesnet httpwwwxingcom 52 httpwwwfacebookcom 53 httpenwikipediaorgwikiList_of_social_networking_sites 54 httpwwwlinknrankcombusinessphp 55 httpdiggcom 56 httpwwwnuouzcom httpwwwblogmemescom httpwwwscoopeocom httpwwwfuzzfr httpwwwtapemoicom httpmeneamenet httpwwwrojocom httpwwwbetanetscapecom 57 httpwwwwikiofr 58 httpwwwagoravoxfr 59 Carlo Revelli Joeumll de Rosnay httpfrwikipediaorgwikiCarlo_Revelli httpfrwikipediaorgwikiJoC3ABl_de_Rosnay 60 Agoravox politique eacuteditoriale httpwwwagoravoxfrarticlephp3id_article=60 61 httpwwwreadspeakercom 62 httpenglishohmynewscom

copy Digimind Digimind Services ndash White Paper |107

Le Web 20 pour la veille et recherche dinformation DIGIMIND

63 State of the Blogosphere- avril 2007 httpwwwsifrycomalertsarchives000493html 64 Les blogs dans le monde Estimation agrave partir des chiffres produits par Digimind Blog Herald Technorati PewInternet Meacutediameacutetrie Loiumlc le Meur Live Journal Skyblogs Overblogs Terra MSN Spaces Splinder Excite Bloggersit Timblog W3B Skynet Bloghr Overskriftdk Smartlog onetpl Tenbit mylogpl eblogpl Blogpl Blogipl blogcentralis Romandiefr Blogspot timsoftro Globocom Financial Express Prixadi blog Baidu Yahoo Blogs South Korea Planet Weblog Service Cyworld LAtelier et ZDNet Australia 65 httpwwwnaturecomwebfeedsindexhtml httpwwwsciencemagorgrss 66 httpsearchlivecom 67 httpsearchyahoocom 68 httpnewsgooglefr httpfrnewsyahooco httpfrnewsbotmsncom httpwwwtopixnet httpwwwwikiofr 69 httpgroupsgooglefrgrouprectraveleuropefeedshl=fr 70 httpwwwforummobilescomindexphpshowforum=200 71 httpfrgroupsyahoocom 72 httpfrmyweb2searchyahoocom httpblogmarksnet httpdelicious 73 httpwwwflickrcom httpphotobucketcom 74 httpwwwyoutubecom httpwwwdailymotioncomfr 75 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 76 httpblogsearchgooglefr httpfraskcomsubjectbls|pg1 httpwwwfeedstercom httpwwwblogpulsecom httpwwwtechnoraticom httpwwwspherecom 77 httpwwwsifrycomalertsarchives000493html 78 httpfrsearchyahoocomwebadvancedei=UTF-8ampybs=0 httpwwwexaleadfrsearchresultsq=sarkozyamp24mode=allweb 79 httpwwwblogaramacom httpwwwrss-networkcom

copy Digimind Digimind Services ndash White Paper |108

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwrssfeedscom 80 httpwww43thingscom http36trucscom 81 httptrainquecomcodedelicious_lookupphp 82 httptechnoraticomtag 83 httpwwwsearchlescom 84 httptagcentralnet httpwwwkeotagcom httpwwwthagoocom httpwwwzewolnet httpwwwgnoshorg 85 httpwwwzibbcom 86 httpwwwecransfr 87 Google Tag Cloud Maker httpuserscriptsorgscriptsshow6171 88 httpnewzingocom 89 Folksonomies les usagers indexent le web Olivier le Deuff Bulletin des Bibliothegraveques de France ndeg4 2006 90 Folksonomy les tags en deacutelire Cyril Fieacutevet Internetactu 13 octobre 2005 httpwwwinternetactunetp=6166 91 httpwwwzoominfocom 92 httpwwwzikicom 93 httpwwwyonamecom httpwwwstalkeraticom httpwinkcom 94 httpfranswersyahoocom httpanswersyahoocom httpaskyahoocom 95 httpanswersgooglecomanswers 96 httpiqlycosfr httpqnalivecombetaaspx 97 httpwwwexpertscomdirectoryasp 98 httpsearchwikiacomwikiSearch_Wikia 99 httpdeciphocom 100 httpwwwyoonocom 101 httpwwwfooxxcom

copy Digimind Digimind Services ndash White Paper |109

Le Web 20 pour la veille et recherche dinformation DIGIMIND

httpwwwwebzzlecom 102 httpinfluxjouebcomnewspowerset-et-xerox-parc-s-attaquent-a-google-naturellement 103 httpwwwmedglecom httpwwwmedwormcom httpwwwmedstorycom httpwwwsearchmedicacouk 104 httpwwwrollyocom httpswickihomeeurekstercom httpgooglecomcoopcseoverview httpbuildersearchyahoocom 105 Different Engines Different Results Web Searchers Not Always Finding What Theyrsquore Looking for Online httpcomparesearchenginesdogpilecomOverlapAnalysispdf 106 Le web invisible (deep web hidden web) deacutesigne la partie du web non accessible aux moteurs de recherche classiques Le web invisible comprend des bases banques de donneacutees et bibliothegraveques en ligne gratuites ou payantesIl est constitueacute de pages web mal ou non indexeacutees par les moteurs Pour plus de preacutecisions voir le White Paper Deacutecouvrir et exploiter le Web Invisible pour la veille strateacutegique httpwwwdigimindfrserviceswhite_paperhtm 107 httpwwwthelancetcom 108 httpwwwdigimindfrproduitsfinderhtm 109 httpwwwncbinlmnihgoventrezqueryfcgiCMD=searchampDB=pubmed 110 httppminlmnihgovinteractindexphptop httpwwwhubmedorg 111 httpwwwusptogovpatftindexhtml httpwwwwashingtonpostcomwp-dyncontentarticle20070304AR2007030401263html 112 httpwwwgooglecomhistory 113 httpwwwgooglecomhistorytrends httpwwwgooglecomhistoryitems 114 httpfrwikipediaorgwikiApplication_composite 115 httpwwwmibazaarcomextrasfortune100html 116 httptagmapsresearchyahoocomworldexplorerphp 117 httpflickrvisioncom 118 httpgmapstommanganusspacecraft_trackinghtml 119 httpwwwhealthmaporg httpwwwbrevardbiodieselorgmapbdhtml httpkartametroinfokartadefaultaspxhl=EN httpwwwwikimapiaorg httpwwwglobalincidentmapcomhomephp httpdartmapsmackerscom

copy Digimind Digimind Services ndash White Paper |110

Le Web 20 pour la veille et recherche dinformation DIGIMIND

120 httpwwwtagurlscom 121 httpwwwthemolucom httpwwwgnoshorg 122 httpwwwwebmashupcom httpwwwprogrammablewebcommashupsdirectory httpmashupfeedcom 123 httpgooglemapsmaniablogspotcom 124 httplocalalkemiscom 125 httpwwwvoxcom httpwwwover-blogcom httpwwwblogspiritcomfrindexphp httpwwwtypepadcom httpswwwbloggercomstart httpviablogacom httpwwwhautetfortcom 126 httpcasselinfreefrfrenchweblogshtmoutils 127 httpwwwclubiccomarticle-67515-8-comparatif-plateformes-blogshtml httpwwwojrorgojrimagesblog_software_comparisoncfm 128 httpwwwfeedburnercomfbahome 129 httppagesgooglecom 130 httpwwwdigimindfrserviceswhite_paperhtm 131 httpfrwikipediaorgwikiAccueil 132 httpblogouter-courtcomarchive2006-12-05-n22html 133 httpwwwnaturecomnews2005051212full438900ahtml httpwwwnaturecomnaturebritannicaindexhtml httpwwwnaturecomnews2005051212multimedia438900a_m1html 134 httpwwwwikiseekcom 135 httpwwwexaleadfr 136 httpwwwwikimindmaporg 137 httpencitizendiumorgwikiMain_Page 138 httpwwwalacrawikicom 139 httpceclinesxwikicomxwikibinviewMainFils+RSS 140 httpwwwwikidwebcom 141 httpwwwoperacom httpwwwmaxthoncom httpwwwmicrosoftcomfrancewindowsie httpwwwmozilla-europeorgfrproductsfirefox

copy Digimind Digimind Services ndash White Paper |111

Le Web 20 pour la veille et recherche dinformation DIGIMIND

142 httpfrtechcrunchcom20060401analysons-les-lecteurs-rss-en-ligne httpvtechcanalblogcomarchives20051025927489html httpvtechcanalblogcomarchives20050905780635html httpallrsscomrssreadershtml 143 httpinfluxjouebcomnewsles-pages-personnalisables-bookmark-n-1 httpwwwinformationoverlordcouk200603where-to-start-in-search-of-ideal_26 144 httpwwwdigimindfrproduitsindexhtm 145 httpshareopmlorg 146 httpwwwquechoisirorgArticlejspid=RessourcesArticlesEF33CF34D5616AF2C125720D0050E701ampcatcss=TEL000 147 httpweblogshitwisecombill-tancer 148 httptechnologyguardiancoukweeklystory0182395900htmlgusrc=rss 149 httpwwwbusinessweekcominnovateNussbaumOnDesignarchives200704are_most_web_20html 150 httpblogsforrestercomcharleneli200704forresters_new_html httprosstypepadcomblog200604power_law_of_pahtml 151 httpwwwobservatoire-omicorgcolloque-icicpdfBarbe3_1pdf 152 httpwwwaaronswcomweblogwhowriteswikipedia 153 httpaphgcaenfreefrchronique393aphg393htm 154 httpfrwikipediaorgwikiDroits_de_l27homme_en_Iran 155 httpfrwikipediaorgwikiWikipC3A9diaArticles_de_qualitC3A9 156 httpenwikipediaorgwikiJohn_Seigenthaler_Sr_Wikipedia_biography_controversy 157 httppewresearchorgpubs71riding-the-waves-of-web-20 158 httptallblogcontedoxacukwp-contentuploads200703survey-summarypdf 159 httpwwwcafepresscomnerdwideweb 160 httpwwwecransfrspipphprubrique30 161 httpfrcreativecommonsorg 162 httpwwwzdnetfractualitesinternet0390207743933447900htm 163 httpwebsemantiqueorgPagePrincipale httpwwww3orgDesignIssuesSemantichtml httpwwww3org2002Talks1213-lpslide1-0html 164 httpwwwinternetactunetp=6902

copy Digimind Digimind Services ndash White Paper |112

  • Digimind Services
  • Christophe ASSELIN
  • Veronique MESGUICH