Master 2 Professionnel« Journalisme, enquête et reportage »
IEP Rennes
Recherche d’information sur Internet
Alexandre SerresURFIST de Bretagne-Pays de la Loire
16 novembre 2009
© A. Serres, URFIST Rennes, 2009
2
Présentation : URFIST ?
Unité Régionale de Formation à l’Information Scientifique et Technique
Missions : Formation des usagers à l’usage de l’information et
des TIC Formation de formateurs Veille Scientifique & Technologique
Des services : des stages de formation des supports en ligne des outils en libre accès des ressources
Voir le site : http://www.sites.univ-rennes2.fr/urfist/ Un réseau de 7 URFIST Au service de la communauté universitaire
et des professionnels de l’information
© A. Serres, URFIST Rennes, 2009
3
© A. Serres, URFIST Rennes, 2009
4
PLAN
1/ Introduction à la recherche d’information sur Internet : contexte, enjeux, méthodologies.
2/ Repérer les sources d’information pour le journalisme et les médias
3/ Connaître et utiliser les outils de recherche : moteurs, métamoteurs...
4/ Faire de la veille : fils RSS, pages personnalisables, Twitter...
5/ Utiliser les platesformes de partage 6/ Quelques ressources pour aller plus
loin
© A. Serres, URFIST Rennes, 2009
5
1.1 Introduction : le contexte informationnel
Complexité d'Internet : Enchevêtrement des applications
Messagerie, forums, web... Diversité du web : blogs, sites, réseaux sociaux...
Imbroglios socio-techniques Abondance de l’information :
Métaphore du "déluge informationnel" Evolution du nombre de noms de domaines Explosion des pages web Explosion du nombre d'internautes
© A. Serres, URFIST Rennes, 2009
6
Réalité documentaire : 1996 : entre 100 et 250 000 sites web 2006 : entre 80 et 100 millions de sites En 2008 : plus de 1000 milliards de pages web
• En deux ans, plus de contenu créé que dans toute l’histoire de l’humanité 93 % de ce contenu = électronique 70% des données créées par des individus
Réalité sociale : 250 millions d’utilisateurs sur Facebook
1.1 Introduction : le contexte informationnel ; le « déluge informationnel »
© A. Serres, URFIST Rennes, 2009
7
1.1 Introduction : du “web 1.0” au “web 2.0”
© A. Serres, URFIST Rennes, 2009
8
1.1 Le contexte informationnel : caractéristiques de l’information
Hétérogénéité, fragmentation : des sources des documents des contenus des supports des points de vue
Manque de « structuration » : Pages HTML Différences entre bases de données et pages web Coexistence pages web
"statiques" "dynamiques"
© A. Serres, URFIST Rennes, 2009
9
1.2 Introduction : quelques enjeux de la « RII »
Quels changements majeurs de la recherche d’information, avec Internet ?
Du monde professionnel au grand public : Usager « seul face aux outils »
De l’ordre au désordre : Usager « seul face aux documents »
De la confiance a priori à la validation personnelle:
Usager « seul face à l’information » Du monde non-marchand à l’économie de
l’attention: Usager « seul face aux liens commerciaux »
De la transparence à la traçabilité généralisée : Usager « seul face à ses traces »
De l’individu à la communauté : Les usagers en réseau
© A. Serres, URFIST Rennes, 2009
10
1.2 Introduction. Quelques enjeux de la « RII » : la « googlisation »
Googlisation : utilisation exclusive des services de Google
Différents problèmes : Dangers du monopole :
“le monde selon Google”, monopole d’une entreprise sur tous les secteurs de l’information
Problèmes du classement, de pertinence des résultats
Problèmes de la traçabilité, de la conservation des données personnelles
Risques d’addiction, de “googlisation” des usages
Enjeux de la formation pour diversifier les outils, prendre du recul
© A. Serres, URFIST Rennes, 2009
11
1.2 Introduction. Quelques enjeux de la « RII » : la « googlisation »
Source : S2M
© A. Serres, URFIST Rennes, 2009
12
1.2 Quelques enjeux de la « RII » : : la confusion des pratiques informationnelles
chercher communiquer Tagger / indexerorganisers’orienter partager
talk
earth
printorkut
API’s
(d’après O. Ertzscheid)(d’après O. Ertzscheid)
© A. Serres, URFIST Rennes, 2009
13
1.2 Quelques enjeux… : l’économie de l’attention
Enjeu majeur sur le web : comment capter et garder l’attention des usagers ? La variante internet du « temps de cerveau
disponible » : « Les internautes vous paient avec le temps qu'ils
passent sur vos contenus, ils vous paient avec leur attention. C'est cette attention, que les annonceurs veulent » . David Eun, responsable des partenariats de contenus chez Google à New York (janv 08)
© A. Serres, URFIST Rennes, 2009
14
1.2 Quelques enjeux… : le positionnement payant
Différence entre liens naturels et liens sponsorisés ? Problèmes et enjeux :
De plus en plus d’usagers arrivent sur des sites via les liens sponsorisés
De plus en plus d’entreprises investissent dans des campagnes de liens sponsorisés
Question : savoir distinguer un lien sponsorisé d’un lien naturel Question par rapport à la recherche, l’accès à l’information, son
usage Problème : près de 60 % des gens ignorent la différence
Risques des liens sponsorisés : 8,5% des liens sponsorisés conduiraient vers des sites représentant un risque pour l’internaute (étude McAfee Site Advisor, Mai 2006)
© A. Serres, URFIST Rennes, 2009
15
1.2 Le positionnement payant
97 % du CA (5,7 Mrds de $, fin 08)
Liens « naturels » Liens commerciaux
© A. Serres, URFIST Rennes, 2009
16
1.2 Quelques enjeux : La traçabilité généralisée
Types de données détenues par les grands portails : Les requêtes sur les
moteurs : Ce qui m’intéresse
Les blogs : Mes opinions
Les réseaux sociaux: Mes réseaux personnels
La messagerie, les forums, le « chat » : Avec qui je communique
et sur quoi
Création de gigantesques base de données sur les goûts et habitudes des internautes
Enjeux : Profilage marketing Pouvoir
considérable accordé aux outils
Risques d’intrusion de pouvoirs autoritaires (cf Chine, Iran...)
© A. Serres, URFIST Rennes, 2009
17
1.2 Quelques enjeux : La traçabilité généralisée
(source : (source : F. Cavazza))
© A. Serres, URFIST Rennes, 2009
18
1.3 Introduction : méthodologie(s) de la recherche d’information
Pas de méthodologie définitive, universelle, linéaire sur le web
Démarche itérative, sérendipité Importance :
du questionnement de la question : bien savoir ce que l'on cherche
de la connaissance des sources : partir de sources fiables, procéder par navigation
de la maîtrise des outils : utiliser le mode avancé de l'évaluation des ressources trouvées de l'utilisation des outils de veille et de
traitement de l’information
© A. Serres, URFIST Rennes, 2009
19
1.3 Méthodologies : Les 10 règles de la recherche d'information
Maîtriser les outils de navigation maîtriser l'interrogation avancée connaître différents outils
Savoir questionner identifier l'objet de la recherche bien cerner le sujet traduire concepts en mots-clés identifier les sources pertinentes
Choisir les bons mots-clés Chercher l'information à la source
trouver les sites de référence privilégier les sources primaires
© A. Serres, URFIST Rennes, 2009
20
1.3 Méthodologies : Les 10 règles de la recherche d'information
Toujours analyser l'information recouper, critiquer, comparer...
Garder les traces bookmark du navigateur outils de gestion de signets
Zotero, Delicious... Maîtriser le temps
faire plan de recherche éviter l'exhaustivité
Rester clair sur ses objectifs
© A. Serres, URFIST Rennes, 2009
21
1.3 Méthodologies : Les 10 règles de la recherche d'information
Utiliser différents types d'outils combiner moteurs, annuaires,
métamoteurs... Etre "agile"
lecture rapide rebondir d'un document à l'autre Mais… éviter le zapping
(d’après V. Mesguich, A. Thomas, Net Recherche 2009, ADBS, 2009)
© A. Serres, URFIST Rennes, 2009
22
2/ Repérer les sources d’information
Diversité des sources d’information :
Médias, presse Bibliothèques, centres
documentaires Institutions, organismes Personnes, chercheurs
Banques de données Sites web, blogs Réseaux sociaux ...
Diversité des outils de repérage des sources:
Catalogues de bibliothèques, réseaux bibliographiques
Annuaires thématiques Portails du web
Distinguer sources d’information primaire et secondaire
© A. Serres, URFIST Rennes, 2009
23
2/ Différence entre sources d’information primaire /secondaire
Critère : le « degré d’élaboration » ou d’originalité du document Source d’information primaire : donne accès au
texte intégral, d’origine, des documents primaires Exemples : base de données de texte intégral, bibliothèque numérique,
portail, moteur de recherche Source d’information secondaire : donne accès
aux références des documents primaires Exemples : catalogues, annuaires, bases de données bibliographiques
… Analogie avec la différence entre sources primaires et
secondaires en journalisme Pour la méthodologie de la RI :
Importance du critère pour la recherche Intérêt de débuter une recherche par des outils et des sources
secondaires : catalogues, annuaires, etc.
© A. Serres, URFIST Rennes, 2009
24
2/ Repérer les sources d’information : sources d’information secondaire
Annuaires, répertoires de sources : Annuaires de
bibliothèques Répertoires de
catalogues de bibliothèques en ligne
Répertoires de laboratoires, de chercheurs…
Répertoires de bases de données
Sélections de ressources Annuaires thématiques
d’Internet
Sources d’information bibliographique :
Catalogues de bibliothèques
Bases de données bibliographiques
© A. Serres, URFIST Rennes, 2009
25
2/ Repérer les sources d’information : sources d’information primaire
Portails spécialisés Bases de données
d’articles de presse Agrégateurs de
presse Archives textuelles
en ligne : Bibliothèques de
revues Bibliothèques
numériques Archives ouvertes Thèses en ligne
Revues et journaux en ligne
Sites de presse Blogs de journalistes Sites d’images Wikis spécialisés Listes de discussion,
forums …
© A. Serres, URFIST Rennes, 2009
26
2.1.1 Pour repérer des sites web :
les annuaires thématiques Définition :
outil de recherche (appelé aussi index ou répertoire), qui classe un ensemble de sites web suivant une thématique arborescente
Premiers outils du web : Virtual Library en 1991, Yahoo en 1994
Plusieurs types d’annuaires : Généralistes (Yahoo) ou spécialisés (UREC) Privés (Yahoo) ou publics (Virtual Library) Collectifs (Open Directory) ou individuels (Quartier
Français…)
© A. Serres, URFIST Rennes, 2009
27
2.1.1 Pour repérer des sites web :
les annuaires thématiques
Des principes communs : Sélection humaine de ressources Recensement de sites web (et non de pages
web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à l’annuaire
Importance des problèmes de classement des sites, de représentation des connaissances et des ressources
Déclin des annuaires généralistes, maintien des annuaires spécialisés
© A. Serres, URFIST Rennes, 2009
28
2.1.1 Pour repérer des sites web :
les annuaires thématiques Usages :
Recherche d’information sur un sujet large Première approche d’un domaine :
Exemple de la presse : recherche des titres de la PQR sur l’Open Directory
Recherche géographique : voir partie annuaire sur Breizhoo.fr
Recherche de sites de référence : ex. des Signets de la BNF
utiles pour défricher un domaine, pour les premières recherches sur un sujet
Complémentarité des annuaires et des moteurs
© A. Serres, URFIST Rennes, 2009
29
2.1.1 Pour repérer des sites web : les annuaires thématiques
Annuaires généralistes ou spécialisés :
Open Directory :http://dmoz.org/
Annuaire collaboratif Guide Yahoo :
À la fois portail, annuaire, et moteur
Virtual Library :http://vlib.org/
Annuaire de ressources scientifiques
IndexWeb
Annuaires spécialisés sur la presse :
Les Signets de la Bnf : presse
Francofil : Les médias dans les pays francophones
WebdoPresse annuaire suisse de plus
de 17000 sites de médias dans le monde
Bibliothèque virtuelle de périodiques
© A. Serres, URFIST Rennes, 2009
30
2.1.2 Pour repérer des bases de données : les répertoires de bases de données
Le répertoire DADI (Répertoire des bases de Données grAtuites sur Internet) ;
Produit par l’URFIST de Lyon Plus de 1000 bases de données recensées Tous les domaines couverts Accès par navigation et par requête Accès libre par Internet :
http://dadi.univ-lyon1.fr/
© A. Serres, URFIST Rennes, 2009
31
2.1.3 Pour trouver des références bibliographiques : le catalogue SUDOC (Système Universitaire de DOCumentation)
Catalogue collectif de 1000 bibliothèques universitaires et de recherche :
> 9 millions de notices bibliographiques (ouvrages, périodiques, thèses…)
Catalogue de > 400 000 notices de périodiques, dans 2400 bibliothèques et centres de documentation
Répertoire des 3000 établissements du réseau SUDOC
http://www.sudoc.abes.fr/DB=2.1/LNG=FR/
Intérêt : Accès unique pour les
recherches bibliographiques :
De livres De thèses De périodiques
(uniquement sur les collections de périodiques)
Prêt Entre Bibliothèques (PEB)
Répertoire des BU
© A. Serres, URFIST Rennes, 2009
32
2.2.1 Source d’information primaire : les portails
Définition : "Ressource accessible via Internet, constituant un point d'accès
unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les réseaux, cours INRIA 2002)
Dispositif : documentaire (ressources informationnelles),
communicationnel, éditorial, technique... Diversité des ressources et services :
recherche d ’information, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services d’alerte…
Portails généralistes / spécialisés Exemples : Yahoo.fr, BusinessCom, Fabula, Culture.fr
© A. Serres, URFIST Rennes, 2009
33
2.2.1 Pour trouver des ressources sur la presse : les portails spécialisées
Categorynet.com (portail de la presse et des médias) : Créé en 1998 par Greg Manset ; entreprise de presse et
réseau de journalistes Press List (portail européen des métiers du journalisme) :
Créé en 2000 par Perry Petrakis, journaliste indépendant Journalistes.enligne-fr.com (portail emplois, missions et
stages des journalistes) : Créé en 2000 ; fait partie d’un dispositif de 1000 sites
d’annonces d’emploi PortailPresse :
Créé en 2002 par la Fédération Nationale de la Presse Française
© A. Serres, URFIST Rennes, 2009
34
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse
Apparus vers la fin des 90’ Regroupent des milliers d’articles de presse
sur une même plate forme, dans le même format
Permettent l’interrogation simultanée de plusieurs titres de presse
Possibilité de requêtes complexes : bases de données
Accessibles sur abonnement Requêtes parfois gratuites, mais
consultation payante des articles Pour en savoir plus :
benchmark des agrégateurs, Archimag
© A. Serres, URFIST Rennes, 2009
35
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse
Europresse: www.europresse.com
Plus de 20 millions d’articles Plus de 20 ans d’archives > 3000 sources françaises, sources canadiennes, texte
intégral Presse généraliste/spécialisée, quotidienne..> en accès gratuit : recherche de sources possible
Lexis Nexis : 11 000 titres de la presse internationale en texte intégral Spécialisé sur l’information juridique
France Actu Régions : Accès à PQR Accès aux articles du jour de plus de 25 quotidiens régionaux
© A. Serres, URFIST Rennes, 2009
36
2.2.2 Pour chercher dans les articles de presse : les agrégateurs de presse
FACTIVA : http://www.factiva.com/ “Factiva propose aux entreprises actualités et
informations essentielles avec des outils et services de livraison de contenu. La base Factiva (+ 10000 sources) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net)
Voir présentation sur : http://www.gfii.asso.fr/rubrique.php3?
id_rubrique=72 Accessible à Rennes 1 et Rennes 2
© A. Serres, URFIST Rennes, 2009
37
2.2.3 Pour survoler l’actualité : les moteurs d’actualité
Principes : Modules ou services proposés par les outils de
recherche Agrégation de multiples sources d’actualité :
Presse, blogs, sites web… Revues de presse automatisées
Services gratuits Nombreux moteurs d’actualité
Précurseur : Google News Concurrence aiguë, enjeux économiques
importants Problèmes et conflits juridiques
© A. Serres, URFIST Rennes, 2009
38
2.2.3 Pour survoler l’actualité : les moteurs d’actualité : Google News
Google News (Actualités) : Créé à la suite du 11/09/01 Lancé en mars 2002 Diffusion en continu d’infos sur l’actualité Sélection de 25 000 sources d’information (avec les
archives) + de 500 sources sur version française
Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des rubriques
prédéfinies : Nombreux conflits :
Avec les agences de presse, les journaux...
© A. Serres, URFIST Rennes, 2009
39
2.2.3 Pour survoler l’actualité : les moteurs d’actualité : Google News
Fonctionnalités : Personnalisation :
Ouvrir Modifier cette page Voir aussi sur les InfoStratèges.com
Veille : Syndication de fils RSS Abonnement gratuit aux alertes : par thèmes...
> Nouveauté : Recherche d’informations locales pour la France
Google News Archive Search : Archives de presse Lancé en 2006, généralisé en 2008 Recherche dans 200 ans d’archives de journaux
Affichage de chronologies Pour en savoir plus : voir brochure de Google
© A. Serres, URFIST Rennes, 2009
40
2.2.3 Pour survoler l’actualité : les moteurs d’actualité : Google News
Syntaxe de recherche : intitle: et allintitle: : dans le titre des
articles intext: et allintext: : dans le texte des
articles inurl: : dans un site particulier source: : sur une source précise
Source:Libération location: : dans un pays précis
Location:Algérie
© A. Serres, URFIST Rennes, 2009
41
2.2.3 Pour survoler l’actualité : les moteurs d’actualité et de blogs Wikio
indexe sources de presse et blogs ; annonce > 143 000 blogs et sites d’actualités
indexés (dont plus de 133 000 blogs) modules spécialisés sur les Actualités, les
blogs, le shopping, et « Live » : suivi de l’actualité en temps réel (de l’indexation…)
agrégation des billets et nouvelles, selon plus de 30 000 catégories
Technologie d’indexation sémantique classement des blogs « influents » par
catégories, selon le nombre de rétroliens ; voir http://www.wikio.fr/blogs/top/politique
Nombreuses innovations technologiques : cf les Wikio Labs
voir notamment Backlink Factory
© A. Serres, URFIST Rennes, 2009
42
2.2.3 Pour survoler l’actualité : les moteurs d’actualité
NewsBrief : l’information en temps réel Union Européenne > 1400 portails, 20 flux d’actualités
commerciales, sites spécialisés Surveillance quotidienne Mises à jour toutes les 10 mns Classement des informations Clusterisation : par thèmes, par Directions
Générales de l’UE Possibilité d’abonnements RSS
© A. Serres, URFIST Rennes, 2009
43
2.2.3 Pour analyser l’actualité : les moteurs d’actualité
NewsExplorer : analyse multilingue Analyse de l’information une fois par jour
Résumé des 20 faits marquants Nombreuses fonctionnalités :
Carte des lieux de l’actualité Analyse des actualités : tous les articles sur le sujet… Chronologie des événements Fiches sur personnalités Recherche rétrospective sur les événements majeurs
d’un pays …
© A. Serres, URFIST Rennes, 2009
44
2.2.3 Pour survoler l’actualité : autres moteurs d’actualité
Anglophones : Yahoo News Alltheweb News Rocket News Digg Topix : 2004
Agrégateur d’actualités localisées
Voir Bases
Francophones : Yahoo France Actualit
és DeepIndex News Widepress
Voir Archimag
Outils de visualisation :
Nuages de tags à partir de Google News, sur les termes de l'actualité :
Newzingo Google News Cloud
© A. Serres, URFIST Rennes, 2009
45
2.2.4 Pour trouver des revues en texte intégral : les répertoires de revues
BNF, Périodiques électroniques : Catalogue des périodiques électroniques de la
BNF Accès au texte intégral de près de vingt mille
périodiques électroniques de toutes disciplines. DOAJ (Directory of Open Access Journals)
http://www.doaj.org Répertoire de plus de 4400 périodiques
électroniques, en libre accès
© A. Serres, URFIST Rennes, 2009
46
2.2.5 Pour trouver des blogs
● Typologie des blogs : Blogs « introspectifs » : journal « extime » Blogs d'actualité et d'opinion :
● Blogs de journalistes Coulisses de Bruxelles, de Jean Quatremer Journalistiques
● Blogs politiques : Blogs thématiques : passionnés, experts,
professionnels...● Blogs juridiques : Law X.0
Blogs d'entreprise Blogs scientifiques : entre 3 et 10 000 blogs scientifiques
dans le monde, dont 2 000 aux USA
© A. Serres, URFIST Rennes, 2009
47
2.2.5 Pour trouver des blogs
Utiliser : la blogroll d'un
blog : Ex. UrfistInfo
des moteurs de blogs :
Technorati Google Blog Search Ask Blog Wikio BlogPulse
Des annuaires : Voir sur Open
Directory Des plateformes de blogs
scientifiques : Hypothèses
Des listes de blogs : Blogs scientifiques :
Academic blogs in French
© A. Serres, URFIST Rennes, 2009
48
3/ Connaître et utiliser les outils de recherche : moteurs, métamoteurs...
© A. Serres, URFIST Rennes, 2009
49
3.1 Les moteurs de recherche
Définition : outil automatisé d’indexation et de recherche des ressources du web
Fonctionnement : 3 modules autonomes :
robot collecteur : collecte des données module d’indexation : base de
données du moteur module de requête : gestion des
requêtes et des résultats
© A. Serres, URFIST Rennes, 2009
50
3.1 Fonctionnement des moteurs de recherche
Source : R. Viseur, CETIC
© A. Serres, URFIST Rennes, 2009
51
3.1 La gestion des requêtes : fonctionnalités de filtrage des requêtes
Nombreuses possibilités de filtrage : géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie,
weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : nombreuses options des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche (Alta
Vista)
voir Google, Exalead, Yahoo Search
© A. Serres, URFIST Rennes, 2009
52
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche
Opérateurs booléens et de présence : AND : implicite ; différent de + + : prend en compte l’orthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : l’un ou l’autre ou tous les termes
Opérateurs numériques : .. = entre (200..300 euros) ..200 = <200 200.. = >200
© A. Serres, URFIST Rennes, 2009
53
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche
Opérateurs linguistiques : «… » : recherche d’expression exacte * : astérisque permet de remplacer un
terme ~ : recherche sur les synonymes (dans
version anglaise) define: : pour trouver la définition d’un
mot Règle des requêtes : limite des 10 mots
© A. Serres, URFIST Rennes, 2009
54
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche
Filtrage sur le type de documents : filetype: ou ext: : recherche sur le format ou
l’extension de fichier Opérateurs de filtrage sur une page web :
pour utiliser les caractéristiques d’une page web site: recherche sur le nom de domaine (hostname)
Lister toutes les pages d’un site Rechercher des fichiers particuliers sur un site (croiser ext: et site:) Affiner une recherche sur un type de sites
inurl: et allinurl: : recherche sur l’URL de la page intitle: et allintitle: : affinement de la recherche sur
le titre de la page (balise Title) inanchor: et allinanchor: : recherches sur les liens
contenant les mots-clés
© A. Serres, URFIST Rennes, 2009
55
3.1 Maîtriser l’interrogation avancée sur Google : les opérateurs de recherche
Opérateurs de fonctions : pour trouver des informations sur une page ou un site cache: : affiche la version cache du document related: : affiche les pages similaires au site ou à la page
indiquée link: : affiche les pages liées à un site (fonction bridée sur
Google) info: : récapitule toutes les informations dont dispose
Google sur un site : version cache, pages similaires, pages liées, pages du site…
Opérateurs spécifiques à Google.com : view:info : permet de chercher dans les mots des résumés,
selon quatre critères : dates, distances, lieux et images view:timeline : présente les résultats sous forme
chronologique, permet de chercher sur une date view:map : géolocalise les résultats sur Google Maps et
permet de chercher par lieux
© A. Serres, URFIST Rennes, 2009
56
3.1. Moteurs de recherche : pour sortir de la « googlisation » Autres moteurs généralistes:
Exalead Yahoo Search Bing Ask Com
© A. Serres, URFIST Rennes, 2009
57
3.2 Les métamoteurs
Définition : Un métamoteur est un outil de recherche
qui interroge en parallèle plusieurs outils (moteurs et annuaires), rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats.
Diversité des métamoteurs : En ligne / hors-ligne Généraux / spécialisés
© A. Serres, URFIST Rennes, 2009
58
3.2 Les métamoteurs
Fonctionnement, éléments d’un métamoteur pas de base de données en propre outils intermédiaires : une seule requête posée
sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et
élimination des doublons Classement des résultats selon critères propres
au métamoteur Présentation des résultats, selon différentes
méthodes : linéaires, cartographiques
© A. Serres, URFIST Rennes, 2009
59
3.2 Les métamoteurs
Utilisation, intérêt : Simplification :
Une seule requête pour plusieurs outils Elargissement de la recherche : :
Possibilité d’interroger plusieurs sources : d’une dizaine à un millier (Copernic)
Renforcement de la pertinence : Sélection des documents plus poussée, par le calcul de
pertinence opéré sur plusieurs outils Utiles pour le panorama des ressources sur
un thème Exploitation parfois sophistiquée des
résultats Outils paramétrables, personnalisables
© A. Serres, URFIST Rennes, 2009
60
3.2 Les métamoteurs
Exemples de métamoteurs : Francophones :
Ixquick : http://www.ixquick.com Kartoo : http://www.kartoo.com/
Anglo-saxons : Mamma : http://www.mamma.com Clusty : http://clusty.com/ Internet Sleuth : http://www.isleuth.com SurfWax : http://www.surfwax.com
© A. Serres, URFIST Rennes, 2009
61
4/ Faire de la veille : alertes, fils RSS, pages personnalisables...
© A. Serres, URFIST Rennes, 2009
62
4.1 Faire de la veille : les alertes
Qu’est-ce qu’une alerte ? Répétition automatique d’une requête à chaque mise
à jour d’une source d'information (base de données, catalogue, revue, moteur de recherche…).
Résultats adressés périodiquement à l’utilisateur par messagerie ou sous forme de flux RSS.
DSI (diffusion sélective de l’information) : alerte mise en place par un service documentaire pour un ou plusieurs usagers.
A quoi sert une alerte ? À surveiller : l'évolution d'un thème les travaux d'un auteur ou d'une institution
sans avoir à réinterroger une source d’information.
© A. Serres, URFIST Rennes, 2009
63
4.1 Faire de la veille : les alertes
Comment mettre en place une alerte ? Ouvrir un compte, définir un profil Définir la source : revue, site… définir la requête : mots-clés.. Définir la périodicité des alertes Définir le mode de transmission : mel, fils RSS
Exemples : Sur les bases de données : voir Services
d’alertes dans les bases de données Sur Google : Alertes Google
© A. Serres, URFIST Rennes, 2009
64
4.2 Faire de la veille : La syndication de contenus
● Syndication de contenus : possibilité de publier automatiquement sur un site web des informations issues d'un autre site web
● Un fil RSS = un fichier texte au format XML (eXtended Markup Language)
● RSS peut signifier : Really Simple Syndication Rich Site Summary RDF (Resource Description
Framework) Site Summary (plus rare)
© A. Serres, URFIST Rennes, 2009
65
4.2 Faire de la veille : La syndication de contenus
● Comment reconnaître les fils RSS ? Logos sur les sites, ou bien RSS, ou ATOM :
● En lien, derrière le logo : l'adresse URL du fichier texte permettant la syndication
Exemple : passer la souris sur un fil RSS et observer la barre d'état du navigateur
Lors de la mise à jour d’un site web, un fichier texte au format XML contenant une description synthétique des nouveautés du site est généré en temps réel
Plusieurs formats de fils RSS :RSS 2.0 et Atom ; compatibles
© A. Serres, URFIST Rennes, 2009
66
4.2 Faire de la veille : La syndication de contenus
Outils : En lecture : agrégateurs de fils RSS Pour l’édition : éditeurs de fils RSS
● Plusieurs types d'agrégateurs :
Agrégateurs en ligne : MetaRSS, « pages perso »
Agrégateurs en local : FeedReader ; voir liste sur RSS et podcasts ;
Agrégateurs intégrés :● Au logiciel de messagerie : Thunderbird● Au navigateur : Firefox, Safari, OPera
© A. Serres, URFIST Rennes, 2009
67
4.2 Faire de la veille : La syndication de contenus
● Omniprésence des fils RSS : blogs sites d'actualité : journaux, agrégateurs de
presse sites de revues spécialisées Sites d'entreprise Résultats de moteurs de recherche Sites web dynamiques Bookmarks sociaux etc.
© A. Serres, URFIST Rennes, 2009
68
4.2 Faire de la veille : La syndication de contenus
●Plusieurs fonctions des fils RSS : Suivre l’actualité d’un site : réception de toutes
les nouveautés Se tenir informé :
●Sur l'actualité : tous les journaux proposent des fils RSS
●Sur un domaine : suivi de blogs et de sites spécialisés
Outil de veille et de surveillance, technique du push
68
© A. Serres, URFIST Rennes, 2009
69
4.3 Faire de la veille : Les pages personnalisables
Définition : Pages personnalisables :
Possibilité de gérer et d’organiser soi-même ses flux RSS
Pages web organisées en onglets et boîtes Fournies gratuitement
Exemples : Netvibes PagesFlakes iGoogle
© A. Serres, URFIST Rennes, 2009
70
4.3 Faire de la veille : Les pages personnalisables
Fonctions : Pour la gestion et la recherche d’information Choix personnel des sources : sites web, blogs, fils RSS … Divers services : calendrier, agenda … Bureau virtuel
Outils de veille, de surveillance Outils d’information, de publication
Développement des portails Netvibes Pages personnalisables Netvibes rendues publiques
Urfist de Rennes Documentation Française Docsdocs
© A. Serres, URFIST Rennes, 2009
71
5. Plates-formes de partage
Les signets Les photos, les vidéos Les diaporamas Les CV, les réseaux sociaux L'information d'actualité
© A. Serres, URFIST Rennes, 2009
72
5.1 Plates-formes de partage de signets
Principes : Externalisation de ses
bookmarks
Indexation libre par tags
Classement des signets par catégories et par tags
Indication du nombre de signalements d'un même signet
Création de réseaux de partage :
« social bookmarking »
Intérêt : Simplicité :
de collecte et de gestion des signets
Plus-value documentaire :
Tags Catégories
Plus-value sociale : Capitalisation du réseau Réseaux de confiance
© A. Serres, URFIST Rennes, 2009
73
5.1 Plates-formes de partage de signets
Généralistes : Delicious : Yahoo Yahoo! Favoris :
Yahoo Blogmarks :
entreprise française Blinklist : MindValley
Labs, entreprise de Malaisie
Diigo
Scientifiques : Connotea : revue
Nature 2collab : Elsevier Bibsonomy :
Université de Kassel (Allemagne)
© A. Serres, URFIST Rennes, 2009
74
5.2 Les plates-formes de partage multimédias
Recherche dans les sites de partage de documents multimédias
Les images : Flickr, racheté par Yahoo! En 2OO5 =
partage de photos Mise à disposition du moteur de
recherche pour recherche à travers des millions de photos mises en ligne par l’ensemble des utilisateurs
Menu Organize pour organiser ses photos Attribution de mots clés, de tags
© A. Serres, URFIST Rennes, 2009
75
5.2 Plates-formes de partage de diaporamas
SlideShare Site de partage et récupération de présentations /
diapositives Powerpoint, mais pas seulement : aussi pdf,
OpenOffice, Word, documents depuis Google Docs…
Transformation des présentations en format flash
Après inscription, possibilité de stocker et de publier les présentations, soit dans un réseau limité, soit publiquement.
© A. Serres, URFIST Rennes, 2009
76
5.3 Sites d'actualité collaborative
AgoraVox : Site collaboratif d'actualité, créé par J. de
Rosnay et C. Revelli Projet emblématique du web 2.0 et du pouvoir
donné aux internautes (« pronétaires ») Trois principes :
« 1- Nous sommes tous des capteurs d’information
2- Le passage des mass-médias aux médias des masses
3- Une politique éditoriale et un comité rédactionnel inédits »
© A. Serres, URFIST Rennes, 2009
77
6/ Supports et ressources pour aller plus loin…
Supports de l’URFIST de Rennes : Les supports sur la recherche d’information Ressources sur les outils de recherche Evaluation de l’information sur Internet
Supports des autres URFIST : Voir adresses sur UrfistInfo
Quelques autres sites-ressources : AERIS SAPRISTI
© A. Serres, URFIST Rennes, 2009
78
Contact
Adresse mel :
Site : http://www.sites.univ-rennes2.fr/urfist/