View
44.981
Download
1
Category
Preview:
DESCRIPTION
Support de la conférence de Béatrice Foenix-Riou (BFR Consultants) à l'Association Belge de Documentation sur le thème "Google : trucs et astuces pour les professionnels de l'infodoc. Focus sur ses fonctions avancées et sur son actualité chargée"
Citation preview
Google : trucs et astuces pour les professionnels de l'infodoc
Béatrice Foenix-‐Riou
Association Belge de Documentation
15 janvier 2013
Béatrice Foenix-‐Riou ?
• depuis + 20 ans : rédactrice en chef des deux lettres publiées par Bases Publications : BASES (lancée il y a 27 ans !) et NETSOURCES (17 ans déjà)
• depuis 4 ans : directrice de BFR Consultants, (cabinet conseil spécialisé dans la
recherche et la veille sur Internet : formations, veilles…) • depuis ± 3 ans : membre du CA de l’ADBS (Association française des professionnels de
l’information) • depuis ± 2 ans : -‐ responsable du secteur « Veille et recherche sur Internet » de l’ADBS
-‐ auteure de « Recherche éveillée sur Internet : mode d’emploi » (co-‐édition Bases Publications -‐ Lavoisier) et du Blog de Recherche-‐eveillee.com
© BFR Consultants - 2013 2
© BFR Consultants - 2013 3
«Google : trucs et astuces pour les professionnels de l'infodoc »
Ou
Comment tirer parti de toute la puissance de Google …
en étant conscient de ses limites
et en restant attentif aux alternatives
qui se présentent
Co-‐édition Bases Publications et Lavoisier (2011). Existe aussi sous forme numérique (PDF et epub) Voir www.recherche-‐eveillee.com
En novembre 2012, en Europe,
près de 90 % des internautes utilisant un outil de recherche
ont interrogé … Google !
Mais la plupart :
-‐> Se contentent des premiers résultats
(les 3 premières réponses génèrent 80% des clics – http://bit.ly/QgNXZW)
-‐> Pensent interroger la totalité du Web
-‐> Ne connaissent pas les fonctions avancées de Google
-‐> Ne sont pas conscients du mode de fonctionnement du moteur…
© BFR Consultants - 2013 4
En guise d’introduction…
© BFR Consultants - 2013 5
Un moteur de recherche en effet…
☛ N'indexe pas (ou mal) le Web invisible : banques de données (pages dynamiques), sites web avec identification, serveurs professionnels, etc
☛ N'indexe que partiellement le Web visible
☛ Lance le plus souvent la recherche sur une partie seulement de son index
☛ Tenter d’estimer la « taille du Web » – ou la taille des index des moteurs – n’a plus de sens
6 © BFR Consultants - 2013
7 © BFR Consultants - 2013
© BFR Consultants - 2011
En
© BFR Consultants - 2012
GOOGLE : PRINCIPES DE FORMULATION
• L’utilisateur saisit un ou plusieurs mots-‐clés dans le formulaire
• La requête est lancée sur le texte intégral des pages enregistrées par le moteur
(plusieurs dizaines de milliards, contenues dans son index)
• La page de résultats affiche la liste et les extraits des (copies de) pages contenant
le(s) mot(s)-‐clé(s) (à la date de l’indexation)
• Un clic sur le titre affiche la page aujourd’hui sur le Web
10 © BFR Consultants - 2013
GOOGLE : RECHERCHE SIMPLE
1. Utiliser des mots aussi PRECIS que possible, dans la langue des documents que l’on recherche (se demander quels mots doivent être présents dans le document recherché)
2. UTILISER « LES GUILLEMETS » pour rechercher « tel quel » : une personnalité (« prénom nom »), un mot-‐composé ou une expression/citation (titre d’un ouvrage…)
MAIS ATTENTION
Penser dans ce cas à « élargir » la recherche (ex.: «prénom nom» OR «nom prénom» OR «initiale prénom nom», ou encore «mot composé» OR «mots composés»)
→ CONSEIL : 1ère recherche sans guillemets, en affichant 100 résultats/page ;
évaluer les résultats puis modifier la requête en conséquence.
11 © BFR Consultants - 2013
GOOGLE : RECHERCHE SIMPLE
Pour afficher 100 résultats/page : Menu "Paramètres de recherche" (via le symbole de la roue dentée) de la page de résultats -‐ désactiver "Prédictions de la recherche instantanée" -‐ choisir "100 résultats par page"
12 © BFR Consultants - 2013
GOOGLE : RECHERCHE SIMPLE
3. ECRIRE DE PREFERENCE LES MOTS AVEC LEURS ACCENTS
(théoriquement non pris en compte par Google)
MAIS ATTENTION :
-‐> incohérences quelquefois lorsque le mot est « entre guillemets » exemple : «moteur a combustion» / «moteur à combustion»
recherche dans ce cas sur l’occurrence exacte du mot (avec OU sans accents)
-‐> bug lorsque la recherche est limitée au titre recherche systématique sur l’occurrence exacte du mot (avec OU sans accents)
CONSEILS : Vérifier la façon dont Google a pris en compte la requête, et en tenir compte. Pour forcer la recherche sur un mot accentué : “mot” (ex.: “marché”, pour avoir uniquement « marché » et non « marche »)
13 © BFR Consultants - 2013
GOOGLE : RECHERCHE SIMPLE 4. COMPARER LES FORMES PLURIELS ET SINGULIERS (ex. pluriel OR singulier)
MAIS ATTENTION :
-‐ l’utilisateur ne peut exiger la troncature sur Google (contrairement à Exalead) ;
-‐ Google applique une troncature implicite « quand il le juge utile » !!!, et pas seulement sur les pluriels/singuliers (recherche également de mots « proches ». Ex.: bibliographie jean racine recherche biographie jean racine)
CONSEILS
-‐> vérifier la façon dont Google a pris en compte les mots (+ simple avec 100 résultats/ page)
-‐> utiliser le cas échéant les guillemets (“bibliographie’’ jean racine) ou l’option « Mot à Mot » (Outils de Recherche > Tous les résultats > Mot à Mot)
-‐> sur Google, le * est un opérateur « de proximité » (« bibliothèque* numérique* » recherche « bibliothèque mondiale numérique »…)
14 © BFR Consultants - 2013
15
ASTUCES
• Fonction En cache de Google (cache:www.URL) dans l’aperçu, colonne de droite :
-‐> retrouver une page disparue -‐> repérer les extraits pertinents
• Fonction Pages similaires (related:url sur Google) dans l’aperçu, colonne de droite
-‐> identifier des sites de même type (ex.: related:www.abd-‐bvd.be)
• Utiliser l’opérateur OR (en majuscules), pour étendre aux mots de forme voisine, aux synonymes… (ex. veille OR "intelligence économique"…)
• Utiliser les guillemets pour rechercher un mot tel qu’il est écrit et
-‐mot pour exclure un mot
© BFR Consultants - 2013
ASTUCES • Fonctions define: de Google (ex.: define:potassium)
-‐> trouver des définitions (mais il faut vérifier la source) • Fonction conversion de Google
(ex.: 18 dollars en euro ; devise du Brésil en monnaie mexicaine) • Fonction numrange: de Google
(ex.: consommation biocarburants France site:gouv.fr 2020..2100) -‐> trouver des pages contenant un chiffre compris entre deux fourchettes ; utile pour données prospectives
• Opérateur de proximité AROUND(n)
(ex. George AROUND(3) Bush)
16 © BFR Consultants - 2013
17 © BFR Consultants - 2013
GOOGLE : FONCTIONS AVANCEES
• Si le nombre de réponses est trop important : limiter la recherche (ou certains mots) aux titres des pages
(ex.: intitle:"intelligence économique" belgique : identifie les pages ayant "intelligence économique" dans le titre et belgique dans le texte)
• Pour identifier des documents spécifiques (publications, chiffres…) : limiter à un
type de fichier ex.: consommation énergie belgique filetype:pdf (ou doc, ppt, xls) • Pour restreindre à certains types de sites : limiter selon le nom de domaine
ex.: consommation énergie Belgique site:fgov.be (ou site:mineco.fgov.be, site:ac.be…) • Si besoin : limiter à l’URL (veille inurl:univ) -‐> Ne pas hésiter à combiner les critères, mais en étant très rigoureux dans la construction de la requête
GOOGLE : NOUVELLE PAGE DE RESULTATS Le 21 novembre 2012, Google a déployé sur Google.fr la nouvelle page de résultats
qu'il avait implantée le 6 novembre sur Google.com
Objectif : unifier l'expérience utilisateur, que ce dernier interroge le moteur depuis un
smartphone, une tablette ou un ordinateur.
Résultats : les fonctionnalités de la colonne de gauche sont désormais regroupées dans
une barre en haut de l'écran. Il faut cliquer sur "Outils de recherche" pour afficher les
différentes options, qui elles-‐mêmes se déploient… Pour une analyse plus détaillée :
http://bfr.li/12StRKb
18 © BFR Consultants - 2013
GOOGLE : NOUVELLE PAGE DE RESULTATS Autres fonctionnalités de Google, depuis la page de résultats
-‐> Plus : sélection par type de résultats (vidéos, actualités, blogs, livres, blogs, discussions, applications...) ;
-‐> Date de publication : menu Outils de recherche > Date indifférente : moins d'une heure, moins de 24h, une semaine, un mois, un an… ou Période personnalisée : possibilité de retrouver des documents indexés à une date donnée ou une période donnée (équivalent daterange:date1-‐date2)
-‐> Outils de recherche > Le Web> Pages en langue étrangères traduites : Google va traduire la requête dans une autre langue, interroger le web dans cette langue et retraduire les résultats en français
19 © BFR Consultants - 2013
© BFR Consultants - 2012 20
© BFR Consultants - 2011 21
22
IDENTIFIER DES PAGES DE LIENS
Lorsque l’on souhaite identifier une liste de sites web sur un sujet, et que la requête
amène trop de résultats -‐> rechercher spécifiquement des pages de liens
Pages contenant le mot-‐clé + le mot liens (ou le mot sites) dans le titre ou dans l’URL
Exemple : identifier une liste de ressources concernant l'énergie renouvelable
-‐ énergie renouvelable : 1 490 000 pages sur Google
-‐ énergie renouvelable intitle:liens|sites OR inurl:liens|sites :
84 700 pages sur Google
© BFR Consultants - 2013
© BFR Consultants - 2011 23
Google : trucs et astuces pour les pros de l’infodoc
24
PENSER A GOOGLE IMAGES Pour identifier par exemple des infographies sur la consommation d'énergie en Belgique
© BFR Consultants - 2013
© BFR Consultants - 2011 25
GOOGLE IMAGES : NOUVELLES FONCTIONNALITES Depuis quelques mois : possibilité d’identifier, pour une image donnée, les pages qui
contiennent une image identique sur le web (symbole de l’appareil photo, dans la zone de saisie de Google Images)
26
GOOGLE : EVOLUTION DE SON ALGORITHME
-‐> 1998 : PageRank : une innovation majeure dans le classement des résultats
A l’origine : classement selon la « popularité » des pages (backlinks)
-‐> 2008 : De « donnez moi ce que je dis » à « donnez moi ce que je veux »
-‐ comprendre le contenu de la page (ajout de concepts)
-‐ Comprendre la requête de l’internaute
-‐ Comprendre l’internaute (localisation, personnalisation)
-‐> 2012 : Recommandations (Search Plus Your World) et Web sémantique
Du moteur d’information au moteur de savoir (Knowledge Graph)
L’utilisateur au cœur de l’information (Google SPYW)
© BFR Consultants - 2013
27
GOOGLE : KNOWLEDGE GRAPH
Déployé en mai 2012 pour les requêtes en anglais, et en décembre 2012 pour de nombreuses
langues dont le français.
Première étape vers une nouvelle génération d'outil de recherche -‐> moteur de savoir
Google applique des algorithmes sémantiques, pour identifier des relations entre des "entités
nommées" (personnes, entreprises, lieux, films…) éparpillées sur le Web
Repose sur des informations issues de sources comme Wikipedia, CIA World Factbook, Freebase et
Metaweb, mais aussi des milliards de requêtes analysées.
L'ensemble représente une base de données de 570 millions d'entités, et 18 milliards de faits et
de relations entre ces entités.
Le Knowledge Graph est personnalisé lorsque l'on est connecté (articles issus de Google+…)
© BFR Consultants - 2013
© BFR Consultants - 2012 28
© BFR Consultants - 2013 29
GOOGLE+ : colonne vertébrale du "nouveau Google"
Google+ : lancé sur invitation en juin 2011, puis ouvert à tous en septembre 2011
100 millions d'utilisateurs en février 2012 – 500 millions d'utilisateurs en décembre 2012
Outil convivial et bien pensé, avec nombreuses fonctionnalités (fonctionnement des "cercles", video bulles, communautés (depuis décembre 2012…), etc.
Google+ : un "liant social" entre les applications, avant d'être un réseau
Objectifs :
• offrir un "nouveau Google", un "Google 2.0" qui place l'utilisateur au centre des résultats, en reliant les contenus à leurs auteurs et en signalant les interactions des utilisateurs identifiés.
• fournir au moteur des données personnelles sur ses utilisateurs (via la bio, les interactions…), pour améliorer la publicité ciblée
Les données Google+ sont intégrées aux résultats web lorsque l'on est logué.
© BFR Consultants - 2013 30
© BFR Consultants - 2013 31
32
CONCLUSIONS
L’interrogation de Google reste un excellent point de départ pour démarrer une
recherche – à la condition toutefois de bien formuler sa requête et de tirer parti
des fonctions avancées du moteur
Mais il est impératif d’être conscient :
-‐> que Google « interprète » la requête et que son classement n’est pas « neutre » ;
-‐> qu’il existe d’autres familles d’outils – notamment des annuaires généralistes,
sélectifs ou thématiques – qui seront plus pertinents dès lors qu’il s’agit d’identifier
une liste de sites (dans un pays, un domaine) ou une liste d’entreprises….
© BFR Consultants - 2013
33
POUR ALLER PLUS LOIN Blogs
– -‐ http://www.abondance.com
– -‐ http://blog.recherche-‐eveillee.com
• Lettre bimestrielle NETSOURCES (articles de plus d’un an en libre accès sur
www.bases-‐netsources.com)
• « Recherche éveillée sur Internet : mode d’emploi -‐ Outils et méthodes pour
explorer le Web » (www.recherche-‐eveillee.com)
© BFR Consultants - 2013
34
Avec l’avènement du Web 2.0, ona vu se développer de nouvellesressources précieuses pour lesprofessionnels de l’information(réseaux sociaux, blogs, sites demicroblogging…). Si, au départ,ces nouveaux services neproposaient que très peu decontenu pertinent dans le domainedes sciences dites «dures», leconstat est aujourd’hui trèsdifférent.
Nous avons voulu dans cet articlefaire le point sur les ressourcesdu Web 2.0 pour la veille et la
recherche d’informations dans ledomaine scientifique (ressourcesgénéralistes du Web 2.0 et outilsspécialisés dans le scientifique ettechnique). Leur nombre étant trèsimportant et en augmentationconstante, nous avons choisi deprésenter une sélection d’outils – tousgratuits – appartenant à des famillesdifférentes, pour illustrer la diversité desservices existant.
Veille et recherchescientifique 2.0 : au-delàdes ressources classiques
© Tous droits réservés BASES!PUBLICATIONS 2012
Les outils généralistesdu Web 2.0
L’ajout de contenu scientifique sur lesoutils classiques du Web 2.0 commeTwitter, LinkedIn ou encore Viadeo n’apas été immédiat. Mais il serait pourautant dommage de les négliger car onpeut aujourd’hui trouver des ressourcesintéressantes comme des partages deliens vers des articles scientifiques, laretransmission d’un congrès en tempsréel, les dates et programmes deprochains congrès, les actualités etprojets d’un organisme technologique…
Seul inconvénient, ces informationspeuvent être noyées au milieu d’un flotde données pas spécifiquementscientifiques et surtout pas forcémentprofessionnelles.
Voici donc un rapide tour d’horizon desoutils généralistes pouvant présenter unintérêt pour les professionnels del’information.
Carole Tisserand-Barthole
Web social
• Veille et recherche scientifique 2.0 : au-delà des ressources classiques, pp.1-6
Actualités
• Chemical abstracts disparaît de Dialog, p.6
• Edition 2012 du Online de Londres, p.8
• STN!regroupe 25 bases de données de CSA, p.9
Web invisible
• Fridoc : 90 000 références danstous les domaines du froid, pp.10-11
Agenda
• Le moteur de recherche interne, élément clé de l’accès à l’information dans l’entreprise, p.8
• Web visible, Web invisible, Web2.0, p.9
• Veille sur le Net, p.9
N°296 • Septembre 2012
S O M M A I R E
© tous droits réservés BASES PUBLICATIONS 2012 • N°98 • Mai /!Juin 2012
Outils de veille• Veille : outils gratuits vs
plateformes payantes.!Confrontation des usages dans cinq organisations, pp.1-6
Actualités «Googlienne»• Google intègre la sémantique
à ses algorithmes avec Knowledge Graph, pp.10-11
• Google Play : la bibliothèque numérique de Google accessible en France, pp.11-12
Web social• Topsy.com : un moteur de
recherche temps réel gratuit etperformant, pp.14-15
Surf sur le Net• GFII : Livre blanc «Nouveaux
usages de la veille», p.8
• Veille et Recherche : la veille, la recherche et la curation, p.8
• Digimind : Baromètre des pratiques de veille, p.9
• Créer un flux RSS pour un tag de Google Reader, p.9
Agenda• IES!2012, p.12
Afin de favoriser le partaged’informations entre leursadhérents, les trois secteurs«Veille et recherche sur Internet»,«Coopération!Développement» et«Education!Enseignement» del’ADBS ont organisé en juindernier une matinée sur le thème«Quels outils de veille pourquelles pratiques ?».Centrée sur les retoursd’expérience, cette matinée avaitpour objectif de permettre à desprofessionnels de l’informationappartenant à des domainesdivers, d’expliquer leur démarchedans la mise en place de leurveille et dans le choix des outils,et de présenter les atouts etlimites des solutions choisies.
Nous tenterons dans cet articlede mettre en avant lefonctionnement des différentes
cellules de veille, tel qu’il est apparudans les témoignages, et de confronterce qui peut être fait – ou non – avec des
outils de veille gratuits (agrégateurs deflux RSS comme Google Reader, outil departage de signets comme Diigo...) etavec des plateformes payantes (AMI,Digimind, KB Crawl...).
Du lecteur de flux RSS à laplateforme de veille AMI!EI 6.0 Mathilde Fourquet, Arkema
Si Mathilde Fourquet occupedepuis peu le poste deResponsable Actionnariat
individuel et information financière,auprès de la Direction CommunicationFinancière d’Arkema, c’est de sonexpérience de chargée de veillestratégique et concurrentielle qu’elleétait venue parler, poste qu’elle aoccupé pendant plus de dix ans au seindu service InfoDoc d’Atofina d’abordpuis, après la fermeture du serviceInfoDoc en 2007, auprès de la DirectionStratégie d’Arkema.Depuis la fermeture du service InfoDoc,la fonction Veille chez Arkema estassurée par le réseau des professionnelsde l’information.
....
Béatrice Foenix-Riou
Veille : outils gratuits vsplateformes payantesConfrontation des usagesdans cinq organisations
OUTILS DE VEILLE N°98 Mai /!Juin 2012
S O M M A I R E
Pour tous renseignements
Béatrice Foenix-‐Riou
BFR Consultants
www.bfr-‐consultants.com
www.recherche-‐eveillee.com
bfoenix@bfr-‐consultants.com
@Bfoenix sur Twitter +BFoenix sur Google+
35 © BFR Consultants - 2013
Recommended