2011 06 gestion_recherche_info_internet

Preview:

DESCRIPTION

Powerpoint de l'animation ayant eu lieu le 08.06.2011 au CIDOC.

Citation preview

Gérer l’information sur internet…

Une gageure?

Détails organisationnels… La séance durera de 09h à 11h Une pause café-croissants interviendra

au milieu (à peu près) La connexion wifi du CIDOC est à votre

disposition! Un dossier ad hoc est remis à chacun

d’entre vous. La présentation powerpoint elle-même

vous sera mise à disposition par mail.

Pour commencer…

Un tour de table …

Une certitude…

On ne pourra pas tout voir! Proposition : axer sur des principes

de base, et vous montrer des outils « généraux ».

Pour être clair

Phase de recherche : qu’est-ce qu’on cherche?

Phase du résultat : qu’en fait-on?

Au menu du jour…

1. Quelques principes élémentaires de recherche (sur Google ou ailleurs…)

2. Flux RSS3. Surveillances de pages web

(alertes)

Comment s’informer dans un monde pareil? (quelques chiffres en vrac…)

En mai 2011, 16 milliards de pages web étaient indexées par les plus grands moteurs de recherches (Google, Bing, Yahoo!). http://www.worldwidewebsize.com/

2 milliards de personnes sont connectées à internet. http://www.itu.int/net/itunews/issues/2010/10/04-fr.aspx

Il est grand temps que nous apprenons tous à mieux nous approprier des outils qui nous permettront de vivre/apprivoiser ce monde numérique

Google donne aussi le vertige…

87 milliards de requêtes sur Google en un mois (en 2010). http://royal.pingdom.com/2010/02/24/google-facts-and-figures-massive-infographic/

Depuis 2008, Google est le moteur de recherche par défaut de 93% des suisses -> monopole de l’information http://www.zorgloob.com/2009/03/14/les-parts-de-marche-de-google-dans-le-monde

/

Sans compter le web invisible…

Le web invisible est l’ensemble des données non indexables par les moteurs de recherche. Il serait 90% plus volumineux que la partie visible du web.

Principes méthodologiques embryonnaires

S’informer, c’est d’abord savoir sélectionner ses sources. C’est un travail que vous devez faire vous-même en vous posant la question : Qu’est-ce que je cherche? Où est-ce que je veux avoir

l’information? Comment est-ce que je veux la recevoir?

Savoir distinguer le type d’information

Recherchez-vous une information factuelle? Exemple : date de l’arrivée de la

Réforme dans le Pays de Vaud = fait indiscutable

Recherchez-vous un ensemble d’informations sur un sujet donné? Exemple : Causes et conséquences de la

Réforme dans le Pays de Vaud = domaine de l’analyse et de l’interprétation!

Ecueils dans la recherche d’information (1) : LE BRUIT

Solutions possibles contre le bruit

Utiliser les fonctions avancées de votre moteur de recherche

Affiner la recherche avec une requête supplémentaire (ex : Bible + Atlas)

Limiter les documents depuis une date de parution (ex : après 1995)

…et ainsi de suite!

N.B. : en pratique, avec un moteur de recherche comme Google, vous aurez toujours du bruit!

Ecueils dans la recherche d’information (2) : LE SILENCE

Solutions possibles contre le silence

Changer de mot-clé! (rechercher des synonymes) Enlever un de vos critères (si vous en avez trop

mis) Contrôler si vous comprenez bien dans quel

champ vous avez mis votre requête. Utiliser la troncature * pour avoir toutes les

variantes d’un mot (singulier, pluriel, masculin, féminin…). Exemple : cheva* (pour cheval et chevaux)

Une chose est CERTAINE : ce n’est pas parce que vous ne trouvez rien qu’il n’y a rien sur le sujet!

Comment combattre le bruit et le silence?

RECHERCHE AVANCÉE OPÉRATEURS BOOLÉENS

Comment combattre le bruit et le silence?

RECHERCHE AVANCÉEOPÉRATEURS BOOLÉENS

Opérateurs booléens + de rechercheOpérateur Description Exemple“….” (guillemets) Permet de rechercher des

expressions« Bed and Breakfast »

+ Permet d’imposer un mot en ignorant les variantes

+marché (ce qui permet d’éviter les résultats comme marche)

OR Cherche au moins un des termes insérés

Diable OR Satan

- [ = SAUF] Permet d’exclure un mot dans le résultat

Piccard -Auguste (pour avoir des résultats qui concernent uniquement Bertrand Piccard, mais attention : cela supprime les résultats qui parlent A LA FOIS d’Auguste Piccard et de Bertrand Piccard….)

Critères avancés de recherche les plus intéressants

Opérateur de recherche

Description Exemple

site: Permet de rechercher des résultats uniquement sur un seul site, ou un seul nom de domaine.

site:cath.chsite:ch (pour obtenir des résultats uniquement avec des sites se terminant avec l’extension .ch)

filetype: Permet de rechercher des documents dans un format défini. Cela peut être en txt, pdf, ppt, doc, xls .

N.B. : les formats d’Office 2007 et 2010 sont également pris en compte (docx,…)

Loi fédérale chômage filetype:pdf

(permet de rechercher uniquement des documents en format PDF. En effet, une règle tacite veut que ce soit le format PDF qui soit utilisé pour une diffusion numérique d’un document officiel)

link: Permet de rechercher des sites qui établissent un lien avec le site que l’on connaît.

link:www.eerv.ch

(il y a donc une très forte probabilité que les sites qui fournissent un lien au CIDOC s’intéressent aux mêmes thématiques)

define: Permet de rechercher (sur Google uniquement) la définition d’un terme que l’on recherche

define:apocatastase

Opérateurs booléens + critères avancés de recherche

Il s’agit de très bon outils pour combattre le bruit et le silence dans les recherches que vous effectuez (voir document annexe)

La plupart d’entre eux sont très peu utilisés mais gagnent beaucoup à être mieux connus

Croisez les informations!(lorsque vous avez le temps…)

Généralistes (// Google) www.bing.com www.yahoo.fr www.exalead.fr Un bon représentant du «clustering» : vous pouvez affiner les

résultats par langue, par pays, par type de source (blog, forum), par type de fichier, par date…mais Google le fait également maintenant!

http://duckduckgo.com/ Moteur particulier pour deux raisons : il travaille sur la

sémantique, et veut respecter la vie privée en n’enregistrant aucune information sur les utilisateurs.

Utilisez des moteurs spécialisés!

http://www.wolframalpha.com/ Pour les mathématiques, l’économie et toutes les données

factuelles.

http://wayback.archive.org/web/ Pour les pages de sites ayant disparu ou pour retrouver d’anciennes

versions de sites webs.

www.gettyimages.fr www.flickr.com www.artres.com www.picsearch.ch

Pour les images. Sur ce terrain-là, Google n’est pas seul! Pour certains de ces sites, il faut s’inscrire pour pouvoir télécharger des images sans filigrane.

Google n’est pas (toujours) le meilleur…

Exemple (comparaison Exalead et Google sur une recherche link:www.cath.ch ).

Cela devrait montrer qu’il est utile, surtout lorsqu’on fait une recherche extensive, thématique, d’aller croiser ses informations en utilisant d’autres moteurs de recherche.

Cependant, faute de place nous en resterons là pour les moteurs de recherche.

Conclusion intermédiaire:

Ces principes basiques sont valables pour tous les moteurs de recherche et tous les catalogues que vous consultez chaque jour du plus petit au plus grand…y compris Google!

Avant la pause…

Que faire des résultats intéressants que l’on a obtenus…?

Si vous visitez régulièrement les mêmes sites.

Si vous voulez être mis au courant lorsqu’une information est publiée sur le web sans devoir à chaque fois manuellement contrôler si c’est bien le cas?

Trois outils en revue…

Flux RSS Alertes Détection de changement de page

FLUX RSS

RSS = Really Simple Syndication

Une image pour résumer (1)

A quoi bon les flux RSS? (1)

Si vous attendez une information, vous n’avez plus besoin d’aller quotidiennement sur le site qui vous intéresse pour savoir s’il y a du nouveau.

Le flux RSS vous amène l’information chez vous.

Une image pour résumer (2)

A quoi bon les flux RSS? (2)

Permettent de gérer/parcourir l’information beaucoup plus rapidement… …un peu comme si vous lisiez un journal

électronique en fait (sauf que c’est vous qui décidez ce qu’il y a dans ledit journal)▪ Avantage : en principe vous n’aurez que des

informations qui vous intéressent▪ Inconvénient : vous restez dans un seul

schéma de pensée : le vôtre!

Pour lire les flux : un agrégateur!

Un très bon exemple : GOOGLE READER

Pour ceux qui ont un ordinateur portable

Créez-vous (si vous le désirez!) un login Google – ou utilisez celui que vous avez déjà

Abonnez-vous aux liens suivants : www.questiondieu.com www.pointkt.org http://www.cath-vd.ch http://www.evangile-et-liberte.net/ http://www.protestinfo.ch/

Et si le site n’a pas de flux RSS? (1)

Un module complémentaire de Firefox : Update Scanner!

Ce module contrôle toutes les modifications d’une page web que vous avez définie.

http://updatescanner.mozdev.org/en/index.html

Et si le site n’a pas de flux RSS? (2)

Si vous n’utilisez pas Firefox, vous pouvez également utiliser un site d’alerte comme http://www.changedetection.com/ ou http://www.changedetect.com/

Vous recevrez des alertes par email (ou par flux RSS)

Ce qui est bien avec les flux RSS et les outils de type Update Scanner

Permet de gérer très facilement les sites pour lesquels vous voulez être tenu au courant.

Permet (s’ils sont bien gérés) de gagner un temps conséquent

Donne (peut-être) le sentiment de maîtriser un peu mieux un environnement informationnel numérique qui paraît souvent écrasant.

Pourquoi (encore) GOOGLE?

C’est vrai qu’on est dans une logique de centralisation (Google tente de rendre captif son public en offrant un maximum de services gratuits).

Et si un jour Google (ou certains de ses services) devient payant (c’est possible…mais pas maintenant!) que faire?

REPONSE :

Google offre la possibilité d’exporter ses données dans un fichier OPML…

…qui peut ensuite être intégré dans un autre agrégateur de Flux RSS.

C’est donc une sécurité pour garder ses données…

N’oublions pas que les données sur le web sont les plus instables qui soient!

Emplacement fichier OPML

(encore) Google

Google Alertes

Vous n’avez pas besoin de vous inscrire pour créer une alerte.

Une adresse email suffit.

Exemples de Google Alerts

Etablissez deux alertes :-Une alerte sur votre propre nom-Une alerte sur le thème de votre choix

Google Alertes

Avantages : Ciblées Pas besoin d’aller sur une autre interface

(consulter sa boîte email suffit) Inconvénients :

Risque de polluer une boîte email (souvent) déjà bien remplie

D’où l’intérêt d’une solution séparée avec des flux RSS.

INTERROGATIONS…

Dans une utilisation extensive de Google Reader et des alertes, on peut se retrouver dans la situation que l’on voulait éviter au départ :

Se retrouver submergé par une foule d’informations qu’on ne lira jamais…

D’où l’importance d’une discipline personnelle : se poser à chaque fois la question : ce site (et son flux RSS) est-il réellement intéressant à long terme?

INTERROGATIONS…

Pour aller sur un angle philosophique, voire théologique : On est dans une société qui « consomme » de

l’information… …au point que s’informer est devenu une

forme de divertissement… ( = infotainment)! Est-ce réellement si sain?

On se dirige vers une situation où nous sommes connectés (et donc atteignables) en permanence.

Et qui valorise l’immédiateté (à outrance?)

Pour consulter tranquillement vos documents…

Le lien pour télécharger ou visionner cette présentation elle-même vous sera envoyée par mail sur slideshare.

Merci de votre attention!