recherche d'information, démarches et outils

Embed Size (px)

Citation preview

Commande

Domaine 4 du B2I : s'informer, se documenter

L.4.1 : je sais interroger les bases documentaires ma disposition

L.4.2 : je sais utiliser les fonctions avances des outils de recherche sur internet

L.4.3 : je sais noncer des critres de tri d'informations

L.4.4 : je sais constituer une bibliographie incluant des documents d'origine numrique

L4.01 : je sais utiliser les outils de veille documentaire

Fourre-tout

Recherche dinformation : 7,67 sur 20 !

Cest la note moyenne en recherche dinformation, tablie pour les 1865 tudiants belges ayant rpondu limportante lenqute mene par le Groupe Edudoc et le Conseil Inter-Universitaire Francophone (CIUF). Les rsultats de cette nouvelle enqute sur Lvaluation des comptences documentaires des primo-arrivants , mene auprs de 35 tablissements denseignement suprieur de Belgique, ont t prsents lors de la journe dtude du 20 mai.

On trouvera un premier cho des rsultats sur le blog Enseignons.be, qui les rsume ainsi : Les jeunes incapables de sinformer sur le Net .

http://urfistinfo.blogs.com/urfist_info/2008/05/digital-natives.html

http://barometre.secrets2moteurs.com/index.php/Barometre-xiti

http://graph.benchmark.fr/journaldunet/solutions/0/4/9/0/0/0/940_369677.png

4 raisons (au moins !) de sortir de Google :

Briser le monopole googlen

Rsister la googlisation des usages :

Ncessaire diversification des usages, des pratiques, des outils

Adapter les outils aux besoins :

Intrt des outils spcialiss

Suivre linnovation technique des moteurs :

Nombreux outils trs innovants

Oui, mais voil, Il est probablement le plus pertinent pour une recherche simple !

http://aixtal.blogspot.com/2008/04/moteurs-google-orange-et-ask.html

http://www.journaldunet.com/solutions/moteur-referencement/dossier/le-comparatif-des-moteurs-de-recherche-de-juin-2008/le-comparatif-des-moteurs-de-recherche-de-juin-2008.shtml

Google a dvelopp 200 domaines locaux pour 120 langues prises en compte

http://www.google.com/language_tools?hl=fr

Combien de mots cls utilisez-vous ?

gographique du web : mondial, francophone

linguistique : choix de la langue des ressources

des types de ressources : images, audio

des ressources internet : web, forum, messagerie, weblogs

des formats : HTML, PDF, DOC, PPT, XLS, RTF

des dates : nombreuses options

des champs : titre, URL, host, domaine

thmatique : choix du domaine de recherche

Rgle n 1, dite la rgle de notre gentil petit n'lve nous (car il est toujours plus intelligent qu'un ordinateur)

Distinction forme / fond ; signifiant / signifi.

Pour un humain, le vocabulaire renvoie toujours du sens, pas pour un automate de recherche

Rgle n2, dite rgle de Polnareff

Termes chargs smantiquement

Rgle n 3, le sens s'exprime par des mots ou par des expressions

Des mots cls pour rpondre une question sur l'immigration

Rgle n4, les mots cls... ne sont que des mots

http://www.boolify.org/

Un moteur de recherche, c'est une base de donnes !

Source : R. Viseur, CETIC

Partie visible du moteur de recherche ; trois grandes fonctions :

gestion des requtes :

fonctions de recherche en mode simple et avanc, diffrentes options de filtrage, affinement...

gestion des rsultats :

quels critres de classement ? question des critres de pertinence

gestion de la prsentation des rsultats :

Listes, cartographie, aperu graphique

Gestion des requtes

Gestion des rsultats

Reconnaissance de la forme du mot cl et calcul d'occurence pour dfinir la pertinence

Gestion des rsultats : lindice de pertinence

Principes :

classement des rsultats fond sur la frquence dapparition et la localisation des termes de la requte dans une page web

affichage des rsultats partir du calcul dun score pour chaque rponse :

Ex. : Requte sur le march des DVD en France : +march +DVD +France

> retourne les documents contenant tous les mots de la requte

>> documents contenant le plus de fois les mots de la requte classs en premier

Utilisation :

premire mthode de classement utilise sur le web, la plus rpandue ;

Problmes :

dtournement par le spamdexing

http://professeurs.esiea.fr/wassner/?2007/06/03/74-l-algorithme-pagerank-comment-ca-marche#doc

Gestion des rsultats

Gestion des rsultats : lindice de popularit

Principes, origines :

Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considrs comme des liens de parent smantique

calcul de la notorit dun site en fonction du nombre de liens pointant vers le site

Utilisation :

indice de popularit lanc par Google en 98

originalit et succs de Google et de son PageRank

Avantages de lindice de popularit :

renforcement de la pertinence

rduction du spamdexing

Gestion des rsultats

Clustering

Gestion des rsultats : la catgorisation automatique

Technologies plus complexes ; domaine dinnovations avances des moteurs :

cf Exalead, Grokker, certains mtamoteurs

Principes :

organisation en temps rel dun lot de rsultats pour donner possibilit daffiner ou tendre la requte

rpartition des documents dans des catgories

Intrt pour la recherche :

aide la slection dun mot-rsultat

aide llimination des corrlations inintressantes,

suggestion dides et de pistes nouvelles

enjeu essentiel : mise en ordre du chaos informationnel

Gestion de l'affichage

Par liste...

Gestion de l'affichage

...Ou autrement !

Indexation automatique

Indexation manuelle

Indexation automanuelle : les metatdata

C'est quoi, une base de donnes ?

Une base de donnes, c'est un tableau, partir duquel on peut sortir diffrente reprsentation d'un objet quelconque.

Un autre mode de reprsentation des informations issues d'une base de donnes : la notice qui est le rsultat obtenu par les lves aprs une recherche.

Un autre mode de reprsentation des informations issues d'une base de donnes, le formulaire de rentre des donnes en mode gestionnaire

http://www.googlinside.com/Ressources/Carto_google.jpg

Tout ce qui se passe sur lInternet est un complment de son activit principale. Plus les gens font des choses en ligne, plus ils voient dannonces et plus Google gagne de largent.

De plus, comme lactivit internet augmente, Google rassemble plus de donnes sur les besoins des consommateurs et leurs comportements et peut adapter ses annonces plus prcisment, ce qui lui permet de renforcer son avantage concurrentiel et augmenter encore ses revenus.

http://www.internetactu.net/2008/02/11/linnovation-agile-a-la-google-est-elle-un-modele-ou-une-anomalie/

Pour conclure

http://www.googlinside.com/index.php/2007/05/27/134-une-realite-menacante

Bibliographie

en plus des rfrences sites dans le document distribu aux enseignants, ce diaporama d'Alexandre Serres de l'URFIST Rennes qui j'ai emprunt et adapt les diapositives 34, 27, 25, 24, 23, 22, 21, 9

http://www.uhb.fr/urfist/sortir_de_google

Voir aussi de frdric Rabat doit-on enseigner Google ? http://documentaliste.ac-rouen.fr/spip/spip.php?article191