Initiation la rechercher sur le web

Embed Size (px)

Citation preview

Recherche efficace dans Internet

Initiation Internet

Module 2Recherche efficace dans le WebL@telier Espace Culture Multimdia. Mdiathque de Lorient1@telier 2009

1

La recherche sur InternetObjectifs de la prsentation :

Dcouvrir les bases de la recherche sur Internet

Utiliser les moteurs de recherche

2@telier 2009

2

Pourquoi

Soit on connat ladresse dun site que lon peut avoir trouve dans un magazine, et on la tape directement dans la barre d'adresse du navigateur, soit on accde au site en question par l'intermdiaire d'un lien trouv sur un autre site, en gnral au contenu proche on fait appel un outil de recherche

3@telier 2009

3

Dfinition : le moteur de recherche Selon le Journal Officiel Moteur de recherche :systme d'exploitation de banque de donnes, et, par extension, serveur spcialis permettant d'accder sur la toile des ressources (pages, sites, etc.) partir de mots cls.

4@telier 2009

4

Annuaire ou moteur de recherche

Un annuaire, rpertoire Internet est un site Web proposant une liste classe de sites web. Le classement se fait typiquement dans une arborescence de catgories, cense couvrir tout ou partie des centres dintrt des visiteurs.Chaque catgorie contient: des sous-catgories concernant des aspects plus pointus dun sujet donn etdes liens agrments dune description. Ces liens sont des URL pointant vers les ressources relatives la catgorie dans laquelle elles ont t classes.

5@telier 2009

5

Moteur de rechercheDe faon complmentaire aux annuaires, les moteurs de recherche effectuent, un travail approfondi pour rpertorier les pages l'intrieur de ces sites. Un moteur de recherche sur le Web est constitu de "robots", spiders, crawlers ou agents qui parcourent les sites intervalles rguliers et de faon automatique pour dcouvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrs sur chaque page atteinte. Chaque page identifie est alors indexe dans une base de donnes.6@telier 2009

6

Le principe en est simple : le service indexe au pralable, c'est--dire stocke et traite sur ses propres disques durs, un certain nombre de pages web.

Cette indexation s'effectue en texte intgral, tous les mots contenus dans toutes les pages rfrences devenant alors des index potentiels de recherche

7@telier 2009

7

Utiliser un moteur de rechercheUn moteur de recherche est un robot qui indexe les pages Web en fonction de leur titre, de certains mots-cls ou de leur contenu complet, sans intelligence particulire.

Il nous faut apprendre effectuer des recherches efficaces afin de tirer le maximum de rsultats pertinents et d'viter les rponses redondantes ou peu concluantes.

Le dfi principal, lors de l'utilisation d'un moteur de recherche, repose sur le choix des mots-cls et de leur disposition. 8@telier 2009

8

Un outil ou des outils de rechercheIl existe des centaines de moteurs qui collectent, regroupent et prsentent linformation de diffrentes manires. Par exemple, Google range les rsultats dune recherche en fonction de limportance et de la pertinence des sites trouvs; Yahoo! possde un rpertoire qui permet des recherches par thmes; Kartoo classe les diffrents sites trouvs lintrieur de catgories slectionnes partir de mots ou de phrases contenus dans les rsultats de leur recherche. Un moteur peut donc tre mieux adapt quun autre tel ou tel type de recherche. 9@telier 2009

9

10@telier 2009

10

11@telier 2009

11

12@telier 2009

12

13@telier 2009

13

@telier 2009 14

Bing, le nouveau moteur de recherche de Microsoft

Comment a marche ?Les descriptions des pages et les mot-cls contenus dans ces pages, quand elles sont prsentes, ne sont pas visibles par l'internaute. Ce sont des informations cachs, introduites dans le code HTML de la page par l'auteur de la page, et uniquement destines pour leur indexation par les moteurs de recherches.

Dans l'exemple qui suit, on retrouve le titre, les mot-cls (Keywords), et la description dune page d'accueil du site

15@telier 2009

15

Codes sources dun page : le moteur collecte les mots-cls permettant son indexation Dportation et camps BODY 16@telier 2009

16

Le moteur va rechercher les occurrences de ces mots dans les pages sources et affiche ensuite celles qui lui semblent les plus pertinentes (selon un algorithme de classement qui lui est propre).

L'utilisateur dans la pratique saisit des mots cls17@telier 2009

17

Donc, quel outil pour quelle recherche ? Les portails gnralistes ou thmatiques

...quand la recherche est cible sur un domaine :

Exemples : pour la Bretagne : breizhoo sur les questions administratives : service-public.frpour le cinma : Internet Movie Database en anglais

18@telier 2009

18

Quel outil pour quelle recherche ? On peut aussi trouver des informations sur les Encyclopdies gratuites et les dictionnaires :

l'encyclopdie cooprative Wikipedia

le quid

19@telier 2009

19

Quel outil pour quelle recherche ? Les annuaires et moteurs de recherche Le site de rfrence est abondance dans la description des principaux annuaires et moteurs de recherche ( http://www.abondance.com/)

Exemples dannuaires : breizhoo ,nomade , babygo (pour les enfants )

20@telier 2009

20

Quel outil pour quelle recherche ? les moteurs : l'indexation est automatique, les moteurs parcourent les pages du web rgulirement => google, google scholar, exalead

les mtamoteurs utilisent plusieurs moteurs de recherche => kartoo ,clusty , webcrawler, ixquick

pour en savoir plus : allez sur la page du site intelligence center (http://c.asselin.free.fr/french/metamoteurs.htm )

21@telier 2009

21

Quel outil pour quelle recherche ? Globalement

quand on veut explorer un sujet il vaut mieux utiliser les thmes et sous-thmes d'un annuaire, utiliser les encyclopdies... et les rayons des bibliothques quand on a une question trs prcise on peut utiliser les moteurs de recherche ou les mtamoteurs (en rdigeant bien sa requte).

22@telier 2009

22

Mthodologie de recherche

Une recherche efficace dans le Web

23@telier 2009

23

Rgles de saisie :formuler un ensemble de mots prcisLes moteur de recherches ne reconnaissent pas le langage naturel. Ils fonctionnent par mots cls

=> comparer mediatheque lorient et lorient mediatheque dans un moteur de recherche ( selon la position du terme laxe de recherche est diffrent )

la casse (minuscule majuscule) pour certains outils il n'y a pas de diffrence et pour d'autres non => tapez ibm ou IBM (sur google, exalead)

24@telier 2009

24

Rgles de saisie les accents pour certains outils il n'y a pas de diffrences et pour d'autres ouitapez bb (sur google, exalead,clusty ) vous trouverez des rsultats contenant bb bbe bebe beb

Nota : pour faire une recherche dans la page Ctrl + F (sur Mozilla Firefox ou sur Internet Eplorer) a permet de gagner du temps !

25@telier 2009

25

Une recherche avance

Les oprateurs boolens :

ET AND : les sites contiennent les deux termes

OU OR : les sites contiennent l'un ou l'autre des termes SAUF AND NOT : les sites contiennent le premier terme et pas le 2me PRES NEAR : les sites contenant les termes rapprochs

Les moteurs proposent des modules de recherche avanc :pour google : c'est une page accessible ici

pour exalead il faut ouvrir une petite fentre

26@telier 2009

26

Signes mathmatiques et recherche d'une expression

Vous pouvez utiliser le signe + dans une requte pour indiquer que vous souhaitez faire figurer le mot cl dans la recherche. De mme, utilisez le signe - pour exclure un terme de la recherche. On utilise les guillemets "..." pour rechercher une expression.

27@telier 2009

27

28@telier 2009

28

Choisir parmi les rsultatsFiltrer ses rsultats avec google :se limiter aux pagesfrancophones, aux pages France : cocher le point qui convient

filtrer les rsultats : aller sur google prfrences: "la fonction SafeSearch interdit m'affichage dans les rsultats de pages Web contenu sexuellement explicite".

29@telier 2009

29

Choisir parmi les rsultats Sur la liste, les noms de domaine d'un site se termine par un .fr un .com.Ces extensions peuvent donner des indicationsgographiques : .fr : site franais.ca : site canadien.be : site belge.ch : site suissede domaine d'activit (mais ce n'est pas une rgle exacte) .com : commercial, communication.org : associatif, but non lucratif.edu : ducation30@telier 2009

30

31@telier 2009

31

Cas pratiqueVous cherchez des informations sur Charlotte Gainsbourg mais pas sur son pre Serge Gainsbourg.

Tapez Gainsbourg AND NOT Serge.

Vous aurez tous les sites dans lesquels apparat le mot Gainsbourg mais pas ceux qui parlent de Serge.

32@telier 2009

32

Comment prciser sa recherche

33@telier 2009

33

Dans Google, lusage de loutil recherche avance

34@telier 2009

34

Autres outils Google

35@telier 2009

35

Conseil No 1Utilisez de six huit mots-cls, de prfrence des noms. La plupart des internautes nutilisent quun ou deux mots, trop peu pour une recherche efficace. vitez les verbes et utilisez des adjectifs ou autres mots sils contribuent mieux dfinir un nom. Par exemple, tapez fromage feta plutt que simplement fromage. 36@telier 2009

36

Conseil No 2Runissez plusieurs mots-cls lintrieur de guillemets pour en faire une phrase, comme systme solaire. La plupart des moteurs de recherche traiteront lexpression au complet et non chaque mot sparment, systme et solaire.

37@telier 2009

37

entre guillemetsMoteurs de recherchePuis Moteurs de recherche ( cest--dire : lexpression entre guillemets )***Y a-t-il une diffrence dans les rsultats?38@telier 2009

38

Conseil No 3La plupart des moteurs de recherche ne font pas la distinction entre majuscules et minuscules. Pour les recherches gnrales, il est toutefois prfrable d'utiliser des lettres minuscules. Tous les moteurs de recherche ne traitent pas les signes de ponctuation de la mme faon. 39@telier 2009

39

Conseil No 4and ou + entre deux mots-cls signifient: Je veux seulement les documents qui contiennent ces deux mots ou tous les mots. or entre deux mots-cls signifie: Je veux les documents qui contiennent lun de ces deux mots, peu importe lequel. not ou - signifient: Je veux les documents qui contiennent le premier mot, condition quils ne contiennent pas le second. Exemple: adolescents and not sexe. Lexpression and not ne sapplique quau mot ou la phrase qui suit immdiatement.

40@telier 2009

40

Conseil No 5Une fois linformation trouve, vrifiez son exactitude en consultant au moins trois autres sites indpendants qui devraient la confirmer. On appelle cela la mthode du triangle. 41@telier 2009

41

Quelques moteurs populaires et performants:google.frsearch.yahoo.comexalead.fr

42@telier 2009

42

Autres petits dtailsliminez tous les pronoms (elle, quel), que les moteurs de recherche considrent redondants. Retenez 6 8mots (maximum recommand). En moyenne, la plupart des utilisateurs soumettent 1,5mot, ce qui n'est pas suffisant.Essayez d'viter les verbes d'action et n'utilisez des adjectifs que s'ils aident dfinir l'objet de votre recherche (comme dans plante bleue). 43@telier 2009

43

defineDans une recherche avec Google, lutilisation de define: plac juste avant un mot ordonne de rechercher les sites contenant une dfinition du mot, ainsi que ladresse du lien Internet o se trouve cette dfinition. 44@telier 2009

44

filetypeMoteurs de recherche filetype:pptMoteurs de recherche filetype:pdfMoteurs de recherche filetype:docLutilisation de loprateur filetype:suivi dun type de format limite les rsultats aux adresses Internet contenant un document dans le format prcis 45@telier 2009

45

relatedrelated:mediatheque.lorient.frrelated:www.lorient.frLoprateur related: peut tre trs utile lorsque lon a trouv un site pertinent notre requte et quon souhaite en trouver dautres semblables. 46@telier 2009

46

allintitleallintitle:pdagogieallintitle:ducationallintitle:apprentissageGoogle restreint les rsultats aux sites dont le titre contient les termes inscrits. 47@telier 2009

47

fonction calculatrice intgre2 * 5 - 428 * 5 / 10 + 2Si vous souhaitez utiliser la fonction calculatrice intgre de Google, il vous suffit dentrer la formule que vous dsirez excuter dans le champ de recherche, appuyer sur la touche Entre ou cliquer sur le bouton Recherche Google. La calculatrice peut excuter des formules mathmatiques en arithmtique simple (5+2*2 ou 2^20) ou plus compliques (e^(i pi)+1) 48@telier 2009

48

Recevoir linformation tranquillement

Les alertes Google49@telier 2009

49

Les Alertes Google sont envoyes par courrier lectronique quand des articles publis en ligne correspondent aux sujets que vous indiquez.

http://www.google.fr/alerts50@telier 2009

50

Crer une alerte

ActualitsWebTous les typesGroupes

-une fois par jour-selon lactualit-une fois par semaine

51@telier 2009

51

Rsultat

52@telier 2009

52

Grer ses alertes

53@telier 2009

53

Bonne recherche!En conclusion.

Les moteurs sont des outils (grande diffrence avec les annuaires et leur cot humain) qui assistes par des robots scrutent le contenu du web la recherche de pages nouvelles. Le contenu des pages est analys et stock dans de larges indexes.

Mais, aucun des moteurs (ni mme des annuaires) necouvre la totalit du web, mais beaucoup offrent des indexes trs larges.54@telier 2009

54

Petits exercices

Exercice sur google,

trouvez le titre de la chanson qui contient les paroles Chrie je t'aime, chrie je t'adore ,

comparer les premiers rsultats avec : chateau de versailles et "chateau de versailles" New York et "New York" 55@telier 2009

55

Exemples pratiques :Rechercher le peintre Millet et son tableau l'Angelus (sur google, exalead)1er essai avec Millet => nombre de pages trouves ? 2e essai : recherche en France seulement : nombre de pages trouves ?

Regarder la premire page trouve, est-elle pertinente ?56@telier 2009

56

Exemples pratiques (2)3e essai : Jean-Franois Millet =>nombre de pages trouves ? 4e essai Angelus =>nombre de pages trouves ? 5e essai Angelus Millet =>nombre de pages trouves ? Autre approche : peinture angelus Millet*************"Googliser quelqu'un" crire votre nom avec et sans les surgoogle, exalead , est-ce bien vous dans les rponses ? 57@telier 2009

57