31
1 La Recherche La Recherche d’Information d’Information sur le Web sur le Web De la documentation électronique de votre université aux outils du Web Gabriel Gallezot - Urfist Paca-c 10/12/07 Gallezot-at-unice.fr 29/11/07

Recherche Information Web SHS

Embed Size (px)

DESCRIPTION

Recherche Information Web SHS

Citation preview

Page 1: Recherche Information Web SHS

1

La Recherche d’Information La Recherche d’Information sur le Websur le Web

De la documentation électronique de votre université aux outils du Web

Gabriel Gallezot - Urfist Paca-c 10/12/07

Gallezot-at-unice.fr

29/11/07

Page 2: Recherche Information Web SHS

2

Programme :Programme :

• Rappel sur la Recherche d’Information (RI)– contexte de la RI, Usage de l’info, Appropriation des outils– formulation des requêtes (des questions)– l’Indexation : notion centrale

• Panorama et utilisation des outils de recherche du web– les bases de données– Dico & co– OA & co– Outils 2.0– Moteurs et outils connexes– les répertoires

Page 3: Recherche Information Web SHS

15.02.07

● Le contexte de la Recherche Le contexte de la Recherche d'Informationd'Information

Page 4: Recherche Information Web SHS

15.02.07

Base Bibliographiques

Banques de données

Revues, ouvrages

Colloques

Site web, page perso, blog

Liste de discussion

Editeurs, agrégateurs

Archives Ouvertes

Bibliothèques

Types de documents

Formats de documents

Accès aux documents

Usage de l’informationRechercher: IR/épistémè

Page 5: Recherche Information Web SHS

5

Les ressourcesLes ressources

En BU• Les catalogues• Les bases de données• Les périodiques • Les encyclopédies et

dictionnaires• Les livres électroniques• Les cédéroms

Web « gratuit »– les bases de données– Dico & co– OA & co– Outils 2.0– Moteurs et outils connexes– les répertoires

Page 6: Recherche Information Web SHS

15.02.07 Source : Info@vis

La RI en contexte- différentes sources- différents outils- différents contextes

Page 7: Recherche Information Web SHS

7

Appropriation des outilsAppropriation des outils

The Machine is Us/ing UsIntroducing the book

Page 8: Recherche Information Web SHS

15.02.07

La Recherche d’InformationLa Recherche d’Information

- - Bien appréhender votre questionBien appréhender votre question

- Bien appréhender ce que vous cherchez et où vous - Bien appréhender ce que vous cherchez et où vous

le cherchezle cherchez

- Comprendre l’envers du “décor” : l’indexation- Comprendre l’envers du “décor” : l’indexation

- Bien gérer ses requêtes- Bien gérer ses requêtes

Page 9: Recherche Information Web SHS

15.02.07

Quelques questionsQuelques questions• Quels documents sont d'intérêt pour moi (ma question) ? • Est-ce que d'autres documents assez proches de mon

intérêt peuvent être également considérés ? • Les titres d'autres documents pourraient-ils déclencher des

idées valables pour ma recherche d'information ? • Comment mes mots-clés sont-ils réellement distribués

dans un des document ? • ....Trois notions à considérer : • Relevance (correspondance a ma question)• Pertinence (ce qui m'intéresse vraiment) • Serendipity (quelle chose que je ne recherchais pas mais

qui pourrait également m'intéresser)

Page 10: Recherche Information Web SHS

15.02.07

Chercher une aiguille dans une botte de foin c’est :

• trouver une aiguille connue dans une botte de foin connue

• trouver une aiguille connue dans une botte de foin inconnue

• trouver une aiguille inconnue dans une botte de foin inconnue

• trouver n'importe quelle aiguille dans une botte de foin

• trouver […] [Koll, 00]Aiguille(s) et Aiguille(s) et

botte(s) de foinbotte(s) de foin

=> 3 façons de recherche l’information• « chercher de l'information sur un objet bien défini ;• chercher de l'information sur un objet incomplètement

décrit mais qui sera reconnaissable dès qu'un le rencontrera ;

• trouver de l'information de manière fortuite. » (Toms)

Page 11: Recherche Information Web SHS

15.02.07

Où chercher ?

Web visibleet Web 2.0

Web invisible

P2P

• Contenu indexable, • contenu taggé

• bases de données spécialisées• Contenu dynamique• Index partiel des sites• Interdiction d’indexation

• Information contenue sur les ordinateurs individuels• plusieurs millions d’ordinateurs inter-connectés

•10 Milliards dePages web•Forum de discussion

À partir de Source : Eric Boutin

Page 12: Recherche Information Web SHS

15.02.07

La notion d’indexationLa notion d’indexation(une notion transversale et centrale)(une notion transversale et centrale)

• Indexer/classer pour retrouver (mots clés/répertoire, …)

• Les métadonnées (entête)• La structuration du document (corps)

• Classification :– Index– Thésaurus– Taxonomie– Facette– Ontologie

Page 13: Recherche Information Web SHS

15.02.07

Gestion du bruit et du silenceGestion du bruit et du silence

Documents non relevants

Documents relevants Corpus

Bien gérer VOS REQUETES !Bien gérer VOS REQUETES !

Page 14: Recherche Information Web SHS

15.02.07

non relevants(bruit)

relevants

Documents retrouvés

Documents non retrouvés

Relevants(silence)

non relevants

Documents retrouvés

Document non retrouvés

Optimiser sa recherche d'information

Bien gérer Bien gérer VOS REQUETES !VOS REQUETES !

Page 15: Recherche Information Web SHS

15.02.07

Les opérateurs booléensLes opérateurs booléensExemple

Ensemble Acours tutorial

Ensemble Btutorial gratuit

Ensemble CPayant

Tutorial

Cours

gratuit

tutorial

payant

Protection

cours ou tutorial

tutorial et gratuit

cours sauf payant

cours

OR

AND

AND NOT

Les booléens sur GIRI : http://www.bibl.ulaval.ca/vitrine/giri/mod3/booleen.htm

Page 16: Recherche Information Web SHS

15.02.07

Les types de rechercheLes types de recherche• La recherche lexicale (+morphologique) : la recherche d'un mot ou d'un

groupe de mots, notamment par le biais de requêtes booléennes (et, ou, etc.). Une fonction à laquelle s'ajoutent des opérateurs d'adjacence et de proximité. Tous des moteurs proposent en général ce type de possibilités.

• La recherche syntaxique : elle permet de retrouver un terme quelle que soit sa déclinaison (plurielle, conjuguée, etc.), et d'étendre la recherche aux mots synonymes ou de même racine étymologique. Cette recherche offre également des modules de recherche floue ou de phonétisation.

• La recherche statistique : lorsque la recherche s'effectue sur les mots, une analyse statistique permet de calculer la pertinence de ces mots par rapport au référentiel documentaire.

• La recherche sémantique : l'opération s'effectue à partir d'une analyse du sens de la requête, c'est-à-dire en recherchant les mots sémantiquement proches de ceux qu'elle utilise. La recherche s'appuie alors sur un dictionnaire sémantique qui, à chaque mot de la langue, associe leurs différents sens. La combinaison des recherches sémantique, syntaxique, lexicale et statistique permet aux éditeurs de proposer des fonctions avancées : résumé de documents, classement et sélection optimisés des réponses, jusqu'aux assistants de requêtes (conçus pour permettre à l'utilisateur d'affiner sa demande en lui proposant des requêtes connexes ou enrichies)

Page 17: Recherche Information Web SHS

15.02.07

Exemples d’outilsExemples d’outils(panorama)(panorama)

Page 18: Recherche Information Web SHS

15.02.07

Les bases de donnéesLes bases de données

• Gallica : http://gallica.bnf.fr

• DAF (didactique et acquisition du français langue maternelle) : http://www.inrp.fr/daf/web/

• Article Inist : (catalogues : http://services.inist.

fr/public/fre/conslt.htm • Images : http://www.jupiterimages.fr (regroupe

Librededroits.com, Goodshoot, AgenceImages et Stockimage)

• Sons : L’encyclopedie Sonore, http://e-sonore.u-paris10.fr/e-sonore/main.php?daj=search_small&sid=&ref=CAE92LEG08

• Librairies en ligne (Amazon, chapitre.com, …)

Page 19: Recherche Information Web SHS

15.02.07

Dico and CoDico and Co• Wikipedia : http://fr.wikipedia.org/wiki/Accueil

• Les dictionnaires : http://www.dictionnaire-mediadico.com/ http://www.les-dictionnaires.com/

• TermScience (lexiques, dictionnaires, thesaurus) : http://www.termsciences.fr

• CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance) http://www.cnrtl.fr/lexicographie/

Page 21: Recherche Information Web SHS

21

Outils du web2.0Outils du web2.0(fonction recherche uniquement)(fonction recherche uniquement)

• Signets : Del.ici.ous (http://del.icio.us/ ), digg (http://www.digg.com/ ), … :

• Ref biblio : CiteUlike (http://www.citeulike.org/ ), Bibsonomy (http://www.bibsonomy.org/ ), … :

• illustrations : Flickr (http://www.flickr.com/ ), youtube (http://www.youtube.com/ ), … :

• Présentations (PPT : http://www.slideshare.net )

Page 22: Recherche Information Web SHS

22

Les outils de recherche du webLes outils de recherche du web(moteurs, annuaires et autres)(moteurs, annuaires et autres)

• Google scholar : http://scholar.google.com• Google book : http://books.google.com/ • Lecdi : http://www.lecdi.net/• In extenso : http://www.in-extenso.org/ • Exalead http://www.exalead.fr • Kvisu : http://beta.kvisu.com/ • Ixquick http://www.eu.ixquick.com/fra/ • Wayback machine http://www.archive.org/ • Wikio (blogs) : http://www.wikio.fr/blogs • Yahoo (Mindset) : http://mindset.research.yahoo.com/ • Open directory project http://www.dmoz.org/

Page 23: Recherche Information Web SHS

15.02.07

Les répertoiresLes répertoires• Répertoire critique en SHS http://album.revues.org/• Répertoire de Bases de données en SHS, CALAME :

http://calame.ish-lyon.cnrs.fr/ • Répertoire de revues Open Access, DOAJ : http://www.doaj.org/• Répertoire d'Archive Ouverte, OpenDOAR : http://www.opendoar

.org/• Répertoire du CHU de Rouen (revues dans le domaine

Biomed) : http://www.chu-rouen.fr/documed/cbc.html• Répertoire de ressources « academiques » : Bubl , http://bubl.ac.

uk/• Répertoire de BdD gratuites (Dadi) : http://dadi.enssib.fr/• Répertoire web2.0 : http://www.go2web20.net/

• Search engines watch : http://searchenginewatch.com/showPage

.html?page=links

Page 24: Recherche Information Web SHS

15.02.07

« Mon environnement de recherche »« Mon environnement de recherche »

Quelques exemples• Mes extensions FF (“mes moteurs”, zotero,…)• Mon moteur de recherche (co-op/customsearch)• Mon portail : Ning, netvibe, Igoogle, facebook, …

Page 25: Recherche Information Web SHS

25

Vos questionsVos questions

?

Page 26: Recherche Information Web SHS

26

… … et en pluset en plus

Page 28: Recherche Information Web SHS

15.02.07

Méthodologie de rechercheMéthodologie de recherche

2 guides• CERISE : http://web.ccr.jussieu.fr/urfist/cerise/

• InfoSphere : http://www.bibliotheques.uqam.ca/InfoSphere/sciences_humaines/index1.html

• Et aussi REPERE : http://repere.enssib.fr/frontOffice/afficheArticle.asp?idTheme=13

Page 29: Recherche Information Web SHS

15.02.07

Stratégie de requête (exemple)Stratégie de requête (exemple)

Inurl:durand intitle « durand pierre »

Site: durand

inurl:durand 

intitle: « durand pierre »

« durand pierre »

Durand pierre

Google

Source : Eric boutin

Page 30: Recherche Information Web SHS

15.02.07

Les deux aspects Les deux aspects des outils de recherchedes outils de recherche

Basede

données

Propagation electrons :

Collecte et

stockage

Fournir à L’internaute 10 à 20 réponses pertinentes

21

Source : Eric Boutin

Page 31: Recherche Information Web SHS

15.02.07

Le point de départ de GoogleLe point de départ de Google

« un article scientifique tire sa légitimité de la reconnaissance par ses pairs »

Analyse de la citation : SCIEugène Garfield

DucheminBla bla blaDugenet(89) Dugenet

Bla bla blaDumoulin(79)

Article 1

Article 2

Chaque page web a un poids appelé Pagerank

PAGERANK (Google)

A B

C

Yahoo! E

F Linux.org

A better than B

A is linked to by more popularsites than B

(whatever the query is)

PAGERANK (Google)

A B

C

Yahoo! E

F Linux.org

A est meilleur que B

A reçoit des liens émanant de sites plus populaires que B

quelle que soit la requête

Source : Eric Boutin

Comprendre le ranking :http://professeurs.esiea.fr/wassner/?2007/06/03/74-l-algorithme-pagerank-comment-ca-marche