Urfist de Rennes, SCD Rennes 1, 20111 Maîtrise de linformation scientifique en Doctorat 2010-2011 URFIST de Rennes, SCD Rennes 1 Module 1, TD 1 : Outils

  • Published on
    03-Apr-2015

  • View
    106

  • Download
    3

Embed Size (px)

Transcript

  • Page 1
  • Urfist de Rennes, SCD Rennes 1, 20111 Matrise de linformation scientifique en Doctorat 2010-2011 URFIST de Rennes, SCD Rennes 1 Module 1, TD 1 : Outils de recherche du web Session MATISSE Alexandre Serres URFIST de Rennes
  • Page 2
  • Urfist de Rennes, SCD Rennes 1, 20112
  • Page 3
  • 3 PLAN 1/Panorama, typologies des outils de recherche 2/ Outils de reprage et daccs : annuaires thmatiques, portails 3/ Outils automatiss : moteurs et mtamoteurs de recherche 4/ Moteurs scientifiques, moissonneurs OAI 5/ Outils pour la veille : syndication de contenu, pages personnalisables 6/ Outils de gestion et de partage de signets : les plates-formes de social bookmarking 7/ Ressources pour aller plus loin
  • Page 4
  • Urfist de Rennes, SCD Rennes 1, 20114 1/ Panorama, typologies des outils de recherche Existence de milliers doutils de recherche : Voir :ISEDB, Vite tous les outilsISEDBVite tous les outils Nombreuses catgories doutils : Annuaires thmatiques Moteurs de recherche Moteurs spcialiss Mtamoteurs Outils de veille, agents intelligents Portails, sites de rfrence Moissonneurs Plates-formes de signets Pages personnalisables... > quelles typologies ?
  • Page 5
  • Urfist de Rennes, SCD Rennes 1, 20115 1/Typologies des outils de recherche du web Distinguer dabord : Outils propres au web : moteurs de recherche, moteurs de blogs Outils accessibles par le web : bases de donnes, catalogues Deux critres essentiels : Offre des ressources : outil gnraliste / spcialis Mode dindexation : outil humain / automatis
  • Page 6
  • Urfist de Rennes, SCD Rennes 1, 20116 1/ Typologies des moteurs de recherche : loffre des ressources Critre : type de ressources collectes Distinction principale : Moteurs gnralistes : Google, Yahoo, Exalead, Ask, Bing caractristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spcialiss : Tendance lourde des moteurs : Modules spcialiss lintrieur des moteurs gnralistes Infinit des types de spcialisations Explosion du nombre doutils
  • Page 7
  • Urfist de Rennes, SCD Rennes 1, 20117 2.1 Outils de reprage : les annuaires thmatiques Premiers outils du web : Virtual Library (1991), Yahoo (1994) Des principes communs : Slection humaine de ressources : Caractre trs slectif des annuaires Recensement de sites web (et non de pages web) Pr-catgorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne lannuaire : Possibilits de requtes
  • Page 8
  • Urfist de Rennes, SCD Rennes 1, 20118 2.1 Outils de reprage : les annuaires thmatiques Usages : Recherche dinformation sur un sujet large Premire approche dun domaine : Exemple de la presse Recherche gographique Recherche de sites de rfrence utiles pour dfricher un domaine, pour les premires recherches sur un sujet Ne pas opposer annuaires et moteurs : outils complmentaires
  • Page 9
  • Urfist de Rennes, SCD Rennes 1, 20119 2.1 Outils de reprage : les annuaires thmatiques Annuaires tous publics: Open Directory : Open Directory plus important annuaire gnraliste Annuaires scientifiques multidisciplinaires : Virtual Library : annuaire collectif de ressources scientifiques Virtual Library Les Signets de la BNF : Les Signets de la BNF slection de sites de rfrence Signets Universits : Signets Universits Liens slectionns par les BU Sciseek DOAJ : annuaire de revues en libre accs DOAJ 5952 revues recenses en janvier 2011 Guides disciplinaires de lUQAC (Universit du Qubec Chicoutimi) : Guides disciplinaires de lUQAC Guides de ressources par disciplines Exemple en Gnie informatiqueGnie informatique
  • Page 10
  • Urfist de Rennes, SCD Rennes 1, 201110 2.1 Outils de reprage et daccs : les portails Dfinition : "Ressource accessible via Internet, constituant un point d'accs unique, simplifi, facile d'emploi et unifi, pour un public cible, des ressources (services, produits) lectroniques distantes, varies et htrognes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les rseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, ditorial, technique... Diversit des ressources et services : recherche d information, achats/ventes, informations gnrales, spcialises, personnalisation, messagerie, forums, services dalerte Portails gnralistes / spcialiss Exemples : Yahoo.fr, Culture.frYahoo.frCulture.fr
  • Page 11
  • Urfist de Rennes, SCD Rennes 1, 201111 2.1 Annuaires et portails en sciences Portails officiels : Science.gouv.fr, portail de la science du Ministre de lEnseignement suprieur Science.gouv.fr Portails multidisciplinaires : Intute : Intute: Portail scientifique multidisciplinaire Voir Intute Mathematics and Computer scienceIntute Mathematics and Computer science SciNet Science and Technology : SciNet Science and Technology Annuaire, cr en 1999 SciCentral Portail de ressources scientifiques, depuis 1997
  • Page 12
  • Urfist de Rennes, SCD Rennes 1, 201112 2.1 Annuaires et portails en sciences de lingnieur SAPRISTI (Sentiers d'Accs et Pistes de Recherche d'Informations Scientifiques et Techniques sur Internet), INSA Lyon SAPRISTI Propose des slections de sites et doutils, une mthodologie de recherche et de validation de linformation, dans le domaine des Sciences de lingnieur. Portail de lIEEE : Portail de lIEEE Exemple : recherche de confrencesrecherche de confrences
  • Page 13
  • Urfist de Rennes, SCD Rennes 1, 201113 2.1 Autres annuaires et portails spcialiss en sciences de lingnieur Un portail scientifique spcialis : AERADE (Aerospace and Defence resources (http://aerade.cranfield.ac.uk)http://aerade.cranfield.ac.uk Cranfield University (G.B.) Deux portails professionnels : Mechanical Engineering Portal (The Mechanical Design Engineering Portal) (http://iCrank.com)http://iCrank.com ABC Electronique, Portail de llectronique (http://www.abcelectronique.com/)http://www.abcelectronique.com/ Depuis 2000
  • Page 14
  • Urfist de Rennes, SCD Rennes 1, 201114 3.1 Les moteurs de recherche Dfinition : outil automatis dindexation et de recherche des ressources du web Fonctionnement : 3 modules autonomes : robot collecteur : collecte des donnes module dindexation : base de donnes du moteur module de requte : gestion des requtes et des rsultats Diffrence avec les annuaires : - indexent automatiquement les ressources - indexent les pages web et/ou les documents, et non les sites
  • Page 15
  • Urfist de Rennes, SCD Rennes 1, 201115 3.1 Moteurs de recherche : comprendre leur fonctionnement Source : R. Viseur, CETICR. Viseur, CETIC
  • Page 16
  • Urfist de Rennes, SCD Rennes 1, 201116 3.1 Moteurs de recherche : matriser linterrogation avance Nombreuses possibilits de filtrage des rsultats : gographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF des dates : plusieurs options (mais problmatique) des champs : titre, URL, host, domaine thmatique : choix du domaine de recherche Exercice de recherche : chercher un support pdagogique rcent, en franais, expliquant le fonctionnement des moteurs de recherche et provenant dune universit
  • Page 17
  • Urfist de Rennes, SCD Rennes 1, 201117 3.1 Moteurs de recherche : matriser les oprateurs de recherche Oprateurs boolens : AND : implicite ; diffrent de + + : prend en compte lorthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : lun ou lautre ou tous les termes Oprateurs linguistiques : : recherche dexpression exacte * : astrisque permet de remplacer un terme sur Google : ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la dfinition dun mot Rgle : limite des 10 mots
  • Page 18
  • Urfist de Rennes, SCD Rennes 1, 201118 3.1 Moteurs de recherche : connatre les m thodes de classement des rsultats Enjeux du relevance ranking , du classement des rsultats selon leur pertinence Deux grandes mthodes (imbriques) de classement : tri par indice de pertinence : calculs statistiques sur la frquence des termes tri par popularit : indice de popularit, indice de clic
  • Page 19
  • Urfist de Rennes, SCD Rennes 1, 201119 3.1 Mthodes de classement des rsultats : lindice de pertinence Principes : classement des rsultats fond sur la frquence dapparition et la localisation des termes de la requte dans une page web affichage des rsultats partir du calcul dun score pour chaque rponse : Ex. : Requte sur le march des DVD en France : +march +DVD +France > retourne les documents contenant tous les mots de la requte >> documents contenant le plus de fois les mots de la requte classs en premier Utilisation : premire mthode de classement utilise sur le web ; Utilise, partiellement ou non, sur tous les moteurs de recherche ; Problmes : dtournement par le spamdexing
  • Page 20
  • Urfist de Rennes, SCD Rennes 1, 201120 3.1 Mthodes de classement des rsultats : lindice de popularit Principes, origines : Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considrs comme des liens de parent smantique calcul de la notorit dun site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularit lanc par Google en 98 originalit et succs de Google et de son PageRankGoogle
  • Page 21
  • Urfist de Rennes, SCD Rennes 1, 201121 3.1 Moteurs de recherche : utiliser le filtrage des rsultats Utiliser les options daffinement des rsultats : Sur Exalead : la zapette zapette Sur Google : Afficher les options Afficher les options Diffrentes possibilits de filtrage : Sur les types de ressources : blogs, vidos, actualits Sur les dates dindexation Sur les mots associs (Exalead), les recherches associes (Google Options de tri et daffichage : Sur la chronologie (Google) Sur les concepts ( roue magique sur Google)
  • Page 22
  • Urfist de Rennes, SCD Rennes 1, 201122 3.1 Moteurs de recherche : distinguer liens naturels et liens sponsoriss Positionnement : Position occupe par un site ou une page web dans la page de rsultats dun outil de recherche Positionnement naturel Selon le contenu, la notorit du site parcouru par le robot Positionnement payant : Achat de mots-cls, pour garantir une visibilit en tte des rsultats dun outil de recherche Ex. sur GoogleGoogle Principale source du financement de Google
  • Page 23
  • Urfist de Rennes, SCD Rennes 1, 201123 3.2 Outils de recherche : Les mtamoteurs Dfinition : Un mtamoteur est un outil de recherche qui interroge en parallle plusieurs outils (moteurs et annuaires), rapatrie leurs rponses et les organise, selon des mthodes de classement spcifiques, pour fournir aux utilisateurs une prsentation structure des rsultats. Ns en 1995 Diversit des mtamoteurs : En ligne / hors-ligne Gnraux / spcialiss
  • Page 24
  • Urfist de Rennes, SCD Rennes 1, 201124 3.2 Les mtamoteurs Fonctionnement, lments dun mtamoteur : pas de base de donnes en propre outils intermdiaires : une seule requte pose sur diffrents outils Exploitation des rsultats des autres outils Gnralement, fusion des rsultats et limination des doublons Classement des rsultats selon critres propres au mtamoteur Prsentation des rsultats, selon diffrentes mthodes : linaires, cartographiques
  • Page 25
  • Urfist de Rennes, SCD Rennes 1, 201125 3.2 Les mtamoteurs Utilisation, intrt : Simplification : Une seule requte sur plusieurs outils Elargissement de la recherche : : Possibilit dinterroger plusieurs sources : dune dizaine un millier (Copernic) Renforcement de la pertinence : Slection des documents plus pousse, par le calcul de pertinence opr sur plusieurs outils Utiles pour un panorama des ressources, des sites de rfrence sur un thme Exploitation parfois sophistique des rsultats Outils paramtrables, personnalisables (surtout hors- ligne)
  • Page 26
  • Urfist de Rennes, SCD Rennes 1, 201126 3.2 Les mtamoteurs Exemples de mtamoteurs : Francophones : Ixquick : http://www.ixquick.com Ixquick Anglo-saxons : Yippy : Yippy Plusieurs modules spcialiss Techniques de clustrisation SurfWax : http://www.surfwax.com SurfWax
  • Page 27
  • Urfist de Rennes, SCD Rennes 1, 201127 4/ Outils de recherche spcialiss selon loffre des ressources Au moins 3 critres de spcialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS Selon la nature du contenu : Moteurs scientifiques, dactualit, de personnes, de produits Selon la nature du mdia : Moteurs dimages, de vidos, de podcasts, de photos.. Autres critres possibles : langue, gographie, domaine thmatique
  • Page 28
  • Urfist de Rennes, SCD Rennes 1, 201128 4/ Outils spcialiss : quelques exemples Selon les ressources internet : Moteurs de blogs : Technorati Google Blog Search Pour aller plus loin : Intelligence-CenterIntelligence-Center Selon la nature des informations : Moteurs dactualit (dpches, articles) : Wikio Yahoo Actualits
  • Page 29
  • Urfist de Rennes, SCD Rennes 1, 201129 4.1 Moteurs scientifiques Moteurs spcialiss sur les ressources scientifiques Plusieurs types, plusieurs statuts; typologie possible selon : Le contenu des ressources : Moteurs multidisciplinaires : Google Scholar, ScirusGoogle ScholarScirus Moteurs disciplinaires : GetInfo, SearchPigeonGetInfoSearchPigeon Laccessibilit des ressources : Moteurs de recherche spcialiss dans les ressources en "libre accs" (open access), appels aussi moissonneurs (harvesters) : OAIsterOAIster Moteurs de recherche spcialiss dans les articles de revues, la littrature scientifique commercialise : ScirusScirus
  • Page 30
  • Urfist de Rennes, SCD Rennes 1, 201130 4.1 Google Scholar : fonctionnalits dinterrogation Prfrences : interface en franais Lien vers bibliothques Champs et oprateurs avancs dinterrogation : Sur lauteur : author: ou champ Auteur en mode avanc Sur le titre dune revue : Uniquement en mode avanc : champ Publication, Sur le titre dun article ou dun document : Oprateur intitle: Sur la date : Uniquement en mode avanc : champ Date Pour en savoir plus
  • Page 31
  • Urfist de Rennes, SCD Rennes 1, 201131 4.1 Moteurs scientifiques en sciences et techniques Toutes disciplines scientifiques : Scirus :Scirus Produit par Elsevier ; indexation des revues et produits dElsevier plus de 450 millions de documents Pour en savoir plus, cf Urfist de LyonUrfist de Lyon Citebase Search : base de citations ; articles en physique, maths, informatique, biologie et mdecineCitebase Search Informatique, Sciences de lingnieur, maths : CiteSeer.IST : informatique et sciences de linforma...

Recommended

View more >