30
Rechercher et trouver l'information sur Internet

Recherche sur le net isen 2013

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Recherche sur le net isen 2013

Rechercher et trouver l'information sur Internet

Page 2: Recherche sur le net isen 2013

Programme

Le Web

Les moteurs de recherche généralistes (Google) Les moteurs spécialisés (Google scholar, Scirus)

Les archives ouvertes (Archimer, Hal…)

Les moissonneurs(Oaister…)

Page 3: Recherche sur le net isen 2013

Le Web a été inventé plusieurs années après Internet et est un système hypertexte public fonctionnant sur internet qui

permet de consulter, avec un navigateur, des pages accessibles sur des sites.

Internet est un réseau de réseaux, sans centre

névralgique, composé de millions de réseaux aussi bien publics que privés, universitaires,

commerciaux et gouvernementaux.

Internet transporte un large spectre d'information et permet l'élaboration d'applications et de services variés comme le courrier électronique, la messagerie instantanée et le Web.

Page 4: Recherche sur le net isen 2013

Les outils de recherche

• Les moteurs : outils de recherche sur le web constitués de «robots» permettant de retrouver des ressources

(pages web, forums, images, vidéo, fichiers, etc.) associées à des mots

• Les annuaires : pour une recherche de sites thématiques

• Les méta moteurs : interrogent plusieurs moteurs de recherche simultanément

• Les encyclopédies : pour des définitions, informations pertinentes

• Les bases de données spécialisées, archives ouvertes : pour des informations validées dans un domaine précis

Page 5: Recherche sur le net isen 2013

Moteurs de recherche généralistes :

Page 6: Recherche sur le net isen 2013

L'algorithme de pertinence de Google (Algorithme de pertinence : “Page Rank” inventé par Larry Page,

cofondateur Google.)

Page 7: Recherche sur le net isen 2013

Il se base principalement sur l'indice de popularité.

Il s'agit d'un programme qui parcourt sans arrêt le web pour alimenter et mettre à jour une base de données contenant les adresses les contenus et liste des liens avec d’autres pages.

les robots, appelés aussi "bot" ou "spider"

Page 8: Recherche sur le net isen 2013

Google compte le nombre de liens qui pointent vers chaque page.

Plus une page est pointée par d'autres pages et

plus elle est considérée comme populaire.

Tous ces paramètres (et sans doute beaucoup d'autres dont nous ignorons l'existence) sont pris en compte par Google pour classer les résultats de recherche et décider quel site aura la fameuse première place, si convoitée, dans ces résultats.

Page 9: Recherche sur le net isen 2013

La GoogleBar (qui est aujourd'hui installée sur des millions de postes à travers le monde). Elle comporte comme un espion et renseigne Google sur les sites visités par les internautes, le temps passé sur chaque site, et, d'une façon générale, sur la façon dont les visiteurs naviguent à travers le web. Il ne fait aucun doute que ces très précieux renseignements sont utilisés dans le classement des sites.

Page 10: Recherche sur le net isen 2013

• Avantages

Les pages trouvées sont en quelque sorte “évaluées” : un site référencé par de nombreux sites du même domaine étant bien sûr, bien classé.

• Inconvénients

Négligence des pages récentes et méconnues, ainsi que des pages traitant de sujets peu populaire.

Les contenus des pages “populaires” ne sont ni garantis ni forcément évalués dans leur contenu.

Effectivement, les résultats de Google sont pertinents.

Page 11: Recherche sur le net isen 2013

Google n’indexe qu’un faible % du Web total :

Estimé à 1% de 1000 milliards de pages.

On sait par exemple que 30 000 milliards de pages Web sont indexées par le moteur Google, pour un poids total de 100 000 To.

Affichage des résultats sur la base de la popularité des liens

Risques

non fiabilité de l’information,

une multitude de publicités, de sites marchands

une perte de temps dans les recherches…

Les Limites de Google

Page 12: Recherche sur le net isen 2013

Le souci premier de ce fonctionnement est qu’il ne répond

tout simplement pas à une démarche axée sur le contenu et sa « validité »

Page 13: Recherche sur le net isen 2013

1-Eviter les recherches en langage naturel

2-Chercher des réponses, ne recherchez pas des questions : Faut-il boire du vin ? vous ramènera 3 fois moins de réponses que Il faut boire du vin. 3-Utiliser les guillemets (« ») pour rechercher une expression exacte 4-Utiliser le signe moins (-) , pour exclure un terme

5-Faire des recherches à 3 mots (au moins)

6-Rechercher des synonymes avec le signe (~)

7-Rechercher un type de fichier particulier avec filetype: (filetype:doc,

filetype:pdf…etc)

Page 14: Recherche sur le net isen 2013

Google, n’est sensible ni à la casse ni aux accents ou autres signes

(par exemple "français",francais", "FRANÇAIS" et

"FRANCAIS" sont équivalents)

Page 15: Recherche sur le net isen 2013
Page 16: Recherche sur le net isen 2013

la réalité virtuelle au service de la gestion des risques en technologie navale

Page 17: Recherche sur le net isen 2013

"réalité virtuelle" + "gestion risques" + "technologie navale"

Page 18: Recherche sur le net isen 2013

"virtual reality" + "risks management" + "naval technology"

"virtual reality" + "risks management" + submarin

3d + "risks management" + submarin

Page 19: Recherche sur le net isen 2013

(3d or 3-d or "virtual reality") + ("risk* management" or prevention or hazard*) + (ship* or submarin* or underwater* or cargo*)

Page 20: Recherche sur le net isen 2013
Page 21: Recherche sur le net isen 2013

Documents : Articles peer-reviewed, thèses, livres, résumés analytiques

Sources : éditeurs scientifiques, sociétés savantes, universités, et organismes de recherche

Page 22: Recherche sur le net isen 2013

En quoi consiste Google Scholar ?

Google Scholar permet d'effectuer une recherche portant sur des travaux universitaires. articles revus par des comités de lecture, thèses, livres, résumés analytiques ... Ces travaux peuvent provenir des éditeurs scientifiques, des sociétés savantes, des référentiels de prépublication, des universités et d'autres organisations de recherche.

Page 23: Recherche sur le net isen 2013

Limites de scholar

Couverture réelle difficile à évaluer :

volume documents ?

types de documents ?

période ?

Langues : anglais privilégié?

Pas d’information sur les éditeurs ou les serveurs indexés

Pas d’information sur les mises à jour

Bien que possédant de nombreux points commun avec une base de données, google scholar n’en reste pas moins un moteur de recherche sur le Net.

Page 24: Recherche sur le net isen 2013

Moteurs de recherche spécialisés

Page 25: Recherche sur le net isen 2013

Moteur de recherche spécialisé en sciences, créé par

Elsevier. Recherche sur le texte intégral de plus de 410

millions de pages web

Documents : articles, résumés, références bibliographiques,

thèses et dissertations, actes de colloques, brevets, rapports,

cours en ligne, pages web scientifiques

Sources : Science Direct, Nature, autres portails de revues

électroniques, Bases de données (Arxiv, Medline, Nasa),

brevets US, Archives ouvertes, serveurs de pré-publications

http://www.scirus.com/srsapp/aboutus/

Depuis 2001

Page 26: Recherche sur le net isen 2013
Page 27: Recherche sur le net isen 2013

Nombre de résultats

Affiner parmi ses résultats par source, sites, types de fichiers…

Mail, sauvegarde ou export format

RIS pour logiciel bibliographique Tri par pertinence

ou date

Affiner, réorienter sa recherche par mots clés

Source

Page 28: Recherche sur le net isen 2013

Une interface de

recherche avancée

complète

Types de

documents

Formats

de fichiers

Sources

Date

Page 29: Recherche sur le net isen 2013

Utiliser les préférences pour paramétrer votre interface de recherche

Choisir le nombre de résultats à afficher par page

Ouvrir une nouvelle fenêtre à l’affichage des résultats

Afficher un lien des résultats vers le catalogue d’une bibliothèque

• Toutes les sources ne sont pas datées

• La nature commerciale du moteur tend à mettre en avant

les ressources issues des portails payants

• Un certain nombre de pages non scientifiques

Attention !

Page 30: Recherche sur le net isen 2013

• N’écartez aucune piste : privilégiez de multiples sources !

• Recherchez dans les bases de données scientifiques l’information validée (WOS, Asfa, Medline, Pubmed…etc.)

• Mettez en place des alertes sur vos recherches :

dans des bases de données

sur des moteurs spécialisés et des portails d’éditeurs

• Consulter les sites institutionnels, académiques :

catalogue de bibliothèque, archives ouvertes…

• Pensez à tous les types de documents : thèses, rapports, actes de colloques, ouvrages, cours en ligne, brevets…

• Pensez aux réseaux : communauté scientifique, listes de diffusion, forums, blogs

• Servez vous des flux RSS disponibles pour rester informés

Source de la page : M LeGall ; Trouver l’information scientifique sur Internet (2011)