Recherche sur le net isen 2013

Preview:

DESCRIPTION

 

Citation preview

Rechercher et trouver l'information sur Internet

Programme

Le Web

Les moteurs de recherche généralistes (Google) Les moteurs spécialisés (Google scholar, Scirus)

Les archives ouvertes (Archimer, Hal…)

Les moissonneurs(Oaister…)

Le Web a été inventé plusieurs années après Internet et est un système hypertexte public fonctionnant sur internet qui

permet de consulter, avec un navigateur, des pages accessibles sur des sites.

Internet est un réseau de réseaux, sans centre

névralgique, composé de millions de réseaux aussi bien publics que privés, universitaires,

commerciaux et gouvernementaux.

Internet transporte un large spectre d'information et permet l'élaboration d'applications et de services variés comme le courrier électronique, la messagerie instantanée et le Web.

Les outils de recherche

• Les moteurs : outils de recherche sur le web constitués de «robots» permettant de retrouver des ressources

(pages web, forums, images, vidéo, fichiers, etc.) associées à des mots

• Les annuaires : pour une recherche de sites thématiques

• Les méta moteurs : interrogent plusieurs moteurs de recherche simultanément

• Les encyclopédies : pour des définitions, informations pertinentes

• Les bases de données spécialisées, archives ouvertes : pour des informations validées dans un domaine précis

Moteurs de recherche généralistes :

L'algorithme de pertinence de Google (Algorithme de pertinence : “Page Rank” inventé par Larry Page,

cofondateur Google.)

Il se base principalement sur l'indice de popularité.

Il s'agit d'un programme qui parcourt sans arrêt le web pour alimenter et mettre à jour une base de données contenant les adresses les contenus et liste des liens avec d’autres pages.

les robots, appelés aussi "bot" ou "spider"

Google compte le nombre de liens qui pointent vers chaque page.

Plus une page est pointée par d'autres pages et

plus elle est considérée comme populaire.

Tous ces paramètres (et sans doute beaucoup d'autres dont nous ignorons l'existence) sont pris en compte par Google pour classer les résultats de recherche et décider quel site aura la fameuse première place, si convoitée, dans ces résultats.

La GoogleBar (qui est aujourd'hui installée sur des millions de postes à travers le monde). Elle comporte comme un espion et renseigne Google sur les sites visités par les internautes, le temps passé sur chaque site, et, d'une façon générale, sur la façon dont les visiteurs naviguent à travers le web. Il ne fait aucun doute que ces très précieux renseignements sont utilisés dans le classement des sites.

• Avantages

Les pages trouvées sont en quelque sorte “évaluées” : un site référencé par de nombreux sites du même domaine étant bien sûr, bien classé.

• Inconvénients

Négligence des pages récentes et méconnues, ainsi que des pages traitant de sujets peu populaire.

Les contenus des pages “populaires” ne sont ni garantis ni forcément évalués dans leur contenu.

Effectivement, les résultats de Google sont pertinents.

Google n’indexe qu’un faible % du Web total :

Estimé à 1% de 1000 milliards de pages.

On sait par exemple que 30 000 milliards de pages Web sont indexées par le moteur Google, pour un poids total de 100 000 To.

Affichage des résultats sur la base de la popularité des liens

Risques

non fiabilité de l’information,

une multitude de publicités, de sites marchands

une perte de temps dans les recherches…

Les Limites de Google

Le souci premier de ce fonctionnement est qu’il ne répond

tout simplement pas à une démarche axée sur le contenu et sa « validité »

1-Eviter les recherches en langage naturel

2-Chercher des réponses, ne recherchez pas des questions : Faut-il boire du vin ? vous ramènera 3 fois moins de réponses que Il faut boire du vin. 3-Utiliser les guillemets (« ») pour rechercher une expression exacte 4-Utiliser le signe moins (-) , pour exclure un terme

5-Faire des recherches à 3 mots (au moins)

6-Rechercher des synonymes avec le signe (~)

7-Rechercher un type de fichier particulier avec filetype: (filetype:doc,

filetype:pdf…etc)

Google, n’est sensible ni à la casse ni aux accents ou autres signes

(par exemple "français",francais", "FRANÇAIS" et

"FRANCAIS" sont équivalents)

la réalité virtuelle au service de la gestion des risques en technologie navale

"réalité virtuelle" + "gestion risques" + "technologie navale"

"virtual reality" + "risks management" + "naval technology"

"virtual reality" + "risks management" + submarin

3d + "risks management" + submarin

(3d or 3-d or "virtual reality") + ("risk* management" or prevention or hazard*) + (ship* or submarin* or underwater* or cargo*)

Documents : Articles peer-reviewed, thèses, livres, résumés analytiques

Sources : éditeurs scientifiques, sociétés savantes, universités, et organismes de recherche

En quoi consiste Google Scholar ?

Google Scholar permet d'effectuer une recherche portant sur des travaux universitaires. articles revus par des comités de lecture, thèses, livres, résumés analytiques ... Ces travaux peuvent provenir des éditeurs scientifiques, des sociétés savantes, des référentiels de prépublication, des universités et d'autres organisations de recherche.

Limites de scholar

Couverture réelle difficile à évaluer :

volume documents ?

types de documents ?

période ?

Langues : anglais privilégié?

Pas d’information sur les éditeurs ou les serveurs indexés

Pas d’information sur les mises à jour

Bien que possédant de nombreux points commun avec une base de données, google scholar n’en reste pas moins un moteur de recherche sur le Net.

Moteurs de recherche spécialisés

Moteur de recherche spécialisé en sciences, créé par

Elsevier. Recherche sur le texte intégral de plus de 410

millions de pages web

Documents : articles, résumés, références bibliographiques,

thèses et dissertations, actes de colloques, brevets, rapports,

cours en ligne, pages web scientifiques

Sources : Science Direct, Nature, autres portails de revues

électroniques, Bases de données (Arxiv, Medline, Nasa),

brevets US, Archives ouvertes, serveurs de pré-publications

http://www.scirus.com/srsapp/aboutus/

Depuis 2001

Nombre de résultats

Affiner parmi ses résultats par source, sites, types de fichiers…

Mail, sauvegarde ou export format

RIS pour logiciel bibliographique Tri par pertinence

ou date

Affiner, réorienter sa recherche par mots clés

Source

Une interface de

recherche avancée

complète

Types de

documents

Formats

de fichiers

Sources

Date

Utiliser les préférences pour paramétrer votre interface de recherche

Choisir le nombre de résultats à afficher par page

Ouvrir une nouvelle fenêtre à l’affichage des résultats

Afficher un lien des résultats vers le catalogue d’une bibliothèque

• Toutes les sources ne sont pas datées

• La nature commerciale du moteur tend à mettre en avant

les ressources issues des portails payants

• Un certain nombre de pages non scientifiques

Attention !

• N’écartez aucune piste : privilégiez de multiples sources !

• Recherchez dans les bases de données scientifiques l’information validée (WOS, Asfa, Medline, Pubmed…etc.)

• Mettez en place des alertes sur vos recherches :

dans des bases de données

sur des moteurs spécialisés et des portails d’éditeurs

• Consulter les sites institutionnels, académiques :

catalogue de bibliothèque, archives ouvertes…

• Pensez à tous les types de documents : thèses, rapports, actes de colloques, ouvrages, cours en ligne, brevets…

• Pensez aux réseaux : communauté scientifique, listes de diffusion, forums, blogs

• Servez vous des flux RSS disponibles pour rester informés

Source de la page : M LeGall ; Trouver l’information scientifique sur Internet (2011)

Recommended