View
216
Download
1
Category
Preview:
DESCRIPTION
Â
Citation preview
Rechercher et trouver l'information sur Internet
Programme
Le Web
Les moteurs de recherche généralistes (Google) Les moteurs spécialisés (Google scholar, Scirus)
Les archives ouvertes (Archimer, Hal…)
Les moissonneurs(Oaister…)
Le Web a été inventé plusieurs années après Internet et est un système hypertexte public fonctionnant sur internet qui
permet de consulter, avec un navigateur, des pages accessibles sur des sites.
Internet est un réseau de réseaux, sans centre
névralgique, composé de millions de réseaux aussi bien publics que privés, universitaires,
commerciaux et gouvernementaux.
Internet transporte un large spectre d'information et permet l'élaboration d'applications et de services variés comme le courrier électronique, la messagerie instantanée et le Web.
Les outils de recherche
• Les moteurs : outils de recherche sur le web constitués de «robots» permettant de retrouver des ressources
(pages web, forums, images, vidéo, fichiers, etc.) associées à des mots
• Les annuaires : pour une recherche de sites thématiques
• Les méta moteurs : interrogent plusieurs moteurs de recherche simultanément
• Les encyclopédies : pour des définitions, informations pertinentes
• Les bases de données spécialisées, archives ouvertes : pour des informations validées dans un domaine précis
Moteurs de recherche généralistes :
L'algorithme de pertinence de Google (Algorithme de pertinence : “Page Rank” inventé par Larry Page,
cofondateur Google.)
Il se base principalement sur l'indice de popularité.
Il s'agit d'un programme qui parcourt sans arrêt le web pour alimenter et mettre à jour une base de données contenant les adresses les contenus et liste des liens avec d’autres pages.
les robots, appelés aussi "bot" ou "spider"
Google compte le nombre de liens qui pointent vers chaque page.
Plus une page est pointée par d'autres pages et
plus elle est considérée comme populaire.
Tous ces paramètres (et sans doute beaucoup d'autres dont nous ignorons l'existence) sont pris en compte par Google pour classer les résultats de recherche et décider quel site aura la fameuse première place, si convoitée, dans ces résultats.
La GoogleBar (qui est aujourd'hui installée sur des millions de postes à travers le monde). Elle comporte comme un espion et renseigne Google sur les sites visités par les internautes, le temps passé sur chaque site, et, d'une façon générale, sur la façon dont les visiteurs naviguent à travers le web. Il ne fait aucun doute que ces très précieux renseignements sont utilisés dans le classement des sites.
• Avantages
Les pages trouvées sont en quelque sorte “évaluées” : un site référencé par de nombreux sites du même domaine étant bien sûr, bien classé.
• Inconvénients
Négligence des pages récentes et méconnues, ainsi que des pages traitant de sujets peu populaire.
Les contenus des pages “populaires” ne sont ni garantis ni forcément évalués dans leur contenu.
Effectivement, les résultats de Google sont pertinents.
Google n’indexe qu’un faible % du Web total :
Estimé à 1% de 1000 milliards de pages.
On sait par exemple que 30 000 milliards de pages Web sont indexées par le moteur Google, pour un poids total de 100 000 To.
Affichage des résultats sur la base de la popularité des liens
Risques
non fiabilité de l’information,
une multitude de publicités, de sites marchands
une perte de temps dans les recherches…
Les Limites de Google
Le souci premier de ce fonctionnement est qu’il ne répond
tout simplement pas à une démarche axée sur le contenu et sa « validité »
1-Eviter les recherches en langage naturel
2-Chercher des réponses, ne recherchez pas des questions : Faut-il boire du vin ? vous ramènera 3 fois moins de réponses que Il faut boire du vin. 3-Utiliser les guillemets (« ») pour rechercher une expression exacte 4-Utiliser le signe moins (-) , pour exclure un terme
5-Faire des recherches à 3 mots (au moins)
6-Rechercher des synonymes avec le signe (~)
7-Rechercher un type de fichier particulier avec filetype: (filetype:doc,
filetype:pdf…etc)
Google, n’est sensible ni à la casse ni aux accents ou autres signes
(par exemple "français",francais", "FRANÇAIS" et
"FRANCAIS" sont équivalents)
la réalité virtuelle au service de la gestion des risques en technologie navale
"réalité virtuelle" + "gestion risques" + "technologie navale"
"virtual reality" + "risks management" + "naval technology"
"virtual reality" + "risks management" + submarin
3d + "risks management" + submarin
(3d or 3-d or "virtual reality") + ("risk* management" or prevention or hazard*) + (ship* or submarin* or underwater* or cargo*)
Documents : Articles peer-reviewed, thèses, livres, résumés analytiques
Sources : éditeurs scientifiques, sociétés savantes, universités, et organismes de recherche
En quoi consiste Google Scholar ?
Google Scholar permet d'effectuer une recherche portant sur des travaux universitaires. articles revus par des comités de lecture, thèses, livres, résumés analytiques ... Ces travaux peuvent provenir des éditeurs scientifiques, des sociétés savantes, des référentiels de prépublication, des universités et d'autres organisations de recherche.
Limites de scholar
Couverture réelle difficile à évaluer :
volume documents ?
types de documents ?
période ?
Langues : anglais privilégié?
Pas d’information sur les éditeurs ou les serveurs indexés
Pas d’information sur les mises à jour
Bien que possédant de nombreux points commun avec une base de données, google scholar n’en reste pas moins un moteur de recherche sur le Net.
Moteurs de recherche spécialisés
Moteur de recherche spécialisé en sciences, créé par
Elsevier. Recherche sur le texte intégral de plus de 410
millions de pages web
Documents : articles, résumés, références bibliographiques,
thèses et dissertations, actes de colloques, brevets, rapports,
cours en ligne, pages web scientifiques
Sources : Science Direct, Nature, autres portails de revues
électroniques, Bases de données (Arxiv, Medline, Nasa),
brevets US, Archives ouvertes, serveurs de pré-publications
http://www.scirus.com/srsapp/aboutus/
Depuis 2001
Nombre de résultats
Affiner parmi ses résultats par source, sites, types de fichiers…
Mail, sauvegarde ou export format
RIS pour logiciel bibliographique Tri par pertinence
ou date
Affiner, réorienter sa recherche par mots clés
Source
Une interface de
recherche avancée
complète
Types de
documents
Formats
de fichiers
Sources
Date
Utiliser les préférences pour paramétrer votre interface de recherche
Choisir le nombre de résultats à afficher par page
Ouvrir une nouvelle fenêtre à l’affichage des résultats
Afficher un lien des résultats vers le catalogue d’une bibliothèque
• Toutes les sources ne sont pas datées
• La nature commerciale du moteur tend à mettre en avant
les ressources issues des portails payants
• Un certain nombre de pages non scientifiques
Attention !
• N’écartez aucune piste : privilégiez de multiples sources !
• Recherchez dans les bases de données scientifiques l’information validée (WOS, Asfa, Medline, Pubmed…etc.)
• Mettez en place des alertes sur vos recherches :
dans des bases de données
sur des moteurs spécialisés et des portails d’éditeurs
• Consulter les sites institutionnels, académiques :
catalogue de bibliothèque, archives ouvertes…
• Pensez à tous les types de documents : thèses, rapports, actes de colloques, ouvrages, cours en ligne, brevets…
• Pensez aux réseaux : communauté scientifique, listes de diffusion, forums, blogs
• Servez vous des flux RSS disponibles pour rester informés
Source de la page : M LeGall ; Trouver l’information scientifique sur Internet (2011)
Recommended