29
Support de cours de l'intervenant INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane COTTIN L’ASSOCIATION DES PROFESSIONNELS DE L’INFORMATION ET DE LA DOCUMENTATION 25, rue Claude Tillier – 75012 PARIS – Tél. : 01 43 72 25 25 – Télécopie : 01 43 72 30 41 – SIRET 784 263 311 00036 – APE 913 E E-mail : [email protected] – http://www.adbs.fr

INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Support de cours de lintervenant

INTERNETRechercher linformation sur Internet

approfondissement des meacutethodes

27 28 et 29 novembre 2006Animateur

Steacutephane COTTIN

LrsquoASSOCIATION DES PROFESSIONNELS DE LrsquoINFORMATION ET DE LA DOCUMENTATION25 rue Claude Tillier ndash 75012 PARIS ndash Teacutel 01 43 72 25 25 ndash Teacuteleacutecopie 01 43 72 30 41 ndash SIRET 784 263 311 00036 ndash

APE 913 EE-mail adbsadbsfr ndash httpwwwadbsfr

Recherche avanceacutee sur Internet (approfondissement des meacutethodes)

httpwwwadbsfrsiteformationsdetail_formationphpid=62ampversion=4

Preacutesentation (0)

Des rappels (Les corpus disponibles) (1)

Les outils agrave disposition Les moteurs et les reacutepertoires (2)

Des meacutethodes et des strateacutegies (3)

La veille quotidienne (4)

Boicircte agrave outils (5)

Autoformation (6)

Travaux pratiques (7)

Lensemble du support de cours est agrave suivre en ligne sur httpwwwservicedocinfo730

2

Ce support de cours de lintervenant est le fil conducteur de ces trois jours de formation Il sappuiera sur louvrage laquo Net Recherche raquo de Veacuteronique Mesguich et Armelle Thomas

Tout au long de ce support de cours les reacutefeacuterences agrave louvrage en question seront noteacutees (voir NR p xx)

Issue de leurs expeacuteriences cumuleacutees agrave lrsquooccasion notamment des stages de formation ADBS Recherche avanceacutee sur Internet (approfondissement des meacutethodes) (ndeg 730) deux des formatrices attitreacutees Veacuteronique Mesguich et Armelle Thomas proposent aux eacuteditions de lrsquoADBS une version tregraves largement ameacutelioreacutee luxueuse et moderniseacutee du support de formationNet recherche le guide pratique pour mieux trouver lrsquoinformation utile Veacuteronique Mesguich et Armelle Thomas Sciences et techniques de lrsquoinformation (ISSN 1762-8288)

2006 - 148 pages - ISBN 2-84365-083-6 Reacutesumeacute

Qursquoelle reacuteponde agrave des besoins professionnels ou personnels la recherche drsquoinformation repreacutesente une grande part de lrsquoactiviteacute des internautes Le fonctionnement des moteurs de recherche est pourtant encore mal connu et les utilisateurs sont souvent perdus face agrave des reacutesultats trop nombreux et impreacutecis agrave des contenus structureacutes ou non valideacutes ou non gratuits ou payants Lrsquoart de la recherche drsquoinformation consiste pour une grande part agrave deacuteterminer les outils geacuteneacuteralistes ou speacutecialiseacutes les plus adapteacutes aux diffeacuterents types de requecirctes et agrave les utiliser avec maicirctrise Cet ouvrage a pour objectif drsquooffrir agrave toute personne ameneacutee agrave effectuer des recherches sur Internet un panorama des outils et meacutethodes existant agrave ce jour Il est destineacute tant aux professionnels de lrsquoinformation (documentalistes bibliotheacutecaires veilleurs) qursquoaux enseignants chercheurs eacutetudiants confronteacutes agrave la complexiteacute sans cesse grandissante des donneacutees disponibles en ligne Ils y trouveront des conseils meacutethodologiques ainsi que des laquo trucs et astuces raquo destineacutes agrave optimiser le processus de recherche des informations preacutecises sur les eacutevolutions actuelles ainsi que des preacutesentations drsquooutils et des listes drsquoadresses utiles

Introduction (pdf)

Table des matiegraveres (pdf)

3

Internet recherche avanceacutee et outils de veillePreacutesentation (0)

Steacutephane Cottin stephanecottingmailcom page perso weblog httpwwwservicedocinfo

Actuellement chef de service informatique - greffe au Conseil constitutionnelAncien Documentaliste de la socieacuteteacute Lexbase SA Speacutecialiseacutee dans la conception de moteurs et de bases de donneacutees juridiques (intra- et extranets)Ancien chef de service Documentation du Conseil constitutionnel creacuteateur du site Internet du Conseil constit (httpwwwconseil-constitutionnelfr) Collaboration ative dans la conception des bases de donneacutees juridiques publiques et dans la mise en place de plusieurs systegravemes dinformation (Seacutenat eacutelection preacutesidentielle Leacutegifrance Conseil dEtat)

Jai une connexion Internet depuis 1994 Jutilise majoritairement un PC (sous windows XP Pro) et Firefox 20 comme explorateur Internet plutocirct quExplorer Mes outils preacutefeacutereacutes sont Google (httpwwwgooglecom) en moteur lOpen directory (httpdmozorg) en reacutepertoire Wticker comme lecteur de fils RSS Wysigot comme agent dalerte (mais javoue quavec Wticker je ne lutilise plus et jai longtemps eacuteteacute fan de C4U) (httpwwwagentlandfrDownload5Monitoring_agentshtml) Pour info jai abandonneacute Copernic (httpwwwcoperniccom) comme assistant logiciel agrave la recherche depuis 2001Depuis 2003 jutilise de faccedilon professionnelle la technologie des weblogs agrave la fois pour diffuser de linformation (en interne comme en externe) et pour en recevoir mon weblog perso est sur httpwwwservicedocinfo

Je vous remercie de vous preacutesenter en indiquant quelques informations techniques - le type de mateacuteriel utiliseacute et son systegraveme dexploitation PC Mac Station sous Windows Linux Unix- le logiciel de navigation preacutefeacutereacute Netscape Explorer Mozilla autre

et en particulier en guise de mini sondage quel(s) moteur(s) ou outil(s) de recherche utilisez-vous le plus freacutequemment et nous dire en quelques mots ce que vous en pensez (eacuteventuellement indiquez si vous avez reacutecemment abandonneacute un outil pour un autre)

VOTRE SYSTEME ET VOTRE MATERIEL

(PC MAC Station) (Windows XP 2000 Linux Unix)

LOGICIEL DE NAVIGATIONInternet Explorer Firefox Netscape Opera Mozilla Safari

MOTEUR de RECHERCHE

FAVORIGoogle Yahoo Dmoz Exalead

LECTEUR DE FILS RSS

En ligne hors ligne les deux netvibes alertinfo bloglines blogbridge

OUTIL DAIDE A LA

RECHERCHE FAVORICopernic

Agreacutegateur Meacutetamoteur Mouchard

Aspirateur

4

Objectif Approfondir une meacutethodologie de recherche speacutecifique agrave InternetExploiter des fonctionnaliteacutes de recherche avanceacuteeIdentifier les outils de veille disponiblesSommaire Rappels et approfondissements- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussionMeacutethodologie speacutecifique- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche - quels outils pour quoi faire - comment identifier de sources dinformation sectorielle ou speacutecialiseacutee les experts agrave contacter les pages de liens- au delagrave des outils strateacutegies et tactiques de recherche- recherche lineacuteaire recherche multidimensionnelle- apprendre agrave geacuterer le temps et lespace de la rechercheVeille sur Internet strateacutegie et outils- les agents intelligents quelle reacutealiteacute - les agents dalerte- les aspirateurs de site- les meacutetamoteurs clients- les logiciels de cartographie de linformationParameacutetrages avanceacutes des logiciels de navigation et de messagerie Gestion avanceacutee des signetsLes problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire - la rediffusion de linformation- geacuterer la confidentialiteacute de ses recherches et de sa veilleAutoformation- les indispensables de lautoformation agrave la recherche- mettre en place une veille sur la veille

INTRODUCTION

LInternet est devenu au fil des anneacutees un outil indispensable mais certainement pas exclusif dans mes recherches documentaires Il doit ecirctre relativiser deacutemythifier dompter pour en retirer le meilleur au plus vite et au plus sucircr Cela neacutecessite non seulement une pratique quotidienne mais aussi une remise en question permanente des outils et des usagesCest pourquoi je vous preacutesenterai en dernier lieu une partie consacreacutee agrave lautoformation agrave mes yeux neacutecessaire agrave lutilisation de tous les outils mis agrave la disposition des internautes avertis que nous verrons dans les quatriegraveme et cinquiegraveme partiesAuparavant il aura eacuteteacute question de traiter dun petit peu de meacutethodes et de theacuteories de lutilisation des outils de recherche speacutecifiquement sur Internet Mais pour cela il faut dabord deacutefinir clairement les typologies doutils de recherche et en guise de preacuteliminaires revoir avec soin ce sur quoi on travaille

Et oui au fait que trouve-t-on sur Internet Ce que lon y cherche Pas si sucircr

5

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 2: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Recherche avanceacutee sur Internet (approfondissement des meacutethodes)

httpwwwadbsfrsiteformationsdetail_formationphpid=62ampversion=4

Preacutesentation (0)

Des rappels (Les corpus disponibles) (1)

Les outils agrave disposition Les moteurs et les reacutepertoires (2)

Des meacutethodes et des strateacutegies (3)

La veille quotidienne (4)

Boicircte agrave outils (5)

Autoformation (6)

Travaux pratiques (7)

Lensemble du support de cours est agrave suivre en ligne sur httpwwwservicedocinfo730

2

Ce support de cours de lintervenant est le fil conducteur de ces trois jours de formation Il sappuiera sur louvrage laquo Net Recherche raquo de Veacuteronique Mesguich et Armelle Thomas

Tout au long de ce support de cours les reacutefeacuterences agrave louvrage en question seront noteacutees (voir NR p xx)

Issue de leurs expeacuteriences cumuleacutees agrave lrsquooccasion notamment des stages de formation ADBS Recherche avanceacutee sur Internet (approfondissement des meacutethodes) (ndeg 730) deux des formatrices attitreacutees Veacuteronique Mesguich et Armelle Thomas proposent aux eacuteditions de lrsquoADBS une version tregraves largement ameacutelioreacutee luxueuse et moderniseacutee du support de formationNet recherche le guide pratique pour mieux trouver lrsquoinformation utile Veacuteronique Mesguich et Armelle Thomas Sciences et techniques de lrsquoinformation (ISSN 1762-8288)

2006 - 148 pages - ISBN 2-84365-083-6 Reacutesumeacute

Qursquoelle reacuteponde agrave des besoins professionnels ou personnels la recherche drsquoinformation repreacutesente une grande part de lrsquoactiviteacute des internautes Le fonctionnement des moteurs de recherche est pourtant encore mal connu et les utilisateurs sont souvent perdus face agrave des reacutesultats trop nombreux et impreacutecis agrave des contenus structureacutes ou non valideacutes ou non gratuits ou payants Lrsquoart de la recherche drsquoinformation consiste pour une grande part agrave deacuteterminer les outils geacuteneacuteralistes ou speacutecialiseacutes les plus adapteacutes aux diffeacuterents types de requecirctes et agrave les utiliser avec maicirctrise Cet ouvrage a pour objectif drsquooffrir agrave toute personne ameneacutee agrave effectuer des recherches sur Internet un panorama des outils et meacutethodes existant agrave ce jour Il est destineacute tant aux professionnels de lrsquoinformation (documentalistes bibliotheacutecaires veilleurs) qursquoaux enseignants chercheurs eacutetudiants confronteacutes agrave la complexiteacute sans cesse grandissante des donneacutees disponibles en ligne Ils y trouveront des conseils meacutethodologiques ainsi que des laquo trucs et astuces raquo destineacutes agrave optimiser le processus de recherche des informations preacutecises sur les eacutevolutions actuelles ainsi que des preacutesentations drsquooutils et des listes drsquoadresses utiles

Introduction (pdf)

Table des matiegraveres (pdf)

3

Internet recherche avanceacutee et outils de veillePreacutesentation (0)

Steacutephane Cottin stephanecottingmailcom page perso weblog httpwwwservicedocinfo

Actuellement chef de service informatique - greffe au Conseil constitutionnelAncien Documentaliste de la socieacuteteacute Lexbase SA Speacutecialiseacutee dans la conception de moteurs et de bases de donneacutees juridiques (intra- et extranets)Ancien chef de service Documentation du Conseil constitutionnel creacuteateur du site Internet du Conseil constit (httpwwwconseil-constitutionnelfr) Collaboration ative dans la conception des bases de donneacutees juridiques publiques et dans la mise en place de plusieurs systegravemes dinformation (Seacutenat eacutelection preacutesidentielle Leacutegifrance Conseil dEtat)

Jai une connexion Internet depuis 1994 Jutilise majoritairement un PC (sous windows XP Pro) et Firefox 20 comme explorateur Internet plutocirct quExplorer Mes outils preacutefeacutereacutes sont Google (httpwwwgooglecom) en moteur lOpen directory (httpdmozorg) en reacutepertoire Wticker comme lecteur de fils RSS Wysigot comme agent dalerte (mais javoue quavec Wticker je ne lutilise plus et jai longtemps eacuteteacute fan de C4U) (httpwwwagentlandfrDownload5Monitoring_agentshtml) Pour info jai abandonneacute Copernic (httpwwwcoperniccom) comme assistant logiciel agrave la recherche depuis 2001Depuis 2003 jutilise de faccedilon professionnelle la technologie des weblogs agrave la fois pour diffuser de linformation (en interne comme en externe) et pour en recevoir mon weblog perso est sur httpwwwservicedocinfo

Je vous remercie de vous preacutesenter en indiquant quelques informations techniques - le type de mateacuteriel utiliseacute et son systegraveme dexploitation PC Mac Station sous Windows Linux Unix- le logiciel de navigation preacutefeacutereacute Netscape Explorer Mozilla autre

et en particulier en guise de mini sondage quel(s) moteur(s) ou outil(s) de recherche utilisez-vous le plus freacutequemment et nous dire en quelques mots ce que vous en pensez (eacuteventuellement indiquez si vous avez reacutecemment abandonneacute un outil pour un autre)

VOTRE SYSTEME ET VOTRE MATERIEL

(PC MAC Station) (Windows XP 2000 Linux Unix)

LOGICIEL DE NAVIGATIONInternet Explorer Firefox Netscape Opera Mozilla Safari

MOTEUR de RECHERCHE

FAVORIGoogle Yahoo Dmoz Exalead

LECTEUR DE FILS RSS

En ligne hors ligne les deux netvibes alertinfo bloglines blogbridge

OUTIL DAIDE A LA

RECHERCHE FAVORICopernic

Agreacutegateur Meacutetamoteur Mouchard

Aspirateur

4

Objectif Approfondir une meacutethodologie de recherche speacutecifique agrave InternetExploiter des fonctionnaliteacutes de recherche avanceacuteeIdentifier les outils de veille disponiblesSommaire Rappels et approfondissements- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussionMeacutethodologie speacutecifique- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche - quels outils pour quoi faire - comment identifier de sources dinformation sectorielle ou speacutecialiseacutee les experts agrave contacter les pages de liens- au delagrave des outils strateacutegies et tactiques de recherche- recherche lineacuteaire recherche multidimensionnelle- apprendre agrave geacuterer le temps et lespace de la rechercheVeille sur Internet strateacutegie et outils- les agents intelligents quelle reacutealiteacute - les agents dalerte- les aspirateurs de site- les meacutetamoteurs clients- les logiciels de cartographie de linformationParameacutetrages avanceacutes des logiciels de navigation et de messagerie Gestion avanceacutee des signetsLes problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire - la rediffusion de linformation- geacuterer la confidentialiteacute de ses recherches et de sa veilleAutoformation- les indispensables de lautoformation agrave la recherche- mettre en place une veille sur la veille

INTRODUCTION

LInternet est devenu au fil des anneacutees un outil indispensable mais certainement pas exclusif dans mes recherches documentaires Il doit ecirctre relativiser deacutemythifier dompter pour en retirer le meilleur au plus vite et au plus sucircr Cela neacutecessite non seulement une pratique quotidienne mais aussi une remise en question permanente des outils et des usagesCest pourquoi je vous preacutesenterai en dernier lieu une partie consacreacutee agrave lautoformation agrave mes yeux neacutecessaire agrave lutilisation de tous les outils mis agrave la disposition des internautes avertis que nous verrons dans les quatriegraveme et cinquiegraveme partiesAuparavant il aura eacuteteacute question de traiter dun petit peu de meacutethodes et de theacuteories de lutilisation des outils de recherche speacutecifiquement sur Internet Mais pour cela il faut dabord deacutefinir clairement les typologies doutils de recherche et en guise de preacuteliminaires revoir avec soin ce sur quoi on travaille

Et oui au fait que trouve-t-on sur Internet Ce que lon y cherche Pas si sucircr

5

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 3: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Ce support de cours de lintervenant est le fil conducteur de ces trois jours de formation Il sappuiera sur louvrage laquo Net Recherche raquo de Veacuteronique Mesguich et Armelle Thomas

Tout au long de ce support de cours les reacutefeacuterences agrave louvrage en question seront noteacutees (voir NR p xx)

Issue de leurs expeacuteriences cumuleacutees agrave lrsquooccasion notamment des stages de formation ADBS Recherche avanceacutee sur Internet (approfondissement des meacutethodes) (ndeg 730) deux des formatrices attitreacutees Veacuteronique Mesguich et Armelle Thomas proposent aux eacuteditions de lrsquoADBS une version tregraves largement ameacutelioreacutee luxueuse et moderniseacutee du support de formationNet recherche le guide pratique pour mieux trouver lrsquoinformation utile Veacuteronique Mesguich et Armelle Thomas Sciences et techniques de lrsquoinformation (ISSN 1762-8288)

2006 - 148 pages - ISBN 2-84365-083-6 Reacutesumeacute

Qursquoelle reacuteponde agrave des besoins professionnels ou personnels la recherche drsquoinformation repreacutesente une grande part de lrsquoactiviteacute des internautes Le fonctionnement des moteurs de recherche est pourtant encore mal connu et les utilisateurs sont souvent perdus face agrave des reacutesultats trop nombreux et impreacutecis agrave des contenus structureacutes ou non valideacutes ou non gratuits ou payants Lrsquoart de la recherche drsquoinformation consiste pour une grande part agrave deacuteterminer les outils geacuteneacuteralistes ou speacutecialiseacutes les plus adapteacutes aux diffeacuterents types de requecirctes et agrave les utiliser avec maicirctrise Cet ouvrage a pour objectif drsquooffrir agrave toute personne ameneacutee agrave effectuer des recherches sur Internet un panorama des outils et meacutethodes existant agrave ce jour Il est destineacute tant aux professionnels de lrsquoinformation (documentalistes bibliotheacutecaires veilleurs) qursquoaux enseignants chercheurs eacutetudiants confronteacutes agrave la complexiteacute sans cesse grandissante des donneacutees disponibles en ligne Ils y trouveront des conseils meacutethodologiques ainsi que des laquo trucs et astuces raquo destineacutes agrave optimiser le processus de recherche des informations preacutecises sur les eacutevolutions actuelles ainsi que des preacutesentations drsquooutils et des listes drsquoadresses utiles

Introduction (pdf)

Table des matiegraveres (pdf)

3

Internet recherche avanceacutee et outils de veillePreacutesentation (0)

Steacutephane Cottin stephanecottingmailcom page perso weblog httpwwwservicedocinfo

Actuellement chef de service informatique - greffe au Conseil constitutionnelAncien Documentaliste de la socieacuteteacute Lexbase SA Speacutecialiseacutee dans la conception de moteurs et de bases de donneacutees juridiques (intra- et extranets)Ancien chef de service Documentation du Conseil constitutionnel creacuteateur du site Internet du Conseil constit (httpwwwconseil-constitutionnelfr) Collaboration ative dans la conception des bases de donneacutees juridiques publiques et dans la mise en place de plusieurs systegravemes dinformation (Seacutenat eacutelection preacutesidentielle Leacutegifrance Conseil dEtat)

Jai une connexion Internet depuis 1994 Jutilise majoritairement un PC (sous windows XP Pro) et Firefox 20 comme explorateur Internet plutocirct quExplorer Mes outils preacutefeacutereacutes sont Google (httpwwwgooglecom) en moteur lOpen directory (httpdmozorg) en reacutepertoire Wticker comme lecteur de fils RSS Wysigot comme agent dalerte (mais javoue quavec Wticker je ne lutilise plus et jai longtemps eacuteteacute fan de C4U) (httpwwwagentlandfrDownload5Monitoring_agentshtml) Pour info jai abandonneacute Copernic (httpwwwcoperniccom) comme assistant logiciel agrave la recherche depuis 2001Depuis 2003 jutilise de faccedilon professionnelle la technologie des weblogs agrave la fois pour diffuser de linformation (en interne comme en externe) et pour en recevoir mon weblog perso est sur httpwwwservicedocinfo

Je vous remercie de vous preacutesenter en indiquant quelques informations techniques - le type de mateacuteriel utiliseacute et son systegraveme dexploitation PC Mac Station sous Windows Linux Unix- le logiciel de navigation preacutefeacutereacute Netscape Explorer Mozilla autre

et en particulier en guise de mini sondage quel(s) moteur(s) ou outil(s) de recherche utilisez-vous le plus freacutequemment et nous dire en quelques mots ce que vous en pensez (eacuteventuellement indiquez si vous avez reacutecemment abandonneacute un outil pour un autre)

VOTRE SYSTEME ET VOTRE MATERIEL

(PC MAC Station) (Windows XP 2000 Linux Unix)

LOGICIEL DE NAVIGATIONInternet Explorer Firefox Netscape Opera Mozilla Safari

MOTEUR de RECHERCHE

FAVORIGoogle Yahoo Dmoz Exalead

LECTEUR DE FILS RSS

En ligne hors ligne les deux netvibes alertinfo bloglines blogbridge

OUTIL DAIDE A LA

RECHERCHE FAVORICopernic

Agreacutegateur Meacutetamoteur Mouchard

Aspirateur

4

Objectif Approfondir une meacutethodologie de recherche speacutecifique agrave InternetExploiter des fonctionnaliteacutes de recherche avanceacuteeIdentifier les outils de veille disponiblesSommaire Rappels et approfondissements- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussionMeacutethodologie speacutecifique- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche - quels outils pour quoi faire - comment identifier de sources dinformation sectorielle ou speacutecialiseacutee les experts agrave contacter les pages de liens- au delagrave des outils strateacutegies et tactiques de recherche- recherche lineacuteaire recherche multidimensionnelle- apprendre agrave geacuterer le temps et lespace de la rechercheVeille sur Internet strateacutegie et outils- les agents intelligents quelle reacutealiteacute - les agents dalerte- les aspirateurs de site- les meacutetamoteurs clients- les logiciels de cartographie de linformationParameacutetrages avanceacutes des logiciels de navigation et de messagerie Gestion avanceacutee des signetsLes problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire - la rediffusion de linformation- geacuterer la confidentialiteacute de ses recherches et de sa veilleAutoformation- les indispensables de lautoformation agrave la recherche- mettre en place une veille sur la veille

INTRODUCTION

LInternet est devenu au fil des anneacutees un outil indispensable mais certainement pas exclusif dans mes recherches documentaires Il doit ecirctre relativiser deacutemythifier dompter pour en retirer le meilleur au plus vite et au plus sucircr Cela neacutecessite non seulement une pratique quotidienne mais aussi une remise en question permanente des outils et des usagesCest pourquoi je vous preacutesenterai en dernier lieu une partie consacreacutee agrave lautoformation agrave mes yeux neacutecessaire agrave lutilisation de tous les outils mis agrave la disposition des internautes avertis que nous verrons dans les quatriegraveme et cinquiegraveme partiesAuparavant il aura eacuteteacute question de traiter dun petit peu de meacutethodes et de theacuteories de lutilisation des outils de recherche speacutecifiquement sur Internet Mais pour cela il faut dabord deacutefinir clairement les typologies doutils de recherche et en guise de preacuteliminaires revoir avec soin ce sur quoi on travaille

Et oui au fait que trouve-t-on sur Internet Ce que lon y cherche Pas si sucircr

5

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 4: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Internet recherche avanceacutee et outils de veillePreacutesentation (0)

Steacutephane Cottin stephanecottingmailcom page perso weblog httpwwwservicedocinfo

Actuellement chef de service informatique - greffe au Conseil constitutionnelAncien Documentaliste de la socieacuteteacute Lexbase SA Speacutecialiseacutee dans la conception de moteurs et de bases de donneacutees juridiques (intra- et extranets)Ancien chef de service Documentation du Conseil constitutionnel creacuteateur du site Internet du Conseil constit (httpwwwconseil-constitutionnelfr) Collaboration ative dans la conception des bases de donneacutees juridiques publiques et dans la mise en place de plusieurs systegravemes dinformation (Seacutenat eacutelection preacutesidentielle Leacutegifrance Conseil dEtat)

Jai une connexion Internet depuis 1994 Jutilise majoritairement un PC (sous windows XP Pro) et Firefox 20 comme explorateur Internet plutocirct quExplorer Mes outils preacutefeacutereacutes sont Google (httpwwwgooglecom) en moteur lOpen directory (httpdmozorg) en reacutepertoire Wticker comme lecteur de fils RSS Wysigot comme agent dalerte (mais javoue quavec Wticker je ne lutilise plus et jai longtemps eacuteteacute fan de C4U) (httpwwwagentlandfrDownload5Monitoring_agentshtml) Pour info jai abandonneacute Copernic (httpwwwcoperniccom) comme assistant logiciel agrave la recherche depuis 2001Depuis 2003 jutilise de faccedilon professionnelle la technologie des weblogs agrave la fois pour diffuser de linformation (en interne comme en externe) et pour en recevoir mon weblog perso est sur httpwwwservicedocinfo

Je vous remercie de vous preacutesenter en indiquant quelques informations techniques - le type de mateacuteriel utiliseacute et son systegraveme dexploitation PC Mac Station sous Windows Linux Unix- le logiciel de navigation preacutefeacutereacute Netscape Explorer Mozilla autre

et en particulier en guise de mini sondage quel(s) moteur(s) ou outil(s) de recherche utilisez-vous le plus freacutequemment et nous dire en quelques mots ce que vous en pensez (eacuteventuellement indiquez si vous avez reacutecemment abandonneacute un outil pour un autre)

VOTRE SYSTEME ET VOTRE MATERIEL

(PC MAC Station) (Windows XP 2000 Linux Unix)

LOGICIEL DE NAVIGATIONInternet Explorer Firefox Netscape Opera Mozilla Safari

MOTEUR de RECHERCHE

FAVORIGoogle Yahoo Dmoz Exalead

LECTEUR DE FILS RSS

En ligne hors ligne les deux netvibes alertinfo bloglines blogbridge

OUTIL DAIDE A LA

RECHERCHE FAVORICopernic

Agreacutegateur Meacutetamoteur Mouchard

Aspirateur

4

Objectif Approfondir une meacutethodologie de recherche speacutecifique agrave InternetExploiter des fonctionnaliteacutes de recherche avanceacuteeIdentifier les outils de veille disponiblesSommaire Rappels et approfondissements- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussionMeacutethodologie speacutecifique- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche - quels outils pour quoi faire - comment identifier de sources dinformation sectorielle ou speacutecialiseacutee les experts agrave contacter les pages de liens- au delagrave des outils strateacutegies et tactiques de recherche- recherche lineacuteaire recherche multidimensionnelle- apprendre agrave geacuterer le temps et lespace de la rechercheVeille sur Internet strateacutegie et outils- les agents intelligents quelle reacutealiteacute - les agents dalerte- les aspirateurs de site- les meacutetamoteurs clients- les logiciels de cartographie de linformationParameacutetrages avanceacutes des logiciels de navigation et de messagerie Gestion avanceacutee des signetsLes problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire - la rediffusion de linformation- geacuterer la confidentialiteacute de ses recherches et de sa veilleAutoformation- les indispensables de lautoformation agrave la recherche- mettre en place une veille sur la veille

INTRODUCTION

LInternet est devenu au fil des anneacutees un outil indispensable mais certainement pas exclusif dans mes recherches documentaires Il doit ecirctre relativiser deacutemythifier dompter pour en retirer le meilleur au plus vite et au plus sucircr Cela neacutecessite non seulement une pratique quotidienne mais aussi une remise en question permanente des outils et des usagesCest pourquoi je vous preacutesenterai en dernier lieu une partie consacreacutee agrave lautoformation agrave mes yeux neacutecessaire agrave lutilisation de tous les outils mis agrave la disposition des internautes avertis que nous verrons dans les quatriegraveme et cinquiegraveme partiesAuparavant il aura eacuteteacute question de traiter dun petit peu de meacutethodes et de theacuteories de lutilisation des outils de recherche speacutecifiquement sur Internet Mais pour cela il faut dabord deacutefinir clairement les typologies doutils de recherche et en guise de preacuteliminaires revoir avec soin ce sur quoi on travaille

Et oui au fait que trouve-t-on sur Internet Ce que lon y cherche Pas si sucircr

5

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 5: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Objectif Approfondir une meacutethodologie de recherche speacutecifique agrave InternetExploiter des fonctionnaliteacutes de recherche avanceacuteeIdentifier les outils de veille disponiblesSommaire Rappels et approfondissements- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussionMeacutethodologie speacutecifique- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche - quels outils pour quoi faire - comment identifier de sources dinformation sectorielle ou speacutecialiseacutee les experts agrave contacter les pages de liens- au delagrave des outils strateacutegies et tactiques de recherche- recherche lineacuteaire recherche multidimensionnelle- apprendre agrave geacuterer le temps et lespace de la rechercheVeille sur Internet strateacutegie et outils- les agents intelligents quelle reacutealiteacute - les agents dalerte- les aspirateurs de site- les meacutetamoteurs clients- les logiciels de cartographie de linformationParameacutetrages avanceacutes des logiciels de navigation et de messagerie Gestion avanceacutee des signetsLes problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire - la rediffusion de linformation- geacuterer la confidentialiteacute de ses recherches et de sa veilleAutoformation- les indispensables de lautoformation agrave la recherche- mettre en place une veille sur la veille

INTRODUCTION

LInternet est devenu au fil des anneacutees un outil indispensable mais certainement pas exclusif dans mes recherches documentaires Il doit ecirctre relativiser deacutemythifier dompter pour en retirer le meilleur au plus vite et au plus sucircr Cela neacutecessite non seulement une pratique quotidienne mais aussi une remise en question permanente des outils et des usagesCest pourquoi je vous preacutesenterai en dernier lieu une partie consacreacutee agrave lautoformation agrave mes yeux neacutecessaire agrave lutilisation de tous les outils mis agrave la disposition des internautes avertis que nous verrons dans les quatriegraveme et cinquiegraveme partiesAuparavant il aura eacuteteacute question de traiter dun petit peu de meacutethodes et de theacuteories de lutilisation des outils de recherche speacutecifiquement sur Internet Mais pour cela il faut dabord deacutefinir clairement les typologies doutils de recherche et en guise de preacuteliminaires revoir avec soin ce sur quoi on travaille

Et oui au fait que trouve-t-on sur Internet Ce que lon y cherche Pas si sucircr

5

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 6: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Internet recherche avanceacutee et outils de veilleRappels (1)

(voir NR p 9)Il est eacutevident quavant de savoir bien chercher il faut savoir ce que lon peut trouver sur InternetIl est donc important de connaicirctre 1) Lhistoire et la philosophie du reacuteseau des reacuteseauxet 2) Les corpus agrave disposition et leur mode de constitutionpour finir 3) ce qui est important agrave retenir pour eacuteviter bien des deacuteconvenues- lhistoire la philosophie et la topologie dInternetIl nest pas question ici de refaire un cours sur le sujet Aller voir par exemple httpagoraqccarech_inthtml (J Duquesne) )On pourra retenir les aspects techniques sur les bases du TCPIP (faire un traceroute sur son poste (Executercommand puis tracert [nom de domaine ou numeacutero IP) ou agrave httpwwwvisualwarecomindexmhtml )application pratique et visuelle httpwwwvisualwarecom (chemin dune commande de Canberra agrave ladbs via infowebmaster )

Votre message passe dun endroit agrave un autre et est conserveacute pour des raisons techniques agrave chaque passage dougrave limportance de la cryptographie A propos qui est preacutesent sur Internet Lire les dossiers remis agrave jour en permanence sur le Journal du Net httpwwwjournaldunetcomchiffres-clesshtml (voir plus loin sur la taille du web)Points de repegraveres sur Internet - les corpus agrave dispositionRappels indispensables pour savoir quels sont les documents disponibles sur le reacuteseau des reacuteseaux en connaicirctre a priori leur statut et leur histoire Par ordre dapparition on a 1deg) Le MailLInternet est neacute pour cela et du mail sont neacutees les listes de diffusion (voir plus loin ou voir httplistescrufrsympa ou httpwwwarobaseorglistesindexhtm ) = certainement les bases de connaissance les plus importantes en quantiteacute et en qualiteacute en flux (reacuteactiviteacute) et en stock (ancienneteacute de certaines dentre elles) Mais elles sont sous-utiliseacutees et meacuteconnues

6

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 7: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

(voir NR p 98)2deg) LUsenet (Newsgroups les groupes de discussion)LInternet a eacuteteacute connu pour cela (les autoroutes de linformation) savoir que cela existe et ce que cela vaut Sen meacutefier en geacuteneacuteral et tester les quelques moteurs de recherche speacutecialiseacutes pour sen servir (ou les eacuteviter selon son goucirct) au mieux httpwwwdejacomusenet (ancienne adresse qui pointe deacutesormais vers le nouveau proprieacutetaire depuis 2002 de DejaNews Google = httpgroupsgooglecom = on y testera notamment la commande authorUsages preacuteconiseacutes = recherches techniques tregraves pointues (essentiellement informatiques) controcircle de rumeurs

(voir NR p 99)3deg) Le WebLe coup de geacutenie de Tim Berneers-LeeDifficile eacutevidemment den faire le tour mais il faut en connaicirctre 1) les techniques (les codes HTML et notamment les balises META cest ce que les moteurs lisent httpwwwabondancecomdocsmeta_1html )2) son eacutevolution et ses piegraveges Taille du web httpwwwstrategic-roadcomrecherchmesurefrhtm 2000 les chiffres sont contradictoires mais la plupart tournent autour de 12 Milliard de pages statiques au deacutebut 2000 avec 100 millions de pages nouvelles par mois et surtout une estimation dagrave peu pregraves autant de pages dynamiques (le web invisible ) voir httpwwwjournaldunetcomcc03_internetmondeintermonde_sitesshtml ou httpwwwnicfrstatistiques 2003 on a arrecircteacute de chiffrer Les moteurs de recherche se battent agrave coup de milliards de pages reacutefeacuterenceacutees Voir sur Abondance des eacuteleacutements de reacuteponse ici httpdocsabondancecomquestion10html et sur le nombre de noms de domaines httpwwwjournaldunetcomcc03_internetmondeintermonde_domainesshtml Pages statiques pages dynamiques voir par exemple httpwwwlegifrancegouvfr ou httpadminetjo

(voir NR p 25)

Interlude Comment se construit une adresse de page web et quels enseignements peut-on en tirer

exemple la page personnelle dune bibliotheacutecaire dune universiteacute de Chicago ceacutelegravebre Lyonette Louis-Jacques

httplibuchicagoedu~llouindexhtmlhttp lib uchicago edu ~ llou

index html

protocole sous-serveur

serveur TLD 1er slash

tilde sous reacute pertoire

Nom du fichier

extension

7

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 8: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

ndash agrave retenir ces quelques eacuteleacutements techniques

La construction des URL (uniform resource location = ladresse des pages web)Connaicirctre les protocoles http (hypertext transfer protocol) https (http seacutecuriseacute) ftp (file transfer protocol) nntp (news network) smtp (sendmail) etcPour les noms de domaines connaicirctre les TLD Top Level Domains avec les ccTLD (country code TLD) agrave deux lettres et les gTLD (generic TLD) agrave trois ou plusLes gTLD historiques com net org int edu gov mil

Sur la notion de cache et de proxy

Les risques agrave connaicirctre Le SPAM publiciteacute non voulue httpwwwcypangonet~spamwhatisspamhtml Les HOAXES les faux-bruits et les rumeurs httpwwwhoaxbustercom Les vrais VIRUS mais aussi le scam (la recherche systeacutematique de contacts en posant des fausses questions sur les listes de messagerie avec sa variante la plus ceacutelegravebre lescroquerie connue sous le nom de nigerian scam) le spamdexing (tromper les moteurs de recherches en mettant de fausses balises meta) les pages satellites (leurres pour les moteurs de recherche) le spoofing (leurrer le destinataire du message en modifiant lentecircte de lexpeacutediteur)

Quelques techniques agrave connaicirctre = savoir installer un logiciel (notion dadministrateur)exercice = installer Wysigot sur le poste et mettre des mouchards sur des pages pour le lendemain (voir plus loin)

(voir NR p 82)

8

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 9: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Les outils agrave disposition Les moteurs et les reacutepertoires (2)- les robots de recherche les catalogues comparaison et approfondissement- meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence- les reacuteseaux humains newsgroups listes de discussion- le pheacutenomegravene weblog et les fils RSS- les robots de recherche les catalogues comparaison et approfondissement

Deacutefinitions et mise en garde MOTEUR ltgt REacutePERTOIRE Les moteurs Indexation meacutecanique de pages web

Eacutevidemment sur Abondance httpoutilsabondancecom(voir NR p 23)

Historique des moteurs httpcbsmarketwatchcomnewsimagesmiscsearch_engines_timelinepdf(voir aussi le papier dAlexandre Serres sur SavoirsCdi du CNDP httpsavoirscdicndpfrCultureProactualisationSerresSerreshtm )

ACTUALITES trois moteurs se sont deacutegageacutes Evidemment GOOGLE toujours premier mais qui voit son heacutegeacutemonie battue en bregraveche par Yahoo Search (agrave ne pas confondre avec le reacutepertoire Yahoo) deacutejagrave en ligne sur httpsearchyahoofr et par MSN Search (Microsoft) pas encore tout agrave fait opeacuterationnel Comparatif peacuteneacutetration = httpwwwjournaldunetcomcc03_internetmondeintermonde_moteursshtml A ces trois moteurs (Google Yahoo MSN on a tendance agrave aouter un challenger franccedilais Exalead)

(voir NR p 31)Pensez agrave utiliser plusieurs moteurs et agrave les comparer freacutequemment sur des requecirctes tests Voir par exemple ce message de Christophe Asselin sur la liste MOTRECH daoucirct 2004Date Tue 24 Aug 2004 094918 +0200De Christophe ASSELIN - DIGIMIND ltchristopheasselindigimindfrgtObjet Jux2 interroge Google et Yahoo et compare les reacutesultatsJux2 est un meacutetamoteur qui permet de rechercher sur Google ET YahooSearch et de comparer les reacutesultats Dans les bulles oranges en haut agrave droite vous pouvez voir les reacutesultats communs entre les 2 moteurs Ougrave lon se rend compte quen cherchant sur un seul moteur mecircme un Google on rate beaucoup de chosehttpwwwjux2comindexphp

httpdeliciouscottinstefcomparateur_de_moteur NB = une application de loutil de bookmark collaboratif DELICIOUS

(voir NR p 87 et p 66 la laquo guerre des moteurs raquo)Nouveau Les moteurs agrave suivre httptinyurlcom2cmcbGoogle en Chiffres httptinyurlcom64vng

(voir NR p 36 les tendances agrave suivre)

9

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 10: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Un tregraves grand nombre de moteurshttpwwwbeaucoupcomBeaucoup Liste mondiales des moteurs et annuaires de recherche - (tregraves ameacutericano-centriste)httpwwwsearchenginecolossuscom Annuaire international de moteurs de recherchehttpwwwenfincomEnfin Liste des moteurs et annuaires francophones ndash ex IDFNET et son weblog httpjouebcominflux agrave suivre sur httpcasselinfreefrfrenchfaitsmarquantshtm SearchEngineWatch httpwwwsearchenginewatchcom Searchtools - httpwwwsearchtoolscom httpwwwnotesscom httpsearchengineshowdowncom Tests actualiteacutes des moteurs de recherche - httpwwwnotesscom ou httpsearchengineshowdowncom httpwwwabondancecomAbondance Actualiteacutes et fiches techniques sur les moteurs de recherche - Olivier Andrieu - httpwwwabondancecom

Mais en fait seuls trois sortent du lot = Google (75 du marcheacute) MSN et Yahoo (10-12 chaque) et les autres le reste mecircme sil ne faut pas oublier des moteurs speacutecialiseacutes comme le francophone Voilafr ou le geacuteneacuteraliste qui monte Exalead

Moteurs ReacutepertoiresArcheacutetype Google Yahoo

(mais aussi) Yahoo Search Technology (YST) MSN anciennement

Altavista Overture Alltheweb Hotbot (tous racheteacute par

Yahoo)

Open Directory (DMOZ)

Uniteacute doc Page web Site webAnalyse Robot Humain

Rafraicircchissement de lindex

Quotidien agrave au pire un mois (pour Google)

Quasiment jamais effectueacute

Indexation Automatique limiteacutee agrave la page daccueil (ex-profondeur

dindexation de google = 4 liens et 100 ko par page)

Humaine = analyse par des documentalistes de lensemble

du site

10

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 11: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Les reacutepertoiresAnalyse humaine de sites Web

Larcheacutetype httpwwwyahoofr Savoir sen servir httpfrdocsyahoocomaide Le concurrent injustement meacuteconnu httpdmozorg

(voir NR p 52)

Meacutetamoteurs bases de donneacutees en ligne portails et sites de reacutefeacuterence(voir NR p 45)

Rappel le web invisible (voir sur le site de lUrfist de Lyon agrave la page daccueil httpurfistuniv-lyon1fr )Archeacutetype httpwwwstrategic-roadcom (mayaconcept)

Bases de donneacutees gratuites sur Internet httpurfistuniv-lyon1fr (normalement arrecircteacute mais poursuivi sur la base DADI httpdadienssibfr )Les portails

(voir NR p 51)nouvelle notion de vortails portails verticaux

(voir NR p 79)exemple de site de reacutefeacuterence httpwwwdroitorg

exercice trouver dautres sites de reacutefeacuterence dans dautres domaines- les reacuteseaux humains newsgroups listes de discussion bookmarks et logiciels sociaux (CMS et delicious)From Marie-Luce PARANQUE-THOMAS ltparanqueocirpfrgtTo Liste de diffusion ADBS ltadbs-infocrufrgtSubject Synthegravese des reacuteponses sur la creacuteation dune liste de diffusionDate Mon 4 Oct 1999 122431 +0200

exercice Trouver ce message de la liste de discussion ADBS-Info BonjourTout dabord merci agrave tous pour vos reacuteponses rapides et inteacuteressantesInscrite depuis peu sur la liste je suis deacutejagrave impressionneacutee par lefficaciteacute de ce systegraveme et tout cela gracircce agrave la participation de chacun Je vous fais part des adresses qui mont eacuteteacute communiqueacutees httpwwwarobaseorglistesautomatshtm pour sinformer sur la marche agrave suivre pour creacuteer une liste de diffusion etou pour faire heacuteberger une liste (ce qui en simplifie la gestion) Voir aussi le leader httpfrgroupsyahoocom

Les solutions existantes sont donc la sous-traitance lheacutebergement gratuit (cf adresses ci-dessus) ou lacquisition dun logiciel speacutecifique Tout deacutepend des moyens dont on dispose et du temps que lon veut consacrer ensuite agrave ladministration de la liste Dapregraves une synthegravese adresseacutee agrave la liste adbs le 27799 il faut reacutefleacutechir agrave certaines questions public concerneacute et ses besoins moyens et ressources dont on dispose (connaissances techniques entre autres) solutions existantes (sous-traitance gestion interne serveur associatif (globenet) services gratuits (type yahoo simple et efficace mais avec pubs)) liste modeacutereacutee gestion darchives suivi et animation de la liste Le temps passeacute agrave ladministration variera en fonction de tous ces eacuteleacutements Pour deacutebuter on peut utiliser le logiciel de messagerie en seacutelectionnant autant de destinataires quon le souhaite Pour apprendre agrave utiliser sa messagerie httpwwwmemocliccom

Marie-Luce Paranque OCIRP-Paris 8 (Union dinstitutions de preacutevoyance reacutegie par le code de la Seacutecuriteacute Sociale) httpwwwocirpfr paranqueocirpfr

Des listes de listes francophones = httpwwwfrancopholistescom Mondiales httpwwwtilenet [google it via dmoz ]

(voir NR p 98)

11

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 12: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Le pheacutenomegravene Weblogs et les fils RSS(voir NR pp 15 19 57 62 104 105)

Les weblogs ou blogues sont neacutes de la rencontre du pheacutenomegravene de simplification des techniques de publication sur Internet et de celui de la volonteacute toujours preacutesente de partager ses informations avec le plus grand nombre Ce dernier pheacutenomegravene principe de base de lInternet des premiers temps connaicirct un jour nouveau avec ces nouveaux moyens de publication rapide simple souple (voir httpwwwservicedocinfoarticlephp3id_article=28) Intimement lieacutee aux weblogs mais sans en ecirctre une caracteacuteristique la syndication est une technique permettant dafficher des donneacutees provenant (et offertes) dautres sites dans son propre site Cest larcheacutetype de la gestion de contenu cest de linformation venant dailleurs mise agrave disposition (eacuteventuellement filtreacutee reconfigureacutee) du plus grand nombre La technique utiliseacutee est issue du XML mais tregraves simplifieacutee elle est dailleurs nommeacutee RSS pour Really Simple Syndication en fait une version deacutepouilleacutee de la norme RDF On peut en profiter directement si on utilise un CMS (Content management system comme SPIP par exemple) qui en tient compte mais il est aussi possible dinseacuterer un simple code java script (voir httpwwwservicedocinfoarticlephp3id_article=57)

Les fils RSS servent alors soit agrave afficher dans un intranet ou dans un autre site internet les infos publieacutees sur le weblog un peu comme une fenecirctre dactualiteacute soit agrave ecirctre collecteacutes via des RSS-aggregators des lecteurs de fils De la mecircme faccedilon que lon ouvre un utilitaire de messagerie ou un lecteur de news on peut sabonner agrave tel ou tel fil et lire en direct les infos provenant de ressources diverses (voir httpwwwservicedocinfoarticlephp3id_article=100) Tregraves anecdotique notamment en Europe jusquen 2002 cette meacutethode pourtant ancienne (les premiers weblogs et fils RSS datent de 1997) a reacutecemment exploseacute tant et si bien quelle a sinon reacutevolutionneacute le circuit de linformation dans certains secteurs (par exemple celui de linformation et de lauto-formation agrave la recherche documentaire) au moins influer tregraves sensiblement sur la politique dindexation des gros moteurs de recherche

Pour en savoir plus sur les fils rss voir le support de cours preacutesent sur le site httpwwwservicedocinforss

Installer un lecteur de fil Wticker eacutetant en laquo panne raquo depuis mi-2006on pourra installer soit un agreacutegateur en ligne (comme bloglines le plus ceacutelegravebre) soit un utilitaire plus laquo web 20 raquo comme netvibes

Et comme agreacutegateur hors ligne le plus simple est dinstaller lapplication du Geste (le groupement des eacutediteurs) qui tourne sous feedreader

httpwwwservicedocinfoPresentation-rapide-de-la-notionhtml

A lrsquooccasion drsquoune journeacutee theacutematique organiseacutee sur le thegraveme des fils RSS le 10 octobre 2006 par le dynamique secteur Ameacutenagement-Transport-Construction de lrsquoADBS jrsquoai proposeacute une courte preacutesentation (une heure) de la technologie RSS

Pour encore plus de deacutetails voir httpwwwservicedocinforss (support des formations 725 et 729 dateacutees de deacutebut 2006)

12

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 13: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Ne pas rater la reacutevolution Folksonomy social bookmarking

(voir NR p 57 et suiv)(Tag Technorati et Delicious)

httpwwwfredcavazzanetindexphp20051025925-quelle-est-la-difference-entre-un-lien-et-un-tag

httpwwwinternetactunetp=6166 Les services baseacutes sur des tags (balises ou plus preacuteciseacutement ici descripteurs) censeacutes correspondre agrave une indexation theacutematique du contenu ont fleuri sur le web Fausse bonne ideacutee ou eacutevolution majeure httpwwwhomo-numericusnetblogLes-mysteres-de-la-folksonomyhtml

httpwwwservicedocinfoQue-mutualiser-sur-le-Web-LhtmlQue mutualiser sur le web Lutilisation des logiciels sociaux (Journeacutee ADBS 11 mai 2006 FIAP Paris )

Visualisation de la preacutesentation powerpoint sur lutilisation des logiciels sociaux dans un contexte professionnel de recherche documentaire

Exercice creacuteation et gestion despace delicioushttpdelicious

httpwwwbrookoolycomblog10-astuces-delicious httpdelicioushelp

13

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 14: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Des meacutethodes et des strateacutegies (3)(voir NR p 19)

Les dix regravegles dor de la recherche dinformation sur Internet 1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de recherche2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires3 Choisir les bons mots-cleacutes 4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees5 Toujours analyser linformation recouper linformation faire preuve desprit critique eacutevaluer rapidement6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacutees7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat desprit

14

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 15: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

1 Affiner sa question (type de recherche sujet preacutecis et objectif eacutetude des concepts recherches preacuteliminaires eacuteventuelles) choisir ses strateacutegies de rechercheChoisir des outils

(voir NR p 65)

Questions agrave se poser Reacuteponses

Quel catalogue Quel moteur Vous devez connaicirctre les outils qui sont susceptibles de vous ecirctre utiles (veille sur la recherche dinfo)

Quel moteur de newsgroups Quelle liste de liste

en guise de questions savez-vous ce qui circulent sur les newsgroups ou sur les listes Avez-vous le temps de leacutevaluer de le recouper Avez-vous le temps (et le pouvoir hieacuterarchique) dinitier des discussions utiles pour vous Quelles sont vos marges de manoeuvres en matiegravere de divulgation dinformation

Quel moteur utiliser Celui que vous maicirctrisez le mieux Fondamentalement les gros moteurs indexent tous la mecircme chose

Sur le site web de la BnF un nouvel outil en ligne le Guide de recherche en bibliothegraveque(httpgrebibbnffr) esquisse les grandes lignes dune recherche dinformation agrave la Bibliothegraveque nationale de France et plus particuliegraverement dans les collections imprimeacutees et audiovisuelles Destineacute avant tout aux lecteurs deacutebutants il peut eacutegalement ecirctre utile agrave des habitueacutes par sa rubrique Miscellaneacutees BnF qui deacutetaille des types ou des fonds de documents plus complexes agrave trouver que de simples ouvrages Deux types de navigation sont proposeacutes - une navigation pas agrave pas qui permet de progresser logiquement deacutetape en eacutetape de la formulation du sujet agrave la reacutedaction du texte et de la bibliographie en passant par les phases de recherche dans les bibliographies les catalogues et la localisation des documents- une navigation libre qui permet daller directement agrave la rubrique souhaiteacutee Bien que certains paragraphes illustrent la complexiteacute des recherches dans une bibliothegraveque nationale la deacutemarche preacutesenteacutee dans le GREBIB peut sappliquer agrave toute autre bibliothegraveque et ecirctre utile particuliegraverement aux usagers des bibliothegraveques universitaires La meacutethodologie repose en partie sur une meacutethode de reacutesolution de problegraveme dinformation deacuteveloppeacutee aux Etats Unis par Mike Eisenberg et Bob Berkowitz sous le nom de Big 6

Les pages sont geacuteneacutereacutees agrave partir dun reacutefeacuterentiel XML et dun moteur XSL-T Ce guide est la version entiegraverement mise agrave jour et ergonomiquement adapteacutee au web du guide imprimeacute diffuseacute dans les salles de lecture depuis 2002 et correspondant lui-mecircme agrave une premiegravere version accessible en ligne sur le site de la BnF de 1999 agrave 2003

Ce nouvel outil peut ecirctre utiliseacute agrave des fins peacutedagogiques de formation des lecteurs sans but lucratif et avec mention copy Bibliothegraveque nationale de FranceRaymond Josueacute Seckel Catherine BonhommeBibliothegraveque nationale de FranceDirection des collectionsDeacutepartement de recherche bibliographiqueVoir aussi httpwwwphilbcomwhichenginehtm httpwwwinternettutorialsnetchoosehtml httpwwwnoodletoolscomdebbieliteraciesinformation5locateadviceenginehtml httpwwwinfopeopleorgsearchcharthtml httpsearchenginewatchcomfactsarticlephp2156031 ajout fin 2005 le site REPERE de lENSSIB = httprepereenssibfr

15

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 16: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

2 Maicirctriser les outils de navigation et de recherche gestion des signets reacutecupeacuteration des donneacutees reacutepertoires moteurs et meacuteta-moteurs Pour les moteurs utiliser au moins deux moteurs ayant des approches diffeacuterentes et compleacutementaires

(voir NR p 69 et suiv)- quels outils pour quoi faire Les moteurs pour les recherches lourdes sans but preacutecis juste pour veacuterifier la preacutesence (ou labsence) dune notion dun fait sur le reacuteseau Savoir alors repeacuterer des notions-clefs si possible discriminantes pour eacuteviter le bruit (par exemple numeacuteros de loi dates noms de personnes rares)Pour les recherches fines les annuaires pour trouver ladresse dun site web sur lequel par expeacuterience on est sucircr de pouvoir trouver ce que lon chercheTrucs divers (voir boicircte agrave outils)

bull Geacuterer les signets (utilitaires) bull Parameacutetrages des navigateurs bull Enregistrer des pages bull Edition-Rechercher (CTRL + F) bull Meacutemoire cache bull Adresse mel de complaisance

3 Choisir les bons mots-cleacutes (voir NR p 73)

Meacutethode analysez leacutechec dune eacutetape Leacutechec dune eacutetape de recherche est le plus souvent ducirc

bull agrave des termes ne correspondant agrave pas agrave ceux qui sont reacuteellement utiliseacutes (connaicirctre les bons outils linguistiques wwwgranddictionnairecom (franccedilais technique anglais latin ) httpatilfatilffrtlfhtm (le fameux Treacutesor de la langue franccedilaise) et les ressources de traduction de lunion europeacuteenne httpeuropaeuintcommdgstranslationindex_frhtm

bull agrave des outils ne permettant pas de trouver linformation (Ex altavista ne cherche pas dans les bases de donneacutees)

bull agrave une direction erroneacutee (ne cherchez pas dinfo sur lethnologie des mineurs du Kouzbass dans DisneyChannel)

bull avez-vous penseacute agrave retirer le filtrage voir httpcyberlawharvardedupeopleedelmangoogle-safesearch et faites le test sur httpwwwresearchbuzzorg200309the_domain_purity_testshtml (ma google key est 3wJB0JQFHIjLag9z1eBxH2WVqKVTqcZ)

bull4 Trouver de bons points de repegravere annuaires et bons sites dans un domaine

(voir NR p 79) - Retrouver les eacutequivalents de ses sources habituelles - Compleacuteter avec les sources originales - Trouver les reacutepertoires et meacuteta-pages speacutecialiseacutees- Utiliser la commande related de google- Si on y a accegraves lire les logs de connexion dun site dinformation et notamment de ses referers (ceux qui pointent vers ces informations ont forceacutement quelque chose agrave voir avec ces informations = notion de laquo cosmos raquo voir httpwwwtechnoraticom )

5 Toujours analyser linformation (voir NR p 91)

recouper linformation faire preuve desprit critique eacutevaluer rapidement (connaicirctre les principes de bases des construction dURL ndash noms de domaines savoir rechercher les entiteacutes responsables dune page web ou dun site connaicirctre en gros la structuration des corpus disponibles leur acircge

16

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 17: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

leur redondance)- comment identifier de sources dinformation sectorielle ou speacutecialiseacutee des experts agrave contacter des pages de liens Recouper Utiliser plusieurs outils Ne pas heacutesiter agrave lancer un fil de discussion sur une liste tout en respectant la neacutetiquette(voir aussi wwwarobaseorg) Faire des synthegraveses agrave partager avec les autres

6 Utiliser en cours de recherche son carnet dadresses pour garder trace des sites ou pages inteacuteressants mais momentaneacutement hors sujet et noter rapidement les ressources enregistreacuteesUtiliser le bloc note (notepad) = faire un lien sur son bureau vers le programme notepadexe et apprendre agrave manipuler les combinaisons de touches ALT+TAB (basculer dune fenecirctre agrave une autre) CTRL+C (copier) et CTRL+V (coller) Apprendre surtout agrave seacutelectionner sur les documents complexes (type HTML avec ou sans cadres le PDF)Utiliser lhistorique de son navigateur (au besoin en augmenter son volume)

7 Savoir se limiter dans le temps ne pas se rendre esclave dune recherche dexhaustiviteacute agrave tout prix ne pas sobstiner en vain Internet contribue souvent agrave reacutepondre agrave la question ougrave trouver (chercher linfo qui conduira agrave linfo)Meacutethode gardez le fil

bull Ne vous laissez pas emporter par la vague Gardez le fil de votre recherche (eacuteviter le pheacutenomegravene Dictionnaire) (a contrario ne pas neacutegliger le pheacutenomegravene dit de laquo serendipiteacute raquo (lheureux hasard)

bull Repreacutesentez-vous mentalement vos eacutetapes de recherche et votre logique bull Ne remettez pas en cause toute votre tactique agrave cause dune eacutetape (ie remettez juste en

cause leacutetape ) Aidez-vous avec lhistorique et les signets (CTRL + H) (finalement le papier a aussi du bon apprenez agrave utiliser NOTEPAD et les combinaisons de touches) Meacutethode la gestion du temps Dire quon na pas le temps de chercher cest mal poser le problegraveme Vous ne pouvez eacutevaluer le temps dune recherche quapregraves avoir deacutetermineacute une strateacutegie de recherche Ce temps deacutepend surtout de votre culture du sujet car on perd eacutenormeacutement de temps agrave trouver le bon terme la bonne expression = commencer par le trouver utiliser des dictionnaires (httpwwwgranddictionnairecom tregraves bon pour les synonymes et la traduction en anglais - et en latin )

Ne vous surestimez pas Si vous ne connaissez pas bien le domaine ajoutez une eacutetape recherche de terminologie dans laquelle vous allez vous former agrave la terminologie du domaine Utilisez les cateacutegories yahoo une recherche vague sur Google et analyser les premiegraveres reacuteponses les documents dencyclopeacutedie en ligne les articles de presse etc

(voir NR p 76)

8 Rester clair sur ses objectifs sa strateacutegie et ses critegraveres de choix eacutetablis auparavant face agrave lhyper-choix Rester vigilant sur la trajectoire parcourue et celle qui reste agrave parcourir- en quoi une recherche sur Internet est-elle diffeacuterente dune autre recherche Problegraveme Internet nest pas conccedilu comme un outil de recherche Ce ne sont que des rustines qui permettent de faire des recherches sur des corpus non stables non structureacutes et non valideacutesRisques manque de fraicirccheur flicage publiciteacute intempestive faux-bruits bruit tout courtAvantages freacutequente gratuiteacute rapiditeacute de reacuteaction immensiteacute du corpus international et agrave la fois tregraves local Curiositeacute une meacutethode originale de recherche = la recherche orienteacutee reacutesultat

17

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 18: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

httpsupercoachover-blogcomarticle-964137html hellipLes informaticiens consciemment ou pas ont compris cette contrainte lsquologiquersquo du questionnement ils savent que pour trouver une information ils ne doivent pas exprimer laquo ce qursquoils cherchent raquo mais plutocirct laquo ce que le reacutesultat doit ecirctre raquo Ne me demandez dougrave cette faculteacute leur vient ce serait effrayantJe propose simplement de dialoguer avec le moteur de recherche comme srsquoil eacutetait un hellip moteur de recherche Crsquoest le principe de la recherche orienteacutee reacutesultat apprendre agrave exprimer non pas ce que lrsquoon cherche mais plutocirct ce que lrsquoon souhaite obtenirhellip

9 Conjuguer harmonieusement recherche dans les outils classiques web invisible presse et actualiteacute et navigation hypertexte la recherche dinformation sur Internet est un processus iteacuteratif qui oblige agrave passer par diffeacuterents modes daccegraves agrave linformation

- Meacutethodes Recherches passivesactives Une eacutevolution surprenante (un peu artificielle) du monde Internet a fait apparaicirctre une rupture entre deux meacutethodes la premiegravere consiste agrave tirer (pull) de lexistant des donneacutees et des infos cela constitue la base de la navigation la seconde consiste agrave se voir rapatrier par des agents externes (qui poussent vers vous) ces mecircmes donneacutees

bull Les meacutethodes pull les plus classiques navigation hypertexte recherches via moteurs dindexation participation passive agrave des newsgroups des listes de messagerie (recherche dans leurs archives par exemple) recherches sur des sites speacutecialiseacutes (comme sur des bases de donneacutees en ligne)

bull Les meacutethodes push Les nouveaux info-agents limiers traqueurs de nouvelles

Application WysigotAvant mecircme lapparition de tels outils et pour que linformation soit reacuteellement partageacutee le fait de participer activement aux newsgroups aux mailing lists de creacuteer ses pages web correspondait deacutejagrave agrave de lexternalisation de votre info et en contrepartie agrave amener (faccedilon laquo veille raquo) de l rsquoinfo externe vers vous - au delagrave des outils strateacutegies et tactiques de recherche 1) Meacutethodes de long terme - Meacutethode du lurker = participation passive agrave des forums de discussions- Mini-veille = installation doutils minimalistes de surveillance de pages strateacutegiques- Meacutethode de la chegravevre = attirer linformation agrave vous = devenez source dinfo 2) Meacutethodes de court terme- Meacutethode de la bouteille agrave la mer = usage inconsideacutereacute de newsgroup ou de liste de discussion (agrave eacuteviter sauf)- La personne ressource (parfois deacuteveloppeacute comme business plan dans certains cas comme AskJeeves httpwwwaskcom ou sur Google Answers http answersgooglecom )

18

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 19: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

10 Etre agile Deacutevelopper une lecture rapide lancer plusieurs recherches agrave la fois savoir rebondir dune information agrave lautre dun outil agrave lautre dun article agrave une institution Se souvenir quil nexiste pas de meacutethode infaillible et que chercher linformation sur Internet cest avant tout un eacutetat despritMeacutethode gestion de lespace de la recherche

bull Apprenez agrave lire un eacutecran rapidement Eacuteduquez votre oeil bull Apprenez agrave mentaliser le document dans son ensemble (et pas juste ce qui est afficheacute) bull Apprenez agrave maicirctriser vos clics de souris Chaque clic sur un lien doit ecirctre peseacute rationnel

(pensez agrave utiliser plutocirct le clic droit et ouvrir dans une nouvelle fenecirctre puis agrave manipuler vos fenecirctre avec ALT TAB) Pas un clic ne doit ecirctre impulsif Il nest pas interdit de surfer au hasard mais dans une logique de veille pas dans une logique de recherche chronomeacutetreacutee

Lors dune recherche ne faites pas nimporte quoi Quand vous cherchez hors dInternet vous ne faites pas nimporte quoi Alors ayez conscience de leacuteconomie de votre recherche

19

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 20: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

La veille quotidienne (4)(voir NR p 95)

- le push et les channels ancecirctres des fils RSS- les agents intelligents quelle reacutealiteacute httpwwwstrategic-roadcomrecherchagentsagentsfrhtm httpwwwagentlandfr (attention plein de pub et gros risques de spywares)httpwwwcybionfrpagestechnologielabo_agentshtml

- les agents dalertedes gratuits Google Alert = httpwwwgooglealertcom (site priveacute non relieacute agrave Google) agrave ne pas confondre avec les Google web Alerts httpwwwgooglecomwebalerts (site laquo officiel raquo de Google)TRACERLOCK httpwwwtracerlockcom (test gratuit pour 30 jours)httpwwwwatchthatpagecom INFOMINDER httpwwwinfomindercomwebminderindexjsphttpwwwtrackenginecom ou peu oneacutereux

Website Watcher httpwwwaignescomindexhtm (version deacutemo pendant 30 jours 30 $ version perso)httpwwwwysigotcomfr Wysigot est le logiciel ideacuteal pour capturer surveiller geacuterer et archiver tous les documents sur internet votre reacuteseau local ou votre ordinateur (version gratuite limiteacutee payante agrave 31 euro)

- les aspirateurs de site (mot clef anglais offline browser)httpdmozorgComputersSoftwareInternetClientsWWWBrowsershttpdiryahoocomBusiness_and_EconomyBusiness_to_BusinessCommunications_and_NetworkingInternet_and_World_Wide_WebSoftwareDevelopmentOffline_Web_Agents

WEBZIP httpwwwspidersoftcom

- les meacutetamoteurs clientsCOPERNIC httpwwwcoperniccom

- les logiciels de cartographie de linformation

httpcasselinfreefrfrenchcartohtm

20

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 21: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Boicircte agrave outils (5)(voir NR p 71 et suiv)

Parameacutetrages avanceacutes des logiciels de navigation et de messagerie- reconnaicirctre les extensions des fichiers (savoir les afficher sur Windows elles sont cacheacutees par deacutefaut) puis la retrouver sur httpfrwikipediaorgwikiListe_dextensions_de_fichiers ou httpwwwcommentcamarchenetsystemesformatphp3 (moins riche en extensions mais plus preacutecis)Google it - httpwwwdsicnrsfrRMLRtextesintegrauxvolume4415-cirdu21-01-2002htm Circulaire du 23 mai 2001 relative au choix des formats pour la reacutealisation de documents constitueacutes de donneacutees numeacuteriques- Jargon

bull en franccedilais httpwwwlinux-franceorgprjjargonf

Gestion avanceacutee des signetsheacutebergement dannuaires (partageacute ou non)Les logiciels sociaux et le laquo social bookmarking raquo httpdelicious

httpwwwmylineacom seacutelection de sharewares httpdownloadcomcom3150-2370-0htmltag=stbcgp (bookmark managers)Webnotes httpwwwwebnotesorg (franccedilais version 63 freeware 70 shareware (20 euro))Powermarks httpwwwkayloncompowerhtml (shareware 25 $)

autres solutions le faire soi-mecircme bull via un CMS (genre SPIP par exemple avec le squelette Biospip) bull via un petit outil de gestion de signet sur une base de donneacutee (voir Hypathiamdb sur le

CD-Rom) Les problegravemes poseacutes par linformation sur Internet- leacutevaluation de linformation comment faire

bull recouper et se meacutefier bull connaicirctre lutilisation des WHOIS des cadres invisibles des http-equiv des reroutages

- la rediffusion de linformation bull Le droit des intranets (intervention deacutecembre 1999) bull Les recommandations du forum des droits sur linternet

httpwwwforuminternetorgrecommandations

- geacuterer la confidentialiteacute de ses recherches et de sa veillebull Des adresses email de complaisance bull Nettoyer ses traces (voir sur Agentland par exemple) bull Ne pas se faire blacklister

21

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 22: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Autoformation (6)

- les indispensables de lautoformation agrave la recherche - mettre en place une veille sur la veille

- les indispensables de lautoformation agrave la recherche FORMATIONS agrave la rechercheEacutevidemment httpurfistuniv-lyon1frrisirisihtm le RISI Recherche dInformation Sur lInternet de Jean-Pierre Lardy (Adbs) httpurfistuniv-lyon1frjplhtml

bull Formist Reacuteseau francophone pour la formation agrave lusage de linformation dans lenseignement supeacuterieur- httpformistenssibfr

bull Arobase Guide dutilisation de la messagerie eacutelectronique - - httpwwwarobaseorg bull Search Engine Guide - httpwwwsearchengineguidecom - bull GIRI Guide dinitiation agrave la recherche sur internet CREPUQ - Sous-comiteacute des

bibliothegraveques Groupe de travail sur laccegraves aux ressources documentaires Sous-groupe de travail sur Internet - - httpwwwbiblulavalcavitrinegiri

Guides de recherches (geacuteneacuteralistes) CERISE Conseils aux eacutetudiants pour une recherche dinformation speacutecialiseacutee efficace) httpwwwextupmcfrurfistceriseindexhtm (voir en geacuteneacuteral le site de lUrfist de Paris eacutecole des Chartes ougrave il est heacutebergeacute httpwwwextupmcfrurfist )Guides BNF httpgrebibbnffr et httpsignetsbnffr Cateacutegorie Yahoo consacreacutee agrave la Recherche sur Internet httpfrdiryahoocomInformatique_et_InternetInternetWorld_Wide_WebRecherche_sur_le_Web eacutequivalent en anglais httpdiryahoocomComputers_and_InternetInternetWorld_Wide_WebSearching_the_Web SAPRISTI= Sentiers dAccegraves et Pistes de Recherches dInformations Scientifiques et Techniques sur Internet consultable agrave httpcsidocinsa-lyonfrsapristi

- mettre en place une veille sur la veilleLire la lettre actu-moteurs dOlivier Andrieu (site Abondance) httplettresabondancecom (version gratuite hebdomadaire ou mensuelle payante 6euro mois)(voir en annexe un extrait des lettres Recherche et Reacutefeacuterencement)Sabonner agrave des listes de messageries speacutecialiseacutees MOTRECH httpmotrechfreefr ou consulter reacuteguliegraverement les sites web des responsables et des animateurs de la liste Olivier Andrieu (httpwwwabondancecom) Jeacuterocircme Charron httpmotrechfreefr

VEILLE httpfrgroupsyahoocomgroupveille ou consulter reacuteguliegraverement les sites Internet des responsables de la liste Intelligence Strateacutegique sur Internet httpwwwcybionfr httpwwwveillecom

22

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 23: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Meacutethode Apports theacuteoriques et pratiquesUtilisation de logiciels speacutecifiques

Exercices proposeacutes En plus des applications pratiques le long du cours (installation de wticker ou dautres logiciels)

on pourra au choix des stagiaires seacutelectionner parmi des exemples dapplications qui sont proposeacutees dans la boicircte agrave outils (partie 5) ou NR pp 71 agrave 136

On privileacutegiera aussi des exercices proposeacutes par les stagiaires (approfondissement sur un domaine en particulier) mais en cas de carence en initiatives voici quelques exercices qui devraient donner des ideacutees

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo copernic-meta ou NeedleSearch pour les utilisateurs de Mozilla)- Installer un utilitaire anti-pop-upinstaller la googlebar critiques et appreacuteciations

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)lire httpwwwdmozorgWorldFranccedilaisabouthtml

4) Installer et localiser des thegraveses (ou des travaux universitaires)les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

5) Exercice dirigeacute creacuteation dune liste de discussion sur Yahoo-Groupes ou Google-groups Gestion de la liste et apprentissage des principales fonctionnaliteacutes

23

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 24: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

Corrections des exercices

1) Trouver le(s) responsable(s) dun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfrex wwwadbsfrex servicedocinfoex whitehousegov whitehousecom [attention contenu adulte]ex legifrancegouvfr legifrancecom

httpwwwservicedocinfoarticlephp3id_article=188

Du bon usage du Whois comment trouver le responsable technique drsquoun site web mars 2004 par Steacutephane CottinTout nom de domaine fait lrsquoobjet drsquoun deacutepocirct aupregraves drsquoun rsquoregistrantrsquo [1] = un prestataire assurant la gestion administrative et technique du nom caracteacuteriseacute notamment par ses derniegraveres lettres apregraves le dernier pointPlus drsquoinformation se trouve aupregraves notamment sur le site du prestataire en charge des noms de domaine se terminant par fr = lrsquoAFNIC sur cette page httpwwwafnicfroutilswhoisIl y est notamment permis de faire une recherche sur lrsquooutil Whois de la zone fr crsquoest-agrave-dire de rechercher les eacuteleacutements techniques (dates de creacuteation noms et lieux des serveurs) et surtout administratifs (noms des responsables techniques et administratifs) du nom de domaine pour autant qursquoil se termine par fr (comme top level domain [2]WHOIS [3] = Base de donneacutees autrefois geacutereacutee par lrsquoInternic et deacutesormais maintenue par Network Solutions aussi connue sous le nom de laquo NICname raquo Elle stocke pas mal drsquoinformations sur le reacuteseau lui-mecircme (adresses des sites des entreprises noms de domaines classes attribueacutees gestionnaires locaux) Crsquoest un annuairePour les autres top level domains et notamment les plus courants que sont les gTLD (generic Top level domains) comme les com net org et plus reacutecemment les biz et les info le travail de recherche est plus difficile car les bases de donneacutees ne sont pas (ou plus) unifieacutees Un outil (Betterwhois httpwwwbetterwhoiscom) permet de retrouver facilement les reacutefeacuterences parmi les gTld sus-citeacutesQuant aux autres noms de domaines et notamment les ccTLD (Country code Top level domains = domaines par pays) il faut chercher tld par tld LrsquoAfnic propose de passer par un service du rsquoNIC geacuteneacuteriquersquo assez efficace httpwwwgeneric-nicnetdynwhois mais pour vraiment tout avoir on peut aussi passer par la liste Yahoo Domain Registration gt International TLD Registry OperatorsExercice pratique Intutileacute du sujet Trouver le(s) responsable(s) drsquoun site (applications WHOIS notions mentions leacutegales registrar billing contact administrative contact)ex conseil-constitutionnelfr [4]ex wwwadbsfr [5]ex servicedocinfo [6]ex whitehousegov [7] whitehousecom [attention contenu adulte] [8]ex legifrancegouvfr [9] legifrancecom [10][1] deacutefinition copy Le Jargon Franccedilais registrant en anglais registrar[2] Top level domain selon le rsquoJargon Franccedilaisrsquo[3] deacutefinition Jargon Franccedilais[4] Solution rechercher rsquoconseil-constitutionnelfrrsquo dans httpwwwafnicfroutilswhois[5] Solution (idem) rechercher rsquoadbsfrrsquo dans httpwwwafnicfroutilswhois[6] Plusieurs solutions via Betterwhois via Gandi

24

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 25: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

[7] pour les rsquodot Govrsquo lrsquoofficiel httpwwwnicgovwhoishtml ne vous donnera pas plus que le fait que le site existe ou a eacuteteacute reacuteserveacute[8] Whitehousecom via Betterwhois[9] legifrancegouvfr agrave rechercher via httpwwwafnicfroutilswhois[10] legifrancecom via GandiCompleacutement

Attention un Whois est deacutependant des informations qui lui sont fournies par le responsable techniqueOr

bull ce responsable technique est souvent un intermeacutediaire professionnel et non le webmestre reacuteel du site crsquoest-agrave-dire la personne organisme ou socieacuteteacute qui le met agrave jour En geacuteneacuteral il y a deux cateacutegories drsquointermeacutediaires de ce genre

o un technicien du fournisseur de nom de domaineo carreacutement une socieacuteteacute dont le meacutetier est drsquoenregistrer des noms de domaine pour drsquoautres Exemple

sur le Whois de Tucows le nom de domaine balladecom donne comme nom de responsable administratif et technique Net City Ltd adresse agrave Hong-Kong Peu parlant Et cette adresse est-elle exacte Nous allons voir ci-dessous comment la veacuterifier

bull les informations fournies au registrant sont de fait rarement mises agrave jour malgreacute le risque de perte de controcircle du nom de domaine Par exemple si lrsquoe-mail donneacute nrsquoest plus en service il peut ecirctre tregraves difficile de reprendre le controcircle en cas de piratage (hack) du nom de domaine par une personne non autoriseacutee) certains changements neacutecessitant de reacutepondre agrave un e-mail de confirmation

bull surtout pour se proteacuteger des spammeurs et indiscrets les informations donneacutees jusqursquoau nom sont souvent tregraves maigres partiellement fausses ou encore renvoient sur une personne qui nrsquoest pas le vrai responsable Par exemple mettre son vrai numeacutero de teacuteleacutephone ou son e-mail principal est une garantie drsquoennuis agrave nrsquoen plus finir En effet les donneacutees agrave fournir comprennent nom adresse teacuteleacutephone et e-mail (cf Internet Privacy Advocate gt Protect Your Personal Information gt What Information Is Made Public ) Les registrants protegravegent maintenant beaucoup mieux leurs bases de donneacutees Whois des teacuteleacutechargements massifs qui sont le plus souvent le fait de pirates (hackers) Ce risque a donc nettement diminueacute mais il existe toujours et la plupart des gens qui procegravedent aux enregistrements de noms de domaine sont maintenant devenus tregraves prudents

Conclusion les informations des Whois sont agrave prendre avec des pincettes et donc agrave veacuterifier et recouper par drsquoautres moyens si possibleQuelques parades aux limites des Whois

bull cherchez sur le plan du site la page Contact celle ou se trouve lrsquoadresse e-mail du webmestre et eacuteventuellement lrsquoadresse physique de lrsquoorganisme auteur du contenu du site Pour reprendre lrsquoexemple de balladecom la page drsquoaccueil de ce site donne une adresse e-mail pour contacter le proprieacutetaire du nom de domaine Or cette adresse est une adresse qui se termine apregraves le par allthenetcom En allant sur le site web correspondant htppwwwallthenetcom on se rend compte qursquoil srsquoagit drsquoun annuaire de sites web tregraves commercialpublicitaire

bull les moteurs de recherche (Google ou Yahoo Search surtout) permettent eacutegalement de trouver des commentaires sur le site incluant les noms en clair de ses auteurs reacuteels ou bien au moins quelques indications (pays etc) ou pistes Ainsi une interrogation de Google par Net City Limited permet de savoir qursquoil srsquoagit drsquoune socieacuteteacute de Hong-Kong gracircce agrave la base de la Securities and Futures Commission (SFC) de Hong-Kong (voir httpwwwhksfcorghkengtakeove)

bull les bases de donneacutees drsquoinformations sur les socieacuteteacutes (RCS organismes de reacutegulation boursiers) sont eacutegalement un bom moyen de veacuterifier les identiteacutes des responsables de site et drsquoen apprendre plus sur eux A condition que la socieacuteteacute ait pignon sur rue Crsquoest tregraves efficace si le pays possegravede un registre du commerce interrogeable sur le Web gratuitement (exemple en France par Societecom) ou bien si la socieacuteteacute est coteacutee en bourse ou bien a eacuteteacute lrsquoobjet drsquoune acquisition ou vente (cf notre exemple supra avec la SFC de Hong-Kong)

Emmanuel Barthe

25

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 26: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

2) Utilitaires pratiques - Installer et utiliser une toolbar (googlebar yahoo mozbotbar ou NeedleSearch pour les utilisateurs de MozillaFirefox)- Installer un utilitaire anti-pop-up

PB = la plupart des manipulations neacutecessitent ici des droits dadministrateurs sur son poste

Diffeacuterences entre les toolbars

- Une toolbar universelle = NeedleSearch (speacutecial MozillaFirefox) = httpneedlesearchmozdevorg

- Google Deskbar Toolbar = httptoolbargooglecom httpdeskbargooglecom

Plus loin que les toolbar = le desktop searching = mettez un moteur de recherche dans votre PCGoogle Desktop Search = httpdesktopgooglecom

26

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 27: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

3) Comprendre le travail dun editor de lOpen Directory (wwwdmozorg)

lire httpwwwdmozorgWorldFranccedilaisabouthtml La reacutepublique du Web

La croissance du Web se poursuit agrave une vitesse stupeacutefiante Les moteurs de recherche automatiseacutes ont de plus en plus de difficulteacutes agrave fournir des reacutesultats satisfaisants Les petites eacutequipes deacutedition professionnelles travaillant sur les sites commerciaux des reacutepertoires ne peuvent plus reacutepondre aux requecirctes et la qualiteacute et le contenu de leurs reacutepertoires sen ressentent Les liens deviennent obsolegravetes et ne peuvent plus suivre le rythme de croissance de lInternet Au lieu de combattre la croissance explosive de lInternet le projet Open Directory permet agrave lInternet de sorganiser Parallegravelement agrave la croissance de lInternet le nombre de citoyens du Web augmente Ces citoyens sont habiliteacutes agrave organiser une petite partie du Web et agrave la preacutesenter au reste de la population en supprimant les eacuteleacutements inutiles ou ininteacuteressants et en conservant les meilleurs eacuteleacutements

laquo Le raquo catalogue du WebLOpen Directory marche dans les pas de certains des plus importants projets collaboratifs du 20e siegravecle Tout comme lOxford English Dictionary a eu le dernier mot en matiegravere de mots de la langue anglaise gracircce aux efforts de beacuteneacutevoles lOpen Directory suit ses traces afin de devenir laquo le raquo catalogue du Web LOpen Directory a eacuteteacute fondeacute dans lesprit du mouvement Open Source et est le seul reacutepertoire dimportance majeure agrave ecirctre totalement gratuit Il ny a rien et il ny aura jamais rien agrave deacutebourser pour y soumettre un site ni pour utiliser ses donneacutees Elles sont gratuitement agrave ladisposition de quiconque accepte de respecter notre free use license

Le cerveau de lInternetLOpen Directory est la plus diffuseacutee des bases de donneacutees sur le contenu du Web catalogueacute par des ecirctres humains Son groupe deacutediteurs citoyens du Net forme le cerveau collectif qui alimente la quecircte de ressources preacutesentes sur le Web LOpen Directory fournit leurs reacutepertoires aux plus grands et aux plus populaires des moteurs de recherches et des portails

Vous avez le moyen de changer les chosesComme dans toute communauteacute vous eacutechangez et reacutecoltez ce que vous avez semeacute LOpen Directory permet agrave tout le monde de participer Linscription est facile choisissez un sujet que vous maicirctrisez et inscrivez-vous Leacutedition des cateacutegories est simple comme bonjour Nous disposons dun ensemble doutils complet permettant dajouter de supprimer et de mettre agrave jour des liens en quelques secondes En quelques minutes vous pouvez participer agrave lameacutelioration du Web et ecirctre reconnu en tant quexpert du sujet choisi

Rejoignez lOpen Directory Project1 Recherchez une cateacutegorie que vous aimeriez entretenir 2 Suivez les instructions du lien Devenir eacutediteur situeacute en haut de la page de cateacutegorie

Remarquez que les pages de cateacutegorie de niveau supeacuterieur ne disposent pas de liens Devenir eacutediteur vous devez rechercher une cateacutegorie plus preacutecise et faire une demande pour cette cateacutegorie

27

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 28: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

4) Localiser des thegraveses (ou des travaux universitaires)

les fonds sudoc et abes = chercher des autres fondsles cas particuliers thegraveses en cours thegraveses soutenues par matiegravere par universiteacutelocalisation acquisition texte inteacutegral

httpwwwservicedocinfoarticlephp3id_article=242 Trouver des thegraveses en ligne juillet 2004 par Steacutephane Cottin

GeacuteneacuteraliteacutesLa super liste de ressources geacuteneacuterales de lrsquoABES agence bibliographique de lrsquoenseignement supeacuterieur renvoie vers httpwwwabesfrabesDesktopDefaultaspxtabindex=7amptabid=17 La page Thegraveses httpwwwabesfrabesDesktopDefaultaspxtabindex=10amptabid=223 regroupant des liens vers Textes reacuteglementaires Guide du doctorant Deacutepocirct papier Deacutepocirct eacutelectronique Thegraveses eacutelectroniques SPARTE Rechercher une thegravese Quelques questions Autres siteset notamment vers la page de liens Autres sitesFichier central des thegraveses (en cours) = Nanterre httpfctu-paris10fr

Internationalgoogle it (related eddvtedu) Site du CREDO (apparemment page perso de K Ben Kahla) httpiquebecifrancecomcredothesesenlignehtml electronic theses and dissertations (ETDs) in humanities httpetextlibvirginiaeduETDETDhtml Portail des ETD httpetdvtedu EtdGuide

httpwwwndltdorgThe Networked Digital Library of Theses and Dissertations (NDLTD) is an international organization dedicated to promoting the adoption creation use dissemination and preservation of electronic analogues to the traditional paper-based theses and dissertationsThis website contains information about the initiative how to set up Electronic Thesis and Dissertation (ETD) programmes how to create and locate ETDs and current research in digital libraries related to NDLTD and ETDs

Sciences de lrsquoinformationMemSic httpmemsicccsdcnrsfrMemsic est une partie de ArchiveSic eacutequivalent de ArXiv pour les articles dans le mecircme domaineExtraits de lrsquoA-propos-gt]Le site du CCSD rchiveSIC a pour objectif de faire deacutecouvrir lrsquoauto-archivage en ligne de documents et de montrer la souplesse et lrsquoefficaciteacute de cet outilLe concept drsquoauto-archivage dont le plus ardent deacutefenseur est Stevan Harnad a pour but de permettre lrsquoineacuteluctable eacutevolution des revues eacuterudites vers la solution optimale pour les eacutetudiants et les chercheurs Reacutesoudre une anomalie post-gutenbergienneCe site a eacuteteacute configureacute pour archiver des articles et des working papers dans le domaine des Sciences de lrsquoInformation et de la Communication (SIC) de maniegravere agrave les rendre disponibles gratuitements agrave tous via le web et par la mecircme augmenter leurs visibiliteacutes Chaque auteur (ou organisme dont il deacutepend) peut librement deacuteposer ses documents sur ce site apreacutes srsquoecirctre enregistreacute Chaque document est examineacute par un modeacuterateur de domaine qui pourra lrsquoaccepter ou non Une bibliographie sur rchiveSIC est disponibleLes responsables du serveur sont

Gabriel Gallezot Ghislaine Chartron Jean-Max Noyer

28

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS
Page 29: INTERNET Rechercher l'information sur Internet ... · INTERNET Rechercher l'information sur Internet : approfondissement des méthodes 27, 28 et 29 novembre 2006 Animateur Stéphane

MultidisciplinaireCCSD thegraveses-EN-ligne Serveur de Thegraveses Multidisciplinaire httptelccsdcnrsfrVoir A propos-gthttptelccsdcnrsfrinformation_frhtml] et lrsquoaide en ligneSurtout des thegraveses de matheacutematiques drsquoinformatique un peu de sciences humainesextrait de lrsquoA-propos Le site du CCSD thegraveses-EN-ligne a pour objectif de promouvoir lrsquoauto-archivage en ligne des thegraveses qui sont des documents importants pour la communication scientifique entre chercheurs il a eacuteteacute deacuteveloppeacute en collaboration avec la Cellule MathDoc Son but est de compleacuteter le serveur ArXiv qui comprend surtout des documents destineacutes agrave ecirctre publieacutes comme articles mais peu de thegraveses avec un format de fichiers peu adapteacute agrave ces derniegraveres (qui nrsquoa pas eacuteteacute conserveacute dans thegraveses-EN-ligne) dans le mecircme esprit qursquoArXiv il permet de rendre aiseacutement disponibles agrave tous gratuitement thegraveses de doctorat et habilitations Il complegravete eacutegalement lrsquoindex national des Thegraveses et Habilitations de Matheacutematiques en France de la cellule Mathdoc Le CCSD comme MathDoc nrsquoeffectue aucune eacutevaluation scientifique sur les thegraveses ou habilitations deacuteposeacutees car crsquoest le rocircle du jury

29

  • Le pheacutenomegravene Weblogs et les fils RSS