Upload
olivier-bot
View
486
Download
7
Embed Size (px)
Citation preview
Surfer en
journaliste
Master de journalisme EJDG
Olivier Bot
Evolution du nombre d’utilisateurs d’internet dans le monde
• L’interconnexion du monde nous ouvre la possibilité
de joindre toutes sortes d’interlocuteurs un peu
partout sur la planète.
• Le développement d’internet n’est pas un
phénomène qui touche seulement le monde
industrialisé. Même si internet n’est pas aussi
répandu ailleurs, il suit la même courbe de
progression.
• Les contenus sur internet suivent une courbe
exponentielle et les modes de participation au web
se multiplient.
• Il est donc de plus en plus nécessaire de faire le tri,
de hiérarchiser ses propres sources sur internet et
d’utiliser les outils adéquats dans vos recherches.
• Huit journalistes sur dix déclarent qu’internet a changé leur manière de travailler.
• L’accélération du rythme de production de l’information provoquée par internet doit nous rendre encore plus rigoureux dans le recoupement des informations.
• Internet se prête facilement au journalisme de petites phrases ou people. Au détriment de la qualité de l’information.
• Les rédacteurs ignorent souvent les possibilités d’approfondir l’information offertes par internet.
• Le journalisme est un artisanat et internet peut devenir une boîte à outils pour trouver ou enrichir des contenus.
Surfer en
journaliste
« Pour un bon tuyau,
demandez
à vos sources
plutôt qu’à Google »
Les bornes
de la recherche
sur internet
• La recherche sur internet à deux bornes: le silence
et le bruit lorsque les requêtes sont trop pointues ou
trop larges.
• Comme dans le monde réel, deux risques guettent
le journaliste dans sa recherche sur internet: le
ratage et le suivisme.
Les pièges du web
• Internet n’est ni la panacée, ni l’enfer
Il doit susciter chez vous un surcroît de vigilance, voire de méfiance
• La recherche intuitive ou aléatoire prend beaucoup de temps.
Avant d’y passer des heures, pensez à ce que voulez trouver
Surfer en journaliste
• Les critères de recevabilité d’une info sont les
mêmes que dans la vie réelle: authenticité,
crédibilité, fiabilité.
• Une info obtenue sur internet ne se recoupe pas
sur internet. Elle se recoupe auprès d’une
source réelle. Car le Web fonctionne par reprise en
boucle des contenus.
Ayez du bon
sens!Cultivez-vous!
• Sur internet, on ne sait pas toujours à qui l’on a à faire.
• Le net colporte de nombreuses rumeurs et théories complotistes.
• Il y aussi des faux.
• Et des sites qui se font passer pour des sites officiels.
• Il faut donc apprendre à reconnaître une rumeur, les sites complotistes, les faux et les sites « faux-semblants ».
• De nombreux sites très fréquentés ou prestigieux
sont détournés pour des motifs divers: parodie,
tromperie, critique.
• Le design, la syntaxe de la langue, l’orthographe
sont bien souvent de meilleurs indices que l’intitulé
du site et son url. Néanmoins, les adresses de sites
(qui sont commercialisées sans restriction aucune),
peuvent aussi fournir des indices utiles.
• Il faut donc apprendre à les déchiffrer.
Rumeurs, fake et théories
complotistes
• Ayez à l’esprit, que sur internet, quand c’est trop
beau, c’est peut-être faux.
• Pour déjouer les pièges d’internet, essayez toujours
de retourner à la source
Reconnaître une rumeur
• Les rumeurs sont des récits présentés comme vrais
qui présentent de nombreuses variantes. Leur
source se perd dans des sables mouvants.
• Elles expriment des peurs contemporaines, des
tabous ou des histoires de comble.
• Quatre grandes familles de rumeurs ont été
identifiées par les sociologues.
• La première étude a été réalisée par Edgar Morin
sur la rumeur d’Orléans: la disparition de femmes
dans les cabines d’essayage d’un grand magasin.
Cette rumeur exprimait un antisémitisme latent dans
cette ville moyenne du centre de la France. Le
propriétaire du magasin était juif.
• Les rumeurs alimentaires: pizza à l’urine, sauce blanche au sperme des kebabs, hamburgers à l’araignée, la souris dans le coca etc.
• Les rumeurs technologiques: la persistance rétinienne des morts assassinés (comme dans « 4 mouches de velours gris »,le film de Dario Argento), le nageur avalé par un Canadair, le strip-tease de sa copine envoyé automatiquement sur internet (comme dans « American Pie ») etc.
• Les peurs criminelles: le LSD en tatouage pour les enfants, le hangar qui cache un site nucléaire…
• Le retour du sauvage: les panthères noires, le crocodile dans les toilettes…
• Le surnaturel: les dames blanches, Nostradamus qui aurait prévu le 11 septembre, etc.
• Une rumeur ne peut se contredire qu’en posant la
question à un spécialiste.
Exemple: Un pilote de Canadair vous dira que
la buse qui pompe l’eau dans un lac ne peut avaler un
plongeur. Son diamètre est trop modeste.
Un toxicologue vous dira que le LSD ne se diffuse pas
par les pores de la peau .
Les théories complotistes
Ebola
et le MH370
Les théories complotistes
s’attachent aux drames et au
mystère.
Reconnaître un site
• En faisant une recherche simple « white house »,
les moteurs font remonter le site de la Maison-
Blanche en tête.
• Mais une recherche avec un suffixe .net ou .org
affiche d’autres réponses.
• Un exemple des sites qui veulent tromper leurs
visiteurs.
• Comment éviter de se faire piéger?
Décrypter
une URL
Pourquoi décoder
une adresse internet?
• Il faut s'interroger sur la source de tout document trouvé sur Internet
• Apprendre à remettre une page Web dans son contexte
• Identifier des critères de crédibilité de l'information et les intentions des émetteurs
• Situer la hiérarchie sur le site de l’information trouvée
• Mais attention, l’url n’est pas une garantie d’authenticité
• Décoder une adresse peut aussi être servir d’outil de recherche
• En déchiffrant une adresse, on peut la tester
• L'adresse d'un site (URL) donne de nombreuses informations d'un seul coup d'oeil (si l'URL n'est pas écrite, il suffit de pointer la souris sur le lien, l'URL apparaît en bas du navigateur).
• protocole://site.hébergeur.tld/domaine/ sous-domaine/répertoire/document.format
• protocole://Protocole utilisé pour le dialogue entre les différentes machines connectées. http est le protocole utilisé pour les pages Web. Il existe d'autres protocoles (par exemple FTP pour les téléchargements...).
• site.hébergeur.tld Nom du site qui peut être différent de l’hébergeur. Un nom de domaine se lit de droite à gauche, à partir du nom de domaine supérieur hébergeur vers le nom de la machine serveur.
Déchiffrez cette adresse
• ftp://urfist.enc.sorbonne.fr/veille-et-
recherche/ateliers/les-boudoirs-de-
lhistorienne/seance-du-18-mai-2015-bibliotheques-
numerique.pdf
Connaître les TLD
• La connaissance des suffixes de sites ou top leveldomain (TLD) peut être utile mais cela ne suffit pas. Les noms de domaine sont en effet libres à l’acquisition. Aucune législation ne les réglemente pour l’instant.
• Ils n’offrent aucune garantie à quelques exceptions près. Les suffixes peuvent cependant renseigner: pour un site gouvernemental aux Etats-Unis, le .gov est une garantie, comme le .gouv en France. Le site www.white-house.netn’est donc pas un site officiel.
• Il peut aussi être utile de connaître les TLD des pays lors de recherches spécifiques: .dz pour Algérie, .de pour Allemagne, .us pour Etats-Unis, .ch pour la Suisse etc.
Des suffixes à connaître
• Les DOMAINES principaux sont les suivants
• eu: union européenne
• com : commercial,
• edu : universités et éducation (US, F),
• gov : organismes gouvernementaux (US)
• gouv: organismes gouvernementaux (F)
• int : organisations internationales,
• mil : militaires (US),
• net : réseaux,
• org : ONG. etc
De nouvelles extensions
sont déjà à l’enregistrement
Les suffixes de paysUnion européenne Ailleurs
.at Autriche .dz Algérie
.be Belgique .ch Suisse
.de Allemagne .ca Canada
.dk Danemark .us Etats-Unis
.es Espagne
.fi Finlande
.fr France
.gr Grèce
.it Italie
.nl Pays-bas
.pt Portugal
.se Suède
.uk Royaume-Uni
Les extensions
de format
Pour lire des formats de fichiers particuliers, il faut des
logiciels adaptés.
• Sur www.filext.com, vous trouverez mention des
outils nécessaires à télécharger pour lire les
fichiers.
• .doc
• .rar
• .dat
Qui parle?
• Derrière les noms de domaine se cachent des adresses IP, des providers et des gérants ou locataires de site.
• Il est possible de les identifier voire de les contacter.
• On peut aussi connaître l’historique du site et les autres sites liés à la même adresse IP.
• Avec les sites whois ou domain name, on peut voir la fiche d’identité du site. On peut aussi trouver les sites liés à la même adresse IP. Ce qui peut être utile dans le cadre d’une enquête, par exemple.
• Un journaliste algérien a ainsi identifié les auteurs
d’un site qui était censé donner la parole à des
officiers algériens qui dénonçaient sous couvert
d’anonymat la politique de l’armée, lors des années
de plomb en Algérie. Pour cela, il a utilisé whois…
Le site anp.org s’est révélé être géré
par un islamiste britannique bien connu
des services de renseignement. Il avait
aussi été suspecté par le MI5 d’avoir
été membre du groupe terroriste FIDA.
Retrouver des pages
disparues…
• Après la tentative d’attentat contre le président
Chirac, lors du défilé du 14 juillet 2002,
l’organisation Unité radicale a été dissoute et son
site rendu inaccessible.
Quand une page est censurée ou
inaccessible…
Extrait du site inaccessible quelques temps après la dissolution du
mouvement Unité radicale, suite à l’attentat raté du 14 juillet 2002
contre le président Jacques Chirac.
Ou accéder à des
contenus protégés
Voilà ce qui se
cache derrière
l’identifiant et le mot
de passe qui interdit
aux non membres
de l’organisation de
voir ce qui s’écrit
sur ce site….
Les moteurs
de recherche
Google, roi d’internet
Sites les plus visités Paul Jacionis, 05/2012
Vous aimez Google,
Google vous aime aussi…
Les filtres de bulle
Il y a d’autres moteurs
de recherche efficaces
Une bataille
contre les géants
• Chaque moteur fait remonter des réponses
différentes, selon ses algorythmes spécifiques. Il est
bon d’avoir plusieurs moteurs à sa disposition (dans
les favoris).
• Certains moteurs ont développé des particularités
intéressantes comme Duckduckgo ou Qwant, qui ne
personnalisent pas vos résultats de recherche.
épons
• Chercher des mots polysémiques peut gêner votre
recherche, Duckduckgo vous propose des
définitions pour faire le tri.
• Faites des recherches non personnalisées et sans
vous faire pister.
• Il vous signale les sites officiels.
• Il vous permet de faire de la recherche
collaborative.
• Quelques moteurs sont très innovants comme
million short qui propose de retirer les 10, 100,
1000, 10000, 100 000, 1 million de premières
réponses de la liste qui vous est proposée.
Intéressant pour trouver des enrichissements
originaux sur un sujet.
• C’est un moteur de découverte plutôt que de
recherche, très utile, donc aux esprits curieux
Des moteurs qui savent
chercher de l’info…
On peut aussi trouver des articles publiés
il y a longtemps sur le site grâce à
google news archives
Site
anglophone
Pour des
recherches
d’articles
en anglais
Et des journaux
Sur le site de l’Ifra,
Today’s front page
propose chaque
jour près de 800
Une de journaux
de 80 pays du
monde
Le lien
entre la
Une et
l’article sur
le site du
journal en
ligne est
proposé
On peut accéder au texte de nombreux articles par le lien du site internet
Pour la presse européenne
Possible recherche par auteur
• Certains outils permettent d’analyser l’actualité.
• Avec newsexplorer, on peut voir la timeline d’un
événement ou d’une personnalité. On peut aussi
analyser les liens entre une personne et d’autres
citées dans les articles.
• Avec Google trends et d’autres outils du même
genre, on peut suivre les tendances de recherche
des internautes, de l’actualité et renifler l’air du net.
Des moteurs qui savent
chercher des blogs
Des sites qui répondent à
vos questions
Chercher avec habileté
• Dans l’ordre: une requête Hilton Paris donnera des
réponses sur les hôtels Hilton à Paris. Une
recherche Paris Hilton donnera des réponses sur
l’héritière du fondateur de la chaîne hôtelière, la
bimbo de la jet set.
• guillemets : Qui a dit : la France est un vieux pays
d’immigration.
• Avec les guillemets, le moteur cherchera les pages
qui contiennent TOUS ces mots ET dans cet ordre
exact. Par rapport à la recherche normale, sans
guillemets, près 500 000 résultats qui ne
correspondent pas exactement sont éliminés!
• Ils peuvent aussi servir à imposer la recherche sur
un mot à Google qui a tendance à vous corriger.
Ainsi, si vous connaissiez un michael jacson qui ne
soit pas le roi de la pop, voilà ce qui arriverait…
Et avec les guillemets
Les opérateurs booléens
• ET/AND/ + : permet d’affiner la recherche en
proposant de recouper deux résultats de recherche.
Cet opérateur est souvent inutile car les moteurs
considère par défaut que deux mots dans la fenêtre
de requête signifie et.
• - /SAUF/ AND NOT : missile syrie -russie divise par
deux les résultats de la recherche missile syrie et
permet d’accéder à de infos sur des missiles de
Corée du Nord ou du Hezbollah.
• OU/OR : Missile OR Syrie vous amènera toutes les
pages qui contiennent l’un ou l’autre des termes.
• NEAR : c’est un opérateur de proximité qui permet
de rechercher deux termes quand ils sont proches
dans un texte.
• Attention à la syntaxe des équations de recherche,
une parenthèse mal placée et on obtient des
résultats non pertinents.
• Exemple...
• Quelques autres outils… sur Google
• * : la troncature, permet de trouver des mots de la
même famille à partir de sa racine, ou d’obtenir des
réponses quand on n’est pas sûr de l’orthographe.
• ?: peut remplacer une lettre inconnue.
• $ permet de chercher un objet à un prix
Recherche avancée
• Allintitle: xxxx Permet de limiter les réponses aux
pages dont le titre contient tous les mots
recherchés.
• Intext: xxxx Contraint Google à aller chercher les
textes qui contiennent ce mot et pas un mot proche.
• site:Permet de restreindre vos recherches à
certains sites ou domaines.
• link:Permet de rechercher toutes les pages qui
redirigent vers une page en particulier
• Related: Permet de rechercher des sites similaires
à une adresse Web spécifique.
Cache: Permet de consulter une page telle qu'elle
s'affichait lors de la dernière exploration Google.
• En recherchant les liens qui pointent sur un site, on
peut trouver des groupes, des personnalités, des
institutions qui sont en lien, par référence, par
affinité.
• Cette recherche est très utile dans la phase
« débroussaillage » d’une enquête sur un réseau.
• Domain: xxx permet de sélectionner un type de
suffixe (org, gov, net etc)
• Define: xxxx donne la définition du mot
• Inurl: xxx Dirige la requête dans l’intitulé de l’url.
Permet notamment de chercher les sites d’origine
• Related: www.xxxxx Permet de chercher des sites
similaires
• Xxx Filetype: pdf Recherche les mots uniquement
dans des documents au format pdf.
Rechercher rapidement
parmi une centaine de pages
Sur
PC:
Ctrl F
Sur
Mac:
Cmd F
Les métamoteurs
• Tous les moteurs fonctionnant différemment comme
on l’a vu, pourquoi se priver d’aller chercher sur
plusieurs moteurs en même temps….
Les annuaires
Chercher des personnes
Chercher des livres
Chercher des images
• Vous aimeriez en savoir plus sur une image que
vous avez trouvée sur le Web ? Faites un clic droit
sur cette image pour copier son URL. Ensuite, sur le
site images.google.fr, cliquez sur l'icône
représentant un appareil photo, puis sur "Coller
l'URL de l'image".
• Même processus sur Tineye
Les forums
• Dans une enquête sur les anticorrida, j’ai navigué sur les forums militants avant de rencontrer mes interlocuteurs.
• Dans cette recherche, le forum anticorrida m’a amené à aller regarder le forum vegan, puis celui de l’antispécisme.
• En rencontrant les principaux animateurs des mouvements anticorrida, cela m’inspira deux questions que je n’aurai pas eu l’idée de poser: êtes-vous vegan? Etes-vous antispéciste? Les deux responsables ont répondu oui aux deux questions.
• Ce qui m’amena à faire une recherche sur l’antispécisme, une idéologie antihumaniste qui veut des droits pour les animaux et situe cette émancipation dans la suite de celle des femmes ou des homosexuels.
Les réseaux sociaux
• Les réseaux sociaux peuvent être utilisés de
plusieurs manières par les journalistes.
• Dans la phase de préparation d’un article, d’un
reportage…
• Dans la recherche de contact, de témoins, d’experts
de traducteurs, de fixeurs à l’étranger ou de
documents lors d’un événement…
• Pour contacter ces témoins, ces experts etc.
Les gazouillis
• En septembre dernier, le Point annonce la mort
d’Albert Jacquard. La nouvelle arrive par email d’un
collègue qui suit twitter.
• Pour s’assurer qu’un tweet est vrai, il faut vérifier le
compte de son auteur et remonter la file des tweets.
Le web invisible
invisible
web visible
indexé par les
moteurs
de recherche
web invisible
web profond
• Actuellement : 40-60 % du web est visible.
• Certains documents ne sont pas accessibles aux
moteurs de recherche classiques
• Les moteurs n’indexent que 75 % : plus de
2 milliards de pages
• Cette partie du web n’est pas accessible parce que
les documents sont trop volumineux, dans des
formats non reconnus ou pas indexés ou protégés
par des codes d’entrée.
• Mais elle est très intéressante pour les journalistes,
car elle provient de sources fiables et qualifiées.
Sur le site de la CIA, les gouvernements
de tous les pays du monde mis à jour.
Les agents intelligents
• Un agent intelligent est un logiciel mis au point pour
remplir et automatiser une tâche sur un réseau pour
le compte de son utilisateur.
• C'est un outil synonyme de gain de temps dans la
surveillance et la collecte des informations.
• Il permet de personnaliser sa recherche et
d’accéder au web profond.
• Il sait raisonner et apprendre à partir des
informations qu'il collecte.
• Il peut interagir avec son environnement et d'autres
agents pour accomplir sa tâche.
• https://vimeo.com/58379109
Sur Mac
Cherchez en toute sécurité
• En reportage à l’étranger dans des pays qui
surveillent particulièrement la presse, sur des sujets
d’enquête délicats (drogue, pédophilie, marché des
armes etc), il est nécessaire de travailler à l’abri.
Pour votre protection personnelle et celle de vos
sources.
• https://youtu.be/Yis5FWa1gyI?t=1689
Journalisme 2.0
• Dans une mini-enquête sur les réseaux pro Assad
en Suisse et en France, l’utilisation d’internet a été
capitale pour repérer les groupes qui défendaient le
président syrien.
• Dans une double actualité consacrée aux émeutes
dans le monde arabe suite à la diffusion sur Youtube
d’une vidéo intitulée « L’innocence des
musulmans », nous avons pu le jour même établir
l’origine et les liens des auteurs de la vidéo avec
des fondamentalistes islamophobes. Terry Jones a
ensuite été joint par notre correspondant aux Etats-
Unis. Un très bon exemple de la complémentarité,
recherche web et terrain…
• Autre exemple d’apport essentiel de la recherche
internet, cet article sur l’Etat islamique qui est partie
de l’analyse des documents de l’organisation mis en
ligne (revue, infographie des attentats et
mujatweets).
Après le pull, le push
• Le RSS Real simple syndication est un fil
d’information en push. L’abonné reçoit le fil en
continu. Il permet de visualiser en une ligne une info
et d’accéder à une page internet.
• La plupart des medias propose ce service.
• Des agrégateurs permettent de les regrouper.
• Afin d’avoir une vue globale de ses fils RSS, il faut
un agrégateur comme netvibes ou onemoretab.
• Dans les deux cas, on peut choisir les fils à intégrer.
• Sur netvibes, on peut aussi insérer ses pages
facebook, twitter, etc.
• Et bien d’autres sources web : pour des revues de
presse, la veille etc.
• Indispensable…
• Sur un feuilleton d’actualités, une enquête, ou
quand on est un journaliste spécialisé (locale,
sciences, économie, culture etc), il est
indispensable de mettre en place une veille.
• Google alerts par exemple, vous envoie un mail
pour vous signaler un contenu internet qui
comprend le mot que vous avez entré comme
alerte.
Les newsletters
Chercher des stats
Datajournalisme
• Le journalisme de données est un processus
journalistique basé sur l'analyse et le filtrage, à
l'aide d'outils open source, d'ensembles de données
volumineux, disponibles librement en ligne.
• Il utilise des données de « littérature grise ».
• L'objectif est de révéler une information
journalistique cachées au milieu de données.
• Le rapport entre les données et le texte permet des
développements pertinents et d’écrie des histoires
inédites, vérifiables, crédibles.
Pour se tenir au courant des publications data
• Un bon exemple du travail de datajournalisme, la
preuve par les données de la collusion entre des
décideurs de marché public et des entreprises
privées publié par le Matin dimanche.
• La plate-forme SIMAP recense tous les marchés
publics. En recoupant les 1745 mandats fédéraux
accordés à des entreprises entre 2009 et 2012 avec
la liste des cadres des entreprises et des offices
concernés pendant une période plus large, on
obtient un certain nombre de correspondances qui
montre d’évidence qu’il y a du copinage.
Enquête réalisée à partir de données accessibles sur internet :
www.admintrips.ch
Les rédactions intégrées
• Le tweet comme info flash, lead d’agence
• Le blog comme analyse, billet, analyse
• Les images, vidéo comme illustration, interview
• Les définitions, données chiffrées, schéma comme
enrichissements rédactionnels.
• Les réseaux sociaux comme témoignages et parole
d’experts
• Les données comme base d’enquête et
datajournalisme
• Le web doc comme dossier
• Galerie photos, interviews vidéo,
webdocumentaires: des formats du webjournalisme
qui passe par les images comme par le texte.
Galerie
photos
Itv vidéo
Le web documentaire utilise tous les matériaux
journalistiques, texte, photos, infographie, vidéos.
Newsresourcer,
un nouveau métier?