Surfer en journaliste Cours 2015

Preview:

Citation preview

Surfer en

journaliste

Master de journalisme EJDG

Olivier Bot

Evolution du nombre d’utilisateurs d’internet dans le monde

• L’interconnexion du monde nous ouvre la possibilité

de joindre toutes sortes d’interlocuteurs un peu

partout sur la planète.

• Le développement d’internet n’est pas un

phénomène qui touche seulement le monde

industrialisé. Même si internet n’est pas aussi

répandu ailleurs, il suit la même courbe de

progression.

• Les contenus sur internet suivent une courbe

exponentielle et les modes de participation au web

se multiplient.

• Il est donc de plus en plus nécessaire de faire le tri,

de hiérarchiser ses propres sources sur internet et

d’utiliser les outils adéquats dans vos recherches.

• Huit journalistes sur dix déclarent qu’internet a changé leur manière de travailler.

• L’accélération du rythme de production de l’information provoquée par internet doit nous rendre encore plus rigoureux dans le recoupement des informations.

• Internet se prête facilement au journalisme de petites phrases ou people. Au détriment de la qualité de l’information.

• Les rédacteurs ignorent souvent les possibilités d’approfondir l’information offertes par internet.

• Le journalisme est un artisanat et internet peut devenir une boîte à outils pour trouver ou enrichir des contenus.

Surfer en

journaliste

« Pour un bon tuyau,

demandez

à vos sources

plutôt qu’à Google »

Les bornes

de la recherche

sur internet

• La recherche sur internet à deux bornes: le silence

et le bruit lorsque les requêtes sont trop pointues ou

trop larges.

• Comme dans le monde réel, deux risques guettent

le journaliste dans sa recherche sur internet: le

ratage et le suivisme.

Les pièges du web

• Internet n’est ni la panacée, ni l’enfer

Il doit susciter chez vous un surcroît de vigilance, voire de méfiance

• La recherche intuitive ou aléatoire prend beaucoup de temps.

Avant d’y passer des heures, pensez à ce que voulez trouver

Surfer en journaliste

• Les critères de recevabilité d’une info sont les

mêmes que dans la vie réelle: authenticité,

crédibilité, fiabilité.

• Une info obtenue sur internet ne se recoupe pas

sur internet. Elle se recoupe auprès d’une

source réelle. Car le Web fonctionne par reprise en

boucle des contenus.

Ayez du bon

sens!Cultivez-vous!

• Sur internet, on ne sait pas toujours à qui l’on a à faire.

• Le net colporte de nombreuses rumeurs et théories complotistes.

• Il y aussi des faux.

• Et des sites qui se font passer pour des sites officiels.

• Il faut donc apprendre à reconnaître une rumeur, les sites complotistes, les faux et les sites « faux-semblants ».

• De nombreux sites très fréquentés ou prestigieux

sont détournés pour des motifs divers: parodie,

tromperie, critique.

• Le design, la syntaxe de la langue, l’orthographe

sont bien souvent de meilleurs indices que l’intitulé

du site et son url. Néanmoins, les adresses de sites

(qui sont commercialisées sans restriction aucune),

peuvent aussi fournir des indices utiles.

• Il faut donc apprendre à les déchiffrer.

Rumeurs, fake et théories

complotistes

• Ayez à l’esprit, que sur internet, quand c’est trop

beau, c’est peut-être faux.

• Pour déjouer les pièges d’internet, essayez toujours

de retourner à la source

Reconnaître une rumeur

• Les rumeurs sont des récits présentés comme vrais

qui présentent de nombreuses variantes. Leur

source se perd dans des sables mouvants.

• Elles expriment des peurs contemporaines, des

tabous ou des histoires de comble.

• Quatre grandes familles de rumeurs ont été

identifiées par les sociologues.

• La première étude a été réalisée par Edgar Morin

sur la rumeur d’Orléans: la disparition de femmes

dans les cabines d’essayage d’un grand magasin.

Cette rumeur exprimait un antisémitisme latent dans

cette ville moyenne du centre de la France. Le

propriétaire du magasin était juif.

• Les rumeurs alimentaires: pizza à l’urine, sauce blanche au sperme des kebabs, hamburgers à l’araignée, la souris dans le coca etc.

• Les rumeurs technologiques: la persistance rétinienne des morts assassinés (comme dans « 4 mouches de velours gris »,le film de Dario Argento), le nageur avalé par un Canadair, le strip-tease de sa copine envoyé automatiquement sur internet (comme dans « American Pie ») etc.

• Les peurs criminelles: le LSD en tatouage pour les enfants, le hangar qui cache un site nucléaire…

• Le retour du sauvage: les panthères noires, le crocodile dans les toilettes…

• Le surnaturel: les dames blanches, Nostradamus qui aurait prévu le 11 septembre, etc.

• Une rumeur ne peut se contredire qu’en posant la

question à un spécialiste.

Exemple: Un pilote de Canadair vous dira que

la buse qui pompe l’eau dans un lac ne peut avaler un

plongeur. Son diamètre est trop modeste.

Un toxicologue vous dira que le LSD ne se diffuse pas

par les pores de la peau .

Les théories complotistes

Ebola

et le MH370

Les théories complotistes

s’attachent aux drames et au

mystère.

Reconnaître un site

• En faisant une recherche simple « white house »,

les moteurs font remonter le site de la Maison-

Blanche en tête.

• Mais une recherche avec un suffixe .net ou .org

affiche d’autres réponses.

• Un exemple des sites qui veulent tromper leurs

visiteurs.

• Comment éviter de se faire piéger?

Décrypter

une URL

Pourquoi décoder

une adresse internet?

• Il faut s'interroger sur la source de tout document trouvé sur Internet

• Apprendre à remettre une page Web dans son contexte

• Identifier des critères de crédibilité de l'information et les intentions des émetteurs

• Situer la hiérarchie sur le site de l’information trouvée

• Mais attention, l’url n’est pas une garantie d’authenticité

• Décoder une adresse peut aussi être servir d’outil de recherche

• En déchiffrant une adresse, on peut la tester

• L'adresse d'un site (URL) donne de nombreuses informations d'un seul coup d'oeil (si l'URL n'est pas écrite, il suffit de pointer la souris sur le lien, l'URL apparaît en bas du navigateur).

• protocole://site.hébergeur.tld/domaine/ sous-domaine/répertoire/document.format

• protocole://Protocole utilisé pour le dialogue entre les différentes machines connectées. http est le protocole utilisé pour les pages Web. Il existe d'autres protocoles (par exemple FTP pour les téléchargements...).

• site.hébergeur.tld Nom du site qui peut être différent de l’hébergeur. Un nom de domaine se lit de droite à gauche, à partir du nom de domaine supérieur hébergeur vers le nom de la machine serveur.

Déchiffrez cette adresse

• ftp://urfist.enc.sorbonne.fr/veille-et-

recherche/ateliers/les-boudoirs-de-

lhistorienne/seance-du-18-mai-2015-bibliotheques-

numerique.pdf

Connaître les TLD

• La connaissance des suffixes de sites ou top leveldomain (TLD) peut être utile mais cela ne suffit pas. Les noms de domaine sont en effet libres à l’acquisition. Aucune législation ne les réglemente pour l’instant.

• Ils n’offrent aucune garantie à quelques exceptions près. Les suffixes peuvent cependant renseigner: pour un site gouvernemental aux Etats-Unis, le .gov est une garantie, comme le .gouv en France. Le site www.white-house.netn’est donc pas un site officiel.

• Il peut aussi être utile de connaître les TLD des pays lors de recherches spécifiques: .dz pour Algérie, .de pour Allemagne, .us pour Etats-Unis, .ch pour la Suisse etc.

Des suffixes à connaître

• Les DOMAINES principaux sont les suivants

• eu: union européenne

• com : commercial,

• edu : universités et éducation (US, F),

• gov : organismes gouvernementaux (US)

• gouv: organismes gouvernementaux (F)

• int : organisations internationales,

• mil : militaires (US),

• net : réseaux,

• org : ONG. etc

De nouvelles extensions

sont déjà à l’enregistrement

Les suffixes de paysUnion européenne Ailleurs

.at Autriche .dz Algérie

.be Belgique .ch Suisse

.de Allemagne .ca Canada

.dk Danemark .us Etats-Unis

.es Espagne

.fi Finlande

.fr France

.gr Grèce

.it Italie

.nl Pays-bas

.pt Portugal

.se Suède

.uk Royaume-Uni

Les extensions

de format

Pour lire des formats de fichiers particuliers, il faut des

logiciels adaptés.

• Sur www.filext.com, vous trouverez mention des

outils nécessaires à télécharger pour lire les

fichiers.

• .doc

• .pdf

• .rar

• .dat

Qui parle?

• Derrière les noms de domaine se cachent des adresses IP, des providers et des gérants ou locataires de site.

• Il est possible de les identifier voire de les contacter.

• On peut aussi connaître l’historique du site et les autres sites liés à la même adresse IP.

• Avec les sites whois ou domain name, on peut voir la fiche d’identité du site. On peut aussi trouver les sites liés à la même adresse IP. Ce qui peut être utile dans le cadre d’une enquête, par exemple.

• Un journaliste algérien a ainsi identifié les auteurs

d’un site qui était censé donner la parole à des

officiers algériens qui dénonçaient sous couvert

d’anonymat la politique de l’armée, lors des années

de plomb en Algérie. Pour cela, il a utilisé whois…

Le site anp.org s’est révélé être géré

par un islamiste britannique bien connu

des services de renseignement. Il avait

aussi été suspecté par le MI5 d’avoir

été membre du groupe terroriste FIDA.

Retrouver des pages

disparues…

• Après la tentative d’attentat contre le président

Chirac, lors du défilé du 14 juillet 2002,

l’organisation Unité radicale a été dissoute et son

site rendu inaccessible.

Quand une page est censurée ou

inaccessible…

Extrait du site inaccessible quelques temps après la dissolution du

mouvement Unité radicale, suite à l’attentat raté du 14 juillet 2002

contre le président Jacques Chirac.

Ou accéder à des

contenus protégés

Voilà ce qui se

cache derrière

l’identifiant et le mot

de passe qui interdit

aux non membres

de l’organisation de

voir ce qui s’écrit

sur ce site….

Les moteurs

de recherche

Google, roi d’internet

Sites les plus visités Paul Jacionis, 05/2012

Vous aimez Google,

Google vous aime aussi…

Les filtres de bulle

Il y a d’autres moteurs

de recherche efficaces

Une bataille

contre les géants

• Chaque moteur fait remonter des réponses

différentes, selon ses algorythmes spécifiques. Il est

bon d’avoir plusieurs moteurs à sa disposition (dans

les favoris).

• Certains moteurs ont développé des particularités

intéressantes comme Duckduckgo ou Qwant, qui ne

personnalisent pas vos résultats de recherche.

épons

• Chercher des mots polysémiques peut gêner votre

recherche, Duckduckgo vous propose des

définitions pour faire le tri.

• Faites des recherches non personnalisées et sans

vous faire pister.

• Il vous signale les sites officiels.

• Il vous permet de faire de la recherche

collaborative.

• Quelques moteurs sont très innovants comme

million short qui propose de retirer les 10, 100,

1000, 10000, 100 000, 1 million de premières

réponses de la liste qui vous est proposée.

Intéressant pour trouver des enrichissements

originaux sur un sujet.

• C’est un moteur de découverte plutôt que de

recherche, très utile, donc aux esprits curieux

Des moteurs qui savent

chercher de l’info…

On peut aussi trouver des articles publiés

il y a longtemps sur le site grâce à

google news archives

Site

anglophone

Pour des

recherches

d’articles

en anglais

Et des journaux

Sur le site de l’Ifra,

Today’s front page

propose chaque

jour près de 800

Une de journaux

de 80 pays du

monde

Le lien

entre la

Une et

l’article sur

le site du

journal en

ligne est

proposé

On peut accéder au texte de nombreux articles par le lien du site internet

Pour la presse européenne

Possible recherche par auteur

• Certains outils permettent d’analyser l’actualité.

• Avec newsexplorer, on peut voir la timeline d’un

événement ou d’une personnalité. On peut aussi

analyser les liens entre une personne et d’autres

citées dans les articles.

• Avec Google trends et d’autres outils du même

genre, on peut suivre les tendances de recherche

des internautes, de l’actualité et renifler l’air du net.

Des moteurs qui savent

chercher des blogs

Des sites qui répondent à

vos questions

Chercher avec habileté

• Dans l’ordre: une requête Hilton Paris donnera des

réponses sur les hôtels Hilton à Paris. Une

recherche Paris Hilton donnera des réponses sur

l’héritière du fondateur de la chaîne hôtelière, la

bimbo de la jet set.

• guillemets : Qui a dit : la France est un vieux pays

d’immigration.

• Avec les guillemets, le moteur cherchera les pages

qui contiennent TOUS ces mots ET dans cet ordre

exact. Par rapport à la recherche normale, sans

guillemets, près 500 000 résultats qui ne

correspondent pas exactement sont éliminés!

• Ils peuvent aussi servir à imposer la recherche sur

un mot à Google qui a tendance à vous corriger.

Ainsi, si vous connaissiez un michael jacson qui ne

soit pas le roi de la pop, voilà ce qui arriverait…

Et avec les guillemets

Les opérateurs booléens

• ET/AND/ + : permet d’affiner la recherche en

proposant de recouper deux résultats de recherche.

Cet opérateur est souvent inutile car les moteurs

considère par défaut que deux mots dans la fenêtre

de requête signifie et.

• - /SAUF/ AND NOT : missile syrie -russie divise par

deux les résultats de la recherche missile syrie et

permet d’accéder à de infos sur des missiles de

Corée du Nord ou du Hezbollah.

• OU/OR : Missile OR Syrie vous amènera toutes les

pages qui contiennent l’un ou l’autre des termes.

• NEAR : c’est un opérateur de proximité qui permet

de rechercher deux termes quand ils sont proches

dans un texte.

• Attention à la syntaxe des équations de recherche,

une parenthèse mal placée et on obtient des

résultats non pertinents.

• Exemple...

• Quelques autres outils… sur Google

• * : la troncature, permet de trouver des mots de la

même famille à partir de sa racine, ou d’obtenir des

réponses quand on n’est pas sûr de l’orthographe.

• ?: peut remplacer une lettre inconnue.

• $ permet de chercher un objet à un prix

Recherche avancée

• Allintitle: xxxx Permet de limiter les réponses aux

pages dont le titre contient tous les mots

recherchés.

• Intext: xxxx Contraint Google à aller chercher les

textes qui contiennent ce mot et pas un mot proche.

• site:Permet de restreindre vos recherches à

certains sites ou domaines.

• link:Permet de rechercher toutes les pages qui

redirigent vers une page en particulier

• Related: Permet de rechercher des sites similaires

à une adresse Web spécifique.

Cache: Permet de consulter une page telle qu'elle

s'affichait lors de la dernière exploration Google.

• En recherchant les liens qui pointent sur un site, on

peut trouver des groupes, des personnalités, des

institutions qui sont en lien, par référence, par

affinité.

• Cette recherche est très utile dans la phase

« débroussaillage » d’une enquête sur un réseau.

• Domain: xxx permet de sélectionner un type de

suffixe (org, gov, net etc)

• Define: xxxx donne la définition du mot

• Inurl: xxx Dirige la requête dans l’intitulé de l’url.

Permet notamment de chercher les sites d’origine

• Related: www.xxxxx Permet de chercher des sites

similaires

• Xxx Filetype: pdf Recherche les mots uniquement

dans des documents au format pdf.

Rechercher rapidement

parmi une centaine de pages

Sur

PC:

Ctrl F

Sur

Mac:

Cmd F

Les métamoteurs

• Tous les moteurs fonctionnant différemment comme

on l’a vu, pourquoi se priver d’aller chercher sur

plusieurs moteurs en même temps….

Les annuaires

Chercher des personnes

Chercher des livres

Chercher des images

• Vous aimeriez en savoir plus sur une image que

vous avez trouvée sur le Web ? Faites un clic droit

sur cette image pour copier son URL. Ensuite, sur le

site images.google.fr, cliquez sur l'icône

représentant un appareil photo, puis sur "Coller

l'URL de l'image".

• Même processus sur Tineye

Les forums

• Dans une enquête sur les anticorrida, j’ai navigué sur les forums militants avant de rencontrer mes interlocuteurs.

• Dans cette recherche, le forum anticorrida m’a amené à aller regarder le forum vegan, puis celui de l’antispécisme.

• En rencontrant les principaux animateurs des mouvements anticorrida, cela m’inspira deux questions que je n’aurai pas eu l’idée de poser: êtes-vous vegan? Etes-vous antispéciste? Les deux responsables ont répondu oui aux deux questions.

• Ce qui m’amena à faire une recherche sur l’antispécisme, une idéologie antihumaniste qui veut des droits pour les animaux et situe cette émancipation dans la suite de celle des femmes ou des homosexuels.

Les réseaux sociaux

• Les réseaux sociaux peuvent être utilisés de

plusieurs manières par les journalistes.

• Dans la phase de préparation d’un article, d’un

reportage…

• Dans la recherche de contact, de témoins, d’experts

de traducteurs, de fixeurs à l’étranger ou de

documents lors d’un événement…

• Pour contacter ces témoins, ces experts etc.

Les gazouillis

• En septembre dernier, le Point annonce la mort

d’Albert Jacquard. La nouvelle arrive par email d’un

collègue qui suit twitter.

• Pour s’assurer qu’un tweet est vrai, il faut vérifier le

compte de son auteur et remonter la file des tweets.

Le web invisible

invisible

web visible

indexé par les

moteurs

de recherche

web invisible

web profond

• Actuellement : 40-60 % du web est visible.

• Certains documents ne sont pas accessibles aux

moteurs de recherche classiques

• Les moteurs n’indexent que 75 % : plus de

2 milliards de pages

• Cette partie du web n’est pas accessible parce que

les documents sont trop volumineux, dans des

formats non reconnus ou pas indexés ou protégés

par des codes d’entrée.

• Mais elle est très intéressante pour les journalistes,

car elle provient de sources fiables et qualifiées.

Sur le site de la CIA, les gouvernements

de tous les pays du monde mis à jour.

Les agents intelligents

• Un agent intelligent est un logiciel mis au point pour

remplir et automatiser une tâche sur un réseau pour

le compte de son utilisateur.

• C'est un outil synonyme de gain de temps dans la

surveillance et la collecte des informations.

• Il permet de personnaliser sa recherche et

d’accéder au web profond.

• Il sait raisonner et apprendre à partir des

informations qu'il collecte.

• Il peut interagir avec son environnement et d'autres

agents pour accomplir sa tâche.

• https://vimeo.com/58379109

Sur Mac

Cherchez en toute sécurité

• En reportage à l’étranger dans des pays qui

surveillent particulièrement la presse, sur des sujets

d’enquête délicats (drogue, pédophilie, marché des

armes etc), il est nécessaire de travailler à l’abri.

Pour votre protection personnelle et celle de vos

sources.

• https://youtu.be/Yis5FWa1gyI?t=1689

Journalisme 2.0

• Dans une mini-enquête sur les réseaux pro Assad

en Suisse et en France, l’utilisation d’internet a été

capitale pour repérer les groupes qui défendaient le

président syrien.

• Dans une double actualité consacrée aux émeutes

dans le monde arabe suite à la diffusion sur Youtube

d’une vidéo intitulée « L’innocence des

musulmans », nous avons pu le jour même établir

l’origine et les liens des auteurs de la vidéo avec

des fondamentalistes islamophobes. Terry Jones a

ensuite été joint par notre correspondant aux Etats-

Unis. Un très bon exemple de la complémentarité,

recherche web et terrain…

• Autre exemple d’apport essentiel de la recherche

internet, cet article sur l’Etat islamique qui est partie

de l’analyse des documents de l’organisation mis en

ligne (revue, infographie des attentats et

mujatweets).

Après le pull, le push

• Le RSS Real simple syndication est un fil

d’information en push. L’abonné reçoit le fil en

continu. Il permet de visualiser en une ligne une info

et d’accéder à une page internet.

• La plupart des medias propose ce service.

• Des agrégateurs permettent de les regrouper.

• Afin d’avoir une vue globale de ses fils RSS, il faut

un agrégateur comme netvibes ou onemoretab.

• Dans les deux cas, on peut choisir les fils à intégrer.

• Sur netvibes, on peut aussi insérer ses pages

facebook, twitter, etc.

• Et bien d’autres sources web : pour des revues de

presse, la veille etc.

• Indispensable…

• Sur un feuilleton d’actualités, une enquête, ou

quand on est un journaliste spécialisé (locale,

sciences, économie, culture etc), il est

indispensable de mettre en place une veille.

• Google alerts par exemple, vous envoie un mail

pour vous signaler un contenu internet qui

comprend le mot que vous avez entré comme

alerte.

Les newsletters

Chercher des stats

Datajournalisme

• Le journalisme de données est un processus

journalistique basé sur l'analyse et le filtrage, à

l'aide d'outils open source, d'ensembles de données

volumineux, disponibles librement en ligne.

• Il utilise des données de « littérature grise ».

• L'objectif est de révéler une information

journalistique cachées au milieu de données.

• Le rapport entre les données et le texte permet des

développements pertinents et d’écrie des histoires

inédites, vérifiables, crédibles.

Pour se tenir au courant des publications data

• Un bon exemple du travail de datajournalisme, la

preuve par les données de la collusion entre des

décideurs de marché public et des entreprises

privées publié par le Matin dimanche.

• La plate-forme SIMAP recense tous les marchés

publics. En recoupant les 1745 mandats fédéraux

accordés à des entreprises entre 2009 et 2012 avec

la liste des cadres des entreprises et des offices

concernés pendant une période plus large, on

obtient un certain nombre de correspondances qui

montre d’évidence qu’il y a du copinage.

Enquête réalisée à partir de données accessibles sur internet :

www.admintrips.ch

Les rédactions intégrées

• Le tweet comme info flash, lead d’agence

• Le blog comme analyse, billet, analyse

• Les images, vidéo comme illustration, interview

• Les définitions, données chiffrées, schéma comme

enrichissements rédactionnels.

• Les réseaux sociaux comme témoignages et parole

d’experts

• Les données comme base d’enquête et

datajournalisme

• Le web doc comme dossier

• Galerie photos, interviews vidéo,

webdocumentaires: des formats du webjournalisme

qui passe par les images comme par le texte.

Galerie

photos

Itv vidéo

Le web documentaire utilise tous les matériaux

journalistiques, texte, photos, infographie, vidéos.

Newsresourcer,

un nouveau métier?

Recommended