Maths pour Journalistes Montréal HackJournalisme, juin 2013

Preview:

Citation preview

Maths pour JournalistesMontréal HackJournalisme,

juin 2013

Des chiffres et des lettres"Statistically untrained journalists are watchdogs

without olfactory cells; they’ll catch wrongdoing when it’s visible, but they lack the skill to sniff a sour deal." -Columbia Journalism Review

Les journalistes qui ne savent pas compter sont des chiens de garde sans odorat... 

Statistiques Mode : Le mode est la valeur la plus fréquente dans un échantillon.

Médiane : la médiane est un nombre qui divise en 2 parties la population telle que chaque partie contient le même nombre de valeurs.

Dans la même logique, il y a les quartiles, déciles et centiles, qui divisent respectivement en 4, 10 et 100 la population.

Moyenne : La moyenne arithmétique est la somme des valeurs de la variable divisée par le nombre d’individus.

La variance : La variance est la moyenne des carrés des écarts à la moyenne.

L’écart-type : c’est la racine carrée de la variance.

 

http://blocnotes.iergo.fr/breve/mode-mediane-moyenne-variance-et-ecart-type/

Stats Au resto, 10 personnes. Leur argent de poche :

 

5, 5, 10, 10, 10, 10, 15, 15, 20 et 500 dollars

 

Mode 10

Médiane 10

Moyenne 60

 

« La moyenne est de 60 $ avec un écart moyen de 154 $ » 

 

Stats:Ça ne veut rien dire, il faut enlever l’extrême,

soit les 500 $.

 

Mode = 10 $

Médiane = 10 $

Moyenne = 11,1 $

Écart-type = 4,8 $

Les écarts-types C’est la moyenne des moyennes,

essentiellement.

C’est une donnée qui permet d’avoir une idée de la diversité des résultats calculés.

ET 1 : 68 % des résultats

ET 2 : 95 %

ET 3 : 99 %

ProbabilitésVous avez 23 amis. Quelle est la probabilité que

deux d’entre eux célèbrent leur anniversaire le même jour et que, par conséquent, vous ne puissiez aller à l’un des deux anniversaires ?

ProbabilitésRéponse : 54 %

364/365 * 363/365 … 342/365 = 46 %, donc 54 % de chances que deux personnes soient nées le même jour.

Les sondages http://www.lapresse.ca/actualites/dossiers/

conflit-etudiant/201205/18/01-4526881-sondage-crop-la-presse-les-quebecois-en-faveur-de-la-ligne-dure.php?utm_categorieinterne=trafficdrivers&utm_contenuinterne=cyberpresse_vous_suggere_4526937_article_POS1

Des enquêtes en ligne pour les statistiques officielles ?

Peut-on utiliser les enquêtes en ligne reposant sur le principe de l’autosélection pour recueillir les données pour les besoins des statistiques officielles ?

L’examen des graves problèmes méthodologiques abordés à la section 2 nous amène à conclure qu’il est très difficile, sinon impossible, de faire une inférence valide au sujet de la population étudiée.

L’autosélection risque d’entraîner un biais dans les estimations des caractéristiques de la population. Ce risque ressemble à l’effet de la non-réponse dans les enquêtes reposant sur l’échantillonnage probabiliste traditionnel, mais nous avons montré que dans les enquêtes reposant sur le principe de l’autosélection, le biais pouvait s’avérer beaucoup plus important.

 

http://www.statcan.gc.ca/pub/11-522-x/2008000/article/10989-fra.pdf

Y a-t-il des changements dans l’opinion ?

S'il la différence entre les deux sondages est inférieure à leurs marges d'erreur respectives, la différence n'est probablement pas significative et ne doit pas être considérée comme un « changement ».

 

S'il y a une différence entre les deux sondages est supérieur à 1,5 fois la marge d'erreur pour les deux, il est presque toujours significatif et peut être en toute confiance classé comme un «changement» .

Les marges d’erreurDans un sondage, le nombre de personnes

interrogées ne sert qu’à une chose : déterminer la marge d’erreur. Celle-ci est à peine modifiée par le fait d’interroger 1000 ou 1001 personnes. la précision exacte du nombre de personnes interrogées, ici, sert donc beaucoup plus à établir la conviction de scientificité qu’à informer réellement.

Erreurs… - Parlons-en, d’ailleurs, de la marge d’erreur. Elle correspond, dans un

sondage, au premier type d’erreur, l’erreur statistique. Celle-ci provient du phénomène suivant. Supposez une urne remplie de 10000 boules, 6000 rouges et 4000 jaunes. Vous prélevez un échantillon aléatoire de 10 boules dans cette urne.

Votre échantillon peut reproduire la répartition de la population (6 boules rouges et 4 jaunes). Mais il y a de fortes chances de tomber sur un échantillon différent de la population (par exemple, 7 rouges et 3 jaunes, ou même 10 rouges et zéro jaunes).

Par contre, plus votre échantillon est grand, plus le risque d’obtenir un échantillon très différent de la population diminue.

http://owni.fr/2010/10/24/manifs-cannabis-foot-et-autres-mauvais-usages-des-statistiques/

Pourcentage c. points de pourcentage

Titre: "Les taux d'intérêt passent de 10% à 12% »

Est-ce: 10/12, soit une hausse de 20% ou une hausse de 2%? Est-ce 20% ou 2%?

 

Correctement parlant, c'était une hausse de 20%, parce que «%» est un rapport entre deux valeurs (la nouvelle valeur divisée par l'ancienne valeur).

 

Cependant, les personnes ayant des prêts immobiliers peuvent penser que vous voulez dire que les taux d'intérêt sont passés de 10% à 30%.

 

Ainsi, l'alternative consiste à dire que c'était une hausse de 2 points de pourcentage. une augmentation de 20% une hausse de 2 points de pourcentage

Ça double ou triple?100 %

200 %

300 %

If you believe in data, try to let it speak before you slap on your own mood or your beliefs or your own expectation.

 

- Michael Blastland

http://www.journalism.co.uk/skills/how-to-report-numbers-in-the-news/s7/a547659/

Recommended