12
Indicateurs statistiques de fraude électorale Ph. Guglielmetti, CEC, 10 mai 2015

Indicateurs statistiques de fraude électorale

Embed Size (px)

Citation preview

Page 1: Indicateurs statistiques de fraude électorale

Indicateurs statistiques de fraude électorale

Ph. Guglielmetti, CEC, 10 mai 2015

Page 2: Indicateurs statistiques de fraude électorale

Indicateurs statistiques de fraude électorale

1. Loi de Benford2. Modèle binomial robuste surdispersé3. Autre indicateur4. Propositions

Page 3: Indicateurs statistiques de fraude électorale

1. Loi de Benford

● Surprenant : en mesurant de nombreuses choses dans la nature, les nombres commencent plus souvent par 1 que par 2 etc. jusqu’à 9

● Exemples : population des pays ou longueur des fleuves

● C’est vrai aussi pour le deuxième digit

Page 4: Indicateurs statistiques de fraude électorale

Test statistique “Loi de Benford”

● Pour la détection de fraude on utilise le 2ème digit, car trop de locaux ont ~ 1000 votants

● le “ test du χ² ” vérifie si le deuxième chiffre du nombre de oui / non des locaux de vote obéit à la loi de Benford

● si le résultat est < 16.92 on est sur à 95% que oui

Page 5: Indicateurs statistiques de fraude électorale

Critique du test de Benford

Si le résultat est > 16.92 on ne sait pas grand chose car:1. ça arrive “normalement” dans

5% des cas2. on ne sait pas quel(s) bureau(x)

de vote sont concernésLa validité du test est fortement contestée dans la littérature lorsqu’il y a peu de bureaux de taille trop similaire

Seule cas de fraude que ce test est vraiment capable de détecter:

Si quelqu’un génère les résultats à l’aide de la fonction RAND() d’Excel au lieu d’utiliser POWER(10;RAND()) / 10

Ah zut je l’ai dit…Donc ce test est désormais inutile.

Page 6: Indicateurs statistiques de fraude électorale

2. Modèle binomial robuste surdispersé

1. On a comparé les votes OUI / NON (binomial) des communes pendant 10 ans

2. On a construit un “modèle robuste” de ces relations selon deux “variables indépendantes”

vote comme

A B C D

A 100% 80% 12% 3%

B 80% 100% 36% 22%

C 12% 36% 100% 42%

D 3% 22% 42% 100%

A

BC

D

Page 7: Indicateurs statistiques de fraude électorale

( Politique à 2 dimensions )

1. Représentation de plus en plus courante en analyse politique

2. http://smartvote.ch/

3. “Wie sich die SVP aus dem Bürgerblock verabschiedet hat” Tages Anzeiger, 21. April 2014 http://sotomo.ch/

Page 8: Indicateurs statistiques de fraude électorale

Modèle binomial robuste surdispersé

3. Le modèle permet de prévoir les résultats dans une commune d’après les résultats dans les autres (surdispersion):

A B C D

OUI 48% ? 80% 52%

A

BC

D

Oui

Page 9: Indicateurs statistiques de fraude électorale

Modèle binomial robuste surdispersé

4. Les poids mesurent la correspondance avec la tendance générale.

5. Les résidus sont les écarts entre le résultat réel et celui prévu par le modèle.

Page 10: Indicateurs statistiques de fraude électorale

Critique du MBRS

1. “Effectivement, les modèlesavec surdispersion sont une très bonne idée !!” (Arthur Charpentier, prof de stats Montréalhttp://freakonometrics.hypotheses.org/12142

2. “Lorsque l'objet concerne des questions d'ordre géographique, les profils ne seront peut-être pas suffisants pour expliquer les résultats.”

3. Le modèle a été établi sur 10 années (199x-200x)Comment le remettre à jour ? Faut-il le faire en permanence ?

Page 11: Indicateurs statistiques de fraude électorale

Autre indicateur de détection de fraude

● Klimek & all (2012). It’s not the voting that’s democracy, it’s the counting: Statistical detection of systematic election irregularities 10.1073/pnas.1210722109

● La participation est une donnée disponible et importante

Page 12: Indicateurs statistiques de fraude électorale

Propositions

1. Représenter les résultats du MBRS en couleur sur une carte du Canton

2. Ajouter les graphiques résultat / participation

3. (Supprimer Benford)

4. Etudier comment “resetter” ou faire évoluer le MBRS