Synthèse du bloc 3 Eugénie Dostie-Goulet

+Synthèse du bloc 3

Eugénie Dostie-Goulet

Plan de la présentationPourquoi des statistiques?InférenceLe tableau croisé et le chi2La corrélation de PearsonLa régression linéaire (MCO)La régression logistique

+Pourquoi des statistiques?

Permet de vérifier les a priori, d’aller au-delà des préconceptions.

Paul Lazarsfeld: « Puisque toute espèce de réaction humaine est concevable, il est d’une grande importance de savoir quelles réactions se produisent en fait le plus fréquemment et dans quelles conditions. Alors seulement, la science sociale peut aller plus loin ».

+La réflexion théorique

Il est essentiel de saisir les arguments théoriques et les débats qui s’y trouvent avant de se lancer dans des analyses statistiques trop poussées.

La littérature nous aide (parfois même est essentielle) pour: • La formulation de la problématique• La revue de littérature sur la question qu’on étudie• La justification de notre hypothèse et nos attentes• La justification des variables contrôle• L’explication entourant les résultats obtenus

(particulièrement si ça va dans un sens contraire à nos attentes)

+La banque de données, les variables

1952 Montréalais âgés de 19 à 31 ans (2007)

Quelles sont les caractéristiques des Montréalais qui ont déjà participé à une manifestation?• Y1 : manifestation (1/0) ; 42% ont déjà manifesté• Y2 : information ( 0 à 10) ; moyenne : 6.07 • X1 : scolarité (trois dichotomiques)

• Primaire/secondaire (26%)

• Cégep (38%)

• Université (36%) >> catégorie de référence.

• X2 : habite à Montréal depuis au moins 5 ans (1/0) ; 21%• X3 : intérêt politique (0 à 10) ; moyenne : 5.71

+Les bases de l’inférence

À 95% de certitude: μ = x ± 1,96 sx où sx = s/√n

À 99% de certitude: μ = x ± 2,58 sx où sx = s/√n

u = moyenne de la populationx = moyenne de l’échantillonsx = écart-type de la distribution d’échantillonnages = écart-type de l’échantillon

Tous les éléments de la formule affectent l’ampleur de l’intervalle: 1)Le niveau de confiance: plus on veut être confiant, plus grand sera l’intervalle (et moins l’estimation sera précise2)L’écart-type de l’échantillon: plus il y a de dispersion, plus grand sera l’intervalle (et moins l’estimation sera précise)3)La taille de l’échantillon: plus grand est l’échantillon, plus petit sera l’intervalle (et plus l’estimation sera précise)

+Le tableau croisé

Lorsqu’on travaille avec des données quantitatives, le tableau croisé est utilisé pour observer la relation entre deux variables lorsque ces variables ont peu de catégories. Un maximum de 20 cellules est fortement recommandé.

Dans un tableau croisé, la convention veut que la variable indépendante soit sur le haut (colonnes) et la variable dépendante sur le côté gauche (lignes, ou rangées).

Les pourcentages font référence à la variable indépendante (colonnes).

Rappel : l’objectif du tableau croisé est de vérifier si vous êtes dans la bonne direction concernant votre hypothèse, en confirmant qu’il existe bien une relation bivariée entre X et Y, significative à 95% de confiance.

+Le tableau croisé

Pas université

Université Total

Jamais manifesté

790(63,2%)

332(47,29%)

Déjà manifesté 460(36,8%)

370(52,71%)

Total 1250(64,04%)

702(35,96%)

Chi2: 46,53 p<0,05

CrossTable(manifestation,universite, prop.c=T, prop.r=F, prop.t=F, prop.chisq=F, chisq=T, format="SPSS")

Le chi2 est une mesure de signification statistique: son objectif est de voir s’il y a une relation, dans la population plus vaste de laquelle fût extrait l’échantillon.

+La corrélation de Pearson

La corrélation de Pearson est une analyse bivariée. Elle nous permet de mesurer la force d’une association, mais ne nous dit rien sur la direction de cette relation.

Lorsqu’on a au moins une variable continue (sur deux), il est hautement préférable d’utiliser la corrélation. Cependant, lorsqu’il y a peu de catégories (ex: deux dichotomiques), nous choisirons un tableau croisé.

La corrélation va de -1 à +1. On dit que la corrélation est faible lorsqu’elle est entre 0 et .25, moyenne entre .25 et .5, et forte entre .5 et 1.

La corrélation entre la participation à une manifestation et l’intérêt pour la politique est de 0.25. C’est une corrélation modérée, significative à 95% de confiance. Elle indique que la participation augmente avec l’intérêt (ou vice-versa).

+La régression linéaire (MCO)

Niveau d’information

Éducation prim/sec (0/1) -1.91 (.11) *

Éducation cégep (0/1) -0.73 (.10) *

Montréal depuis 5 ans et + (0/1)

.23 (.10) *

Intérêt politique (0 à 10) .33 (.02) *

Constante 4.91 (.02) *

R2 ajusté 0.2858

N 1948Note: pour l’éducation, on compare avec les gens ayant été à l’Université.

+Les déterminants du niveau d’information (MCO)

+Les déterminants de la participation à une manifestation

+Qualité du modèle

> logit$null.deviance - logit$deviance[1] 186.4063

> logit$df.null - logit$df.residual[1] 4

> dchisq(logit$null.deviance-logit$deviance, logit$df.null-logit$df.residual)[1] 1.551587e-39

+« Odds Ratio » ouRapports de probabilité

OR = eb = e0.41389 = 1,51

+Comment lire les rapports de probabilité?

P = 0,60: diminue la probabilité de 40%

P = 0,80: diminue la probabilité de 20%

P = 1: 0%. Le changement dans la variable indépendante n'affecte pas la variable dépendante

P = 1,40: augmente la probabilité de 40%

P = 2: augmente la probabilité de 100% (c'est un rapport de 2 contre 1)

P = 4,20: augmente la probabilité de 320%

+Les déterminants de la participation à une manifestation

Coefficients Rapports de probabilité

Éducation prim/sec (0/1) -.77 (.13) * .46

Éducation cégep (0/1) -.29 (.11) * .75

Montréal 5 ans et plus (0/1)

.41 (.12) * 1.51

Intérêt politique .22 (.02) * 1.25

Constante -1.41 (.17) *

N 1952

+Prédictionsprim_sec=c(1)cegep=c(0)universite=c(0)mtl5ans=c(1)interet=c(mean(df$interet, na.rm=T))newdata1=data.frame(prim_sec, cegep, universite, mtl5ans, interet)newdata1newdata1$predict=predict(logit, newdata=newdata1, type="response")newdata1

________________________________

+Prédictions

newdata2=data.frame(prim_sec=0, cegep=0, universite=1, mtl5ans=1, interet=seq(0,10,2))newdata2$predict2=predict(logit, newdata=newdata2, type="response")newdata2

newdata2=data.frame(prim_sec=0, cegep=0, universite=1, mtl5ans=0, interet=seq(0,10,2))newdata2$predict2=predict(logit, newdata=newdata2, type="response")newdata2

Synthèse du bloc 3 Eugénie Dostie-Goulet

Documents

École élémentaire Eugénie Cotton B · 2016-09-19 · 5, rue Eugénie Cotton - Paris 19e Tél. : 01 42 03 35 58 École élémentaire Eugénie Cotton B Livret d’accueil 2016-2017

Balzac eugénie grandet

Les Prés d’Eugénie | Eugénie-les-Bains

+ Synthèse du bloc 3 Eugénie Dostie-Goulet Plan de la présentation Pourquoi des statistiques? Inférence Le tableau croisé et le chi2 La corrélation de

Karine GOULET Directrice Politiques Européennes -Région ... · 1 1 16 mars 2018 Karine GOULET Directrice Politiques Européennes -Région des Pays de la Loire-

Les Jardins d' Eugénie Deauville - France

SEMAINE DU - st-frederic.com fileSACREMENTS CÉLÉBRÉS BAPTÊMES EN L’ÉGLISE SAINTE-FAMILLE LE 18 OCTOBRE 2015 Cedrik Goulet, fils de Michel Goulet et Sarah Lachance Zoé Jacques,

M.-o. Goulet-Caze L'Ascese Cynique

Les 62 fautes de l'impératrice Eugénie

Eugénie Holliger-Hagmann* Das …...Eugénie Holliger-Hagmann* Das Produktesicherheitsgesetz: Eine Büchse der Pandora Das Produktesicherheitsgesetz (PrSG) trat am 1. Juli 2010 in

Les Provisions de l'écureuil - Eugénie VEGLERIS

DELAUNE Eugénie - Tic à l'appui - Approche ostéopathique ...eugeniedelaune-osteo.fr/content/DELAUNE Eugénie - Tic à l'appui... · TIC À L'APPUI APPROCHE OSTÉOPATHIQUE : VISCÉRALE

Régression logistique Eugénie Dostie-Goulet

Eugénie Grandet

Eugénie Grandet: Lecture 1 - personal.kent.edupersonal.kent.edu/~rberrong/fr33337/eugenie1-9.pdf · I-1 Eugénie Grandet Honoré de Balzac LECTURE I. PRÉSENTATION DE SAUMUR ET DES

S SABOURIN GOULET BJORKMAN G B RESTREPO • … · ISBN 88-86726-06-6 30.000 Lit •15 € SABOURIN •GOULET BJORKMAN ... Social Science’, ... Fundacion Santillana Para IberoAmérica

Honoré de Balzac Eugénie Grandet - Ebooks gratuits · 2016. 1. 25. · Balzac. 3. Eugénie Grandet Édition de référence : Paris, Alexandre Houssiaux, Éditeur, 1855. 4. À Maria

Rose-Marie Goulet : dans le sommeil des noms

SYSSTÈME dE CHArGE 3 - Goulet

Les Jardins d' Eugénie Deauville - Plein Propriété France