14
M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Embed Size (px)

Citation preview

Page 1: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

M1 2013/2014

Mesures de position, de dispersion et de forme, distributions, représentations

graphiques

Page 2: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Mesures de position

Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée

Exemple : on dispose du nombre moyen d’enfants par femmedes 27 régions de France (outre-mer inclus) et on souhaite calculerle nombre moyen d’enfants par femme au niveau national. Ne pasoublier de pondérer par le nombre de femmes de chaque région.

Quantiles La quantile d’ordre α % est la valeur x du caractère telle que α % des

valeurs observées soient inférieures strictement à x Médiane : quantile d’ordre 50%, elle partage la série des valeurs

observées en deux séries de même taille Les trois quartiles partagent la série en 4 séries de même taille: 25%

des observations sont inférieures au 1 er quartile, 50% …, 75% … . Déciles, centiles, etc

Modes : La ou les valeurs observée d’effectif maximum Sous SAS : proc freq et proc mean

Page 3: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Statistiques descriptives

Qualités Mode Médiane Moyenne

Dépendre du nombre de termes de la série

non oui oui

Robustesse (faible sensibilité aux valeurs extrêmes)

oui oui non

Se prêter aux calculs algébriques

non non oui

Page 4: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Fonctions de répartition

Distribution ou loi de probabilité. Elles peuvent être discrètes, continues ou hybrides.

Densité d’une loi normale standard

Page 5: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Distributions

Fonction de répartition empirique Soit {Yi} un échantillon. La fonction de répartition empirique

de cet échantillon est la fonction :

Donne la proportion de l’échantillon sur laquelle la valeur de la variable Y est inférieure à une valeur y.

Page 6: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Construction d’une fonction de répartition empirique

Exemple:

Page 7: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Fonctions de répartition et quantiles

Page 8: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Mesures de dispersion

Moments et moments centrés Les moments centrés d’ordre pair renseignent sur la dispersion des

observations autour de la moyenne et les moments centrés d’ordre impair sur la dissymétrie de la distribution.

Variance

Ecart-type

Page 9: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

SAS

Quelques procédures SAS importantes à connaître

Proc sort Proc format Proc surveyselect : extraire un échantillon aléatoire

d’une table d’observations

Page 10: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Mesures de forme

Ce sont des nombres sans dimension Ils renseignent sur la forme des distributions statistiques : symétrie

et aplatissement Coefficient d’asymétrie de Fisher - Coefficient d’aplatissement de

Pearson Skewness Kurtosis

Où μ i désigne le moment d’ordre i et σ l’écart-type Exemple

Asymétrie Aplatissement

Page 11: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Mesures de forme - Propriétés

Coefficient de skewness/asymétrie γ = 0 <=> distribution est symétrique <=> moy = med = modeγ < 0 <=> distribution étalée vers la gauche <=> moy < med < mode

γ = 0 <=> distribution étalée vers la droite <=> moy > med > mode

=> distribution étalée vers la gauche

Coefficient de kurtosisSi F = 0 la distribution est « normale »Si F < 0, la distribution est plus aplatie que la normaleSi F > 0, la distribution est moins aplatie que la normale

Page 12: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Différents paramètres pour la loi normale

Page 13: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Représentations graphiques

SynthèseBoîte à moustache (box plots)

Représentation graphique d’un caractère numérique résumé par la valeur minimal le premier quartile la médiane le dernier quartile la valeur maximale

Page 14: M1 2013/2014 Mesures de position, de dispersion et de forme, distributions, représentations graphiques

Représentations graphiques

Caractères qualitatifs: diagramme à bandes ou à secteurs

Caractères quantitatifs: histogrammes avec regroupement en classes d’amplitudes égales ou inégales

Préférer toujours Excel à SAS