70
Statistiques Descriptives Et Probabilités Omar Darhouche Année 2020/2021 P (X = k )= n k p k (1 - p) n-k E (X r )= Z +-∞ x r f (x) dx V (X )= 1 n k X i=1 n i (x i - x) 2 = k X i=1 f i (x i - x) 2 P (A|B )= P (A B ) P (B )

Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistiques Descriptives

Et

Probabilités

Omar Darhouche

Année 2020/2021P (X = k) =

(n

k

)pk(1− p)n−k

E(Xr) =

∫ +∞

−∞xrf (x) dx

V (X) =1

n

k∑i=1

ni(xi − x)2 =

k∑i=1

fi(xi − x)2

P (A|B) =P (A ∩B)

P (B)

Page 2: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Contents

1

2

3

4

5

6

Chapter 1 La Statistique descriptive à une variable Page 4

1.1 Généralités 4

1.2 Vocabulaire 4

1.3 Distribution statistique discrète 5

1.4 Distribution statistique groupée 9

1.5 Variable qualitative (nominale ou ordinale) 11

1.6 Paramètres de position 13

1.7 Paramètres de dispersion 18

Chapter 2 Statistique descriptive à deux variables Page 21

2.1 Distributions marginales et distributions conditionnelles 21Dépendance et indépendance – Ajustement linéaire d’un nuage de points

Chapter 3 Dénombrement et espace de probabilités Page 29

3.1 Dénombrement 29Ensembles finis – Arrangements et combinaisons

3.2 Espaces de probabilités 30Expérience aléatoire et événements – Lois de probabilités conditionnelles et indépendance

Chapter 4 Variables aléatoires discrètes Page 36

4.1 Généralités 36Variable aléatoire discrète – Fonction de répartition – Quantiles – Espérance, variance, écart-type et moments – Inégalitéde markov et de Bienaymé-Tchebychev

4.2 Lois classiques 42Loi uniforme discrète – Loi de Bernoulli – Loi binomiale – Loi géométrique – Loi hypergéométrique – Loi de Poisson

Chapter 5 Variables aléatoires continues Page 47

5.1 Généralités 47Variable aléatoires réelles et densité de probabilité – Fonction de répartition – Quantiles – Espérance, variance, écart-typeet moments

5.2 Lois usuelles 51Loi uniforme sur [a, b] – Loi exponentielle – Loi normale ou loi de Gauss-laplace – Loi de Cauchy

Page 3: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

ContentsContentsContents

1

2

3

4

5

6

3

1

2

3

4

5

6

3

1

2

3

4

5

6

3

Chapter 6 Couple de variables aléatoires Page 63

6.1 Couple de variables aléatoires discrètes 63Loi conjointe – Fonction de répartition conjointe – Lois marginales – Lois conditionnelles – Indépendance

6.2 Couple de variables aléatoires continues 66Fonction de répartition et densité – Densités marginales – Indépendance

6.3 Covariance et coefficient de corrélation 69

Page 4: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

1La Statistique descriptive à une variable

1

2

3

4

5

6

4

1.1 GénéralitésLa statistique désigne l’ensemble des méthodes ou des techniques consistant à collecter desdonnées, à les traiter, les analyser et à les interpréter afin de tirer des conclusions et prendre desdécisions dans les situations d’incertitudes.La statistique s’applique à la plupart des disciplines: agronomie, biologie, démographie, économie,sociologie,... On distingue deux catégories, la statistique descriptive et la statistique inférentielle:

1. L’objectif de la statistique descriptive est de résumer et synthétiser l’information con-tenue dans les données étudiés afin d’en déduire un certain nombre de propriétés. Onutilise à cette fin, des tableaux, des graphiques et on calcule certains indicateurs ou car-actéristiques.

2. Le but de la statistique inférentielle consiste à extrapoler à partir d’un échantillon (unepartie restreinte) de la population à étudier, le comportement de la population dans sonensemble. En d’autre terme, elle généralise à une population toute entière des propriétésconstatées sur un échantillon. On peut citer comme exemples, les sondages, les contrôlede qualité, ....

Remarque 1.1. La statistique descriptive ne s’applique que si les données ont été collectées surtoute la population, alors que pour la statistique inférentielle ça ne concerne qu’un échantillonde la population. On se limitera dans ce cours à la statistique descriptive seulement.

1.2 VocabulairePopulation: ensemble des éléments sur lesquels porte l’étude ou l’activité statistique. Cet

ensemble est généralement noté Ω.( Étudiants, entreprises, plantes, pièces, produits,...).

Individu (ou unité statistique): chaque élément de la population.(Un étudiant, une plante, une pièce, un homme, une femme,...).

Échantillon: sous-ensemble issu de la population.

Variable: caractère (ou propriété) mesuré ou observé sur chaque individu notée X,Y,...(Note,taille, poids, sexe, âge, couleur,...).

Modalités: les différentes valeurs possibles que peut prendre une variable statistique.

Série statistique: suite de valeurs prises par une variable X notées x1, x2, x3, ...

Variable quantitative: ses modalités sont mesurables ou repérables.

Variable quantitative discrète: ses seules valeurs possible sont des nombres isolée.(Nombre d’enfants, nombre d’ouvriers, nombre de pièces, ...).

Variable quantitative continue: ses valeurs possible sont en nombres infini et a prioriquelconques dans un intervalle. (Age, poids, diamètre d’une pièce, température,vitesse,...).

Variable qualitative: ses modalités ne sont pas mesurables (profession, couleur, numéro detelephone,...).

Variable qualitative nominale: ses modalités ne peuvent pas être ordonnées. (Couleur,profession, sexe, groupe sanguin,...).

Page 5: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

5

1

2

3

4

5

6

5

1

2

3

4

5

6

5

Variable qualitative ordinale: ses modalités peuvent être ordonnées.(Chemises classéespar taille: XS, S, M, L, XL, XXL, XXXL).

Remarque 1.2. 1. Les caractères qualitatifs peuvent toujours être transformés en quanti-tatifs par codage. Exemple Masculin : 1, Féminin : 2. C’est ce qui se fait le plusgénéralement. Mais un tel codage est purement conventionnel et effectuer des opérationsalgébriques sur ces valeurs numériques n’a pas de sens.

2. Certains caractères qualitatifs s’expriment à l’aide des nombres, mais ils n’ont pas de sensquantitatif (Exemple : numéro de téléphone).

1.3 Distribution statistique discrèteConsidérons une population de N individus décrite par une variable X dont les k modalités sontx1, x2, ..., xk.

L’effectif (fréquence absolue) ni de la modalité xi est le nombre d’individus présentant lamodalité xi.

L’effectif total est N et on ak∑

i=1

ni = N.

La fréquence (fréquence relative) fi de la modalité xi est définie par

fi =ni

N.

On a évidementk∑

i=1

fi = 1.

Le pourcentage pi de la modalité xi est pi = fi × 100%.

L’effectif cumulé croissant Ni:

N1 = n1,

N2 = n1 + n2,

...Nk = n1 + n2 + ...+ nk = N.

La fréquence cumulée croissante Fi:

F1 = f1 =N1

N,

F2 = f1 + f2 =N2

N,

...

Fk = f1 + f2 + ...+ fk =Nk

N= 1.

Remarque 1.3. Il est également possible de cumuler les effectifs et les fréquences dans le sensdécroissant.

Page 6: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

6

1

2

3

4

5

6

6

1

2

3

4

5

6

6

L’effectif cumulé décroissant Ni:

N1 = N,

N2 = N − n1 = N1 − n1,

N3 = N − n1 − n2 = N2 − n2,

...Nk = N − n1 − n2 − ...− nk−1 = Nk−1 − nk−1.

La fréquence cumulée décroissante Fi:

F1 = 1 =N1

N,

F2 = 1− f1 =N2

N,

F3 = 1− f1 − f2 =N3

N,

...

Fk = 1− f1 − f2 − ...− fk−1 =Nk

N.

La série statistique (xi, ni)1≤i≤k ou (xi, fi)1≤i≤k est appelée distribution statistique discrète.Exemple.Un quartier est composé d’une population de 50 ménages, et la variable X représente le nombrede personnes par ménage. Les valeurs ordonnées de X sont :

1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 33 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 8 8

Tableau statistique

Effectifs Effectifs Fréquences Fréquencesxi cumulés cumulées

ni croissants Ni fi croissantes Fi

1 5 5 0.10 0.102 9 14 0.18 0.283 15 29 0.30 0.584 10 39 0.20 0.785 6 45 0.12 0.906 3 48 0.06 0.968 2 50 0.04 1

Représentation graphique

Page 7: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

7

1

2

3

4

5

6

7

1

2

3

4

5

6

7

Figure 1.1: Diagramme en batôns des effectifs

Figure 1.2: Diagramme en batôns des effectifs cumulés croissants

Tableau statistique (fréquences cumulées décroissantes)

Page 8: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

8

1

2

3

4

5

6

8

1

2

3

4

5

6

8

Effectifs Effectifs Fréquences Fréquencesxi cumulés cumulées

ni décroissants Ni fi décroissantes Fi

1 5 50 0.10 12 9 45 0.18 0.903 15 36 0.30 0.724 10 21 0.20 0.425 6 11 0.12 0.226 3 5 0.06 0.108 2 2 0.04 0.04

Courbe CumulativeLa courbe cumulative ou courbe des fréquences cumulées de la distribution (xi, fi)1≤i≤k est lacourbe représentative de la fonction F : R → [0, 1] définie par

F (x) =

0 si x < x1

Fi =i∑

j=1fj si xi ≤ x < xi+1

1 si x ≥ xk.

Cette fonction est appelée fonction cumulative ou fonction de répartition.La fonction de répartition F pour l’exemple précédent est définie par :

F (x) =

0, si x < 1;0.10, si 1 ≤ x < 2;0.28, si 2 ≤ x < 3;0.58, si 3 ≤ x < 40.78, si 4 ≤ x < 5;0.90, si 5 ≤ x < 6;0.96, si 6 ≤ x < 8;

1, si x ≥ 8.

La courbe de F est la représentation graphique de la portion F (x) des individus de la populationdont le caractère prend une valeur inférieur ou égale à x.

Page 9: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

9

1

2

3

4

5

6

9

1

2

3

4

5

6

9

1.4 Distribution statistique groupéeLorsque la variable quantitative discrète ou continue comprend un grand nombre de valeurs, ilest préférable de regrouper les valeurs en certains intervalles appelés classes pour rendre lesdonnées statistiques plus lisibles.Considérons une variable X dont les valeurs sont dans un intervalle.On découpe cet intervalle en classes [e1, e2[, [e2, e3[, ..., [ep−1, ep] de même amplitude (ei+1 −ei =constante). Pour choisir le nombre de classe, on utilise par exemple l’une des deux règlessuivantes :

1. Règle de Sturge : P = 1 + 3.3× log10(N);

2. Règle de Yule : P = 2.5× 4√N,

où N est l’effectif total. Le nombre J de classes est l’entier le plus proche de P . Nous mention-nons que les deux formules sont presque pareils si N 200.L’amplitude des classes est a =

xmax − xminJ

, où xmax (resp. xmin) est la plus grande (res. pluspetite) valeur de X.L’effectif ni de la classe [ei, ei+1[ est le nombre de valeurs de X prises dans cette classe.La fréquence fi de la classe [ei, ei+1[ est le rapport fi =

ni

N.

La série statistique ([ei, ei+1[, ni)1≤i≤p−1 ou ([ei, ei+1[, fi)1≤i≤p−1 est appelée distribution statis-tique groupée ou continue.Un histogramme est un diagramme composé de rectangles contigus dont les aires sont pro-portionnelles aux fréquences (ou effectifs) et dont les bases sont déterminées par les classes.Exemple : cas d’amplitudes égales. La variable X des tailles en cm de N = 20 étudiantsest donnée par le tableau

Classes Effectifs Fréquences Fréquences cumulées[145, 150[ 4 0.2 0.2[150, 155[ 7 0.35 0.55[155, 160[ 4 0.2 0.75[160, 165[ 3 0.15 0.9[165, 170[ 2 0.1 1

Figure 1.3: Histogramme des fréquences

Page 10: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

10

1

2

3

4

5

6

10

1

2

3

4

5

6

10

Cas d’amplitudes inégales. Lorsque les classes sont d’amplitudes inégales, les effectifs oufréquences ne permettent pas d’apprécier la distribution du caractère (ainsi la fréquence d’unintervalle ”étroit” ne peut pas être directement comparée à celle d’un intervalle dix fois pluslarge !).On ramène toutes les classes à une largeur standard, en calculant par proportionnalité les effectifscorrigés ou bien les fréquences corrigées correspondantes.Soit a l’amplitude standard (choisis librement). Si la classe numéro i a pour effectif ni et unefréquence fi et une amplitude ai alors

• L’effectif corrigé de la classe est n∗i =

ni

ai× a

• La fréquence corrigée de la classe est f∗i =

fiai

× a =n∗i

N.

On définit la densité d’effectifs d’une classe d’amplitude ai et d’effectif ni par

di =ni

ai.

En générale on se contente de calculer soit la densité d’effectifs soit les effectifs corrigés et pasles deux.Exemple. Considérons la série statistique définie par le tableau suivant :

Classes [100,110[ [110, 120[ [120, 125[ [125, 130[ [130, 140[ [140,160[Effectifs 12 24 20 22 14 8

Les effectifs se rapportant à des classes d’amplitudes inégales ne sont pas directement compara-ble. On doit donc corriger ces effectifs

Classes Effectifs Amplitude densité effectifs Fréquenceni ai di corrigé n∗

i corrigée f∗i

[100, 110[ 12 10 1.2 12 0.12[110, 120[ 24 10 2.4 24 0.24[120, 125[ 20 5 4 40 0.4[125, 130[ 22 5 4.4 44 0.44[130, 140[ 14 10 1.4 14 0.14[140,160[ 8 20 0.4 4 0.04

Figure 1.4: Histogramme des effectifs (corrigés)

Exemple. On s’intéresse à la consommation en litre par 100km de N = 20 voitures:

Page 11: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

11

1

2

3

4

5

6

11

1

2

3

4

5

6

11

6.11 6.05 5.98 5.77 5.18 5.66 5.28 5.11 5.58 5.495.62 5.33 5.55 5.45 5.76 5.23 5.57 5.52 5.8 6.0.

Par la règle de Sturges: P = 1 + 3.3 log10(20) = 5.293.On prend J=5.L’amplitude a =

xmax − xminJ

=6.11− 5.11

5= 0.2.

Tableau statistique

Classes Effectifs Fréquences Fréquences cumulées[5.11, 5.31[ 4 0.2 0.2[5.31, 5.51[ 3 0.15 0.35[5.51, 5.71[ 6 0.3 0.65[5.71, 5.91[ 3 0.15 0.8[5.91, 6.11] 4 0.2 1

Courbe CumulativeLa courbe cumulative des fréquences de la distribution ([ei, ei+1[, fi), 1 ≤ i ≤ p− 1 est la courbede la fonction dite de répartition F définie par

F (x) =

0 si x < e1Fi−1 +

x−eiei+1−ei

fi si ei ≤ x < ei+1

1 si x ≥ ep,

(avec F0 = 0).

Figure 1.5: Courbe cumulative des fréquences

1.5 Variable qualitative (nominale ou ordinale)On s’intéresse à la variable X = état-civil d’une population de N = 20 personnes. Notons

C: célibataire, M: marié, V: veuf, D:divorcé.

Considérons la série statistique suivante:

M D M C C M C C C M C M V M V D C C M C

Tableau statistique

Page 12: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

12

1

2

3

4

5

6

12

1

2

3

4

5

6

12

Modalités xi Effectifs ni Fréquences fi pi%célibataire 9 0.45 45%

marié 7 0.35 35%Veuf 2 0.10 10%

divorcé 2 0.10 10%

Diagramme en secteursChaque modalité xi est représentée par un secteur dont l’aire est proportionnelle à la fréquence:

αi = 360 × fi.

Figure 1.6: Diagramme en secteurs

On interroge une population de N = 50 personnes sur leur dernier diplôme obtenu. On note:

Sd: Sans diplôme, P: Primaire, Se: Secondaire,Su: Supérieur non-universitaire, U: Universitaire.

Sd Sd Sd Sd P P P P P P P P P P P Se Se SuSe Se Se Se Se Se Se Se Se Se Se Se Su Su SuSu Su Su Su U U U U U U U U U U U U Su

Les modalités étant ordonnées selon un gradient de codage de 1 (Sd) à 5 (U)Tableau statistique

Diplômes Effectifs Fréquences( en %)Sans diplôme 4 8%

Primaire 11 22%Secondaire 14 28%

Supérieur non-universitaire 9 18%Universitaire 12 24%

Page 13: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

13

1

2

3

4

5

6

13

1

2

3

4

5

6

13

Figure 1.7: Diagramme à bandes (barres) des fréquences (en %)

1.6 Paramètres de positionLe mode ou la classe modale est la valeur ou classe correspondante à la fréquence (ou ef-fectif) la plus élevée (si les classes sont d’amplitudes inégales, il s’agira de la classe de fréquencecorrigée la plus élevée ou de densité maximale).Une distribution présentant un seul mode est appelée une distribution unimodale. Une distribu-tion bimodale est une distribution présentant deux modes. Une distribution multimodale est unedistribution présentant plusieurs modes. Elle est souvent le reflet d’une population composéede plusieurs sous-populations distinctes. Exemple.

Modalités xi Effectifs ni Fréquences ficélibataire 9 0.45

marié 7 0.35Veuf 2 0.10

divorcé 2 0.10

Le mode est x1 = célibataire correspondant à l’effectif n1 = 9.

Classes Effectifs Fréquences[5.11, 5.31[ 4 0.2[5.31, 5.51[ 3 0.15[5.51, 5.71[ 6 0.3[5.71, 5.91[ 3 0.15[5.91, 6.11] 4 0.2

La classe modale est [5.51, 5.71[ et pour déterminer le mode, on utilise la formule suivante :

M0 = ei−1 +d1

d1 + d2ai,

où ai = ei − ei−1 est l’amplitude de la classe modale [ei−1, ei[,d1 = ni − ni−1 et d2 = ni − ni+1 ou bien d1 = fi − fi−1 et d2 = fi − fi+1.

Page 14: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

14

1

2

3

4

5

6

14

1

2

3

4

5

6

14

ni et fi sont l’effectif et la fréquence de la classe modale.ni−1 et fi−1 sont l’effectif et la fréquence de la classe qui précède la classe modale.ni+1 et fi+1 sont l’effectif et la fréquence de la classe qui suit la classe modale.Le mode Mo est déterminé par l’intersection des droites représentés dans la figure suivante.

Figure 1.8: Representation graphique du mode (cas continu)

On a ei−1 = 5.51 la borne inférieur de la classe modale [5.51, 5.71[ et son amplitude est ai =5.71− 5.51 = 0.2.d1 = 0.3− 0.15 = 0.15 et d2 = 0.3− 0.15 = 0.15. D’où

Mo = 5.51 +0.15

0.15 + 0.15.0.2 = 5.51 + 0.1 = 5.61.

Exemple

Classes Effectifs[0, 5[ 50[5, 10[ 150[10, 20[ 200[20, 30[ 40[30, 50] 60

Les classes sont d’amplitude inégales. On commence d’abord par calculer les effectifs corrigésou calculer les densités. Attention la classe modale n’est pas [10, 20[ même si elle a l’effectifmaximale!

Classes Effectifs Effectifs corrigés[0, 5[ 50 10[5, 10[ 150 30[10, 20[ 200 20[20, 30[ 40 4[30, 50] 60 3

La classe modale est la classe [5, 10[. On applique la formule et on obtient

Mo = 5 +30− 10

(30− 10) + (30− 20).5 = 5 +

100

3' 8.33.

Page 15: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

15

1

2

3

4

5

6

15

1

2

3

4

5

6

15

La médiane est la valeur qui partage la série statistique supposée rangée par ordre croissant,en deux groupes de même effectifs.Dans le cas d’une variable quantitative discrète, la médiane s’obtient en ordonnant les valeursdans l’ordre croissant puis:

- si l’effectif total N est impair, alors la médiane est la valeur de rang N + 1

2;

- si l’effectif total N est pair, alors la médiane est la moyenne des deux valeurs de rang N

2

et N

2+ 1.

Exemples.1. On considère la série statistique

0 0 1 1 2 2 3.

La médiane est la valeur du rang 4, donc Me = 1.2. On considère la série statistique

0 0 1 1 2 2 3 4.

La médiane est Me =1+22 = 1.5.

3. Si on veut déterminer la médiane d’une série statistique à partir d’un tableau (modalités,effectifs), on commence par remplir le tableau des effectifs cumulés croissants.

Modalités xi Effectifs ni Effectifs cumulées Ni

5 10 108 15 2512 17 4215 8 50

la moitié de l’effectif total étant 25. Donc La médiane est

Me =x25 + x26

2=

8 + 12

2= 10.

Dans le cas d’une variable quantitative continue, la médiane Me est la valeur correspondante àla fréquence cumulée 1

2(ou effectif cumulé N

2) :

F (Me) =1

2= 0.5.

Exemple. Considérons le tableaux statistique suivant

Classes Fréquences fi Fréquences cumulées Fi

[3, 5[ 0.24 0.24[5, 10[ 0.109 0.349[10,20[ 0.178 0.527[20, 35[ 0.203 0.73[35, 50[ 0.102 0.832[50, 55[ 0.168 1

On a F (10) = 0.349 < 0.5 et F (20) = 0.527 > 0.5, donc la classe médiane est [10, 20[.L’interpolation linéaire fournit

Me = 10 +0.5− 0.349

0.17810 ' 18.48.

Page 16: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

16

1

2

3

4

5

6

16

1

2

3

4

5

6

16

Les Quartiles

On appelle quartiles d’une série statistique le triplet des nombres (Q1, Q2, Q3) qui divise la sérieen 4 groupes de même effectif. C’est-à-dire chaque groupe représente 25% de la populationtotale.Le premier quartile Q1 est la plus petite valeur de la variable pour laquelle au moins un quartdes données sont inférieures ou égales à Q1.Le troisième quartile Q3 est la plus petite valeur de la variable pour laquelle au moins troisquarts des données sont inférieures ou égales à Q3.Évidement le deuxième quartile Q2 n’est autre que la médiane. Q2 = Me.Dans le cas d’une variable quantitative discrète, les quartiles s’obtiennent en ordonnant lesvaleurs dans l’ordre croissant puis:

- si l’effectif total N est multiple de 4 alors Q1 est la valeur de rang N

4et Q3 est la valeur

de rang 3N

4;

- si l’effectif total N n’est pas multiple de 4 alors Q1 est la valeur de rang immédiatementsupérieur à N

4et Q3 est la valeur de rang immédiatement supérieur à 3N

4.

Remarque 1.4. D’une manière analogue, on appelle déciles d’une série statistique un 9-uplet(D1, D2, ..., D9) qui divise la série en dix groupes de même effectifs. C’est-à-dire chaque groupereprésente 10% de la population totale. De plus D5 = Me.

Ainsi

- si l’effectif total N est multiple de 10 alors D1, D2, ..., D8, D9 sont les valeurs de rangN

10,2N

10, ...,

8N

10,9N

10respectivement.

- si l’effectif total N n’est pas multiple de 10 alors D1, D2, ..., D8, D9 sont les valeurs de rangimmédiatement supérieur à N

10,2N

10, ...,

8N

10,9N

10respectivement.

Exemple. Une étude sur le nombre d’employés dans les commerces du centre d’une ville adonné les résultats suivants :

Nombre d’employés 1 2 3 4 5 6 7 8Effectif 11 18 20 24 16 14 11 6

On a N = 120, le premier quartile est donc la valeur de rang 30 et le troisième quartile est lavaleur de rang 90. Ainsi Q1 = 3 et Q3 = 6.Le premier décile est la valeur de rang 12, le deuxième décile est la valeur de rang 24,...,etc.Ainsi D1 = 2, D2 = 2, D3 = 3 D4 = 3, D5 = 4, D6 = 4, D7 = 5, D8 = 6 et D9 = 7. Dans lecas d’une variable quantitative continue, le premier quartile Q1 est la valeur correspondante àla fréquence cumulée (croissante) 0.25 et le troisième quartile est la valeur correspondante à lafréquence cumulée (croissante) 0.75.De même, le premier décile D1 est la valeur correspondante à la fréquence 0.10, le deuxième décileD2 est la valeur correspondante à 0.20, ..., le neuvième décile D9 est la valeur correspondante à0.90.Exemple. Une étude sur la durée de vie en heures de N = 200 ampoules électriques a donnéles résultats suivants:

Durée de vie (100h) [12 , 13[ [13 , 14[ [14, 15[ [15 , 16[ [16 , 17[Effectif 28 46 65 32 29

Pour calculer les quartiles Q1, Q2 et Q3. On commence par completer le tableau en ajoutant leseffectifs cumulés croissants.

Page 17: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

17

1

2

3

4

5

6

17

1

2

3

4

5

6

17

Durée de vie (100h) [12 , 13[ [13 , 14[ [14, 15[ [15 , 16[ [16 , 17[Effectif 28 46 65 32 29

Effectifs croissants 28 74 139 171 200

Calcul de Q1 : On a N4 = 50, la plus petite valeur des effectif cumulés supérieur ou égale à 50

est 74. Cette valeur correspond à la classe [13, 14[. Puis par interpolation linéaire, on obtient

Q1 − 13

14− 13=

50− 28

74− 28⇐⇒ Q1 = 13 +

11

23=

310

23' 13.48.

Calcul de Q2 = Me : On a 2N4 = 100, la plus petite valeur des effectif cumulés supérieur ou

égale à 100 est 139. Cette valeur correspond à la classe [14, 15[. Puis par interpolation linéaire,on obtient

Q2 − 14

15− 14=

100− 74

139− 74⇐⇒ Q2 = 14 +

26

65=

72

5= 14.4.

Calcul de Q3 : On a 3N4 = 150, la plus petite valeur des effectif cumulés supérieur ou égale à 150

est 171. Cette valeur correspond à la classe [15, 16[. Puis par interpolation linéaire, on obtient

Q3 − 15

16− 15=

150− 139

171− 139⇐⇒ Q3 = 15 +

11

32=

490

32' 15.34.

Calcul de D3 : On a 3N10 = 60, la plus petite valeur des effectif cumulés supérieur ou égale à 60

est 74. Cette valeur correspond à la classe [13, 14[. Puis par interpolation linéaire, on obtient

D3 − 13

14− 13=

60− 28

74− 28⇐⇒ D3 = 13 +

16

23=

315

23' 13.70.

Calcul de D9 : On a 9N10 = 180, la plus petite valeur des effectif cumulés supérieur ou égale à 180

est 200. Cette valeur correspond à la classe [16, 17[. Puis par interpolation linéaire, on obtient

D9 − 16

17− 16=

180− 171

200− 171⇐⇒ D9 = 16 +

4

23=

473

29' 16.31.

La moyenne arithmétiqueLa moyenne arithmétique x d’une variable quantitative discrète X est la somme pondérée desvaleurs possibles par les fréquences:

x =k∑

i=1

fixi =1

N

k∑i=1

nixi,

c’est-à-dire encore la somme des observations divisée par l’effectif total de la population.

Remarque 1.5. Il existe d’autres moyennes comme la moyenne géométrique, la moyenne har-monique, la moyenne interquartile ou les moyennes tronquées. Elles sont moins utilisées carelles sont généralement réservées à des contextes particuliers.

Exemple. Le nombres d’enfants de 20 familles sont les suivants

1 0 2 1 3 2 2 1 0 2 2 2 4 0 1 2 1 2 2 3.

Avec cette forme brute, la moyenne est

x =1 + 0 + 2 + 1 + 3 + 2 + 2 + 1 + 0 + 2 + 2 + 2 + 4 + 0 + 1 + 2 + 1 + 2 + 2 + 3

20= 1.15.

Avec un tableau modalité effectifs

Page 18: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

18

1

2

3

4

5

6

18

1

2

3

4

5

6

18

Nombre d’enfants 0 1 2 3 4

Effectif 3 5 9 2 1

La moyenne estx =

3× 0 + 5× 1 + 9× 2 + 2× 3 + 1× 4

20= 1.15

Remarque 1.6. Dans le cas d’une variable quantitative continue X, on convient de calculer lamoyenne de la distribution ([ci, ci+1[, fi), 1 ≤ i ≤ p− 1

x =

p−1∑i=1

fi.ci =1

N

p−1∑i=1

ni.ci.

où ci =ei + ei+1

2est le centre de la classe [ei, ei+1[. Exemple

Centre des classes 12.5 13.5 14.5 15.5 16.5Durée de vie (100h) [12 , 13[ [13 , 14[ [14, 15[ [15 , 16[ [16 , 17[

Effectif 28 46 65 32 29

la moyenne est

x =28× 12.5 + 46× 13.5 + 65× 14.5 + 32× 15.5 + 29× 16.5

200=

361

25= 14.44.

Les indicateurs de tendance centraleLes indicateurs de tendance centrale comme la moyenne x et la médiane Me et le mode Mo sontdes mesures qui indiquent la position où semble se rassembler les valeurs de la population. Le mode est la plus mauvaise mesure du centre, car la classe la mieux représentée n’est pasnécessairement au centre de la distribution. Si les valeurs extrêmes sont modifiées, la médiane ne change pas car elle n’est pas sensible auxvaleurs extrêmes. Par contre la moyenne change car elle tient compte de toutes les valeurs.On préférera la médiane ou la moyenne selon que l’on veut une mesure sensible ou non auxvaleurs extrêmes.

1.7 Paramètres de dispersionL’étendue est l’écart entre les valeurs extrêmes de la variable, soit

e = xmax − xmin,

où xmax (resp. xmin) est la plus grand (res. plus petite) valeur.Ce paramètre n’est pas défini exactement pour les distributions groupées, les valeurs extrêmesn’étant plus connues avec exactitude après le groupement en classes.L’écart interquartile est le nombre Q3 − Q1. C’est la longueur de l’intervalle interquartile[Q1, Q3].L’écart interdécile est le nombre D9−D1. C’est la longueur de l’intervalle interdécile [D1, D9].

Remarque 1.7. L’écart interquartile et L’écart interdécile mesure la dispersion de la sériestatistique autour de la médiane. Cet écart n’est pas sensible aux valeurs extrêmes.

Diagramme en boîte

On construit un diagramme en boîte de la façon suivante :

- les valeurs du caractère sont représentées sur un axe (vertical ou horizontal) ;

Page 19: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

19

1

2

3

4

5

6

19

1

2

3

4

5

6

19

- on place sur cet axe, le minimum, le maximum, les quartiles et la médiane de la sériestatistique;

- on construit alors un rectangle parallèlement à l’axe, dont la longueur est l’interquartileet la largeur arbitraire.

Exemple. On donne les notes obtenues à un devoir dans une classe de 27 étudiants:Note 2 3 4 6 7 8 9 10 11 12 14 15 16 18 20

Effectif 2 1 2 1 3 1 2 2 3 2 2 1 1 1 3

Q1 = 7, Me = 10 et Q3 = 14. L’intervalle interquartile est [7,14]. Cela signifie qu’au moins lamoitié des notes sont situées entre 7 et 14.

0 2 4 6 8 10 12 14 16 18 20min Q1 Me Q3 max

50% 50%

La variance, l’écart-type et le coefficient de variation

La variance d’une variable quantitative discrète X est la moyenne des carrés des écarts entre lesvaleurs de X et sa moyenne x :

V (X) =k∑

i=1

fi(xi − x)2 =1

n

k∑i=1

ni(xi − x)2.

L’écart-type de la variable X est donné par

σ(X) =√V (X).

Il sert à mesurer la dispersion de la série statistique autour de la moyenne. Plus il est petit, plusles valeurs sont concentrées autour de la moyenne (on dit que la série est homogène).Le coefficient de variance est l’écart-type en valeur relative de la moyenne:

cv(X) =σ(X)

x.

Plus il est élevé, plus la dispersion relative autour de la moyenne est grande. Il est sans unité etpar suite on peut l’exprimé en pourcentage. Il permet ainsi de comparer la dispersion de deuxdistributions qui n’ont pas la même unité de mesure.

Remarque 1.8.1. La variance peut aussi s’écrire

V (X) =1

n

k∑i=1

nix2i − x2.

2. Dans le cas d’une variable quantitative continue, la variance (ainsi l’écart type) est définiede la même manière avec les centres des classes jouent le rôle des valeurs xi.

Exemple. Soit la série statistique 2 3 4 4 5 6 7 9.

x =2 + 3 + 2× 4 + 5 + 6 + 7

8= 5.

V (X) =22 + 32 + 2× 42 + 52 + 62 + 72

8− 52 = 4.5.

Page 20: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

La Statistique descriptive à une variableLa Statistique descriptive à une variableLa Statistique descriptive à une variable

1

2

3

4

5

6

20

1

2

3

4

5

6

20

1

2

3

4

5

6

20

Théorème 1.1. Changement d’origine et d’unité) Si X et Y sont deux variables en corre-spondance par le changement d’origine b (constante) et le changement d’unité a (constante) :Y = aX + b, alors

y = ax+ b, V (Y ) = a2V (X) et σ(Y ) = |a|σ(X).

Corollaire 1.1. • Si on fait augmenter chaque modalité d’une série de r%, alors la moyennede cette série se trouve multipliée par (1 +

r

100).

• Si on fait diminuer chaque modalité d’une série de r%, alors la moyenne de cette série setrouve multipliée par (1− r

100).

Exemple. On suppose que la moyenne des notes d’un groupe d’étudiants est x = 10. Si onaugmente chaque note de 15%, cela revient à multiplier chaque note par 1.15. Donc la moyennedevient y = 1.15x = 11.5.

Page 21: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

2Statistique descriptive à deux variables

1

2

3

4

5

6

21

2.1 Distributions marginales et distributions conditionnellesL’objectif de cette partie est d’étudier sur une même population de n individus, deux caractèresdifférents X et Y et de rechercher s’il existe un lien entre ces deux variables. Chacune desdeux variables peut être, soit quantitatives, soit qualitatives. Désignons par x1, x2, ..., xk les kmodalités de la variable Xet par y1, y2, ..., yl les l modalités de la variable Y.L’effectif nij est le nombre d’individus présentant à la fois la modalité xi et la modalité yj . On a

k∑i=1

l∑j=1

nij = n.

L’effectif ni• est le nombre d’individus présentant la modalité xi:

ni• =l∑

j=1

nij .

L’effectif n•j est le nombre d’individus présentant la modalité yj :

n•j =k∑

i=1

nij .

La fréquence fij du couple des modalités xi et yj est

fij =nij

n.

On ak∑

i=1

l∑j=1

fij = 1.

Tableau de contingence des effectifs

X \ Y y1 . . . yj . . . yl Totalx1 n11 . . . n1j . . . n1l n1•...

......

......

......

xi ni1 . . . nij . . . nil ni•...

......

......

......

xk nk1 . . . nkj . . . nkl nk•Total n•1 . . . n•j . . . n•l n

Distributions marginalesConsidérons la colonne marginale du tableau ci-dessus.Les effectifs ni• définissent ce qu’on appelle la distribution marginale suivant X.La fréquence marginale de la modalité xi est

fi• =ni•n

.

On ak∑

i=1

fi• = 1.

Page 22: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

22

1

2

3

4

5

6

22

1

2

3

4

5

6

22

De façon analogue, la distribution marginale suivant Y est définie par les effectifs marginauxn•j .La fréquence marginale de la modalité yj est

f•j =n•jn

On al∑

j=1

f•j = 1.

Exemple. On s’intéresse à une éventuelle relation entre X = le sexe et Y = la couleur des yeuxde n = 200 personnes.Tableau de contingence des effectifs:

X \ Y Bleu vert Marron TotalHommes n11 = 10 n12 = 50 n13 = 20 n1• = 80

Femmes n21 = 20 n22 = 60 n23 = 40 n2• = 120

Total n•1 = 30 n•2 = 110 n•3 = 60 n = 200

Tableau de contingence des fréquences:

X \ Y Bleu vert Marron TotalHommes f11 = 0.05 f12 = 0.25 f13 = 0.10 f1• = 0.40

Femmes f21 = 0.10 n22 = 0.30 f23 = 0.20 f2• = 0.60

Total f•1 = 0.15 f•2 = 0.55 f•3 = 0.30 1

Distributions conditionnelles La distribution de la variable X, la variable Y = yj est appeléedistribution conditionnelle de X si (sachant) Y = yj .La fréquence conditionnelle fi|j (lire f, i si j) de la modalité xi liée par yj est

fi|j =nij

n•j=

fijf•j

.

Exemple. La fréquence conditionnelle des personnes de sexe masculin sachant qu’ils ont lesyeux vert est

f1|2 =n12

n•2=

50

110' 0.45 ou f1|2 =

f12f•2

=0.25

0.55' 0.45.

Tableau statistique de X si Y = yj .

X \ Y = yj Effectifs Fréquencesx1 n1j f1|j...

......

xi nij fi|j...

......

xk nkj fk|jTotal n•j 1

De façon analogue on définit la distribution conditionnelle de Y si X = xi.

2.1.1 Dépendance et indépendanceDéfinition 2.1. On dit que deux variables statistique X et Y sont indépendantes si pour tout iet j, on a

fi|j = fi• ou bien fj|i = f•j .

Page 23: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

23

1

2

3

4

5

6

23

1

2

3

4

5

6

23

Proposition 2.1. X et Y sont indépendantes si pour tout i et j, on a

fij = fi• f•j ,

ou d’une façon équivalente si pour tout i et j, on a

N × nij = ni• × n•j .

Il suffit que l’une des 3 égalités précédentes ne soit pas vérifiée pour un certain couple (i, j) donnépour que les deux variables ne soit pas indépendantes.

Exemple. Reprenons l’exemple précédent.On a f21 = 0.10 et f2• × f•1 = 0.60× 0.15 = 0.09.Donc f21 6= f2• × f•1. D’où X et Y ne sont pas indépendantes.Lorsque deux variables ne sont pas indépendantes, on cherche à évaluer l’intensité de leur liaisonet dans le cas de deux variables quantitatives, on examine si on peut les considérer liées par unerelation linéaire.

2.1.2 Ajustement linéaire d’un nuage de pointsReprésentation graphique: le nuage de pointsIl s’agit d’un graphique très commode pour représenter les observations simultanées de deuxvariables quantitatives (discrètes).Considérons deux variables X et Y dont les couple d’observations sur une population de nindividus, sont

(x1, y1), (x2, y2), ..., (xn, yn).

On représente chaque couple d’observation (xi, yi) par un point du plan Mi(xi, yi).L’ensemble de points Mi, i = 1, ..., n, est appelé nuage de points.Exemple. Considérons les deux séries statistique sur une population de 16 individus

X : 1 1 2 2 2 3 4 5 5 5 6 7 8 8 9 10

Y : 4 5 5 3 5 3 4 4 4 6 6 5 9 8 8 7

Figure 2.1: Nuage de points

Page 24: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

24

1

2

3

4

5

6

24

1

2

3

4

5

6

24

La covariance et Le coefficient de corrélationLa covariance des variables X et Y est définie par

Cov(X,Y ) =1

n

n∑i=1

(xi − x)(yi − y) =1

n

n∑i=1

xiyi − x y.

Remarque 2.1. Dans le cas des données groupées dans un tableau de contingence, en termesd’effectifs (ou fréquences) on peut écrire

Cov(X,Y ) =1

n

k∑i=1

l∑j=1

nij(xi − x)(yj − y) =1

n

k∑i=1

l∑j=1

nijxiyj − x y,

où x = 1n

k∑i=1

ni•xi (moyenne marginale de X) et y = 1n

l∑j=1

n•jyj (moyenne marginale de Y )

Proposition 2.2.1) Cov(X,Y ) = Cov(Y,X).2) Cov(X,X) = V (X).3) V (X + Y ) = V (X) + V (Y ) + 2Cov(X,Y ).4) Cov(aX + b, Y ) = aCov(X,Y ), a, b ∈ R.5) |Cov(X,Y )| ≤ σ(X)σ(Y ).

Le coefficient de corrélation est définie par

r(X,Y ) =Cov(X,Y )

σ(X)σ(Y ).

Ce coefficient caractérise la liaison linéaire entre les deux variables.

Remarque 2.2.1. −1 ≤ r(X,Y ) ≤ 1.2. Si r(X,Y ) = ±1, les points du nuage sont alignées, c’est à dire, il y a une corrélation linéaireparfaite entre X et Y :

Y = aX + b, a, b ∈ R.

3. Si r(X,Y ) est proche de 1 ou -1, on dit que X et Y sont fortement corrélées.4. Si r(X,Y ) > 0, les points du nuage sont alignées le long d’une droite ascendante.5. Si r(X,Y ) < 0, les points du nuage sont alignées le long d’une droite descendante.6. Si r(X,Y ) = 0, il n’y a pas de liaison linéaire.

Remarque 2.3. Il convient de prêter attention toute particulière aux unités choisies pourconstruire le nuage de points. En effet une unité sur l’un et/ou l’autre des axes écrase ce nuageet peut laisser croire à un alignement qui n’a pas de sens statistique. Il faut donc faire en sorteque celui-ci remplisse au mieux la figure quite pour cela à effectuer sur l’un et/ou l’autre desaxes un changement d’origine et/ou d’unité.

Droite de MayerL’idée la plus simple consiste à partager l’ensemble des points (xi, yi) en deux sous-ensemblesE1 et E2 ayant à peu près le même nombre de points. On détermine G1 le centre de gravité (lepoint moyen) de E1 et G2 le centre de gravité de E2. La droite de Mayer associée au nuage depoint est la droite passant par les ponts G1 et G2.Exemple Le tableau présente l’évolution du budget publicitaire X et du chiffre d’affaire Yd’une société sur les 6 dernière années.

Budget publicitaire (en 104 DH) 8 10 12 14 16 18Chiffre d’affaire (en 104 DH) 40 55 55 70 75 95

Page 25: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

25

1

2

3

4

5

6

25

1

2

3

4

5

6

25

Sot G1(x1, y1) le point moyen associé au trois premier points du nuages et G2(x2, y2) le pointmoyen associé au trois derniers.

x1 =8 + 10 + 12

3= 10 et y1 =

40 + 55 + 55

3= 50.

x2 =14 + 16 + 18

3= 16 et y2 =

70 + 75 + 95

3= 80.

Donc G1(10, 50) et G2(16, 80). D’où la droite d’ajustement de Mayer (G1, G2).

Figure 2.2: Droite d’ajustement de Mayer

En supposant que cette evolution reste la même on peut par exemple estimer le chiffre d’affaireà prévoir pour un budget de 220000 DH. Pour cela soit on utilise le graphe ou bien l’equationde la droite de Mayer y = 5x. Ainsi pour x = 22, on trouve y = 110, ce qui veut dire que pourun budget de 220000 DH, le chiffre d’affaire prévisionnel est 1100000 DH.On peut aussi estimer le budget publicitaire qu’il faudrait prévoir pour obtenir un chiffre d’affairede 1000000 DH. On a pour y = 100, x = 20. Ceci veut dire que pour un chiffre d’affaire de1000000 DH, le budget prévisionnel est 200000 DH.

Remarque 2.4. La construction de la droite de Mayer est extrêmement rapide et fournit unedroite tout à fait convenable lorsque les points de nuage sont presque alignés. Mais sa grandesimplicité ne permet pas d’obtenir une mesure de sa fiabilité. Nous allons présenter maintenantune méthode nettement plus sophistiqué mais qui va nous permettre de découvrir un nouveauparamètre statistique qui mesure le degré de confiance de cet alignement.

La droite de régression linéaire ou des moindre carrés de y en x.Lorsque |r(X,Y )| est proche de 1 et le nuage de points a une forme linéaire ou approximativementlinéaire, on cherche l’équation d’une droite qui s’ajuste au mieux aux valeurs aux points du nuage.

Page 26: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

26

1

2

3

4

5

6

26

1

2

3

4

5

6

26

Figure 2.3: Droite de régression

Cette droite, dite droite de régression linéaire, est généralement déterminer par la méthode desmoindres carrés, c’est à dire de manière à rendre minimum la somme des carrés des distances(comptées parallèlement à (oy)) entre cette droite et chaque point du nuage.Elle consiste à minimiser la fonction à deux variables

ϕ(a, b) =n∑

i=1

MiH2i =

n∑i=1

(yi − axi − b)2.

Le minimum (a, b) peut donc être déterminer en annulant les dérivées partielles de ϕ. On trouveainsi

a = Cov(X,Y )V (X)

b = y − a x.

La droite de régression linéaire de Y en X est y = ax+ b. Notons que cette droite passe par lepoint moyen G(x, y).Les valeurs yi = a xi + b sont appelées les valeurs ajustées (prédites).Les écarts ei = yi − yi sont appelées les résidus de la régression linéaire de Y en X. La moyennerésiduelle est

e =1

n

n∑i=1

ei = 0.

La variance résiduelle est la variance des résidus:

V (e) =1

n

n∑i=1

e2i

Le coefficient de détermination noté R2 est

R2 =

n∑i=1

(yi − y)2

n∑i=1

(yi − y)2=

V (Y )

V (Y )=

variance expliquéevariance totale

Il représente la proportion de la variance expliquée par le modèle (la régression linéaire). Ilpermet donc de juger la qualité de cette régression linéaire.Exemple. On dispose des mesures de taille en cm et de poids en kg de 10 étudiants.

X(cm) 192 165 186 196 171 182 187 176 164 182Y (Kg) 97 63 70 125 64 75 83 79 50 85

x = 180.1, y = 79.1,

σ(X) = 10.91, σ(Y ) = 20.85,

Page 27: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

27

1

2

3

4

5

6

27

1

2

3

4

5

6

27

Cov(X,Y ) = 196.54

r(X,Y ) = 0.864.

Le coefficient de détermination est R2 = r2 = 74.6%, donc on a un assez bon qualité d’ajustement(linéaire).

a = 1.65, b = −218.06.

La droite de régression linéaire au sens des moindres carrées est

y = 1.65x− 218.06.

Figure 2.4: Droite de régression linéaire de Y en X.

Remarque 2.5. On peut déterminer de la même façon, la droite de regression de x en y. SoitMi(xi, yi) un nuage de pints et D′ la droite d’équation x = αy+ β (attention l’ordre est inversé).Notons H ′

i la projection de Mi sur D′ parallèlement à l’axe (ox) et posons

ϕ′(a, b) =n∑

i=1

MiH2i =

n∑i=1

(xi − αyi − β)2.

Alors il existe de même une unique droite rendant minimale la somme ϕ′(a, b), cette droite estappelée droite de regression de x en y ou encore droite des moindres carrés de x en y sous laforme x = αy + β avec

α = Cov(X,Y )V (Y )

β = x− α y.

Il est bon de noter que les deux droites de regression passent par le point moyen G(x, y) et quele produit des coefficients directeurs a et α des droites de regression est égal à r(X,Y )2.

Exemple. La statistique suivante indique pour les pays concernés les taux de chômage X et letaux de d’inflation Y correspondant à l’année 1977 exprimés en pourcentage.

Pays B D F I L NLChômage 6.5 4.5 4.9 7.2 0.6 4.5Inflation 7.1 3.9 9.5 18.4 6.7 6.7

Page 28: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Statistique descriptive à deux variablesStatistique descriptive à deux variablesStatistique descriptive à deux variables

1

2

3

4

5

6

28

1

2

3

4

5

6

28

1

2

3

4

5

6

28

x =28.2

6= 4.7, y =

52.3

6' 8.7167

V ar(X) = σ(X)2 =158.96

6−(28.2

6

)2

=1321

300' 4.4033,

V ar(Y ) = σ(Y )2 =584.21

6−(52.3

6

)2

=76871

3600' 21.35305,

Cov(X,Y ) =276.9

6− 28.2

6.52.3

6=

3049

600=' 5.0816

Soit y = ax+ b l’équation de la droite de regression de y en x. On a :

a =Cov(X,Y )

V ar(X)=

31.09

26.42' 1.1768, b = y − ax ' 3.1859.

Soit x = αy + β l’équation de la droite de regression de x en y. On a :

α =Cov(X,Y )

V ar(Y )=

31.09

128.32' 0.2423, β = x− αy ' 2.5882.

Le coefficient de corrélation entre le taux de chômage et le taux d’inflation vaut :

r(X,Y ) =Cov(X,Y )

σ(X)σ(Y )=

31.09√26.42× 128.32

' 0.5339.

Ce coefficient de corrélation est donc médiocre. Attention, il ne faut pas en conclure a prioriqu’il n’y a pas de relation entre les phénomènes de chômage et d’inflation. En effet, la relationpeut être d’une autre nature.

Page 29: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

3Dénombrement et espace de probabilités

1

2

3

4

5

6

29

3.1 Dénombrement3.1.1 Ensembles finisDéfinition 3.1. On dit qu’un ensemble E 6= ∅ est fini s’il existe n ∈ N∗ et une bijection de1, 2, ..., n dans E. L’entier n est appelé cardinal de E et on note CardE = n. On convientCard∅ = 0.

Proposition 3.1. Soit E un ensemble fini.1) Si F est un ensemble en bijection avec E alors F est fini et CardE = CardF.2) Si A ⊂ E alors A est fini et CardA ≤ CardE.

Proposition 3.2. Soient A et B deux ensembles finis.1) Si A ∩B = ∅ alors Card(A ∪B) = CardA+ CardB.2) Si A ⊂ B alors Card(B\A) = CardB − CardA.3) Card(A ∪B) = CardA+ CardB − Card(A ∩B).

Proposition 3.3. Soit une famille (Ai)1≤i≤n formant une partition d’un ensemble Ω c’est-à-diren⋃

i=1

Ai = Ω et Ai ∩Aj = ∅ pour tout i 6= j. Alors Card

(n⋃

i=1

Ai

)=

n∑i=1

CardAi

Proposition 3.4. Soit (Ei)1≤i≤n une famille d’ensembles finis. Alors

Card(E1 × E2 × ...× En) = CardE1 × CardE2 × ...× CardEn.

3.1.2 Arrangements et combinaisonsDéfinition 3.2. On appelle k-uplet d’un ensemble E tout élément (x1, ..., xk) de Ek.

Proposition 3.5. Le nombre de k-uplets d’un ensemble à n éléments est nk.

Exemple. On lance une pièce de monnaie trois fois successive. Un résultat est 3-uplet deE = P, F, donc le nombre de résultats est 23.

Définition 3.3 (Arrangement). On appelle arrangement de k éléments d’un ensemble E, toutk-uplet d’éléments deux à deux distincts de E.

Proposition 3.6. Le nombre d’arrangements de k éléments d’un ensemble à n éléments est

Akn = n(n− 1)...(n− k + 1) =

n!

(n− k)!.

Remarque 3.1. Lorsque k = n, on parle plutôt de permutation que d’arrangement et on a n!est le nombre de permutations d’un ensemble à n éléments.

Définition 3.4 (Combinaison). On appelle combinaison de k éléments d’un ensemble E, toutsous-ensemble de E ayant k éléments.

Proposition 3.7. Le nombre de combinaison de k éléments d’un ensemble à n éléments est(k

n

)= Ck

n =n!

k!(n− k)!=

Akn

k!.

Remarque 3.2. On a

Ckn = Ck−1

n−1 + Ckn−1 pour tout 1 ≤ k ≤ n.

Page 30: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

30

1

2

3

4

5

6

30

1

2

3

4

5

6

30

Cette relation permet de construire le triangle de Pascal:

1 1

1 2 1

1 3 3 1

1 4 6 4 1

...

ApplicationsOn considère une urne contentant n boule. On tire au hasard k boule de cette urne.1) Tirage avec remiseLe nombre de tirages successifs avec remise de k boule parmi n est nk.2) Tirage sans remiseLe nombre de tirages successifs sans remise de k boule parmi n est Ak

n.3) Tirage simultanéLe nombre de tirages simultanés de k boule parmi n est Ck

n.

3.2 Espaces de probabilités3.2.1 Expérience aléatoire et événements Une expérience est dite aléatoire si l’on ne peut prévoir par avance son résultat. Ensemble fondamental ou encore l’univers des possibles Ω est l’ensemble de tous les résultats. Un événement est une assertion, dont on peut dire si elle est vérifiée ou non une fois le résultatde l’expérience connu. Ω : événement certain. ∅ : événement impossible w, où w ∈ Ω, événement élémentaire.Exemple. Jet d’un dé à six faces numérotées: Ω = 1, 2, 3, 4, 5, 6.A : obtenir un nombre paire. A = 2, 4, 6.B : obtenir un nombre supérieur ou égale à 2. B = 1, 2.Exemple. On lance une pièce jusqu’a obtenir pile. Le nombre de jet peut être infini.

Ω = 1, 2, ..., n, ... = N∗, ensemble infini dénombrable.

Exemple. On observe la durée de vie d’une lampe.

Ω = [0,+∞[= R+, ensemble infini non dénombrable.

Algèbre et tribu d’événementsUn événement étant un élément de P (Ω) obéit à la théorie des ensembles. Nous allons indi-quer dans le tableau ci-après comment certaines notions ensemblistes se traduisent, en termesd’événements.Ensemble ÉvénementOn a observé le résultat w et w ∈ A L’événement A est réaliséA = B Les événements A et B sont identiquesA ⊂ B L’événement A implique l’événement B

∅ Événement impossibleΩ Événement certainA ∩B Les deux événements A et B son réalisésA ∪B Un au moins des événement est realiséA ∩B = ∅ Les événements A et B sont incompatiblesA = Ω\A L’événement A n’est pas réalisé

Page 31: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

31

1

2

3

4

5

6

31

1

2

3

4

5

6

31

Définition 3.5. On appelle ensemble des événements, toute famille C de parties de Ω telle que:

i) Ω ∈ C;

ii) ∀A ∈ C, A = A ∈ C (événement contraire de A);

iii) Pour toute famille (Ai)i∈I (I fini ou dénombrable) d’éléments de C,⋃i∈I

Ai ∈ C.

C est appelé aussi tribu d’événements ou σ−algèbre et le couple (Ω, C) est appelé espace proba-bilisable.

Définition 3.6. Un système complet d’événements est une famille (Ai)i∈I formant une partitionde Ω : ⋃

i∈IAi = Ω et Ai ∩Aj = ∅ ∀i 6= j.

les Ai sont deux à deux disjoints etΩ = A1∪A2∪A3∪A4∪A5 donc formentun système complet d’événements deΩ.

Définition 3.7. On appelle probabilité sur (Ω, C) une application P : C → [0, 1] telle que

i) P (Ω) = 1;

ii) Pour toute famille (Ai)i∈I (I fini ou dénombrable) d’événements deux à deux incompatibles,on a

P

(⋃i∈I

Ai

)=∑i∈I

P (Ai).

Le triplet (Ω, C, P ) est appelé espace probabilisé.

Proposition 3.8.1) P (∅) = 0.2) P (A) = 1− P (A).3) Si A ⊂ B, alors P (A) ≤ P (B).4) P (A ∪B) = P (A) + P (B)− P (A ∩B).

5) P

(⋃i∈I

Ai

)≤∑i∈I

P (Ai).

Théorème 3.1 (Théorème des probabilités totales). Soit (Bi)i∈I Un système complet d’événements.Alors, pour tout événement A,

P (A) =∑i∈I

P (A ∩Bi).

Espaces de probabilités élémentairesConsidérons un ensemble Ω fini ou dénombrable. A chaque élément w ∈ Ω, on associe un nombrep(w) ≥ 0 tel que ∑

w∈Ωp(w) = 1.

Page 32: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

32

1

2

3

4

5

6

32

1

2

3

4

5

6

32

A chaque partie A de Ω, on associe le nombre:

P (A) =∑w∈A

p(w).

On définit ainsi une probabilité sur (Ω,P(Ω)).Supposons que Ω est fini. Pour chaque w ∈ Ω, on pose

p(w) = 1

CardΩ.

On définit alors une probabilité uniforme par

∀A ⊂ Ω, P (A) =CardA

CardΩ=

nombre de cas favorablesnombre de cas possibles

Attention Il faut bien faire attention que cette règle ne s’applique que dans le cas d’équiprobabilitédes événements élémentaires.Dans les exercices, pour signifier qu’on est dans une situation d’équiprobabilité, on a générale-ment dans l’énoncé des expressions de type : on lance un dé non pipé, les boules dans l’urnesont indiscernables au toucher, on choisit au hasard un ... etc.Exemple. On lancer deux dés non pipés.A: la somme des deux chiffres est inférieur ou égale à 5.On a

Ω = 1, 2, 3, 4, 5, 62,

A = (1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (4, 1),

doncP (A) =

cardA

cardΩ=

10

36.

3.2.2 Lois de probabilités conditionnelles et indépendanceDéfinition 3.8. Soient (Ω, C, P ) e.p. et B un événement de probabilité non nulle. On appelleprobabilité conditionnelle sachant B l’application P (./B) : C → [0, 1] définie par

P (A/B) =P (A ∩B)

P (B), ∀A ∈ C.

Cette application notée aussi PB définie une probabilité sur le même espace probabilisé.

Exemple. On lance deux dés non pipés.A: la somme des deux chiffres est inférieur ou égale à 5.B: les deux chiffres sont pairs.Calcul de P (A/B)

On a B = (2, 2), (2, 4), (2, 6), (4, 2), (4, 4), (4, 6), (6, 2), (6, 4), (6, 6) et A ∩B = (2, 2),

doncP (A ∩B) =

1

36, P (B) =

9

36, P (A/B) =

1

9.

Remarque 3.3. Soit un S un événement de probabilité non nulle.L’application P (./S) vérifie toutes les propriétés d’une probabilité. On a par exemple :

• P (Ω/S) = 1 et P (∅/S) = 0.

• P (A/S) = 1− P (A/S).

Page 33: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

33

1

2

3

4

5

6

33

1

2

3

4

5

6

33

• P ((A ∪B)/S) = P (A/S) + P (B/S)− P ((A ∩B)/S).

Propriété 3.1. (Formule des probabilités composées)Pour tout événements A et B de probabilité non nulle, on a

P (A ∩B) = P (A).P (B/A) = P (B).P (A/B).

Exemple. 85% d’une population sont vaccinés contre une maladie. On a constaté que 2% desindividus vaccinés n’ont pas été immunisés contre cette maladie et ont tombés malades.Quelle est la probabilité qu’un individu soit vacciné et malade ?Soit V l’événement ”un individu vacciné” et M l’événement ” un individu est malade”.La probabilité cherchée est P (V ∩M) = P (V ).P (M/V ) =

85

100.2

100= 0.017.

Propriété 3.2. (Généralisation de la formule des probabilités composées)Soient n événement A1, A2, ..., An d’un espace probabilisé vérifiant P (A1 ∩ A2 ∩ ... ∩ An) > 0.On a

P (A1 ∩A2 ∩ ... ∩An) = P (A1).P (A2/A1).P (A3/A1 ∩A2)... ∩ P (An/A1 ∩A2 ∩ ... ∩An−1)

Exemple. Dans une urne qui contient deux boules rouges et trois noires, quatre personnesA,B,C et D tirent successivement une boule sans la remettre; la première qui tire une rougegagne.Calculons la probabilité de gain de chaque personne.Notons pour i = 1, 2, 3, 4, l’événement Ri : ”tirer une boule rouge au i ème tirage”,et pour i = 1, 2, 3, l’événement Ni : ”tirer une boule noire au i ème tirage”.

P (A) = P (R1) =2

5.

P (B) = P (N1 ∩R2) = P (N1).P (R2/N1) =3

5.2

4=

3

10.

P (C) = P (N1 ∩N2 ∩R3) = P (N1).P (N2/N1).P (R3/N1 ∩N2) =3

5.2

4.2

3=

1

5.

P (D) = P (N1 ∩N2 ∩N3 ∩R4) = P (N1).P (N2/N1).P (N3/N1 ∩N2).P (R4/N1 ∩N2 ∩N3)

P (D) =3

5.2

4.1

3.2

2=

1

10.

Définition 3.9. On dit que les événements A et B sont indépendants si P (A/B) = P (A).

Conséquences 3.1.1) Si A est indépendant de B, alors B et indépendant de A.2) A et B sont indépendants si et seulement si P (A ∩B) = P (A)× P (B).

Exemple. On jette un dé rouge et un dé vert non pipés et on considère les événements A :”le dé vert marque 6”, et B : ”le dé rouge marque 5”. Montrons que ces deux événements sontindépendants (bien entendu ce résultat est évident, il n’y a pas d’influence d’un dé sur l’autre!).On a Ω = 0, 1, 2, 3, 4, 5, 62 et A = (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6),B = (1, 5), (2, 5), (3, 5), (4, 5), (5, 5), (6, 5), A ∩B = (6, 5). On obtient

P (A) =CardA

CardΩ=

6

36=

1

6

P (B) =CardB

CardΩ=

6

36=

1

6

P (A ∩B) =card(A ∩B)

cardΩ=

1

36= P (A).P (B).

Page 34: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

34

1

2

3

4

5

6

34

1

2

3

4

5

6

34

Donc A et B sont bien indépendants.Exercice. Si A et B sont indépendants, alors :i) A et B sont indépendants.ii) A et B sont indépendants.iii) A et B sont indépendants.Corrigé. i) Supposons A et B sont indépendants. En appliquant le théorème des probabilitétotales on obtient

P (A ∩B) = P (A)− P (A ∩B)

= P (A)− P (A).P (B)

= P (A)(1− P (B))

P (A ∩B) = P (A).P (B)

Donc A et B sont indépendants.ii) Il suffit d’échanger les rôles de A et B.iii) il suffit d’appliquer les résultats i) et ii).

Définition 3.10. Les événements A1, A2, ..., An sont dits mutuellement indépendants si, pourtout I ⊂ 1, 2, ..., n,

P

(⋂i∈I

Ai

)=∏i∈I

P (Ai).

Première formule de BayesSoient A et B deux événements tels que P (A)P (B) 6= 0. Alors

P (B/A) =P (A/B)P (B)

P (A).

Deuxième formule de BayesSoit (Bi)i∈I un système complet d’événements. Alors

P (Bi/A) =P (A/Bi)P (Bi)

P (A)=

P (A/Bi)P (Bi)∑j∈I

P (A/Bj)P (Bj).

Exercice. Trois machines A, B et C produisent respectivement 50%, 30% et 20% des piècesd’une usine. Chacune de ces machines fabrique respectivement 3%, 4% et 5% de pièces dé-fectueuses.On tire au hasard une pièce fabriquée par cette usine : elle est défectueuse.Calculer la probabilité que cette pièce ait été produite par la machine A.Corrigé.Soit D l’événement ”la pièce est défectueuse”.L’événement A : ”la pièce est fabriquée par la machine A”.L’événement B : ”la pièce est fabriquée par la machine B”.L’événement C : ”la pièce est fabriquée par la machine C”.La probabilité cherchée est P (A/D).En appliquant la deuxième formule de Bayes, on obtient

P (A/D) =P (A ∩D)

P (D)

=P (A).P (D/A)

P (A).P (D/A) + P (B).P (D/B) + P (C).P (D/C)

=0.50× 0.03

0.50× 0.03 + 0.30× 0.04 + 0.20× 0.05=

15

37P (A/D) ' 0.4054.

Page 35: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Dénombrement et espace de probabilitésDénombrement et espace de probabilitésDénombrement et espace de probabilités

1

2

3

4

5

6

35

1

2

3

4

5

6

35

1

2

3

4

5

6

35

la situation peut être représentée par l’arbre suivante :

Figure 3.1: Arbre de probabilités pondéré

Règles : Arbre pondéré et calculs de probabilité

• La somme des probabilités inscrites sur les branches issues d’un même nœud est égale à 1.

• La probabilité d’un chemin est le produit des probabilités figurant sur ses branches. (prob-abilités composées)

• La probabilité d’un événement est la somme des probabilités de tous les chemins menantà un sommet où apparaît cet événement. (probabilités totales)

Figure 3.2: Arbre de probabilités pondéré

Page 36: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

4Variables aléatoires discrètes

1

2

3

4

5

6

36

4.1 Généralités4.1.1 Variable aléatoire discrèteDéfinition 4.1. Soit (Ω, C, P ) un espace probabilisé. On appelle variable aléatoire (v. a.) réellediscrète toute fonction X : Ω → R telle que

i) X(Ω) = xi : i ∈ I avec I est fini ou dénombrable.

ii) Pour tout xi ∈ X(Ω), on a

[X = xi] := X−1(xi) = w ∈ Ω : X(w) = xi ∈ C,

c-à-d [X = xi] est un événement.

La famille (xi, pi)i∈I avec pi = P (X = xi), s’appelle distribution ou loi de probabilité de la v.a. X.

Remarque 4.1. L’univers des réalisations X(Ω) est aussi appelé support de la loi de probabilitéde X. La loi de probabilité d’une variable aléatoire X est la donné de la liste des probabilités P (X = xi)pour toutes les réalisations xi ∈ X(Ω).Si X ne prends qu’un petit nombre de valeurs, cette distribution (ou loi de probabilité) estgénéralement présentée dans un tableau.

Valeurs de X x1 x2 ... xnpi = P (X = xi) p1 p2 ... pn

Noter que les événements [X = xi], i ∈ I forme un système complet d’événements, donc∑i∈I

pi =

1. Si X(Ω) contient un grand nombre de réalisations ou infini, une telle représentation n’est pluspossible en pratique. on utilise alors la fonction de masse associée à la loi de probabilité.

Définition 4.2. La fonction de masse associée à la loi de probabilité de X est la fonction notéefX qui à chaque réalisation xi ∈ X(Ω) fait correspondre la probabilité P (X = xi) :

fX(xi) = P (X = xi), ∀xi ∈ X(Ω).

Exemple. On lance deux fois une pièce de monnaie régulière. L’ensemble des résultats possiblesest

Ω = P, F2 = (P, P ), (P, F ), (F, P ), (F, F ).

Soit X la v. a. représentant le nombre de faces obtenues. Alors le support de X est

X(Ω) = 0, 1, 2.

La loi de probabilité de X :

xi 0 1 2pi = P (X = xi) 1/4 1/2 1/4

La fonction de masse fX :

Page 37: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

37

1

2

3

4

5

6

37

1

2

3

4

5

6

37

Figure 4.1: Fonction de masse

4.1.2 Fonction de répartitionDéfinition 4.3. Soit X une v. a. réelle discrète définie sur (Ω, C, P ). On appelle fonction derépartition de X l’application F : R → [0, 1] définie par

F (x) = P (X ≤ x),

où [X ≤ x] = w ∈ Ω : X(w) ≤ x.

Remarque 4.2. La fonction de répartition F notée aussi FX , contrairement à la fonctionde masse fX , est définie pour toute valeur réelle x et pas uniquement pour les valeurs desréalisations appartenant à X(Ω). Par exemple, si le support de la variable aléatoire X estX(Ω) = 0, 1, 2, on peut calculer FX(1.59) = P (X ≤ 1.59), FX(5) = P (X ≤ 5) ou mêmeFX(−3.2) = P (X ≤ −3.2). C’est pourquoi cette définition de la fonction de répartition estvalable tant pour les variables aléatoires discrètes, que pour les variables aléatoires continues(voir chapitre 5).si pi = P (X = xi), i ∈ I est la loi de probabilité de X, alors

F (x) =∑

i:xi≤x

pi.

La quantité P (X ≤ x) est appelée probabilité cumulée car elle correspond au cumul c’est-à-direà la somme de toutes les probabilités associées à des réalisations xi ∈ X(Ω) inférieur ou égale àx. Ainsi

Exemple. Soit X la variable aléatoire dont la loi de probabilité est donnée par le tableausuivant

xi −4 −2 1 5

pi = P (X = xi) 0.1 0.3 0.5 0.1

Page 38: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

38

1

2

3

4

5

6

38

1

2

3

4

5

6

38

La fonction de répartition F de X est définie sur R par

F (x) =

0 si x < −4,0.1 si −4 ≤ x < −2,0.4 si −2 ≤ x < 1,0.9 si 1 ≤ x < 5,1 si x ≥ 5

Représentation graphique de la fonction de répartition F .

Figure 4.2: Fonction de répartition F de X

Proposition 4.1. Soit F la fonction de répartition d’une v.a. réelle discrète.1) F est croissante.2) lim

x→−∞F (x) = 0 et lim

x→+∞F (x) = 1.

3) F est continue à droite en tout x ∈ R.4) F a une limite à gauche en tout x ∈ R, et

P (X = xi) = F (xi)− limt→x−

i

F (t).

4.1.3 QuantilesNous avons vu que la fonction de répartition est une fonction qui à toute valeur x ∈ R associela probabilité cumulative FX(x) = P (X ≤ x). Il est possible ”d’inverser” cette fonction derépartition à fin de déterminer la valeur de x qui correspond à une certaine probabilité cumulativeα = P (X ≤ x) avec α ∈ [0, 1]. On parle alors de la fonction de répartition inverse ou de quantiled’ordre α.

Définition 4.4. Le quantile d’ordre α de la loi de probabilité de X, notée F−1X (α) ou Qα est

la plus petite réalisation appartenant à X(Ω) associée à une probabilité cumulée supérieure ouégale à α.

FX(Qα) = P (X ≤ Qα) ≥ α, ∀α ∈ [0, 1], ou encore

FX(F−1X (α)) = P (X ≤ F−1

X (α)) ≥ α, ∀α ∈ [0, 1].

Interprétation d’un quantile est la suivante :Si le quantile d’ordre α = 0.05 est égale à Q0.05 = F−1

0.05 = 2, cela signifie qu’il y a 5% de chancesque les réalisations de la variable aléatoire discrète X soit inférieur ou égale à 2.Exemple. Reprenons l’exemple du lancer d’une pièce de monnaie régulière deux fois. Soit Xla v. a. représentant le nombre de faces obtenues. Alors le support de X est X(Ω) = 0, 1, 2et la loi de probabilité de X est donnée par le tableau suivant :

Page 39: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

39

1

2

3

4

5

6

39

1

2

3

4

5

6

39

xi 0 1 2pi = P (X = xi) 1/4 1/2 1/4

La fonction de répartition de X est représentée par

Déterminons les quantiles d’ordre α = 0.14 ,α = 0.75 et α = 0.50.Q0.14 = F−1

X (0.14) est la plus petite réalisation de X c-à-d 0, 1 ou 2 telle que la probabilitécumulée P (X ≤ Q0.14) soit supérieure ou égale à 0.14. graphiquement, on voit que Q0.14 = 0.De la même façon, on vérifie que Q0.75 = 1 et Q0.5 = 1.

Remarque 4.3. Le quantile d’ordre α = 0.5 de la loi de probabilité d’une v.a. X est appelé lamédiane de X et il est noté

Me = Q0.5 = F−1X (0.5)

4.1.4 Espérance, variance, écart-type et momentsDéfinition 4.5 (Espérance mathématique). Soit X une v. a. réelle discrète définie sur (Ω, C, P ).On appelle espérance mathématique de X le réel, noté E(X) donné par

E(X) =n∑

i=1

xiP (X = xi),

lorsque X(Ω) = x1, x2, ..., xn, ou

E(X) =+∞∑i=1

xiP (X = xi),

lorsque X(Ω) = xi : i ≥ 1 et que cette série est absolument convergente.

Remarque 4.4. L’espérance E(X) s’interprète comme la valeur moyenne des valeurs prisespar X lorsque l’expérience est répétée un grand nombre de fois.Lors d’un jeu, si E(X) = 0 on dit que le jeu est equitable.

Proposition 4.2. Soit X et Y deux v. a. réelles discrètes définies sur (Ω, C, P ), qui possèdentune espérance. On a1) Pour tout a ∈ R, E(a) = a.2) Pour tout (a, b) ∈ R2, E(aX + bY ) = aE(X) + bE(Y ).En particulier E(aX + b) = aE(X) + b.

Page 40: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

40

1

2

3

4

5

6

40

1

2

3

4

5

6

40

Théorème 4.1 (Théorème de transfert). Soit X une v. a. réelle discrète définie sur (Ω, C, P ) etf une fonction continue par morceaux définie sur un intervalle contenant X(Ω) à valeur réelles.Alors f(X) est une v. a. discrète et on a

E (f(X)) =∑i

f(xi)P (X = xi),

sous réserve de convergence absolue.

Définition 4.6 (Variance et écart-type). On appelle variance d’une v. a. réelle discrète X laquantité, si elle existe

V (X) = E((X − E(X))2

).

C’est le réel sous réserve d’existence:

V (X) =∑i

(xi − E(X))2 P (X = xi).

La quantité σ(X) =√

V (X) est appelée écart-type de X.

Remarque 4.5. La variance et l’écart-type servent à apprécier la dispersion des valeurs prisespar la variable aléatoire autour de sa moyenne.Dans un jeu cala mesure les risques en gain ou en perte pris par le joueur.

Propriété 4.1. (Deuxième formule de la variance) V (X) = E(X2)− (E(X))2

Proposition 4.3. Soit X une v. a. réelle discrète admettant une variance, alorsPour tout (a, b) ∈ R2 V (aX + b) = a2V (X).

Définition 4.7 (Moments). On appelle moment d’ordre r ∈ N∗ d’une v. a. réelle discrète deX le nombre réel, s’il existe

E (Xr) =∑i

xriP (X = xi).

On appele moment centré d’ordre r ∈ N∗ de X, le nombre réel, s’il existe

µr = E ((X − E(X))r) =∑i

(xi − E(X))rP (X = xi).

Exemple. Une urne contient 3 boules rouges et 4 boules noires. On tire successivement avecremise 2 boule de l’urne.Soit Ω = R1, R2, R3, N1, N2, N3, N42 et P probabilité uniforme. On mise au départ 10 Dh eton gagne 8 Dh par boule rouge obtenue.Soit X la v. a. prenant pour valeur le gain final. Loi de X :

xi -10 -2 6P (X = xi)

1649

2449

949

Espérance de X :

E(X) = (−10)× 16

49+ (−2)× 24

49+ 6× 9

49=

−22

7.

Variance de X :

V (X) = (−10)2 × 16

49+ (−2)2 × 24

49+ 62 × 9

49−(−22

7

)2

=1536

49' 31.35.

Espérance et Variance de −7X + 5 :

E(−7X + 5) = −7E(X) + 5 = 27, V (−7X + 5) = (−7)2V (X) = 1536.

Page 41: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

41

1

2

3

4

5

6

41

1

2

3

4

5

6

41

4.1.5 Inégalité de markov et de Bienaymé-TchebychevFaute de connaître une probabilité exacte, il suffit parfois de trouver une borne supérieure ouinférieure à cette probabilité. Dans cette partie, on va presenter deux inégalités permettantde ”localiser” les valeurs prises par une variable aléatoire en fonction de sa moyenne et de savariance.

Théorème 4.2. (Inégalité de markov)Soit X une variable aléatoire positive d’espérance E(X). Alors,

∀δ > 0, P (X ≥ δ) ≤ E(X)

δ.

Remarque 4.6. Si on pose δ = αE(X) alors l’inégalité de Markov devient

∀α > 0, P (X ≥ αE(X)) ≤ 1

α.

On déduit qu’une variable aléatoire positive a peu de chances d’être plus grande que sa moyenne.

Exemple. Soit X une v.a telle que E(X) = 3. Donnons la limite supérieure de la probabilitépour que la variable aléatoire X soit supérieure ou égale à 15.

P (X ≥ 15) ≤ E(X)

15

≤ 3

15P (X ≥ 15) ≤ 0.2

On a donc au plus 20% de chances pour que les valeurs de X soit supérieure ou égale à 15.

Théorème 4.3. (Inégalité de Bienaymé-Tchebychev)Soit X une variable aléatoire telle que E(X) et V (X) existent. Alors,

∀δ > 0, P (|X − E(X)| ≥ δ) ≤ V (X)

δ2.

Remarque 4.7. Soit X un variable aléatoire. On note son espérance E(X) = µ et sa varianceV (X) = σ2. Cette inégalité est dite inégalité de concentration. Elle donne un intervalle de fluctuation

]µ− δ, µ+ δ[ pour X de niveau 1− σ2

δ2avec δ > 0. En effet

P (X ∈]µ− δ, µ+ δ[) = P (|X − µ| < δ) = 1− P (|X − µ| ≥ δ) ≥ 1− σ2

δ2.

Si on applique l’inégalité précédente pour δ = 2σ et δ = 3σ on obtient

P (X ∈]µ− 2σ, µ+ 2σ[) = P (|X − µ| < 2σ) = 1− P (|X − µ| ≥ 2σ) ≥ 1− σ2

4σ2=

3

4

P (X ∈]µ− 3σ, µ+ 3σ[) = P (|X − µ| < 3σ) = 1− P (|X − µ| ≥ 3σ) ≥ 1− σ2

9σ2=

8

9.

Ces propriétés sont encore une illustration du fait que l’écart-type mesure la dispersion de lavariable aléatoire autour de sa moyenne.

Exemple. Soit X une v.a telle que E(X) = 4 et σ = 2. Donnons une limite de la probabilitéque X soit comprise strictement entre 0 et 8.P (0 < X < 8) = P (−4 < X − 4 < 4) = P (|X − 4| < 4) = P (|X − µ| < 2σ) ≥ 3

4.

On a au moins 75% de chances pour que les valeurs de la variable aléatoire X soient comprisestrictement entre 0 et 8.

Page 42: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

42

1

2

3

4

5

6

42

1

2

3

4

5

6

42

4.2 Lois classiques4.2.1 Loi uniforme discrèteDéfinition 4.8. on dit qu’une v.a.r X suit une loi uniforme discrète sur l’intervalle[[1, n]] = 1, 2, ..., n de N, si l’on a :

X(Ω) = [[1, n]] et ∀k ∈ [[1, n]], P (X = k) =1

n

Nous écrivons alors X → Un.

Situation concrète.On choisit au hasard (c-à-d avec équiprobabilité) un objet parmi n objets numérotés de 1 à net on appelle X la variable aléatoire donnant le numéro de l’objet choisit.

Proposition 4.4. Si X → Un alors

E(X) =n+ 1

2et V (X) =

n2 − 1

12.

Exemple. On lance un dé non pipé numéroté de 1 à 6 et on considère la variable aléatoire Xdonnant le numéro de la face obtenu.On a X(Ω) = 1, 2, 3, 4, 5, 6 et ∀k ∈ X(Ω), P (X = k) =

1

6.

Donc X suit une loi uniforme discrète sur [[1, 6]] et on écrit X → U6.

On a E(X) =6 + 1

2= 3.5 et V (X) =

62 − 1

12=

35

12' 2.9.

4.2.2 Loi de BernoulliDéfinition 4.9. Soit p ∈]0, 1[. On dit qu’une v. a. X suit la loi de Bernoulli de paramètre p si

(i) X(Ω) = 0, 1;

(ii) P (X = 1) = p et P (X = 0) = 1− p.

On note X → B(1, p).

Situation concrète.Une variable aléatoire de Bernouli illustre généralement toute experience aléatoire n’ayant quedeux issues possibles : le succès ou l’échec, effectuée une seule fois. Une telle expérience estalors appelée épreuve de Bernoulli. On affecte alors 1 à la variable en cas de succès et 0 en casd’échec. Dans une expérience aléatoire où on s’interesse à la réalisation d’un événement A donné. Lav.a X égale à 1 si A est réalisé et égale à 0 sinon est une variable aléatoire de Bernouli. Lancer une pièce où la probabilité d’amener pile est p ∈]0, 1[. Le fait d’amener pile étantconsidéré comme un succès. X : le nombre de pile obtenu suit une loi de Bernouli. Effectuer un tirage d’une boule dans une urne contenant une proportion p de boules blanches.X : le nombre de boules blanches obtenues suit une loi de Bernouli.

Proposition 4.5. Si X → B(1, p), alors E(X) = p et V (X) = p(1− p).

4.2.3 Loi binomialeDéfinition 4.10. Soient n ∈ N∗ et p ∈]0, 1[. On dit qu’une v. a. X suit la loi binomiale deparamètres n et p si

i) X(Ω) = 0, 1, 2, ..., n;

Page 43: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

43

1

2

3

4

5

6

43

1

2

3

4

5

6

43

ii) ∀k ∈ 0, 1, 2, ..., n, P (X = k) =

(n

k

)pk(1− p)n−k = Ck

npk(1− p)n−k.

On note X → B(n, p).

Situation concrète. Si on effectue une épreuve de Bernouli de paramètre p. Elle n’a donc que deux issues : le suc-cès avec une probabilité p et l’échec avec une probabilité 1− p. Si on répète n fois cette épreuveet si les n épreuves sont indépendantes c-à-d la probabilité de succès p est la même à chaqueépreuve. Alors la variable X donnant le nombre de succès au cour de ces n épreuve suit une loiBinomiale de paramètres n et p. Une v.a X qui suit une loi binomiale de paramètres n et p peut être vue comme une sommede n variables aléatoires indépendantes de Bernouli Xi de paramètre p.

X = X1 +X2 + ...+Xn où Xi :

1 pour le succès,0 sinon.

Proposition 4.6. Si X → B(n, p), alors E(X) = np et V (X) = np(1− p).

Remarque 4.8. le mot binomial vient du fait que lorsqu’on somme toutes ces probabilités, onretrouve le développement du binôme de Newton,

n∑k=0

Cknp

k(1− p)n−k = (p+ 1− p)n = 1.

Exemple. On lance 4 fois un dé équilibré numéroté de 1 à 6 et on considère X la variablealéatoire qui compte le nombre d’apparition de la face 6.Montrons que X suit une loi binomiale et calculons E(X) et V (X). Lancer un dé équilibré numéroté de 1 à 6 une fois est une épreuve de Bernouli de paramètrep =

1

6. On a répéter cette épreuve 4 fois d’une façon indépendante. Donc la variable aléatoire

X donnant le nombre d’apparition de la face 6, compte le nombre de succès de ces épreuves.Par consequent X suit la loi binomiale de paramètre n = 4 et p =

1

6et on écrit X → B(4, 1

6).

On a

X(Ω) = 0, 1, 2, 3, 4 et ∀k ∈ X(Ω), P (X = k) = Ck4

(1

6

)k (1− 1

6

)4−k

= Ck4

54−k

64.

L’espérance de X est E(X) = 4× 1

6=

2

3.

La variance de X est V (X) = 4× 1

6× 5

6=

10

18.

4.2.4 Loi géométriqueDéfinition 4.11. On dit q’une v.a.r X suit une loi géométrique de paramètre p si on a :

X(Ω) = N∗ et ∀k ∈ N∗, P (X = k) = (1− p)k−1p.

Nous écrivons alors X → G(p).

Situation concrète. On effectue une épreuve de Bernoulli. Elle n’a donc que deux issues : le succès avec une proba-bilité p ou l’échec avec une probabilité 1−p. Puis on répète l’épreuve jusqu’à l’apparition du premier succèsde sorte que toutes les épreuves sont indépendantes entre elles. Alors dans cette situation, X lavariable aléatoire égale au rang de l’apparitiondu premier succès suit une loi géométrique de paramètre p. On dit que X est le temps d’attentedu premier succès.

Page 44: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

44

1

2

3

4

5

6

44

1

2

3

4

5

6

44

Remarque 4.9. On est donc dans les même hypothèses que pour la loi binomiale, mais lenombre d’épreuves n’est pas fixé à l’avance. on s’arrête au premier succès.

Proposition 4.7. Si X → G(p) alors E(X) =1

pet V (X) =

1− p

p2.

Remarque 4.10. Le mot géométrique vient du fait que lorsqu’on somme toutes ces probabilités,on obtient une série géométrique.

+∞∑k=0

(1− p)k−1p =p

1− (1− p)= 1.

Exemple.On lance une pièce régulière jusqu’à obtenir pour la première fois face. Soit X la variablealéatoire égale au nombre de lancers nécessaires pour obtenir face. Calcul de la probabilité pour obtient face au bout de 5 lancers.Lancer une pièce une fois est une épreuve de Bernouli. La probabilité d’obtenir face (le succès)est p =

1

2. On répète cette expérience jusqu’à obtenir le premier succès. Donc X suit une loi

géométrique de paramètre p =1

2.

La probabilité cherchée est

P (X = 5) =

(1− 1

2

)5−1 1

2=

(1

2

)5

=1

32.

Calcul de E(X): E(X) =1

p= 2.

4.2.5 Loi hypergéométriqueDéfinition 4.12. Soit une urne contenant N boules dont a boules blanches et b boules noiresavec a + b = N . On effectue n tirage d’une boule sans remise (ou on prélève simultanémentn boules) avec n ≤ N . Le tirage sans remise est dit exhaustif. Soit X la variable aléatoirereprésentant le nombre de boules blanches obtenues. La variable X est dite hypergéométrique eton note X → H(N, a, n). Cette loi depend de trois paramètres et on a

P (X = k) =CkaC

n−kb

CnN

, ∀k ∈ 0, 1, ..., a.

Remarque 4.11. Si p est la proportion des boules blanches de l’urne et q celle des boules noires,on a p =

a

Net q =

b

Navec p+ q = 1. Donc on a a = pN et b = qN = (1− p)N et

P (X = k) =CkpNCn−k

qN

CnN

=CkpNCn−k

(1−p)N

CnN

,

et on note X → H(N, p, n).

Proposition 4.8. Soit une variable aléatoire X → H(N, p, n). Alors

1. L’espérance mathématique est donnée par E(X) = np.(Formule identique à celle d’une loi binomiale).

2. la variance est donnée par V (X) = npqN − n

N − 1= np(1− p)

N − n

N − 1.

Le rapport ρ =N − n

N − 1est appelé coefficient d’exhaustivité.

Page 45: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

45

1

2

3

4

5

6

45

1

2

3

4

5

6

45

Exemple.Chaque matin, un professeur interroge 4 étudiants pour tester leurs connaissance du cours. Uneindiscrétion lui permet de savoir que dans la classe composée de 45 étudiants, 10 ne connaissentpas le cours.On se trouve dans la situation d’un ensemble E comprenant 45 éléments dont une proportion 10

45d’une catégorie d’éléments (les étudiants ne connaissent pas le cours). Le professeur interroge 4étudiants successivement sans interroger deux fois le même étudiant (ce qui correspond à 4 tiragessuccessifs sans remise d’un élément de E) alors la variable aléatoire X representant le nombred’éléments des étudiants qui ne connaissent pas le cours, obtenus suit une loi hypergéométriqueH(45, 10, 4) ou H(45,

10

45, 4) et on a

P (X = k) =Ck10C

4−k35

C445

, ∀k ∈ 0, 1, 2, 3, 4.

L’espérance mathématique est E(X) = 4× 10

45=

8

9' 0.88.

La variance est V (X) = 4× 10

45× 35

45× 45− 4

45− 1=

574

891' 0.64.

Proposition 4.9. Soit une variable aléatoire X → H(N, p, n). Lorsque N −→ +∞, alors

H(N, p, n) −→ B(n, p).

En pratique si N > 10n, alors on peut approcher la loi hypergéométrique par la loi binomiale.

4.2.6 Loi de PoissonDéfinition 4.13. Soient λ > 0. On dit qu’une v. a. X suit la loi de paramètre λ si

i) X(Ω) = N;

ii) ∀k ∈ N, P (X = k) = λk

k! e−λ.

On note X → P(λ).

Situation concrete.La loi de Poisson modélise des situations où l’on s’intéresse au nombre d’occurrences d’un événe-ment dans un laps de temps déterminé ou dans une région donnée. Par exemple : Nombre d’appels téléphoniques qui arrivent à un standard en x minutes. Nombre de clients qui se présentent à un guichet de banque en une heure. Nombre de malades qui arrivent au urgence d’un hôpital en une nuit. Le nombre de véhicules franchissant un poste de péage pendant une période de temps. le nombre de défauts de peinture par m2 sur la carrosserie d’un véhicule.Les phénomènes ainsi étudiés sont des phénomènes d’attente.

Proposition 4.10. Si X → P(λ), alors E(X) = λ et V (X) = λ.

Exemple. On considère X la variable aléatoire mesurant le nombre de clients se présentant auguichet d’un bureau de poste par intervalle de temps de durée 10 minutes entre 14h30 et 16h30.X suit une loi de Poisson. On suppose que X → P(5). La probabilité qu’entre 14h30 et 14h30, 10 personnes exactement se présentent à ce guichetvaut :P (X = 10) = e−5.

510

10!' 0.018.

Page 46: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires discrètesVariables aléatoires discrètesVariables aléatoires discrètes

1

2

3

4

5

6

46

1

2

3

4

5

6

46

1

2

3

4

5

6

46

La probabilité qu’entre 15h10 et 15h20, au maximum 3 personnes se présentent à ce guichetvaut :

P (X ≤ 3) = P (X = 1) + P (X = 2) + P (X = 3)

= e−5.51

1!+ e−5.

52

2!+ e−5.

53

3!P (X ≤ 3) ' 0.258

La probabilité qu’entre 15h50 et 16h, au moins une personne se présente à ce guichet vaut :

P (X ≥ 1) = 1− P (X < 1) = 1− P (X = 0)

= 1− e−5.50

0!P (X ≥ 1) ' 0.993

Proposition 4.11. Soit une v.a. X → B(n, p). On pose np = λ. On suppose que λ est uneconstante positive fixée.

limn→+∞

P (X = k) = e−λλk

k!.

On en déduit qu’une loi binomiale B(n, p) peut être approchée par une loi de Poisson P(λ)lorsque n est suffisamment grand et p petit, avec λ = np.En pratique, On peut estimer une bonne approximation avec des valeurs de l’ordre de :

n ≥ 30, p ≤ 0.1 et np ≤ 10.

Exemple. Suite à une vaccination contre le paludisme, dans une population à risque, on estimeà 2%, compte tenu du délai d’immunisation, la proportion de personne qui seront pourtantatteintes de la maladie. Quelle est la probabilité de constater, lors d’un contrôle dans un petitvillage de 100 habitants tous recrement vaccinés, plus d’une personne malade ? (on supposeral’indépendance des éventualités).Compte tenu des hypothèses, la v.a X qui compte le nombre de malade suit une loi binomialede paramètre n = 100 et p = 0.02. On a np = 2 et tous les conditions de l’approximation parune loi de Poisson sont vérifiées. La probabilité cherchée est

P (X > 1) = 1− P (X ≤ 1) = 1− P (X = 0)− P (X = 1)

= 1− e−2 20

0!− e−2 2

1

1!P (X > 1) = 0.5939..

L’application peu pratique de la loi binomiale aurait fournit

P (X > 1) = 1− P (X = 0)− P (X = 1) = 1− (0.98)100 − 2(0.98)99 = 0.5967..

L’approximation dans ce cas est excellente.

Page 47: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

5Variables aléatoires continues

1

2

3

4

5

6

47

5.1 Généralités5.1.1 Variable aléatoires réelles et densité de probabilitéDéfinition 5.1. Soit (Ω, C, P ) un espace probabilisé. On appelle variable aléatoire réelle toutefonction X : Ω → R telle que

Pour tout intervalle I ⊂ R, [X ∈ I] := X−1(I) = w ∈ Ω : X(w) ∈ I ∈ C.

Cela exprime que l’image réciproque d’un intervalle quelconque de R est un événement.En d’autre terme, une variable aléatoire est dite réelle si elle peut prendre toutes les valeurs d’unintervalle de R.On appelle loi de probabilité de X la donné de PX :

PX(I) = P (X ∈ I) = P (X−1(I)), ∀I ∈ C.

Définition 5.2. (densité de probabilité)Soit f : R −→ R une fonction. On dit que f est une densité de probabilité si les conditionssuivantes sont vérifiées.

1. f(x) ≥ 0 ∀x ∈ R.

2. f est continue presque partout, c-à-d peut ne pas être continue sur un ensemble dénombrablede points de R.

3.∫ +∞

−∞f(x)dx = 1.

Définition 5.3. Soit f une densité de probabilité. On dit qu’une variable aléatoire X est dedensité de probabilité f si pour tout a, b ∈ R tels que a ≤ b, on a

P (a ≤ X ≤ b) =

∫ b

af(x)dx.

On dit que X est une variable aléatoire à densité ou continue.

Propriétés 5.1. Soit X une v.a. continue de densité f . On a

1. ∀a ∈ R, P (X = a) = 0.

2. P (X < a) = P (X ≤ a) =∫ a−∞ f(x)dx.

3. P (X > a) = P (X ≥ a) =∫ +∞a f(x)dx.

4. ∀a, b ∈ R, tels que a ≤ b, on a

P (a ≤ X ≤ b) = P (a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) =

∫ b

af(x)dx.

5.1.2 Fonction de répartitionDéfinition 5.4. Soit X une v. a. réelle définie sur (Ω, C, P ) de densité de probabilité f . Onappelle fonction de répartition de X l’application F : R → [0, 1] définie par

F (x) = P (X ≤ x) =

∫ x

−∞f(t)dt.

Proposition 5.1. Soit F la fonction de répartition d’une v.a.r X de densité f . Alors :

Page 48: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

48

1

2

3

4

5

6

48

1

2

3

4

5

6

48

1. F est à valeurs dans [0, 1].

2. F est croissante sur R.

3. ∀a, b ∈ R, tels que a ≤ b, P (a < X ≤ b) = F (b)− F (a).

4. limx→−∞

F (x) = 0 et limx→+∞

F (x) = 1.

5. F est continue sur R.

6. F est derivable sur R sauf en au plus un nombre dénombrable de points et F ′(x) = f(x)si F est derivable en x.

Remarques 5.1. La probabilité pour que X appartienne à un intervalle de R pouvant secalculer à partir de la fonction caractéristique F . Cette fonction caractéristique caractérise laloi de X. Par comparaison avec le cas discret, seul les deux dernières propriétés changent. F est main-tenant continue au lieu d’être juste continue à droite. Ceci permet de distinguer la fonction derépartition d’une v.a continue de celle d’une v.a. discrète. La dernière propriété permet d’obtenir la densité f si on connaît la fonction de répartition Fen dérivant. Inversement si on connaît la densité f , on peut obtenir la fonction de répartitionF en integrant.

5.1.3 QuantilesTout comme dans le cas des variables discrètes, il est possible ”d’inverser” la fonction de répar-tition à fin de determiner la valeur de x ∈ R qui correspond à une certaine probabilité cumuléeα = P (X ≤ x) avec α ∈ [0, 1]. On obtient alors la fonction de répartition inverse ou le quantiled’ordre α. La définition du quantile est légèrement différente de celle présentée dans le cadredes variables aléatoires discrètes.

Définition 5.5. Soit X une variable aléatoire réelle, le quantile d’ordre α de la loi de probabilitéde X notée Qα ou F−1

X (α), est la réalisation appartenant à X(Ω) ⊆ R correspondant à uneprobabilité cumulée égale à α.

FX(F−1X (α)) = P (X ≤ F−1

X (α)) = α, ∀x ∈ [0, 1].

Interprétation d’un quantile est la suivante :Si le quantile d’ordre α = 0.15 est égale à Q0.15 = F−1

X (0.15) = 3, cela signifie qu’il y a 15% dechances que les réalisations de la variable aléatoire réelle X soit égale à 3.

Définition 5.6. (Médiane d’une v.a.)La médiane d’une variable aléatoire X continue est la valeur Me de X pour laquelle la fonctionde répartition est égale à 1

2. C’est-à-dire le quantile d’ordre α = 0.5.

F (Me) = P (X ≤ Me) =1

2.

Exemple. Soit f la fonction définie par

f(x) =

0 si x ≤ 0,1

2√x

si 0 < x ≤ 1,

0 si x ≥ 1.

Page 49: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

49

1

2

3

4

5

6

49

1

2

3

4

5

6

49

Montrons que f est une fonction de densité d’une certaine variable aléatoire continue.

On a f(x) ≥ 0,∀x ∈ R. f est continue sauf en x = 0 et en x = 1.

∫ +∞

−∞f(x)dx =

∫ 1

0f(x)dx =

[√x]10= 1.

Donc f est une densité de probabilité.

Calculons sa fonction de répartition.

Si x ≤ 0 alors F (x) =∫ x−∞ 0 dt = 0.

Si 0 < x ≤ 1 alors F (x) =∫ 0−∞ 0 dt+

∫ x0

12√tdt =

[√t]x0=

√x.

Si x > 1 alors F (x) =∫ 0−∞ 0 dt+

∫ x0

12√tdt+

∫ x−∞ 0 dt = 1.

la médiane de X est Me =1

4, car F

(1

4

)=

1

2.

Exemple. (Détermination de la densité de la v.a. g(X))Soit X une v.a. continue de densité f définie par

f(x) =

1, si 0 < x < 1,0, sinon

Déterminer la densité de la v.a Y = eX . Soit y ∈]0,+∞[. FY (y) = P (Y ≤ y) = P (eX ≤ y) car la fonction x −→ ex est bijective, etstrictement croissante.Si y ≤ 0 alors FY (y) = 0.Si y > 0 alors FY (y) = P (eX ≤ y) = P (X ≤ ln y) = FX(ln y).En dérivant, on obtient fY (y) =

1y .f(ln y).

Si 0 < ln y < 1, c-à-d 1 < y < e alors f(ln y) = 1 et donc fY (y) =1y .

Sinon f(ln y) = 0 et donc fY (y) = 0.En résumé la densité de Y = eX est définie par

fY (y) =

1y , si 1 < y < e,

0, sinon.

Remarque 5.1. Même si la fonction g n’est pas bijective, on peut parfois determiner la densitéY = g(X) par dérivation de P (Y ≤ y) = P (g(X) ≤ y). Prenons l’exemple de g(x) = x2.Soit y ∈ R. FY (y) = P (Y ≤ y) = P (X2 ≤ y).Si y < 0 alors P (X2 ≤ y) = 0 et donc fY (y) = 0.Si y ≥ 0 alors FY (y) = P (X2 ≤ y) = P (−√

y ≤ X ≤ √y) = FX(

√y)− FX(−√

y).En dérivant on obtient fY (y) =

1

2√yfX(

√y) +

1

2√yfX(−√

y).

Finalement la densité de la v.a Y = X2 est donnée par

fY (y) =

1

2√y

(fX(

√y) + fX(−√

y)), si y ≥ 0,

0, sinon.

Page 50: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

50

1

2

3

4

5

6

50

1

2

3

4

5

6

50

5.1.4 Espérance, variance, écart-type et momentsDéfinition 5.7 (Espérance). Soit X une v. a. réelle de densité f définie. On appelle espérance(mathématique) de X le réel, noté E(X) donné par

E(X) =

∫ +∞

−∞xf(x)dx,

lorsque cette intégrale est absolument convergente.

Proposition 5.2. Soient X et Y deux v. a. réelles à densité admettant une espérance eta, b ∈ R. Alors,

E(aX + b) = aE(X) + b, E(X + Y ) = E(X) + E(Y ).

Théorème 5.1 (Théorème de transfert). Soit X une v. a. réelle de densité f et φ une fonctionde R dans R telle que |φ|f soit integrable sur R. Alors, φ(X) possède une espérance, et on a

E (φ(X)) =

∫ +∞

−∞φ(x)f(x)dx.

Définition 5.8 (Variance et écart-type). Soit X v. a. réelle de densité f. On appelle variancede X la quantité, si elle existe

V (X) = E((X − E(X))2

).

C’est le réel sous réserve d’existence:

V (X) =

∫ +∞

−∞

(x− E(X)2

)f(x)dx.

La quantité σ(X) =√

V (X) est appelée écart-type de X.

Proposition 5.3. Soient X une v. a. réelle à densité admettant une variance et a ∈ R. Alors,

V (X) = E(X2)− (E(X))2, V (aX + b) = a2V (X).

Remarque 5.2. Soit X une v.a continue (ou discrete) d’espérance E(X) et d’écart-type σ(X).La variable aléatoire définie par :

X∗ =X − E(X)

σ(X)

est appelée v.a. centrée réduite associée à la v.a. X et on a E(X∗) = 0 et σ(X∗) = 1.

Définition 5.9 (Moments). Soit X une v. a. réelle de densité f. On appelle moment d’ordrer ∈ N∗ le nombre réel, s’il existe

E (Xr) =

∫ +∞

−∞xrf(x)dx.

On appele moment centré d’ordre r ∈ N∗ de X, le nombre réel, s’il existe

µr = E ((X − E(X))r) =

∫ +∞

−∞(x− E(X)r) f(x)dx..

Page 51: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

51

1

2

3

4

5

6

51

1

2

3

4

5

6

51

5.2 Lois usuelles5.2.1 Loi uniforme sur [a, b]

Définition 5.10. On dit qu’une v.a.r X suit la loi uniforme continue sur [a, b] si elle a pourdensité f définie par

f(x) =

1

b−a si x ∈ [a, b]

0 sinon

On note X → U([a, b]).

Figure 5.1: densité de probabilité de X → U([a, b])

Proposition 5.4. Si X → U([a, b]), alors sa fonction de répartition est la fonction

F (x) =

0 si x < ax−ab−a si a ≤ x ≤ b,

1 si x > a

Figure 5.2: fonction de répartition de X → U([a, b])

Proposition 5.5. Si X → U([a, b]) alors X a une espérance et une variance.

E(X) =a+ b

2et V (X) =

(b− a)2

12.

Propriété 5.1. Si X → U([a, b]) alors pour tout intervalle [c, d] ⊂ [a, b], on a

P (c ≤ x ≤ d) =d− c

b− a.

Situation concrete. On utilise généralement la loi uniforme continue lorsque la situation seramène à choisir au hasard un nombre réel dans un intervalle.

Page 52: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

52

1

2

3

4

5

6

52

1

2

3

4

5

6

52

Exemple. A l’arrêt donné d’un bus, un bus passe toutes les 10 minutes. Un voyageur ignoreles horaires et arrive à cet arrêt de bus. Quelle est la probabilité d’attendre le bus exactement3 minutes ? entre 2 et 4 minutes ? plus de 5 minutes ?Soit T la variable aléatoire représentant le temps d’attente, en minutes. On peut supposer queT suit la loi uniforme U [0, 10]), puisque la situation se ramène à choisir au hasard un nombreentre 0 et 10.La probabilité que ce voyageur attend exactement 3 minutes est P (T = 3) = 0.La probabilité que ce voyageur attend entre 2 et 4 minutes est :P (2 ≤ T ≤ 4) =

4− 2

10− 0=

2

10=

1

5.

La probabilité que ce voyageur attend plus de 5 minutes estP (T > 5) = 1− P (T ≤ 5) = 1− F (5) = 1− 5− 0

10− 0=

1

2.

L’attente moyenne de ce voyageur à cet arrêt de bus en minute est E(T ) =0 + 10

2= 5.

5.2.2 Loi exponentielleDéfinition 5.11. Soit θ > 0. On dit qu’une v. a. X suit la loi exponentielle de paramètre θ sielle a pour densité f définie par

f(x) =

0 si x < 0θe−θx si x ≥ 0.

On note X → E(θ).

Figure 5.3: densité de X → E(θ)

Proposition 5.6. Si X → E(θ), alors

E(X) =1

θet V (X) =

1

θ2.

Proposition 5.7. Si X → E(θ), alors sa fonction de répartition est la fonction

F (x) =

0 si x < 01− e−θx si x ≥ 0,

Page 53: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

53

1

2

3

4

5

6

53

1

2

3

4

5

6

53

Figure 5.4: fonction de répartition de X → E(θ)

Exemple : Calcul des quantilesOn considère une v.a X à valeurs dans X(Ω) = R+ est distribuée selon une loi exponentiellede paramètre θ = 2 et admettant une fonction de répartition F définie par F (x) = 1 − e−θx,∀x ∈ R+.Posons α = F (x) et inversons la fonction de répartition F ,

α = F (x) ⇐⇒ α = 1− e−θx

⇐⇒ e−θx = 1− α

⇐⇒ F−1(α) = x = − ln(1− α)

θ

le quantile d’ordre α est donc égale à F−1(α) = − ln(1− α)

θ.

Ainsi le quantile d’ordre α = 5% est égale à 0.0256 puisque

F−1(0.05) = − ln(1− 0.05)

2= 0.0256.

Le quantile Q0.05 s’interprète de la façon suivante : il y a 5% de chances que les réalisations dela variable aléatoire X soient égale au seuil F−1(0.05) = 0.0256, c’est-à-dire

P (X ≤ 0.0256) = 0.05 = 5%.

Remarque 5.3. Pour toutes les lois de probabilités pour lesquelles il n’existe pas d’expressionanalytique de la fonction de répartition, il n’existe pas non plus d’expression analytique desquantiles. Ceux-ci sont alors approximés par des méthodes numériques.

Proposition 5.8. (phénomène sans mémoire)Si X → E(θ), alors pour tout réels t et s tels que 0 < s < t, on a

P (X < t|X > s) = P (X < t− s).

En effet :

P (X < t|X > s) =P ((X < t) ∩ (X > s))

P (X > s)=

P (s < X < t)

1− P (X ≤ s)

=F (t)− F (s)

1− F (s)=

(1− eθt)− (1− eθs)

1− (1− eθs)

=eθs − eθt

eθs= 1− eθ(t−s)

= F (t− s)

P (X < t|X > s) = P (X < t− s).

Page 54: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

54

1

2

3

4

5

6

54

1

2

3

4

5

6

54

Situation concrete. Une loi exponentielle modélise la duré de vie de la radioactivité, ou d’uncomposant électronique, de décrire le temps écoulé entre deux moments, en général la duré devie d’un phénomène sans mémoire, ou sans vieillissement ou sans usure. En d’autre terme, lefait que le phénomène a démarre à l’instant ou que le phénomène à démarré depuis l’instant srevient au même.Exemple.La duré de vie, en heures, d’un composant électronique est une variable aléatoire X qui suit uneloi exponentielle de paramètre θ = 0.00005. La probabilité que ce composant tombe en panne avant 10000 heures est

P (X ≤ 10000) = F (10000) = 1− e−0.00005×10000 ' 0.4.

La probabilité que ce composant fonctionne au moins 15000 heures est

P (X ≥ 15000) = 1− P (X < 15000) = 1− F (15000) = e−0.00005×15000 ' 0.47.

La probabilité que ce composant tombe en panne entre la 10000 heures et la 15000 heures est

P (1000 ≤ X ≤ 15000) = F (15000)− F (10000) ' 0.53− 0.4 ' 0.13.

Sachant que ce composant a fonctionner plus de 5000 heures. La probabilité qu’il fonctionneau moins 15000 heures est

P (X ≤ 15000|X > 50000) = P (X < 15000− 5000) = P (X < 10000) = P (X ≤ 10000) ' 0.4.

L’espérance de vie de ce composant est E(X) =1

θ=

1

0.00005= 500000 heures.

5.2.3 Loi normale ou loi de Gauss-laplaceLa loi normale est la loi de certains phénomènes continues qui fluctuent autour d’une valeurmoyenne µ, de manière aléatoire, résultante d’un grand nombre de causes indépendantes dontles effets s’ajoutent sans que l’un d’eux soient dominant.Par exemple la taille d’un individu en cm, influencée par la nourriture, l’environnement, l’hérédité,le lieu géographique,... etc.

Définition 5.12. On dit qu’une v. a. X suit la loi normale centrée réduite si elle a pour densitéf définie par

∀x ∈ R, f(x) =1√2π

e−x2

2 .

On note X → N (0, 1).

Page 55: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

55

1

2

3

4

5

6

55

1

2

3

4

5

6

55

Figure 5.5: densité de X → N (0, 1)

Remarque 5.4. Pour tout x ∈ R, la fonction de répartition de X → N (0, 1) est donnée par

F (x) = P (X ≤ x) =1√2π

∫ x

−∞e−

x2

2 dx.

On ne connaît pas une expression explicite de la primitive de la fonction x −→ e−x2

2 . Doncon a pas d’expression explicite de la fonction de répartition d’un v.a. suivant une loi normaleréduite. On la notera Φ.Pour calculer Φ(x), on utilisera une calculatrice ou une table dite de la loi normale qui donnedes valeurs approché des probabilités.

Propriétés 5.2. Si X → N (0, 1), alors ∀a, b ∈ R, tel que a ≤ b

1. P (X ∈ I) = Φ(b)− Φ(a), où I = [a, b], [a, b[, ]a, b] ou ]a, b[.

2. P (X ≤ a) = P (X < a) = Φ(a) et P (X ≥ a) = P (X > a) = 1− Φ(a).

3. ∀x ∈ R, Φ(−x) = 1− Φ(x). En particulier Φ(0) =1

2.

Proposition 5.9. Si X → N (0, 1), alors E(X) = 0 et V (X) = 1.

Théorème 5.2. Soit X une variable aléatoire qui suit une loi normale réduite. Pour tout réelα ∈]0, 1[, il existe un unique réel strictement positif uα tel que

P (−uα ≤ X ≤ uα) = 1− α.

Preuve.On cherche un réel x strictement positif tel que :

P (−x ≤ X ≤ x) = 1− α

Φ(x)− Φ(−x) = 1− α

Φ(x)− 1 + Φ(x) = 1− α

2Φ(x) = 2− α

Φ(x) = 1− α

2.

On sait que la fonction Φ est continue et strictement croissante sur ]0,+∞[. De plus

limx−→0

Φ(x) = Φ(0) =1

2et lim

x−→+∞Φ(x) = 1,

Page 56: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

56

1

2

3

4

5

6

56

1

2

3

4

5

6

56

et 0 < α < 1 ⇐⇒ 1

2< 1− α

2< 1.

Donc d’après le théorème des valeurs intermédiaires, il existe un unique x = uα strictementpositif tel que Φ(uα) = 1− α

2. D’où le résultat.

Définition 5.13. Soient µ ∈ R et σ > 0. On dit qu’une v. a. X suit la loi normale deparamètres µ et σ si elle a pour densité f définie par

∀x ∈ R, f(x) =1

σ√2π

e−(x−µ)2

2σ2 .

On note X → N (µ, σ).

Proposition 5.10. Si X → N (µ, σ), alors E(X) = µ et V (X) = σ2.

Proposition 5.11.X → N (µ, σ) ⇔ Z =

X − µ

σ∼ N (0, 1).

Figure 5.6: densités de X → N (4, σ), où σ = 0.5, 1 et 2.

Remarque 5.5. On constate que plus l’écart-type σ est grand, plus la courbe s’étale autour dela moyenne et plus le maximum est petit, en accord avec la signification de l’écart-type.

Utilisation de la table de la loi normale.Considérons un extrait de la table de la loi centrée réduite.

z 0.05 0.06 0.07 0.08

0.9 0.8289 0.8315 0.8340 0.8365

1 0.8531 0.8554 0.8577 0.8599

1.1 0.9749 0.9770 0.8790 0.8810

1.2 0.8944 0.8962 0.8980 0.8997

1.3 0.9115 0.9131 0.9147 0.9162

Soit une variable aléatoire Z → N (0, 1). Calcul de P (Z ≤ 1.36) :On écrit 1.36 = 1.3 + 0.06. Le nombre 0.9131 situé à l’intersection de la ligne 1.3 et de lacolonne 0.06 est la valeur de la fonction de répartition de Z au point z = 1.36. C’est-à direΦ(1.36) = 0.9131. D’où P (Z ≤ 1.36) = 0.9131. Calcul de P (Z > 1.25) :On a P (Z > 1.25) = 1− P (Z ≤ 1.25) = 1− Φ(1.25) = 1− 0.8944 = 0.1056. Calcul de P (Z ≤ −1.17) :

Page 57: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

57

1

2

3

4

5

6

57

1

2

3

4

5

6

57

On a P (Z ≤ −1.17) = Φ(−1.17) = 1− Φ(1.17) = 1− 0.8790 = 0.121. Calcul de P (0.95 < Z ≤ 1.28) :On a P (0.95 < Z ≤ 1.28) = Φ(1.28)− Φ(0.95) = 0.8997− 0.8289 = 0.0708.Exemples de calcul inverse de la table : Trouver z tel que P (Z < z) = 0.95.On cherche dans la table les valeurs les plus proches de 0.95, on trouveΦ(1.64) = 0.9495 et Φ(1.65) = 0.9505.On pose x1 = 1.64, y1 = 0.9495 et x2 = 1.65, y2 = 0.9505.On cherche donc z = x tel que y = 0.95 ?La formule d’interpolation linéaire donne

x = x1 +y − y1y2 − y1

.(x2 − x1)

= 1.64 +0.95− 0.9495

0.9505− 0.9495.(1.65− 1.64)

z = 1.645,

ce qui veut dire qu’on a 95% de la population étudiée ont une valeur inférieur à 1.645. Trouver z tel que P (Z ≤ z) = Φ(z) = 0.146.Dans la table, les valeurs de z ne commencent qu’à 0.5, donc on a pas de valeurs proches de0.146. Cela est du au fait que Φ(z) < 0.5 ⇐⇒ z < 0.sachant maintenant que z < 0, on peut écrire Φ(z) = 1− Φ(|z|) = 0.146 soit encoreΦ(|z|) = 1− 0.146 = 0.854.Par le tableau d’interpolation linéaire, on obtient

1.03 x 1.04

0.8485 0.854 0.8508

x = 1.03 +0.854− 0.8485

0.8508− 0.8485.(1.04− 1.03)

x = 1.0539

Donc |z| = 1.054 et comme z < 0, alors z = −1.054.Exercice.Soit X une variable aléatoire qui suit une loi normale centrée réduite.Déterminer l’intervalle I centré en 0 tel que P (X ∈ I) = 0.8.(On donnera les bornes de l’intervalle avec une précision de 10−2).On a 1− α = 0.8 ⇐⇒ α = 0.2.On doit donc avoir Φ(uα) = 1− α

2 = 0.9.C’est-à-dire uα = Φ−1(0.9).On trouve à l’aide de la table uα ' 1.28. Donc I = [−1.28; 1.28].

Remarque 5.6. Il est bon de retenir les valeurs de u0.01 = 2.58 et u0.05 = 1.96. Ainsi on obtient

P (−2.58 ≤ X ≤ 2.58) = 1− 0.01 = 0.99

P (−1.96 ≤ X ≤ 1.96) = 1− 0.05 = 0.95

Soit une variable aléatoire X → N (15, 2). On pose Z =X − 15

2, alors Z → N (0, 1).

Calcul de P (X < 16) :

P (X < 16) = P

(X − 15

2<

16− 15

2

)= P

(Z <

1

2

)= Φ(0.5)

P (X < 16) = 0.6915.

Page 58: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

58

1

2

3

4

5

6

58

1

2

3

4

5

6

58

Calcul de P (X > 17) :

P (X > 17) = P

(X − 15

2>

17− 15

2

)= P (Z > 1) = 1− Φ(1) = 1− 0.8413

P (X > 17) = 0.1587.

Calcul de P (13 ≤ X ≤ 17) :

P (13 ≤ X ≤ 17) = P

(13− 15

2≤ X − 15

2≤ 17− 15

2

)= P (−1 ≤ X ≤ 1) = Φ(1)− Φ(−1)

P (13 ≤ X ≤ 17) = 2Φ(1)− 1 = 0.6826

Propriétés 5.3. Soit X → N (µ, σ) et Z → N (0, 1) sa loi centrée réduite associée.

1. P (µ− σ ≤ X ≤ µ+ σ) = P (−1 ≤ Z ≤ 1) = 2Φ(1)− 1 ' 0.6826.

2. P (µ− 2σ ≤ X ≤ µ+ 2σ) = P (−2 ≤ Z ≤ 2) = 2Φ(2)− 1 ' 0.9544.

3. P (µ− 3σ ≤ X ≤ µ+ 3σ) = P (−3 ≤ Z ≤ 3) = 2Φ(3)− 1 ' 0.9973.

Approximation d’une loi binomiale par une loi normale

Théorème 5.3. (Théorème de Moivre-Laplace)Soit X une v.a qui suit la loi binomiale B(n, p) et Z la loi centrée réduite associé à X. C’est-àdire Z =

X − E(X)

σ(x)=

X − np√np(1− p)

. Alors

limn−→+∞

P (a ≤ Z ≤ b) =1√2π

∫ b

ae−t2/2 dt

Remarque 5.7. Pour les grandes valeurs de n, la loi binomiale B(n, p) est proche de la loinormale N (np,

√np(1− p).

En pratique, on pourra faire l’approximation d’une loi binomiale par une loi normale si on a lesconditions suivantes : n ≥ 30, np ≥ 5, et np(1− p) ≥ 5.

Page 59: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

59

1

2

3

4

5

6

59

1

2

3

4

5

6

59

Exemple. On lance un dé équilibré 180 fois et on note X la variable aléatoire qui représente le

Page 60: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

60

1

2

3

4

5

6

60

1

2

3

4

5

6

60

nombre d’apparition de la face 6. En utilisant l’approximation normale calculer les probabilitésuivantes : P (X ≤ 20), P (X > 45) et P (X ≤ 20 ouX > 45). Il faut d’abord calculer les paramètres de la loi normale correspondante à cette loi binomialeB(180,

1

6

).

E(X) = np = 180.1

6= 30 et σ(X) =

√np(1− p) =

√180.

1

6.5

6= 5.

Il faut vérifier qu’on se trouve dans les hypothèses de l’approximation :n = 180 ≥ 30, np = 30 ≥ 5 et n(1− p) = 150 ≥ 5.Donc on peut approcher la loi binomiale B

(180, 16

)par la loi normale N (30, 5).

Calcul de P (X ≤ 20) :

P (X ≤ 20) = P

(X − 30

5≤ 20− 30

5

)= P (Z ≤ −2) = 1− Φ(2) = 1− 9772 = 0.0228.

Calcul de P (X > 45) :

P (X > 45) = P

(X − 30

5>

45− 30

5

)= P (Z > 3) = 1− Φ(3) = 1− 0.9987 = 0.0013.

Calcul de P (X ≤ 20 ouX > 45).

P (X ≤ 20 ouX > 45) = P (X ≤ 20) + P (X > 45) = 0.0228 + 0.0013 = 0.0241.

Page 61: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

61

1

2

3

4

5

6

61

1

2

3

4

5

6

61

5.2.4 Loi de CauchyDéfinition 5.14. Une variable aléatoire continue X suit une loi de Cauchy de paramètres α > 0(paramètre d’échelle) et x0 ∈ R (paramètre de position) si elle admet pour densité de probabilitéla fonction

f(x) =1

π

α

α2 + (x− x0)2, ∀x ∈ R.

On note X → CA(x0, α).

Remarque 5.8. La loi de Cauchy n’admet ni espérance ni variance. Il en va de même pourmoment d’ordre supérieur.

Representation graphique. La figure ci-dessous représente les courbes des densités de loide Cauchy CA(0, 1), CA(1, 1) et CA

(3

2, 1

). Nous voyons l’allure de la densité en fonction des

paramètres.

Proposition 5.12. Si X et Y sont deux v.a.r. indépendantes qui suivent la loi normale N (0, 1)

alors la variable aléatoire X

Ysuit la loi de Cauchy CA(0, 1).

Proposition 5.13. Pour tout x ∈ R, la fonction de répartition de X → CA(x0, α) est donnéepar

F (x) =1

2+

1

πarctan

(x− x0

α

).

Page 62: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Variables aléatoires continuesVariables aléatoires continuesVariables aléatoires continues

1

2

3

4

5

6

62

1

2

3

4

5

6

62

1

2

3

4

5

6

62

Page 63: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

6Couple de variables aléatoires

1

2

3

4

5

6

63

6.1 Couple de variables aléatoires discrètes6.1.1 Loi conjointeSoit (X,Y ) un couple de variables aléatoire discrètes sur un un espace probabilism (Ω, C, P ).On note dans toute la suite X(Ω) = xi : i ∈ I et Y (Ω) = yj : j ∈ J, où I, J ⊂ N.

Définition 6.1. La loi conjointe du couple (X,Y ) est la donnée de

pij = P ((X = xi) ∩ (Y = yj)), (i, j) ∈ I × J.

On a alors∑i∈I

∑j∈J

pij = 1.

6.1.2 Fonction de répartition conjointeDéfinition 6.2. Soit (X,Y ) un couple de v. a. réelles sur un espace probabilism (Ω, C, P ).On appelle fonction de répartition conjointe du couple (X,Y ), l’application FX,Y : R2 → [0, 1]définie par

FX,Y (x, y) = P (X ≤ x, Y ≤ y) = P ((X ≤ x) ∩ (Y ≤ y)).

6.1.3 Lois marginalesDéfinition 6.3. Les lois marginales du couple (X,Y ) sont les lois des variables X et Y.La loi marginale de X: P (X = i) = pi• =

∑j∈J

pij .

La loi marginale de Y : P (Y = j) = p•j =∑i∈I

pij .

Exemple. Une urne contient 4 boules blanches, 2 boules noires et 4 boules rouges. On tiresimultanément 3 boules au hasard. Soient X la variable prenant pour valeur le nombre de boulesblanches obtenus, et Y la variable prenant pour valeur le nombre de boules noires obtenus.Déterminer la loi conjointe du couple (X,Y ) et les lois marginale de Xet Y.On a cardΩ = C3

10 = 120, X(Ω) = 0, 1, 2, 3 et Y (Ω) = 0, 1, 2, et P la probabilité uniforme.

X \ Y 0 1 2 pi•0 1/30 3/30 1/30 5/30

1 6/30 8/30 1/30 15/30

2 6/30 3/30 0 9/30

3 1/30 0 0 1/30

p•j 14/30 14/30 2/30 1

On remarque par exemple que (xi, yj) = (3, 1) /∈ (X,Y )(Ω). En pratique, on pose pij = 0.

6.1.4 Lois conditionnellesDéfinition 6.4. La loi conditionnelle de X sachant Y = yj est la donnée de

P (X = xi/Y = yj) =P ((X = xi) ∩ (Y = yj))

P (Y = yj)=

pijp•j

, i ∈ I.

On a la même définition pour la loi conditionnelles de Y sachant X = xi.Exemple. Avec l’exemple précédent, la loi conditionnelle de X sachant Y = 1 est

xi/Y = 1 0 1 2 3P (X = xi/Y = 1) 3/14 8/14 3/14 0/14

Page 64: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

64

1

2

3

4

5

6

64

1

2

3

4

5

6

64

La moyenne conditionnelle de X/Y = 1 est

E(X/Y = 1) = 0× 3

14+ 1× 8

14+ 3× 3

14+ 3× 0

14= 1.

Remarque 6.1. Notons que E(Y /X) est une fonction de X, donc c’est une variable aléatoirediscrète dont la loi de probabilité est définie par l’ensemble de ses valeurs possibles, c’est-à-direE(Y /X = xi) /i ∈ I et les probabilités correspondantes pi. = P (X = xi). L’espérance deE(Y /X) est donnée par

E(E(Y /X)) =∑i∈I

pi.E(Y /X = xi).

Remarque 6.2. On vérifie que E(E(Y /X)) = E(Y ).

En effet

E(E(Y /X)) =∑i∈I

pi..E(Y /X = xi)

=∑i∈I

pi.∑j∈J

yjP (Y = yj/X = xi)

=∑i∈I

pi.∑j∈J

yjP (Y = yj , X = xi)

P (X = xi

=∑i∈I

∑j∈J

pi.yjpijpi.

=∑j∈J

yj∑i∈I

pij

E(E(Y /X)) =∑j∈J

yjp.j = E(Y )

Théorème 6.1. Théorème de transfert Soit φ une fonction de R2 dans R telle que φ(X,Y ) soitune v. a. vérifiant

∑i,jφ(xi, yj)pij converge absolument. Alors φ(X,Y ) possède une espérance, et

E (φ(X,Y )) =∑i,j

φ(xi, yj)P (X = xi ∩ Y = yj) =∑i,j

φ(xi, yj)pi,j

6.1.5 IndépendanceDéfinition 6.5. On dit que X et Y sont indépendantes si

P ((X = xi) ∩ (Y = yj)) = P (X = xi).P (Y = yj), ∀(i, j) ∈ I × J,

ou encorepij = pi•p•j , ∀(i, j) ∈ I × J.

Proposition 6.1. Si X et Y sont indépendantes, admettant une espérance, alors la v. a. XYadmet une espérance, et

E(XY ) = E(X)E(Y ).

Proposition 6.2. Si X et Y sont indépendantes, alors toute fonction de X est indépendantede toute fonction de Y.

Exemple. Reprenons l’exemple précédentX \ Y 0 1 2 pi•

0 1/30 3/30 1/30 5/30

1 6/30 8/30 1/30 15/30

2 6/30 3/30 0 9/30

3 1/30 0 0 1/30

p•j 14/30 14/30 2/30 1

Page 65: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

65

1

2

3

4

5

6

65

1

2

3

4

5

6

65

On a par exemple p42 = 0 et p4. × p.2 =130 × 14

30 .Donc p42 6= p4. × p.2 et par suite X et Y ne sont pas indépendantes.Exercice Soit (X,Y ) un couple de v. a. discrètes dont la loi est donnée par le tableau suivant

X \ Y 1 2 3 41 0.08 0.04 0.16 0.12

2 0.04 0.02 0.08 0.06

3 0.08 0.04 0.16 0.12

1. Déterminer les lois marginales du couple (X,Y ) et préciser si X et Y sont indépendantes.

2. Vérifier que E(XY ) = E(X)E(Y ).

Corrigé 1) Les lois marginales du couple (X,Y ) sont données par le tableau :

X \ Y 1 2 3 4 pi.1 0.08 0.04 0.16 0.12 0.4

2 0.04 0.02 0.08 0.06 0.2

3 0.08 0.04 0.16 0.12 0.4

p.j 0.2 0.1 0.4 0.3 1

On remarque que toutes les probabilités des couples(xi, yj) s’obtiennent en faisnat le produitdes probabilités marginales

∀i ∈ [[1, 3]], ∀j ∈ [[1, 4]] pij = pi. × p.j

Donc X et Y Sont indépendantes.2) Les espérances de X, Y et de XY se calcul à partir du tableau précédent

E(X) =3∑

i=1

xipi• = 1× 0.4 + 2× 0.2 + 3× 0.4

= 0.4 + 0.4 + 1.2

E(X) = 2

E(Y ) =

4∑j=1

1× 0.2 + 2× 0.1 + 3.4 + 4× 0.3

= 0.2 + 0.2 + 1.2 + 1.2

E(Y ) = 2.8

E(XY ) =3∑

i=1

4∑j=1

xiyjpij

= 1× 1× 0.08 + 1× 2× 0.04 + 1× 3× 0.16 + 1× 4× 0.12

+ 2× 1× 0.04 + 2× 2× 0.02 + 2× 3× 0.08 + 2× 4× 0.06

+ 3× 1× 0.08 + 3× 2× 0.04 + 3× 3× 0.16 + 3× 4× 0.12

= 0.08 + 0.08 + 0.48 + 0.48 + 0.08 + 0.08 + 0.48 + 0.48 + 0.24 + 0.24 + 1.44 + 1.44

E(XY ) = 5.6

On a E(X)E(Y ) = 2× 2.8 = 5.6 = E(XY ). Ceci est prévisible car X et Y sont indépendantes.

Page 66: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

66

1

2

3

4

5

6

66

1

2

3

4

5

6

66

6.2 Couple de variables aléatoires continues6.2.1 Fonction de répartition et densitéDéfinition 6.6. Soit (X,Y ) un couple de variable aléatoires réelles sur un espace probabilisé(ω, C, P ). On appelle fonction de répartition conjointe du couple (X,Y ), l’applicationFX,Y : R2 −→ [0, 1] définie par

FX,Y (x, y) = P (X ≤ x, Y ≤ y) = P ((X ≤ x) ∩ (Y ≤ y))

Remarque 6.3. La valeur FX,Y (x, y) représente la probabilité de la zone hachurée indiquée dansla figure

Figure 6.1: Courbe des fréquences cumulées

Remarque 6.4. Si FX,Y est deux fois derivable par rapport aux deux variables, alors la loi ducouple (X,Y ) est dite absolument continue de densité f définie par

f(x, y) =∂2FX,Y

∂x∂y.

La fonction de répartition se calcule alors par double intégration

F (X,Y )(x, y) =

∫ x

−∞

∫ y

−∞f(u, v)dudv.

Définition 6.7. Un couple de variables aléatoire (X,Y ) admet une densité s’il existe unefonction f : R2 → R positive, dont l’intégrale sur R2 existe et vaut 1, et telle que

∀(a, b) ∈ R2, P ((X ≤ a) ∩ (Y ≤ b)) =

∫ a

−∞

∫ b

−∞f(x, y)dxdy.

Exemple. Le fonction f définie par

f(x, y) =

e−(x+y) si x, y ≥ 00 sinon

est positive et ∫∫R2

f(x, y)dxdy =

∫ +∞

0e−xdx

∫ +∞

0e−ydy = 1.

Page 67: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

67

1

2

3

4

5

6

67

1

2

3

4

5

6

67

6.2.2 Densités marginalesProposition 6.3. Soit (X,Y ) un couple de v. a. de densité f. Alors X et Y sont des variablesà densité, dont une densité pour X est:

fX : x 7→∫ +∞

−∞f(x, y)dy.

et une densité pour Y est:

fY : y 7→∫ +∞

−∞f(x, y)dx.

Les fonctions fX et fY sont appelées densités marginales du couple (X,Y ).

Exemple. Soit (X,Y ) un couple de densité f définie sur R2 par

f(x, y) =1

2πe−

x2+y2

2

X a pour densité:

fX(x) =

∫ +∞

−∞

1

2πe−

x2+y2

2 dy =1√2π

e−x2

2

∫ +∞

−∞

1√2π

e−y2

2 dy︸ ︷︷ ︸=1

On remarque que X ∼ N (0, 1).

Théorème 6.2. Théorème de transfert Soit (X,Y ) un couple de densité f et φ une fonction deR2 dans R telle que |φ|f soit intégrable sur R2. Alors, φ(X,Y ) possède une espérance, et on a

E (φ(X,Y )) =

∫∫R2

φ(x, y)f(x, y)dxdy.

6.2.3 IndépendanceDéfinition 6.8. On dit que X et Y sont indépendantes si

∀(x, y) ∈ R2 P (X ≤ x, Y ≤ y) = P ((X ≤ x) ∩ (Y ≤ y)) = P (X ≤ x)P (Y ≤ x).

Proposition 6.4. Soient X et Y deux variables aléatoires de densité fX et fY et soit f ladensité du couple (X,Y ). X et Y sont indépendantes si et seulement si

∀(x, y) ∈ R2 f(x, y) = fX(x)fY (y).

Dans ce cas on a E(XY ) = E(X)E(Y ).

Exercice. Soit la fonction définie par

f(x) =

2e−(x+2y) si x ≥ 00 sinon

1. Déterminer les lois marginales de X et de Y .

2. Déterminer les densités conditionnelles de X sachant Y = y et de Y sachant X = x.

3. X et Y sont-elles indépendantes ?

4. Calculer la moyenne de X et celle de Y .

Page 68: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

68

1

2

3

4

5

6

68

1

2

3

4

5

6

68

Corrigé. 1) Loi marginale de X. Soit x ∈ R.

fX(x) =

∫ +∞

−∞f(x, y)dy =

∫ +∞

02e−xe−2ydy

= −e−x

∫ +∞

0−2e−2ydy = −e−x

[e−2y

]+∞0

= −e−x(0− 1)

fX(x) = e−x.

Loi marginale de Y . Soit y ∈ R.

fY (y) =

∫ +∞

−∞f(x, y)dx =

∫ +∞

02e−xe−2ydx

= −2e−2y

∫ +∞

0−e−xdx = −2e−2y

[e−x]+∞0

= −2e−2y(0− 1)

fY (y) = 2e−2y.

2) Pour tout y ∈ R, la densité conditionnelle de X sachant Y = y est donnée par

∀x ∈ R fX|Y=y =f(x, y)

fY (y).

Si x 6∈]0,+∞[ alors f(x, y) = 0 et par suite fX|Y=y(x) = 0.

Si x ∈]0,+∞[ alors fX|Y=y(x) =2e−xe−2y

2e−2y= e−x.

DoncfX|Y=y(x) =

e−x si x ∈]0,∞[,0 sinon

De la même façon, on obtient

fY |X=x(y) =

2e−y si y ∈]0,∞[,0 sinon

3) X et Y sont-elles indépendantes ?On remarque

∀x ∈ R fX|Y=y(x) = fX(x).

Donc X et Y sont indépendantes.On peut aussi voir que

∀y ∈ R fY |X=x(y) = fY (y),

ce qui traduit le fait que X et Y sont indépendantes.On peut aussi remarquer que

∀(x, y) ∈ R2 fX(x).fY (y) = f(x, y),

ce qui prouve que X et Y sont indépendantes.4) L’espérance de X.

E(X) =

∫ +∞

−∞xfX(x)dx =

∫ +∞

0xe−xdx

=[−xe−x

]+∞0

+

∫ +∞

0e−xdx = 0 +

[−e−x

]+∞0

E(X) = 1.

Page 69: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

69

1

2

3

4

5

6

69

1

2

3

4

5

6

69

L’espérance de Y .

E(Y ) =

∫ +∞

−∞yfY (y)dy =

∫ +∞

02ye−2ydy

=[−ye−2y

]+∞0

+

∫ +∞

0e−2ydy = 0 +

[−1

2e−2y

]+∞

0

E(Y ) =1

2.

6.3 Covariance et coefficient de corrélationSoit h : R2 −→ R une fonction continue. L’espérance de h(X,Y ) se calcule pour une loi dedensité f par l’intégrale

E(h(X,Y )) =

∫ ∫R2

h(x, y)f(x, y)dx dy.

Dans le cas particulier où h(X,Y ) = (X −E(X))(Y −E(Y )), ceci définie la covariance de X etY .

Cov(X,Y ) = E((X − E(X))(Y − E(Y ))

),

Définition 6.9. On appelle covariance de X et Y le réel, s’il existe

Cov(X,Y ) = E((X − E(X))(Y − E(Y ))

),

Proposition 6.5.1) Cov(X,Y ) = E(XY )− E(X)E(Y ).2) Cov(X,Y ) = Cov(Y,X).3) Cov(X + Y, Z) = Cov(X,Y ) + Cov(X,Z).4) Cov(aX + b, Y ) = aCov(X,Y ), ∀(a, b) ∈ R2.5) V (X + Y ) = V (X) + V (Y ) + 2Cov(X,Y ).6) |Cov(X,Y )| ≤ σ(X)σ(Y ).7) Si X et Y sont indépendantes, alors Cov(X,Y ) = 0.

Remarque 6.5. Si X et Y sont deux variables aléatoires indépendantes, alors

E(XY ) =

∫ ∫R2

xyf(x, y)dx dy =

∫ ∫R2

xyfX(x)fY (y)dx dy

=

∫RxfX(x)dx

∫RyfY (y)dy

E(XY ) = E(X)E(Y ).

Par consequent Cov(X,Y ) = E(XY )− E(X)E(Y ) = 0.Attention : la réciproque est généralement fausse, c-à-d si deux variables aléatoires ont unecovariance nulle, elles ne sont pas forcement indépendantes.

Définition 6.10. On appelle coefficient de corrélation linéaire de X et Y le réel, s’il existe

r(X,Y ) =Cov(X,Y )

σ(X)σ(Y ).

On a alors|r(X,Y )| ≤ 1.

Page 70: Statistiques Descriptives Et ProbabilitésLa Statistique descriptive à une variable 1 8 2 3 4 5 6 8 Effectifs Effectifs Fréquences Fréquences xi cumulés cumulées ni décroissants

Couple de variables aléatoiresCouple de variables aléatoiresCouple de variables aléatoires

1

2

3

4

5

6

70

1

2

3

4

5

6

70

1

2

3

4

5

6

70

Exercice . Soit un couple de variable aléatoire de densité

f(x, y) =

1

πR2 si (x, y) ∈ D(0, R)0 sinon,

où D(0, R) = (x, y) ∈ R2 : x2 + y2 ≤ R2.1) Déterminer les densités marginales de X et Y.2) X et Y sont-elles indépendantes?3) Calculer Cov(X,Y ).

Corrigé . 1) La densité marginale de f .

Soit x ∈ R. On a fX(x) =

∫ +∞

−∞f(x, y)dy.

Si x /∈ [−R,R] alors ∀y ∈ R, f(x, y) = 0 et donc fX(x) = 0.Si x ∈ [−R,R] alors

f(x, y) 6= 0 ⇐⇒ (x, y) ∈ D(0, R)

⇐⇒ x2 + y2 ≤ R2

⇐⇒ y2 ≤ R2 − x2

⇐⇒ |y| ≤√R2 − x2

f(x, y) 6= 0 ⇐⇒ −√

R2 − x2 ≤ |y| ≤√

R2 − x2.

Donc fX(x) =

∫ √R2−x2

−√R2−x2

1

πR2dy =

2

πR2

√R2 − x2.

Finalement la densité marginale de X est donnée par

fX(x) =

2

πR2

√R2 − x2 si −R ≤ x ≤ R,

0 sinon,

De la même façon, on obtient la densité marginale de Y ,

fY (y) =

2

πR2

√R2 − y2 si −R ≤ y ≤ R,

0 sinon,

2) X et Y sont-elles indépendantes ?.On a

∀(x, y) ∈ [−R,R]2, fX(x).fY (y) =4√R2 − x2

√R2 − y2

π2R46= 1

πR2= f(x, y).

Donc X et Y ne sont pas indépendantes.3) Calcul de Cov(X,Y ).On sait que Cov(X,Y ) = E(XY )− E(X)E(Y ).

E(X) =

∫ +∞

−∞xfX(x)dx =

2

πR2

∫ R

−Rx√

R2 − x2dx = 0,

car x −→ x√

R2 − x2 est une fonction impaire et on intègre sur [−R,R].De même pour l’espérance de Y , on obtient

E(Y ) =

∫ +∞

−∞yfY (y)dy =

2

πR2

∫ R

−Ry√R2 − y2dx = 0,

E(XY ) =

∫ ∫R2

f(x, y)dx dy =

∫ R

−R

∫ R

−R

1

πR2xydx dy =

1

πR2

∫ R

−Rxdx

∫ R

−Rydy = 0.

Donc Cov(X,Y ) = 0.Remarquer qu’on a un exemple de variables aléatoires dont la covariance est nulle, pourtantelles ne sont pas indépendantes.