626
Un cours complet De nombreux exercices et problèmes Toutes les solutions détaillées Sous la direction de Christian Gautier André Warusfel François Lussier • Gonzague de Monicault Serge Nicolas • Monique Ramis Bruno Caminade MATHÉMATIQUES TOUT-EN-UN • BCPST 2 e année

MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

� Un cours complet� De nombreux exercices et

problèmes� Toutes les solutions détaillées

Sous la direction de

Christian Gautier André WarusfelFrançois Lussier • Gonzague de MonicaultSerge Nicolas • Monique Ramis Bruno Caminade

MATHÉMATIQUESTOUT-EN-UN • BCPST 2e année

Page 2: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

MathématiquesTOUT-EN-UN • BCPST 2e année

Sous la direction de

Christian Gautier et André Warusfel

Cours et exercices corrigés

Bruno CaminadeProfesseur au lycée militaire de Saint-Cyr-l’École

François LussierProfesseur au lycée Sainte Geneviève

Gonzague de MonicaultProfesseur au lycée Montaigne

Serge NicolasProfesseur au lycée Henri IV

Monique RamisAncien professeur de chaires supérieures

Page 3: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

© Dunod, Paris, 2008ISBN 978-2-10-053976-5

Page 4: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Table des matières

Chapitre 1 Espaces vectoriels 11 Espaces vectoriels, sous-espaces vectoriels 12 Familles de vecteurs génératrices, libres 63 Base, dimension d’un espace vectoriel 94 Sous-espace vectoriel, somme de sous-espaces vectoriels 14

Chapitre 2 Applications linéaires 241 Applications linéaires 242 Rang d’une application linéaire 303 L’ensemble des applications linéaires de E dans F 324 Projections 355 Matrices et applications linéaires 376 Rang d’une matrice 45

Chapitre 3 Réduction des endomorphismes et des matrices 511 Changement de base 512 Valeurs et vecteurs propres d’un endomorphisme 553 Réduction des endomorphismes 584 Diagonalisation des matrices carrées 605 Applications de la réduction 69

Chapitre 4 Séries numériques 821 Généralités 822 Séries à terme général positif 913 Séries absolument convergentes 101

Page 5: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Table des matières

4 D’autres séries de référence 1025 Appendice : complément en vue des probabilités 107

Chapitre 5 Fonctions réelles de plusieurs variables 1191 Limites 1192 Continuité 1223 Dérivées partielles, fonctions de classe C1 1254 Fonctions de classe C2 1385 Notation différentielle, formes différentielles 142

Chapitre 6 Extensions de la notion d’intégrale 151

1 L’intégrale impropre∫ +∞

af (t)dt 151

2 L’ intégrale impropre∫ b

af (t)dt 161

3 Intégrales plusieurs fois impropres 1664 Pratique des intégrales impropres 1705 Intégrales doubles 176

Chapitre 7 Espaces probabilisés 1941 Espaces probabilisables 1942 Espaces probabilisés 1993 Les probabilités conditionnelles 2124 Indépendance 222

Chapitre 8 Variables aléatoires réelles discrètes 2331 Une application liée à une expérience aléatoire : la variable aléatoire 2332 Variables aléatoires discrètes 2373 Les moments d’une variable aléatoire 2484 Les lois usuelles 261

Chapitre 9 Couples de variables aléatoires réelles discrètes 2791 Lois associées à un couple de variables aléatoires discrètes 2792 Indépendance de variables aléatoires discrètes 2873 Variable aléatoire fonction de deux variables aléatoires 2924 Covariance et coefficient de corrélation linéaire 299

Chapitre 10 Variables aléatoires réelles à densité 3131 Notion de variable aléatoire réelle à densité 3132 Variable aléatoire fonction d’une variable aléatoire à densité 3213 Espérance et variance d’une variable aléatoire à densité 327

iv

Page 6: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Table des matières

4 Les lois usuelles 3375 Indépendance 351

Chapitre 11 Couples de variables aléatoires admettant une densité 3611 Lois associées à un couple de variables aléatoires à densité 3612 Variables aléatoires fonctions d’un couple de variables à densité 3713 Covariance - Coefficient de corrélation 382

Chapitre 12 Convergences et approximations 3931 Loi faible des grand nombres 3932 Convergence en loi 3963 Théorème de la limite centrée 399

Solution des exercices 407Chapitre 1 408Chapitre 2 419Chapitre 3 425Chapitre 4 453Chapitre 5 475Chapitre 6 484Chapitre 7 498Chapitre 8 513Chapitre 9 534Chapitre 10 555Chapitre 11 579Chapitre 12 608

Index 615

v

Page 7: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année
Page 8: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1Espaces vectoriels

1. Espaces vectoriels, sous-espaces vectorielsNous reprenons et complétons les définitions et propriétés établies dans le livre de premièreannée, le lecteur s’y référera pour les démonstrations que nous ne reprenons pas en détail.

Dans tout ce chapitre K représente soit l’ensemble des réels R soit celui des com-plexes C.

1.1 Espaces vectoriels sur K

Définition 1

Soit E un ensemble muni d’une loi de composition interne notée + et d’une loi decomposition externe à opérateurs dans K notée ·. On dit que (E, +, ·) est un K-espacevectoriel s’il vérifie les dix propriétés suivantes

1. (E, +) est un groupe commutatif, c’est-à-dire que :

Oi L’opération + est une loi de composition interne.

A Pour tout triplet (x, y, z) d’éléments de E, on a (x + y) + z = x + (y + z).

N Il existe un élément 0E dans E, tel que pour tout élément x de E, on ax + 0E = 0E + x = x.

S Pour tout élément x de E, il existe un élément y de E tel que x+y = y+x = 0E ;on note cet élément −x.

C Pour tout couple (x, y) d’éléments de E on a x + y = y + x.

2. La loi · vérifie les cinq propriétés suivantes :

Oe L’opération · est une loi de composition externe.

Am Pour tout couple (l, m) d’éléments de K et pour tout élément x de E,l · (m · x) = (lm) · x.

Page 9: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

N Pour tout élément x de E, 1 · x = x.

Dg Pour tout couple (l, m) d’éléments de K et pour tout élément x de E,

(l + m) · x = l · x + m · x.

Dd Pour tout l ∈ K et tout couple (x, y) d’éléments de E, l · (x + y) = l · x + l · y.

➤ Remarques• Les éléments de K sont appelés des scalaires et les éléments de E des vecteurs.

• Sauf mention contraire, les lettres majuscules E, F . . . désigneront des espaces vectoriels sur K, les lettresminuscules u, v, . . . , ou e1, e2, . . . désigneront des vecteurs et les lettres grecques a, b,. . . , l, m, . . . desscalaires.

• Le vecteur nul 0E, élément neutre pour l’addition des vecteurs, est unique et nous avons, pour tout scalaire l

et tout vecteur x, l’équivalence lx = 0E ⇐⇒ (l = 0) ou (x = 0E).

• L’opposé d’un vecteur x est unique et nous avons pour tout scalaire l les égalités suivantes(−l)x = l(−x) = −(lx).

• Tout espace vectoriel contient au moins le vecteur nul et n’est donc pas vide.

Exemples

1. L’ensemble K[X] des polynômes muni des lois habituelles est un K-espace vectoriel.

2. Pour toute valeur des entiers non nuls n et p, l’ensemble Mn,p(K) des matrices muni deslois habituelles est un K-espace vectoriel.

3. Pour toute valeur de l’entier non nul n, l’ensemble Kn(ou M1,n(K)

)des n-uplets de

scalaires est un K-espace vectoriel.

4. L’ensemble C lui-même peut être considéré comme un R-espace vectoriel ou un C-espacevectoriel.

5. L’ensemble KN des suites de scalaires muni de l’addition des suites et du produit par un

scalaires est un K-espace vectoriel.

6. L’ensemble RI des fonctions réelles f définies sur un intervalle I muni de l’addition desfonctions et du produit par un réel est un R-espace vectoriel.

Définition 2

On appelle famille finie de vecteurs tout n-uplet de n vecteurs où n est un entier naturelnon nul.

➤ Remarques• Deux familles de vecteurs sont égales si elles sont constituées des mêmes vecteurs dans le même ordre.

• On note habituellement une telle famille (e1, e2, . . . , en) ou (ei )i∈I avec I un sous-ensemble fini de N.

• On dira que (ei )i∈J est une sous famille de la famille (ei )i∈I si l’on a J ⊂ I.

2

Page 10: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces vectoriels, sous-espaces vectoriels

Définition 3

Un vecteur x de E est dit combinaison linéaire d’une famille (e1, e2, . . . , en) s’il existe n

éléments l1, l2, . . . , ln de K tels que x =n∑

i=1

liei.

L’ensemble des combinaisons linéaires de (e1, e2, . . . , en) est noté Vect(e1, e2, . . . , en).

Exemples1. Dans l’ensemble K

3 des triplets de scalaires, le vecteur (2, 5, 9) est combi-naison linéaire de la famille de vecteurs

((1, 1, 1), (0, 1, 1), (0, 0, 1)

), en effet

(2, 5, 9) = 2(1, 1, 1) + 3(0, 1, 1) + 4(0, 0, 1).

2. Dans l’ensemble des polynômes R[X], on a Vect(X2, X, 1) qui est égal à R2[X] puisquenous avons par définition R2[X] = {aX2 + bX + c|(a, b, c) ∈ R

3}.

3. Dans M2(R), posons D =(

1 00 1

)et D =

(0 1

−1 0

).

Pour tous scalaires l et m, nous avons alors lD+mD =(

l m

−m l

). Nous en déduisons

Vect(D, D) ={(

l m

−m l

)∣∣∣∣ (l, m) ∈ R2

}.

1.2 Sous-espaces vectoriels

Définition

Définition 4

Soient E un espace vectoriel et F un sous-ensemble de E. On dit que F est un sous-espace vectoriel de E si F est non vide et s’il vérifie les deux propriétés suivantes.

1. Pour tout couple (x, y) de vecteurs de F, le vecteur x + y appartient à F.

2. Pour tout scalaire l et tout vecteur x de F, le vecteur lx appartient à F.

➤ RemarqueOn dira que F est un sous-espace de l’espace vectoriel E s’il est non vide, stable par addition et stable par multipli-cation par un scalaire.

Exemples1. Tout espace vectoriel E a toujours au moins deux sous espaces qui sont E lui-même (c’est

le plus grand des sous-espaces de E pour l’inclusion) et {0E} (c’est le plus petit des sous-espaces de E pour l’inclusion).

2. L’ensemble{

(x, y, 0)| (x, y) ∈ K2}

est un sous espace vectoriel de K3.

Théorème 1

Soit (E, +, ·) un K-espace vectoriel et F un sous-espace vectoriel de E.L’ensemble F est lui-même un espace vectoriel pour les lois + et ·.

3

Page 11: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

PreuveIl suffit d’observer que (F, +, ·) vérifie les dix propriétés OANSCOANDD caractéristiques des espaces vectoriels.L’existence dans F de l’opposé de tout élément x de F et de l’élément nul vient de la stabilité de F par lamultiplication par un scalaire : soit x un élément de F, (il en existe au moins un, F �= ∅) alors −x = (−1)x et0E = 0x existent et sont dans F. ❑

Exercice 1.Soit K[X] le K-espace vectoriel des polynômes sur K. Soient a un scalaire fixé et Ea l’ensembledes polynômes qui s’annulent en a.Montrer que Ea est un sous-espace vectoriel de K[X].

Solution.Nous avons :

• Ea sous-ensemble de K[X] est non vide, il contient le polynôme P = X − a.

• Si P et Q sont deux polynômes tels que P(a) = 0 et Q(a) = 0, alors nous avons(P + Q)(a) = P(a) + Q(a) = 0 ; P + Q appartient à Ea qui est donc stable pour l’addition.

• Si P est un polynôme tel que P(a) = 0 et l un scalaire, alors (lP)(a) = lP(a) = 0 ; lPappartient à Ea qui est donc stable par multiplication par un scalaire.

L’ensemble Ea des polynômes qui s’annulent en a est non vide, stable par addition et parmultiplication par un scalaire ; c’est un sous-espace vectoriel de K[X].

Exercice 2.Soit S l’ensemble des matrices symétriques de tailles 2× 2 sous ensemble de l’espace vectorielM2[K]. Nous rappelons qu’une matrice est symétrique si elle est égale à sa transposée, ainsi

S ={(

r ss t

)∣∣∣∣ (r, s, t) ∈ K3

}. Montrer que S est un sous-espace vectoriel de M2[K].

Solution.Nous avons :

• S est non vide, il contient la matrice nulle.

• Nous savons que pour toutes matrices A et B de même taille t(A + B) = tA + tB ; si A et Bsont deux matrices dans S, leur somme est aussi dans S.

• Nous savons que pour toute matrice A et tout réel l on a t(lA) = l(tA) ; si A est unematrice dans S, alors lA est aussi dans S.

L’ensemble S des matrices 2 × 2 symétriques est non vide, stable par addition et par multipli-cation par un scalaire ; c’est un sous-espace vectoriel de M2[K].

Théorème 2 (Pour démontrer qu’une partie de E est un sous-espace)

Soit F une partie d’un espace vectoriel (E, +, ·). L’ensemble F est un sous-espace de E si

1. F est non vide,

2. ∀(x, y) ∈ F2 ∀(l, m) ∈ K2 lx + my ∈ F.

4

Page 12: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces vectoriels, sous-espaces vectoriels

➤ RemarqueOn peut résumer cette proposition en disant qu’un sous-ensemble F d’un espace vectoriel E est un sous-espace s’ilest non vide et stable par combinaisons linéaires.

PreuveIl suffit de remarquer que si F vérifie les deux conditions ci-dessus, alors il vérifie la définition des sous-espace.En effet, F est non vide, puis en prenant l = m = 1 nous obtenons la stabilité de F par addition, en prenant l

quelconque et m = 0 nous obtenons la stabilité de F par multiplication par un scalaire. ❑

Proposition 1 (Intersection de sous-espaces vectoriels)

Toute intersection de sous-espaces vectoriels d’un espace vectoriel est un sous-espacevectoriel.

Preuve Soit I une intersection de sous-espaces vectoriels d’un espace vectoriel E ; 0 appartient à chacun dessous-espaces donc à I qui est de ce fait non vide ; une combinaison linéaire d’éléments de I appartient à chacundes sous-espaces donc à leur intersection I.L’ensemble I est non vide, stable par combinaison linéaire c’est un sous-espace de E. ❑

1.3 Exemples de sous-espaces vectoriels

Les exemples qui suivent sont importants.

Les ensembles Kn[X]

Proposition 2

Soit n un entier naturel, l’ensemble Kn[X] des polynômes de degré inférieur ou égal à nest un sous-espace de l’espace vectoriel K[X]

L’ensemble Kn[X] des polynômes de degré inférieur ou égal à n est non vide et stablepar combinaison linéaire.

Certains sous-ensembles de l’ensemble des fonctions définies sur unintervalle I

Proposition 3

Soit I un intervalle non vide de R. L’ensemble C0(I, R) des fonctions continues de I dansR est un sous-espace de l’espace vectoriel R

I des fonctions réelles définies sur I .

Il en est de même pour l’ensembles des fonctions dérivables, de classe Cn ou C∞ surun intervalle I non vide et non réduit à un point.

L’ensemble des solutions d’un système d’équations linéaires homogène

Proposition 4

L’ensemble des solutions d’un système linéaire homogène est un sous-espace de Rn.

5

Page 13: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Preuve Soit le système S de p équations à n inconnues.

S :

⎧⎪⎪⎪⎨⎪⎪⎪⎩a1,1x1 + a1,2x2 + · · · + a1,nxn = 0

(E1)

a2,1x1 + a2,2x2 + · · · + a2,nxn = 0(E2)

...ap,1x1 + ap,2x2 + · · · + ap,nxn = 0

(Ep)

Le vecteur nul est solution de S. Si X = (x1, x2, . . . , xn) et X′ = (x′1, x′2, . . . , x′n) sont deux solutions, nous voyonsfacilement que X + X′ est aussi solution ; si de plus l est scalaire quelconque, lX est aussi solution. L’ensembledes solutions est donc non vide, stable par addition et par multiplication par un réel, c’est un sous-espacevectoriel de Kn. ❑

2. Familles de vecteurs génératrices, libres

2.1 Sous-espace vectoriel engendré par une famille de vecteur

Proposition 5

Soit (e1, e2, . . . , en) une famille finie de vecteurs de E.L’ensemble Vect(e1, e2, . . . , en) des combinaisons linéaires de cette famille est un sous-espace vectoriel de E, c’est le sous-espace engendré par (e1, e2, . . . , en).

PreuveIl suffit de vérifier que Vect(e1, e2, . . . , en) est non vide et stable par combinaison linéaire. ❑

Exemples1. Le sous-espace vectoriel Vect(1, X, X2) de K[X] engendré par (1, X, X2) est le sous-espace

vectoriel K2[X] = {aX2 + bX + c|(a, b, c) ∈ K3} des polynômes de degré inférieur ou

égal à 2.

2. Le sous-espace vectoriel de K3 engendré par((−1, 1, 0), (−1, 0, 1)

)est le sous-espace

P = {(−y − z, y, z)|(y, z) ∈ K2} de l’espace vectoriel K

3.On peut observer que les éléments de P sont des triplets solutions de l’équation x+y+z = 0et réciproquement si (x, y, z) est solution de cette équation, alors il s’écrit (−y − z, y, z) etest un élément de P. L’ensemble P est donc l’ensemble des solutions de x + y + z = 0.

➤ RemarqueUne manière efficace de montrer qu’un ensemble est un espace vectoriel est de montrer qu’il est un sous-espacevectoriel engendré par une famille de vecteurs.

Exercice 3.

Montrer que l’ensemble E ={(

a + b ba a − b

)∣∣∣∣ (a, b) ∈ R2

}est un espace vectoriel sur R.

Solution.Remarquons que E est un sous-ensemble de l’espace vectoriel M2(R).

Posons M1 =(

1 01 1

)et M2 =

(1 10 −1

). Nous avons E =

{aM1 + bM2| (a, b) ∈ R2

},

c’est à dire E = Vect (M1, M2) ; l’ensemble E est donc un sous-espace de M2(R) et donc unespace vectoriel.

6

Page 14: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Familles de vecteurs génératrices, libres

L’ensemble des suites définies par une même récurrence linéaire double

Proposition 6

Soit (a, b) ∈ C2, avec b �= 0, soit E l’ensemble des suites de complexes (un)n∈N telle que∀n ∈ N un+2 = aun+1 + bun.On note l et m les racines de son polynôme caractéristique P = X2 − aX − b et (xn) et(yn) les suites définie par xn = ln et par yn = mn si l �= m ou yn = nln si l = m.Alors E est un sous-espace vectoriel de K

N et E = Vect(xn, yn)

Le théorème vu en première année affirmait que E ⊂ Vect(xn, yn) et il est facile devérifier l’inclusion inverse dans le cas l �= m et dans le cas l = m.

2.2 Familles génératrices d’un espace vectoriel, familles libres

Définition 5

Soit E un espace vectoriel sur K.Une famille finie (e1, e2, . . . , en) de n vecteurs de E est dite génératrice de E si pour

tout x ∈ E, il existe n scalaires l1, l2, . . . , ln tels que x =n∑

i=1

liei.

On a alors Vect(e1, e2, . . . , en) = E.

➤ RemarqueOn dit aussi qu’une famille de vecteurs (e1, e2, . . . , en) engendre le sous-espace vectoriel F siF = Vect(e1, e2, . . . , en).

Proposition 7 (Propriétés des familles génératrices)

Soient E un espace vectoriel et (ei)1�i�n une famille de vecteurs de E.Soit F = Vect(e1, e2, . . . , en) le sous-espace de E engendré par cette famille.Si

• on change l’ordre des vecteurs de la famille (ei)1�i�n,

• ou on ajoute à un vecteur de la famille (ei)1�i�n une combinaison linéaire des autres,

• ou on multiplie un vecteur de la famille (ei)1�i�n par un scalaire non nul,

• ou on ajoute à la famille (ei)1�i�n un nombre p d’autres vecteurs de F,

• ou on enlève de la famille (ei)1�i�n un de ses vecteurs qui lui-même est une combinai-son linéaire des autres vecteurs de la famille,

alors le sous-espace engendré par chacune de ces nouvelles familles est encore égal à F.

En particulier ceci est vrai pour une famille finie génératrice de E lui même.

PreuveVoir le cours de première année. ❑

7

Page 15: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Définition 6

Une famille (e1, e2, . . . , en) est dite libre si pour tout n-uplet de scalaires (l1, l2, . . . , ln)on a ( n∑

i=1

liei = 0)

⇒ (l1 = l2 = · · · = ln = 0).

On dit aussi que les vecteurs e1, e2, . . . , en sont linéairement indépendants.Une famille qui n’est pas libre est dite liée.

➤ Remarque

Pour toute famille (e1, e2, . . . , en) de vecteurs, il y a toujours la combinaison linéaire nulle trivialen∑

i=1

0ei = 0. Une

famille finie de vecteurs est libre si la seule combinaison linéaire nulle est la combinaison linéaire nulle triviale ; elleest liée s’il existe une combinaison linéaire nulle non triviale, c’est-à-dire avec des coefficients non tous nuls.

Exemples1. Toute famille contenant le vecteur nul 0E est une famille liée, en effet, la combinaison

linéaire des vecteurs de cette famille écrite avec un coefficient égal à 1 pour 0E et tous lesautres coefficients nuls est une combinaison linéaire nulle non triviale.

2. La famille(

(3, 1) , (0, 2))

est-elle une famille libre de vecteurs de R2 ?

Soient a et b sont deux réels tels que

a(3, 1) + b(0, 2) = 0.

alors (3a, a + 2b) = (0, 0), et donc a = 0 et b = 0.La famille

((3, 1) , (0, 2)

)est libre.

3. La famille(1+X +X2, 3+X +5X2, 2+X +3X2

)est-elle une famille liée de vecteurs de K2[X] ?

Nous remarquons que 1(1+X+X2)+1(3+X+5X2)−2(2+X+3X2) = 0, il existe donc unecombinaison linéaire nulle non triviale ; la famille

(1 + X + X2, 3 + X + 5X2, 2 + X + 3X2

)est une famille liée.

4. La famille de polynômes (1, X, X2, . . . , Xn) est une famille libre de K[X]. En effet, si

a0, a1, . . . , an sont des scalaires tels quen∑

i=0

aiXi = 0K[X] alors a0 = a1 = · · · = an = 0.

Proposition 8 (Propriétés des familles liées)

Soit E un espace vectoriel.

• Une famille finie de vecteurs liée dont on change l’ordre des vecteurs reste une familleliée.

• La famille (e1) est liée si, et seulement si, le vecteur e1 est nul.

• La famille (e1, e2) est liée si, et seulement si, l’un des vecteurs est égal à l’autre multipliépar un scalaire ; on dit dans ce cas que les vecteurs e1 et e2 sont colinéaires.

• La famille (e1, e2, . . . , en) est liée si, et seulement si, l’un des ei est égal à une combinaisonlinéaire des autres.

PreuveLa preuve est détaillée dans le cours de première année. ❑

8

Page 16: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Base, dimension d’un espace vectoriel

Proposition 9 (Propriétés des familles libres)

Soient E un espace vectoriel et (e1, e2, . . . , en) une famille de vecteurs.

• Une famille finie de vecteurs libre dont on change l’ordre des vecteurs reste une famillelibre.

• Si la famille (e1, e2, . . . , en) est libre, toute sous-famille de (e1, e2, . . . , en) est aussi libre.

• La famille (e1, e2, . . . , en) est libre si, et seulement si, tout vecteur de Vect(e1, e2, . . . , en)s’écrit de manière unique comme combinaison linéaire de cette famille.

PreuveNous reprenons juste la démonstration du troisième point.

� Supposons dans un premier temps avoir une famille (e1, e2, . . . , en) libre. Soit v un vecteur deVect(e1, e2, . . . , en) qui s’écrit de deux façons comme combinaison linéaire de cette famille

v =n∑

i=1

liei =n∑

i=1

miei

alorsn∑

i=1

(li − mi )ei = 0.

Comme la famille (e1, e2, . . . , en) est libre, nous avons l1−m1 = l2−m2 = · · · = ln−mn = 0. Autrementdit l1 = m1, l2 = m2, . . . , ln = mn et le vecteur v s’écrit donc de manière unique comme combinaisonlinéaire de la famille (e1, e2, . . . , en).

� Réciproquement, donnons-nous une famille (e1, e2, . . . , en) qui vérifie la propriété donnée et prouvons quecette famille est libre. Soient l1, l2, . . . , ln des scalaires tels que

n∑i=1

liei = 0, c’est-à-diren∑

i=1

liei =n∑

i=1

0ei.

De l’unicité de l’écriture d’un vecteur, nous déduisons que l1 = 0, l2 = 0, . . . , ln = 0, c’est-à-dire que lafamille (e1, e2, . . . , en) est libre. ❑

3. Base, dimension d’un espace vectoriel

3.1 Définition

Définition 7

Une famille finie (e1, e2, . . . , en) est une base de E si elle est libre et génératrice, autrementdit si pour tout x ∈ E il existe un et un seul n-uplet (l1, l2, . . . , ln) d’éléments de K telsque

x =n∑

i=1

liei.

Les scalaires l1, . . . , ln sont appelés coordonnées de x dans la base (e1, . . . , en), et lesvecteurs l1e1, . . . , lnen sont ses composantes.

9

Page 17: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

➤ Remarques• Plus généralement une famille sera appelée base d’un sous-espace vectoriel F si elle est libre et génératrice

pour l’espace vectoriel F.

• On retiendra que si une famille B est une base de l’espace vectoriel E, alors, parce que B est génératrice deE, tout vecteur de E s’écrit comme une combinaison linéaire des vecteurs de B et, parce que B est libre, cetteécriture est unique.

• Certains des espaces vectoriels que nous rencontrerons ont une base particulièrement simple que l’on appellebase canonique. Elles sont décrites ci-dessous.

Base canonique de Kn. Définissons dans Kn les vecteurs

e1 = ( 1 , 0 , 0 , . . . , 0 , 0 )...

ei = (0, . . . , 0 , 1,︸︷︷︸ie place

0, . . . , 0)...

en = ( 0 , 0 , 0 , . . . , 0 , 1 ).

Pour tous scalaires x1, x2, . . . , xn nous avonsn∑

i=1

xiei = (x1, x2, . . . , xn).

La famille (e1, e2, . . . , en) engendre bien tous les n-uplets de Kn et si une combinaisonlinéaire des vecteurs de cette famille est nulle, les coefficients xi pour 1 � i � ndoivent être nuls. La famille (e1, e2, . . . , en) est donc libre et génératrice de K

n, c’estune base de K

n. Cette famille est appelée la base canonique de Kn.

Dans cette base, les coordonnées d’un n-uplet (x1, x2, . . . , xn) de Kn sont justement

les éléments x1, x2, . . . , xn du n-uplet. Ce n’est pas le cas pour toute autre base de Kn.

Base canonique de Kn[X]. La famille de polynômes

(1, X, X2, . . . , Xn)

est génératrice de Kn[X] par définition de Kn[X]. Elle est aussi libre puisque toutpolynôme de degré inférieur ou égal à n s’écrit de manière unique comme combinai-son linéaire de cette famille de vecteurs.Cette famille est appelée la base canonique de Kn[X].Dans cette base, les coordonnées d’un polynôme a0 + a1X + · · ·+ anXn sont justementles coefficients a0, a1, a2, . . . , an des termes du polynôme. Ce n’est pas le cas pourtoute autre base de Kn[X].

Base canonique de Mn,p(K). La base canonique de Mn,p(K) n’est pas au pro-gramme, elle est cependant similaire à celle de Kn.Nous définissons dans Mn,p(K) les matrices Ei,j dont tous les coefficients sont nuls

10

Page 18: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Base, dimension d’un espace vectoriel

sauf celui de la ième ligne et de la jème colonne qui vaut 1.

jème colonne↓

Ei,j =

⎛⎜⎜⎜⎜⎜⎝0 · · · 0 · · · 0...

......

0 · · · 1 · · · 0...

......

0 · · · 0 · · · 0

⎞⎟⎟⎟⎟⎟⎠ ← ième

ligne

Pour toute matrice A = (ai,j) 1�i�n1�j�p

, nous avons A = (ai,j) 1�i�n1�j�p

=n∑

i=1

p∑j=1

ai,jEi,j.

Par ailleurs, si l’on an∑

i=1

p∑j=1

ai,jEi,j = 0, les coefficients (ai,j) 1�i�n1�j�p

doivent alors être

tous nuls.La famille (Ei,j) 1�i�n

1�j�pest donc libre et génératrice dans Mn,p(K) , c’est la base canonique

de Mn,p(K).Dans cette base, les coordonnées d’une matrice A = (ai,j) 1�i�n

1�j�psont justement les

coefficients de cette matrice. Ce n’est pas le cas pour toute autre base de Mn,p(K).

3.2 Dimension d’un espace vectoriel

Espace vectoriel de dimension finie

Définition 8

Un espace vectoriel E est dit de dimension finie s’il possède une famille génératrice finieou s’il est réduit à {0}.

ExempleLes espaces K

n, Kn[X] et Mn,p(K) sont des K-espaces de dimension finie, leur base canoniquesont des familles finies qui les engendrent.

Lemme

Soit E un espace vectoriel tel qu’il existe une famille libre L = (e1, e2, . . . , ek) de vecteursde E et des vecteurs f1, f2, . . . , fn de E tels que la famille G = (e1, e2, . . . , ek, f1, . . . , fn) soitgénératrice de E. Alors il existe une famille B contenant L et contenue dans G qui est unebase de E.

PreuveVoir le cours de première année. ❑

11

Page 19: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Théorème 3

Tout espace de dimension finie non réduit à {0} admet une base.

PreuveSoit E un espace vectoriel non réduit à {0} de dimension finie. Il admet donc une famille génératrice finie G quicontient au moins un vecteur e1 non nul, sinon E serait réduit à {0}. La famille (e1) est libre.On applique le lemme précédent avec (e1) famille libre et G famille finie génératrice de E. ❑

Théorème de la base incomplète, dimension

Lemme

Soient (e1, e2, . . . , en) et (f1, f2, . . . , fn+1) deux familles de vecteurs de E telles que chacundes vecteurs de la seconde famille soit combinaison linéaire de la première famille. Lafamille (f1, f2, . . . , fn+1) est liée.

PreuveLa démonstration peut se faire par récurrence sur n, elle a été détaillée dans le cours de première année. ❑

➤ Remarques• Cela veut dire qu’avec n vecteurs, on ne peut pas écrire par combinaison linéaire une famille de n + 1 vecteurs

qui soit libre.

• Plus généralement si n vecteurs (f1, f2, . . . , fn) s’expriment comme combinaison linéaire de p vecteurs(e1, e2, . . . , ep) où p < n, alors la famille (f1, f2, . . . , fn) est liée. Il suffit en effet de considérer que les vecteursf1, f2, . . . , fn sont des combinaisons linéaires des n − 1 vecteurs (e1, e2, . . . , ep, ep+1, . . . , en−1), où l’on a poséek = 0 pour k ∈ �p + 1, n − 1� et d’appliquer le lemme précédent.

Théorème 4

Soit E un espace non réduit à {0} de dimension finie. Toutes les bases de E ont le mêmenombre de vecteurs. Ce nombre est appelé la dimension de l’espace.Par convention, la dimension de l’espace réduit à {0} est 0.

PreuveSoient E = (e1, e2, . . . , en) et F = (f1, f2, . . . , fp) deux bases d’un même espace vectoriel E. Comme E est unefamille génératrice, tous les vecteurs de F sont des combinaisons linéaires de la famille E . La famille F étantlibre, on a nécessairement p � n. Mais en renversant les rôles, on obtient n � p. Donc n = p. ❑

Exemples1. La base canonique de K

n possédant n vecteurs, Kn est de dimension n.

2. De même la base canonique de Kn[X] possédant n + 1 vecteurs, Kn[X] est de dimen-sion n + 1.

3. La base canonique de Mn,p(K) est composée des n × p vecteurs (Ei,j) 1�i�n1�j�p

, l’espace des

matrices de tailles n × p est donc de dimension np.

➤ RemarqueUn espace pour lequel il n’existe pas de famille génératrice finie est dit de dimension infinie. Pour un tel espace,il n’existe pas de base finie. Nous pouvons citer entre autres l’espace vectoriel des suites de scalaires KN, l’espace

12

Page 20: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Base, dimension d’un espace vectoriel

vectoriel des polynômesK[X], l’espace vectorielRI des fonctions réelles définies sur un intervalle I, l’espace vectorielC0(I,R) des fonctions continues d’un intervalle I dans R (c’est un sous-espace de RI).

Théorème 5 (Théorème de la base incomplète)

Soit (e1, e2, . . . , ek) une famille libre de E espace de dimension n. Il existe des vecteursek+1, . . . , en de E tels que (e1, e2, . . . , ek, ek+1, . . . , en) soit une base de E.

PreuveSoit L cette famille libre et G une famille génératrice, la famille G′ formée de la « juxtaposition »des vecteurs deL et de G est aussi génératrice. On sait alors qu’il existe une base B de E qui contient L et contenue dans G′,et qui complète bien la famille L. ❑

Théorème 6

Soit E un espace de dimension n.

1. a. Toute famille libre possède au plus n vecteurs.

b. Toute famille libre de n vecteurs est une base.

c. Toute famille de p vecteurs avec p > n n’est pas libre, elle est liée.

2. a. Toute famille génératrice possède au moins n vecteurs.

b. Toute famille génératrice de n vecteurs est une base.

c. Toute famille de p vecteurs avec p < n n’est pas génératrice.

PreuveVoir le cours de première année. ❑

➤ RemarqueLorsque l’on travaille dans un espace vectoriel de dimension finie n connue, pour prouver qu’une famille de nvecteurs est une base, il suffit donc de vérifier qu’elle est soit libre soit génératrice. En générale il est plus rapidede montrer que la famille est libre.

Exercice 4.On considère les quatre polynômes P0 = (X − 1)(X − 2)(X − 3), P1 = X(X − 2)(X − 3),P2 = X(X − 1)(X − 3) et P3 = X(X − 1)(X − 2).Démontrer que la famille B = (P0, P1, P2, P3) est une base de K3[X].

Solution. Soient l0, l1, l2, l3 quatre scalaires tels que pour tout x dans K on ait

l0P0(x) + l1P1(x) + l2P2(x) + l3P3(x) = 0.

Remarquons que pour x = 0 tous les polynômes de B s’annulent sauf P0(0) qui vaut −6, enprenant donc x = 0, nous obtenons −6l0 = 0, donc l0 = 0.En prenant successivement x = 1, x = 2 et x = 3, nous obtenons de même 2l1 = 0,−2l2 = 0 et 6l3 = 0, donc l1 = l2 = l3 = 0.La famille B est donc une famille libre de quatre vecteurs dans un espace de dimension 4, elleest donc une base de K3[X].

13

Page 21: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Exercice 5.On se place dans l’espace vectoriel Kn[X].Soit B = (P0, P1, . . . , Pn) une famille de n+1 polynômes de Kn[X] tels que pour tout i ∈ �0, n�on ait deg(Pi) = i. On dit qu’une telle famille de polynômes est échelonnée en degrés.Démontrer que la famille B est libre, en déduire que c’est une base de Kn[X].

Solution. Soient l0, l1, . . . , ln n + 1 scalaires tels que pour tout x dans K on ait

l0P0(x) + l1P1(x) + · · · + lnPn(x) = 0.

Supposons que les li ne soient pas tous nuls et notons i0 le plus grand indice i ∈ �0, n� tel queli �= 0 et notons axi0 , avec a �= 0, le terme de plus haut degré de Pi0 (x).Si nous regroupons et ordonnons tous les termes de la somme de polynômesl0P0(x) + l1P1(x) + · · · + lnPn(x), nous pouvons observer que son terme de plus haut degréest li0ax

i0 avec li0a �= 0 ce qui contredit le fait que cette somme est le polynôme nul. Nousavons donc li = 0 pour tout i ∈ �0, n� et la famille B est une famille libre de n + 1 vecteurs.Comme B est une famille libre de n + 1 vecteurs dans Kn[X], espace de dimension n + 1, elleest une base de Kn[X].

4. Sous-espace vectoriel, somme de sous-espaces vectoriels

4.1 Dimension des sous-espaces d’un espace de dimension finie

Théorème 7

Tout sous-espace vectoriel F d’un espace E de dimension finie est de dimension finie etdim F � dim E ; il y a égalité des dimensions si, et seulement si, F = E.

PreuveSoit F un sous-espace vectoriel d’un espace E de dimension n.Si F est réduit à {0}, on a dim F � dim E. On suppose maintenant F non réduit à {0}.Toutes les familles libres de vecteurs de F étant également des familles libres de vecteurs de E, elles comptentau plus n éléments.Il existe au moins une famille libre B de vecteurs de F de cardinal p maximal. Soit

B = (e1, e2, . . . , ep) avec p � n.

Montrons que B est une famille génératrice de F. Soit f un vecteur quelconque de F ; la famille (e1, e2, . . . , ep, f )est liée, sinon la famille B de vecteur libres ne serait pas de cardinal maximal. Soient l1, l2, . . . , lp, lp+1 desscalaires non tous nuls tels que

l1e1 + l2e2 + · · · + lpep + lp+1f = 0.

Le scalaire lp+1 ne peut pas être nul, sinon nous aurions une contradiction avec la liberté de la famille B. Nouspouvons donc écrire

f = − 1

lp+1(l1e1 + l2e2 + · · · + lpep)

et conclure que f est combinaison linéaire de la famille B.La famille B est donc génératrice de F, elle est libre, c’est une base de F. La dimension de F est p et p � n.De plus si dim(F) = dim(E), c’est-à-dire p = n, alors la famille B est une famille libre de E de n vecteurs. Lafamille B est donc une base de E d’où F = E.Réciproquement si F = E alors il est clair que dim(F) = dim(E). ❑

14

Page 22: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Sous-espace vectoriel, somme de sous-espaces vectoriels

Corollaire 1

Soient F, G deux sous-espaces vectoriels de E. Si F ⊂ G alors dim F � dim G ; il y aégalité des dimensions si, et seulement si, F = G.

PreuveIl suffit de remarquer que, si F et G sont deux sous-espaces vectoriels de E avec F ⊂ G, alors F est lui-même unsous-espace de G ; puis appliquer le théorème précédent à F et G. ❑

Définition 9

Soit E un espace de dimension n. On appelle droite vectorielle de E un sous-espace vec-toriel de E de dimension 1 et plan vectoriel un sous-espace vectoriel de E de dimension2.

Exemples1. En utilisant les vecteurs de la base canonique de R3, on voit clairement que

{(x, 0, 0)|x ∈ R} est une droite vectorielle incluse dans{

(x, y, 0)|(x, y) ∈ R2}

qui est unplan vectoriel inclus dans l’espace vectoriel R

3 qui est de dimension 3.Nous retrouvons ici un vocabulaire classique qui parle de « droite réelle » , pour desreprésentation géométrique de l’ensemble des réels, de deux dimensions pour la géométrieplane et de trois dimensions pour la « géométrie dans l’espace ».

2. Le lecteur pourra vérifier à l’aide de la base canonique que l’espace vectoriel des matricescarrées Mn(K) de dimension n2 avec n � 1, a comme sous-espace celui des matrices

triangulaires supérieures qui est de dimensionn(n + 1)

2· et qui a lui-même comme sous-

espace celui des matrices diagonales qui est de dimension n. Il y a égalité entre ces troisespaces si, et seulement si n = 1.

4.2 Somme de sous-espaces vectoriels

Proposition 10

Soient E un K-espace vectoriel et F1, F2 deux sous-espaces vectoriels de E. L’ensemble

H = {x1 + x2 | x1 ∈ F1, x2 ∈ F2}est un sous-espace vectoriel de E appelé somme de F1 et F2 et noté F1 + F2.

PreuveTout d’abord H est non vide. En effet, comme 0 ∈ Fi pour i ∈ �1, 2�, l’élément 0 + 0 appartient à H.Ensuite, soient x, y deux éléments de H et l, m deux scalaires. D’après la définition de H, il existe des élémentsx1, x2, y1, y2 tels que xi ∈ Fi , yi ∈ Fi pour i ∈ {1; 2}, et

x = x1 + x2 et y = y1 + y2.

Alors

lx + my = l (x1 + x2) + m (y1 + y2)

= (lx1 + lx2) + (my1 + my2)

= (lx1 + my1) + (lx2 + my2).

15

Page 23: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Les sous-espaces vectoriels F1 et F2 de E sont stables par combinaisons linéaires donc lx1 + my1 ∈ F1 etlx2 + my2 ∈ F2. On en déduit que lx + my ∈ H et que H est bien un sous-espace vectoriel de E. ❑

➤ Remarques• On peut remarquer que F1 + F2 est l’ensemble de toutes les combinaisons linéaires de toutes les familles finies

de vecteurs pris dans F1 ∪ F2.

• Attention, l’union de deux sous-espaces vectoriels n’est pas en général un sous-espace vectoriel.

ExempleOn considère les deux sous-espace F1 =

{(x, y, z, t) ∈ K4 | 3x − y + z = 0 et t = 0

}et

F2 ={

(x, y, z, t) ∈ K4 | y − z − 2t = 0 et x = 0}

de l’espace vectoriel K4.Déterminer une base et la dimension de chacun des sous-espace F1, F2, F1 ∩ F2, et F1 + F2.

Nous pouvons remarquer rapidement que l’on a

F1 = Vect((1, 3, 0, 0), (0, 1, 1, 0)

)F2 = Vect

((0, 1, 1, 0), (0, 0,−2, 1)

).

Les vecteurs e1 = (1, 3, 0, 0), e2 = (0, 1, 1, 0) et e3 = (0, 0,−2, 1) sont linéairement indépen-dants.Nous en déduisons que (e1, e2) est une base de F1 qui donc est de dimension 2 et de même(e2, e3) est une base de F2 qui est aussi de dimension 2.

Considérons alors un élément x de F1∩F2 qui s’écrit donc l1e1 +l2e2 d’une part et l′2e2 +l′

3e3

d’autre part avec l1, l2, l′2 et l′

3 des scalaires. Nous avons donc l’égalité

l1e1 + l2e2 + 0e3 = 0e1 + l′2e2 + l′

3e3.

Nous en déduisons l1 = l′3 = 0 et l2 = l′

2. Donc x est dans Vect(e2). Inversement nousavons Vect(e2) ⊂ F1 ∩ F2, donc F1 ∩ F2 = Vect(e2) et (e1) est une base de F1 ∩ F2 qui est dedimension 1.Considérons maintenant un élément x = x1 + x2 de F1 + F2 avec x1 = l1e1 + l2e2 ∈ F1

et x2 = l′2e2 + l′

3e3 ∈ F2 ; alors x est un dans Vect(e1, e2, e3). Inversement toute élémentx = l1e1 + l2e2 + l3e3 de Vect(e1, e2, e3) est un élément de F1 + F2 puisqu’il peut s’écrirex = (l1e1+l2e2)+l3e3 ou tout aussi bien x = l1e1+(l2e2+l3e3), donc F1+F2 = Vect(e1, e2, e3)et (e1, e2, e3) est une base de F1 + F2 qui est de dimension 3.

➤ Remarques• Dans l’exemple ci-dessus, on a e1 ∈ F1 ∪ F2 et e3 ∈ F1 ∪ F2 mais e1 + e3 /∈ F1 ∪ F2 ce qui montre que F1 ∪ F2

n’est pas un sous-espace vectoriel.

• De façon générale, lorsque l’on a deux sous-espaces vectoriels F1 et F2 d’un espace de dimension finie, on peuttoujours rechercher une base de F1∩F2 puis la compléter pour obtenir d’une part une base de F1 et d’autre partune base de F2 et finalement en prenant l’union des vecteurs de ces deux bases obtenir une base de F1 + F2.

• Dans l’exemple ci-dessus la décomposition d’un élément x de F1 + F2 en x1 + x2 avec x1 ∈ F1 et x2 ∈ F2 n’estpas unique puisque e2 appartient aussi bien à F1 qu’à F2, ce qui suggère d’introduire la définition suivante.

Définition 10

Soient F1 et F2 deux sous-espaces vectoriels d’un espace vectoriel E. La somme F1 + F2

est dite directe si F1 ∩ F2 = {0}. Elle est alors notée F1 ⊕ F2.

16

Page 24: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Sous-espace vectoriel, somme de sous-espaces vectoriels

Proposition 11

Soient F1 et F2 deux sous-espaces vectoriels d’un espace vectoriel E. La somme F1 + F2

est directe si, et seulement si, pour tout élément x de F1 +F2, il existe un et un seul couple(x1, x2) ∈ F1 × F2 tel que x = x1 + x2.

Preuve� Supposons que la somme soit directe. Soit x ∈ F1 ⊕ F2, supposons avoir deux écritures de x

x = x1 + x2

= y1 + y2

où x1, y1 sont des vecteurs de F1 et x2, y2 deux vecteurs de F2. On a alors x1 − y1 = x2 − y2. Comme F1 estun sous-espace, on sait que x1 − y1 ∈ F1, de même x2 − y2 ∈ F2. Donc x1 − y1 ∈ F1 ∩ F2. Or F1 ∩ F2 = {0},donc x1 − y1 = 0. On en déduit que x1 = y1 et par suite x2 = y2. L’écriture est bien unique.

� Réciproquement, supposons que F1 et F2 vérifient la propriété donnée. Soit x ∈ F1 ∩ F2. On peut écrire lesdeux égalités

x = x︸︷︷︸∈F1

+ 0︸︷︷︸∈F2

= 0︸︷︷︸∈F1

+ x︸︷︷︸∈F2

.

D’après l’unicité de la décomposition on doit avoir x = 0. Ainsi F1 ∩ F2 = {0} et la somme est bien directe.❑

Définition 11

Soient F1 et F2 deux sous-espaces vectoriels d’un espace vectoriel E. F1 et F2 sont ditssupplémentaires si E = F1 ⊕ F2.

➤ RemarqueOn dit aussi que F2 est un sous-espace supplémentaire du sous-espace F1 par exemple.

Exemples1. Montrons que les ensembles P et I des fonction paires et impaires définies sur R sont des

espaces supplémentaires de l’ensemble RR des fonctions réelles définies sur R.Il est clair que chacun des ensembles P et I est non vide et stable par combinaison linéaire ;ce sont donc bien des sous-espaces vectoriels de RR.Soit f ∈ RR, nous allons prouver qu’il existe un unique couple (f1, f2) ∈ P × I tel quef = f1 + f2.Supposons avoir f1 une fonction paire et f2 une fonction impaire telles que f = f1 + f2. Ona alors pour tout réel x

f (x) = f1(x) + f2(x)et

f (−x) = f1(−x) + f2(−x)

= f1(x) − f2(x).

Par demi-somme et demi-différence, on trouve

f1(x) =f (x) + f (−x)

2

f2(x) =f (x) − f (−x)

17

Page 25: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Autrement dit, si f1 et f2 existent, elles sont définies de façon unique par ces égalités.Montrons que ce couple de fonctions convient. Tout d’abord

f1(−x) =f (−x) + f

(− (−x)

)2

=f (−x) + f (x)

2= f1(x)

et

f2(−x) =f (−x) − f

(− (−x)

)2

=f (−x) − f (x)

2= −f2(x),

donc f1 est paire et f2 est impaire. Ensuite

(f1 + f2)(x) = f1(x) + f2(x)

=f (x) + f (−x)

2+

f (x) − f (−x)2

= f (x).

Ainsi f = f1 + f2. On peut alors conclure avec la proposition précédente que RR = P ⊕I.Par ailleurs, il est clair que la seule fonction qui est à la fois paire et impaire est la fonctionnulle, c’est-à-dire que P ∩ I = {0}

2. Considérons dans R3 le sous-espace F défini par l’équation 2x − 4y + 3z = 0 et le sous-

espace G = Vect(1, 0,−1).Montrons que F et G sont supplémentaires dans R3.Soit u = (x, y, z) un vecteur de R3. Prouvons qu’il existe un seul couple (v, w) ∈ F ×G telque u = v + w.Supposons que (v, w) soit un tel couple. Comme w ∈ G, il existe un réel l tel quew = l(1, 0,−1). On a alors v = u − l(1, 0,−1) = (x − l, y, z + l). Comme v ∈ F, on anécessairement 2(x − l) − 4y + 3(z + l) = 0, soit l = −2x + 4y − 3z. Autrement dit, sile couple (v, w), existe il vaut nécessairement{

v = (x, y, z) − (−2x + 4y − 3z)(1, 0,−1) = (3x − 4y + 3z, y, 2x − 4y + 4z)w = (−2x + 4y − 3z)(1, 0,−1) = (−2x + 4y − 3z, 0, 2x − 4y + 3z)

Réciproquement le couple (v, w) ainsi défini vérifie v ∈ F, w ∈ G et v + w = (x, y, z) = u.Les sous-espaces F et G sont des sous-espaces supplémentaires de R3.

3. Considérons maintenant, toujours dans R3, le sous-espace F défini par l’équation

x − y + z = 0 et G le sous-espace défini par x + y − z = 0.Vérifions d’abord que R3 = F + G. Soit u un vecteur de R3 avec u = (x, y, z). On a

18

Page 26: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Sous-espace vectoriel, somme de sous-espaces vectoriels

clairement (1, 1, 0) ∈ F. Recherchons un réel l tel que u − l(1, 1, 0) ∈ G. On a

u − l(1, 1, 0) ∈ G ⇔ (x − l, y − l, z) ∈ G

⇔ (x − l) + (y − l) − z = 0

⇔ l =x + y − z

On en déduit qu’en posant l =x + y − z

2, on a

u = l(1, 1, 0)︸ ︷︷ ︸∈F

+ u − l(1, 1, 0)︸ ︷︷ ︸∈G

et donc R3 = F + G.Néanmoins, F et G ne sont pas supplémentaires. Cherchons par exemple un vecteur nonnul de F ∩ G. Soit u un vecteur de R3 avec u = (x, y, z), on a

u ∈ F ∩ G ⇐⇒{

x − y + z = 0x + y − z = 0 ⇐⇒

{x − y + z = 0

2y − 2z = 0 ⇐⇒{

x = 0y = z

On en déduit qu’on a par exemple (0, 1, 1) ∈ F ∩ G. En particulier F ∩ G �= {0} et F etG ne sont donc pas supplémentaires.

Proposition 12

Soit E un espace vectoriel de dimension finie, F1 et F2 deux sous-espaces de E. On a alorsles équivalences

F1 et F2 sont supplémentaires

⇔ La « juxtaposition »d’une base de F1 et d’une base de F2 est une base de E

⇔ dim(F1 + F2) = dim(F1) + dim(F2) = dim(E).

PreuvePosons n1 = dim(F1) et n2 = dim(F2) ; soit (e1, . . . , en1 ) une base de F1 et (e′1, . . . , e′n2

) une base de F2.Supposons F1 et F2 supplémentaires. Alors tout élément x de E peut s’écrire x = x1 + x2 avecx1 ∈ Vect(e1, . . . , en1 ) et x2 ∈ Vect(e′1, . . . , e′n2

), donc x ∈ Vect(e1, . . . , en1 , e′1, . . . , e′n2).

Par ailleurs, considérons dans E la combinaison linéaire nulle

l1e1 + · · · + ln1 en1︸ ︷︷ ︸∈F1

+ l′1e′1 + · · · + l′

n2e′n2︸ ︷︷ ︸

∈F2

= 0E.

Notons 0F1 et 0F2 les vecteurs nuls de F1 et F2 respectivement (même si nous savons que 0F1 = 0F2 = 0E). Acause de l’unicité de l’écriture de 0E comme 0F1 + 0F2 , somme d’un élément de F1 et d’un élément de F2 nousavons

l1e1 + · · · + ln1 en1 = 0F1 et l′1e′1 + · · · + l′

n2e′n2

= 0F2

et donc l1 = l2 = · · · = ln1 = l′1 = l′

2 = · · · = l′n2

= 0

19

Page 27: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

La famille (e1, . . . , en1 , e′1, . . . , e′n2) est libre et génératrice de E, la réunion d’une base de F1 et de F2 est donc

une base de E.Supposons maintenant que la juxtaposition des vecteurs de (e1, . . . , en1 ), base de F1, et de (e′1, . . . , e′n2

), basede F2, est une base de E. Nous avons alors dim(F1) + dim(F2) = dim(E). De plus F1 + F2 est un sous-espace de Equi contient la famille libre (e1, . . . , en1 , e′1, . . . , e′n2

) de n1 + n2 vecteurs. Nous avons donc

n1 + n2 � dim(F1 + F2) � dim(E) � n1 + n2

et donc dim(F1 + F2) = dim(F1) + dim(F2) = dim(E).

Supposons maintenaient que l’on ait dim(F1 + F2) = dim(F1) + dim(F2) = dim(E). Le sous espace F1 + F2 de E ala même dimension que E, on a donc E = F1 + F2.La famille (e1, . . . , en1 , e′1, . . . , e′n2

) est donc une famille génératrice de E qui a n1 + n2 = dim(E) vecteurs, elleest donc aussi libre. Soit x un élément de F1 ∩ F2, alors il existe des scalaires l1, . . . , ln1 , l′

1, . . . , l′n2

tels quex = l1e1 + · · · + ln1 en1 = l′

1e′1 + · · · + l′n2

en2 , nous avons donc

l1e1 + · · · + ln1 en1 − l′1e′1 − · · · − l′

n2en2 = 0

et donc l1 = l2 = · · · = ln1 = l′1 = l′

2 = · · · = l′n2

= 0.

L’intersection F1 ∩ F2 est réduite à {0} et les sous-espaces F1 et F2 sont supplémentaires.Ceci achève la démonstration puisque nous avons successivement démontré que la ligne 1 du théorèmeimplique la ligne 2, que la ligne 2 implique la ligne 3, et que la ligne 3 implique la première ligne ; les troislignes sont donc équivalentes. ❑

Proposition 13

Soit E un espace vectoriel de dimension finie n. Pour tout sous-espace F1 de E, il existeun sous-espace F2 supplémentaire de F1 ; si de plus F1 est différent de {0} et de E, l’espaceF2 n’est pas unique.

PreuveL’espace E n’a qu’un espace supplémentaire, c’est {0} ; de même l’espace {0} n’a qu’un espace supplémentaire,c’est E.Soit F1 un sous-espace de E de dimension finie n différent de {0} et de E, soit (e1, . . . , en1 ) une base de F1 ; nousavons alors n1 ∈ �1; n−1�. La famille (e1, . . . , en1 ) est une partie libre de F1, c’est une partie libre de E que nouspouvons compléter par les vecteurs (e′1, . . . , e′n2

) pour en faire une base de E avec n2 = n − n1 ∈ �1; n − 1�.Posons F2 = Vect((e′1, . . . , e′n2

)). Les espaces F1 et F2 sont supplémentaires.L’espace F2 n’est pas unique, nous pouvons obtenir un espace F2 différent en substituant e′1 + e1 à e′1 parexemple. ❑

20

Page 28: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. 1. Déterminer une base des sous-espaces vectoriels de C2 définis par

a. A = Vect(

(1, i − 2) , (2 + i,−5)),

b. B = Vect(

(i, 2) , (3, 4i) , (i, 7)).

2. Déterminer une base des sous-espaces vectoriels de R3 définis par

a. A = Vect(

(1, 3,−3) , (4, 2,−3) , (−1, 7, 6))

b. B = Vect(

(4,−5, 3) , (2, 3,−2) , (4,−16, 10) , (8, 1,−1))

c. C = Vect(

(1, 1,−2) , (2, 1,−3) , (0, 1,−1))

d. D = Vect(

(1, 4,−3) , (−2,−8, 6))

2. 1. Soit E le sous-ensemble de K4 défini par

E ={

(x, y, z, t) ∈ K4 |2x + y − z + 2t = 0, x + y + z = 0

}.

Est-ce que E est sous-espace vectoriel de K4 ? Si oui, en donner une base et sa dimension.

2. Inversement, déterminer des équations caractérisant les éléments du sous-espace F de K4

défini parF = Vect

((−1, 2, 1,−1), (3, 1, 0,−1)

).

3. Dans l’espace vectoriel M4,1(R), on définit les 5 vecteurs suivants

v1 =

⎛⎜⎝ −111

−3

⎞⎟⎠ , v2 =

⎛⎜⎝ 13

−1−1

⎞⎟⎠ , v3 =

⎛⎜⎝ 11

−11

⎞⎟⎠ , v4 =

⎛⎜⎝ 2121

⎞⎟⎠ , v5 =

⎛⎜⎝ 3311

⎞⎟⎠ .

On définit F = Vect(v1, v2, v3) et G = Vect(v4, v5)

1. Déterminer une base et la dimension du sous-espace F ∩ G.

2. Compléter cette première base pour obtenir des bases des sous-espaces vectoriels F, G etfinalement F + G.

3. Vérifier que l’on a bien dim(F + G) = dim(F) + dim(G) − dim(F ∩ G).

4. Généralisation. On considère maintenant un K-espace vectoriel E et deux sous-espacesvectoriels F et G de E de dimension finie p et q respectivement .a. Expliquer pourquoi F ∩G est de dimension finie ; on pose r = dim(F ∩G) et, si r �= 0,

on en définit une base BI = (l1, l2, . . . , lr).

b. Expliquer pourquoi on a r � p et r � q ; Compléter éventuellement la base BI pourobtenir d’une part une base BF de F et d’autre part une base BG de G.

c. Expliquer pourquoi F + G est de dimension finie. En considérant les vecteurs de BF etBG, déterminer la dimension de F + G. Conclure que l’on a

dim(F + G) = dim(F) + dim(G) − dim(F ∩ G).

4. On se place dans l’espace vectoriel des fonctions définis sur R.Pour toute fonction f et pour tout réel k, on note fk la fonction fk : x → f (x + k).Pour toute fonction f , on note Ef le sous-espace vectoriel

Ef = Vect(f0, f1, f2, f3

).

21

Page 29: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Déterminer la dimension et une base simple de Ef dans chacun des cas suivants.

1. La fonction f est la fonction exponentielle.

2. La fonction f est la fonction sinus.

3. La fonction f est définie par f : x → x2.

4. La fonction f est définie par f : x → xex.

5. La fonction f est définie par f : x → ex2.

5. 1. Soient (un), (vn), (wn) trois suites réelles définies pour n ∈ N par

un = 2n, vn = (−3)n, wn = n2n.

Montrer que(

(un) , (vn) , (wn))

est une famille libre du R-espace vectoriel RN des suitesréelles.

2. On définit le sous-ensemble E de RN par

E ={

(tn) ∈ RN∣∣ ∀n ∈ N, tn+3 = tn+2 + 8tn+1 − 12tn

}.

a. Montrer que E est un sous-espace vectoriel de RN.

b. En remarquant que toute suite (tn) élément de E peut être définie par la donnée destrois premiers termes de cette suite et la relation R : ∀n ∈ N, tn+3 = tn+2 + tn+1 − 12tn,montrer que les suites (an), (bn) et (cn) de E définies par les égalités ci-dessous formentune famille génératrice de E.

(a0, a1, a2) = (1, 0, 0)(b0, b1, b2) = (0, 1, 0)(c0, c1, c2) = (0, 0, 1)

c. Vérifier que les suites (un), (vn) et (wn) sont des éléments de E puis donner l’expressiongénérale des éléments de E.

6. Somme directe de sous-espaces

1. Soit E = K3[X], F = {P ∈ E|P(1) = P(2) = 0}, et G = {P ∈ E|P(3) = P(4) = 0}.

Montrer que F et G sont des sous-espaces de E = K3[X] et démontrer que l’on aE = F ⊕ G.Autrement dit : Tout polynôme de degré inférieur ou égal à 3 s’écrit de façon uniquecomme somme de deux polynômes de degré inférieur ou égal à 3, l’un nul en 1 et 2 etl’autre nul en 3 et 4.

2. Soit E = Mn(K), S l’ensemble des matrices symétriques de Mn(K) et A l’ensemble desmatrices antisymétriques de Mn(K) c’est-à-dire les matrices qui sont égales à l’opposé deleur transposée.Montrer que S et A sont des sous-espaces de E = Mn(K) et démontrer que l’on aF = S ⊕A.

3. Soit E = C1(R, R), F l’ensemble des fonctions de C1(R, R) telles que f (0) = f ′(0) = 0 etG l’ensemble des fonctions affines définies sur R.Montrer que F et G sont des sous-espaces de E et démontrer que l’on a E = F ⊕ G.

22

Page 30: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

4. Soit E le sous-espace vectoriel de RN des suites réelles convergentes, F l’ensemble des suites

convergeant vers 0 et G l’ensemble des suites constantes.Montrer que F et G sont des sous-espaces de E et démontrer que l’on a E = F ⊕ G.

7. Polynômes de Lagrange

Soit n un entier naturel non nul et soit (xi)i∈�0,n� une suite de n + 1 scalaires distincts.

1. Montrer qu’il existe pour chaque i0 de �0, n� un polynôme Pi0 de degré n qui vaut 1 en xi0et qui a pour racine les n réels {xi|0 � i � n, i �= i0}.

2. Montrer que la famille de polynômes (Pi)i∈�0,n� est une famille génératrice de Kn[X].

3. Soit (yi)i∈�0,n� une suite de n + 1 scalaires. Montrer qu’il existe un et un seul polynôme Qde degré inférieur ou égal à n tel que pour tout i ∈ �0, n� on ait Q(xi) = yi.

8. 1. L’union de deux sous-espaces vectoriels n’est pas un sous-espace vectoriel engénéral.Soit F et G deux sous-espaces vectoriels d’un espace vectoriel E, démontrer l’équivalence

F ∪ G est un sous-espace de E ⇐⇒ (F ⊂ G ou G ⊂ F).

2. Soit F G et H trois sous-espaces vectoriels d’un espace vectoriel E, démontrer l’implication

G ⊂ F =⇒ F ∩ (G + H) = G + (F ∩ H).

9. On note M3 (R) l’ensemble des matrices carrées réelles d’ordre trois et on considèreles matrices suivantes de M3 (R)

I =

(1 0 00 1 00 0 1

)A =

(1 1 11 0 01 0 0

)

1. Calculer A2 et A3, puis vérifier : A3 = A2 + 2A.

2. Montrer que la famille(A, A2

)est libre dans M3 (R).

3. Montrer que, pour tout entier n supérieur ou égal à 1, il existe un couple unique (an, bn) denombres réels tel que : An = anA + bnA2, et exprimer an+1 et bn+1 en fonction de an et bn.

4. a. Montrer, pour tout entier n supérieur ou égal à 1

an+2 = an+1 + 2an

b. En déduire an et bn en fonction de n, pour tout entier n supérieur ou égal à 1.

c. Donner l’expression de An en fonction de A, A2 et n, pour tout entier n supérieur ouégal à 1.

10. Soit n un entier naturel.Montrer que la famille de vecteurs

((X − 1)k(X + 1)n−k

)0�k�n

est une base de Kn[X].

23

Page 31: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

2Applications linéaires

Dans tout ce chapitre, sauf indications contraires, les espaces vectoriels sont des espacesvectoriels sur K qui est soit l’ensemble des réels R soit celui des complexes C.

1. Applications linéaires

1.1 Application linéaire de E dans F

Définition 1

Soient E et F deux espaces vectoriels sur K. Une application u de E vers F est linéaire si

1. Pour tout couple (x, y) d’éléments de E, u(x + y) = u(x) + u(y).

2. Pour tout scalaire l de K et tout x vecteur de E, u(lx) = lu(x).

L’ensemble des applications linéaires de E vers F est noté L(E, F).Une application linéaire de E vers E lui-même est appelée un endomorphisme et l’en-semble des endomorphismes est noté plus simplement L(E).

➤ RemarqueOn peut dire qu’une application linéaire est une application entre deux espaces vectoriels qui respecte leur structured’espace vectoriel.

Exemples1. L’application de E vers F qui à tout vecteur x de E associe 0F est une application linéaire

appelée l’application nulle, elle est notée 0 si il n’y a pas d’ambiguïté.

2. L’application de E vers E qui à tout vecteur x de E associe lui même est un endomorphismeappelé l’endomorphisme identité, il est noté IdE.

3. L’application de Kn[X] dans lui même qui à un polynôme P lui associe sa fonction déri-vée P′ est une application linéaire puisque la dérivée de P + Q est P′ + Q′ et celle de lPest lP′. La dérivation est donc un endomorphisme de Kn[X].

4. Définissons l’application

u :

{K3 → K2

(x1, x2, x3) → (x1 − x2 + 4x3, 3x1 − x3)

Page 32: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications linéaires

Montrons que u est une application linéaire. Soient x, y deux éléments K3 avec

x = (x1, x2, x3) et y = (y1, y2, y3), on a

u(x + y) = u(

(x1, x2, x3) + (y1, y2, y3))

= u(

(x1 + y1, x2 + y2, x3 + y3))

=(x1 + y1 − (x2 + y2) + 4 (x3 + y3) , 3 (x1 + y1) − (x3 + y3)

)= (x1 − x2 + 4x3 + y1 − y2 + 4y3, 3x1 − x3 + 3y1 − y3)

= (x1 − x2 + 4x3, 3x1 − x3) + (y1 − y2 + 4y3, 3y1 − y3)

= u(x) + u(y).

Soit de plus un scalaire l, on a alors

u(lx) = u(l (x1, x2, x3)

)= u

((lx1, lx2, lx3)

)= (lx1 − lx2 + 4lx3, 3lx1 − lx3)

= l(x1 − x2 + 4x3, 3x1 − x3)

= lu(x).

Proposition 1 (Pour démontrer qu’une application est linéaire)

Soit u une application de E vers F, u est linéaire si pour tout couple (l, m) d’éléments deK et tout couple (x, y) d’éléments de E

u(lx + my) = lu(x) + mu(y).

Preuve� Soit u ∈ L(E, F). Soient (x, y) un couple d’éléments de E et l, m deux éléments de K, on a en appliquant

successivement les propriétés des applications linéaires

u(lx + my) = u(lx) + u(my) = lu(x) + mu(y).

� Réciproquement, soit u une application de E vers F vérifiant la propriété annoncée, montrons que u estlinéaire.Soit (x, y) un couple d’éléments de E et l un scalaire, on a

u(x + y) = u(1x + 1y) = 1u(x) + 1u(y) = u(x) + u(y),

u(lx) = u(lx + 0 · 0E) = lu(x) + 0u(0E ) = lu(x). ❑

ExempleVérifions à l’aide de ce critère que l’application

u :

{Kn[X] → Kn[X]

P → P + P′

25

Page 33: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

est linéaire. Soient P, Q deux polynômes de Kn[X] et l, m deux éléments de K. Alors

u(lP + mQ) = (lP + mQ) + (lP + mQ)′ = l(P + P′) + m(Q + Q′) = lu(P) + mu(Q).

Donc u est linéaire.

Proposition 2

Soit u ∈ L(E, F). Pour tout n-uplet (x1, x2, . . . , xn) d’éléments de E et n-uplet(l1, l2, . . . , ln) d’éléments de K, on a

u

(n∑

k=1

lkxk

)=

n∑k=1

lku(xk).

PreuveLa démonstration se fait sans difficulté par récurrence sur n. ❑

1.2 Espace image, applications linéaires surjectives

Définition 2

Soit u ∈ L(E, F).On appelle image de u et l’on note �m(u) l’ensemble {y ∈ F | ∃x ∈ E f (x) = y} ;c’est l’ensemble des éléments de F qui ont un antécédent par u dans E.

Proposition 3

Soit u ∈ L(E, F), l’ensemble �m(u) est un sous-espace vectoriel de F.L’image par u de l’élément nul de E est l’élément nul de F ;l’image de l’opposé d’un élément x de E est l’opposé de l’image de x.

PreuveVoir le cours de première année. ❑

Proposition 4

Soient E un espace vectoriel de dimension finie p, (e1, e2, . . . , ep) une base de E, u uneapplication linéaire de E dans F et f1 = u(e1), f2 = u(e2), . . . , fp = u(ep), les images desvecteurs de la base de E.La famille (f1, f2, . . . , fp) est une famille génératrice de �m(u).L’application u est surjective si, et seulement si, la famille (f1, f2, . . . , fp) est une famillegénératrice de F.

PreuveVoir le cours de première année. ❑

26

Page 34: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications linéaires

➤ RemarqueLa proposition suivante montre que pour définir une application linéaire, il suffit de connaître la famille(f1, f2, . . . , fp) des images d’une base de E.

Proposition 5

Soient E un espace vectoriel de dimension finie p, (e1, e2, . . . , ep) une base de E et(f1, f2, . . . , fp) une famille de vecteurs de F.Il existe une unique application linéaire u de E vers F telle que u(e1) = f1, . . . , u(ep) = fp.

PreuveMontrons d’abord l’existence d’une telle application. Définissons l’application u de E vers F qui à tout vecteur xde coordonnées (l1, l2, . . . , lp) dans la base (e1, e2, . . . , ep) associe le vecteur

u(x) =

p∑i=1

li fi.

Pour tout i ∈ �1, p�, les coordonnées de ei étant (0, . . . , 0, 1, 0, . . . , 0), on a u(ei ) = fi . On vérifie aisément quecette application est linéaire. u est donc une application qui satisfait les propriétés souhaitées.

Supposons que deux applications u1 et u2 conviennent. Soit x un élément de E avec x =

p∑i=1

liei , on a

u1(x) = u1

(p∑

i=1

liei

)=

p∑i=1

liu1(ei ) =

p∑i=1

li fi

et de la même façon

u2(x) = u2

(p∑

i=1

liei

)=

p∑i=1

liu2(ei ) =

p∑i=1

li fi.

Ainsi, pour tout x ∈ E, u1(x) = u2(x), c’est-à-dire u1 = u2. ❑

➤ RemarqueEn conséquence, pour démontrer l’égalité de deux application linéaires, u1 et u2, définies sur un espace E dedimension finie, il suffit de démontrer que pour tout vecteur x appartenant à une base de E, on a u1(x) = u2(x).

1.3 Noyau, applications linéaires injectives

Définition 3

Soit u ∈ L(E, F).On appelle noyau de u et l’on note Ker(u) l’ensemble Ker(u) = {x ∈ E | u(x) = 0F}.

➤ RemarqueLe noyau d’une application linéaire est donc l’ensemble des antécédents du vecteur nul, cet ensemble contient aumoins 0E .

Proposition 6

Soit u ∈ L(E, F). L’ensemble Ker(u) est un sous-espace vectoriel de E.

27

Page 35: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

PreuveLe noyau Ker(u) est un sous-ensemble de E.On sait que u(0E ) = 0F , donc 0E ∈ Ker(u) et Ker(u) n’est pas vide.Soient x, y deux vecteurs de Ker(u) et l, m deux scalaires. On a

u(lx + my) = lu(x) + mu(y) = l0F + m0F = 0F .

Autrement dit lx + my ∈ Ker(u). Ker(u) est non vide, stable par combinaison linéaire, c’est un sous-espacevectoriel de E. ❑

Exemples1. Reprenons l’exemple de l’application u définie page 24 en début de chapitre.

u :{

K3 → K2

(x1, x2, x3) → (x1 − x2 + 4x3, 3x1 − x3)

Déterminons une base de Ker(u). Soit v un vecteur de K3 avec v = (x, y, z), on a

v ∈ Ker(u) ⇐⇒ u(x, y, z) = 0 ⇐⇒{

x − y + 4z = 03x − z = 0

⇐⇒{

y = 13xz = 3x

d’où Ker(u) = Vect(1, 13, 3).

2. Nous avons aussi remarqué que la dérivation est un endomorphisme de Kn[X] ; le noyaude cet endomorphisme, c’est-à-dire l’ensemble des polynômes de dérivée nulle, est le sous-espace vectoriel K0[X] des polynômes constants.

Proposition 7

Soit u ∈ L(E, F), u est injective si, et seulement si, Ker(u) = {0E}.

Preuve� Supposons que u soit injective. On sait déjà que 0E ∈ Ker(u). Soit x un élément de Ker(u). On a donc

u(x) = 0F , soit encore u(x) = u(0E). Or u est injective, donc x = 0E. On en déduit que Ker(u) = {0E}.

� Réciproquement, soit u ∈ L(E, F) une application telle que Ker(u) = {0E}, montrons que u est injective.Soit x, y deux vecteurs de E tels que u(x) = u(y). On a alors successivement u(x) − u(y) = 0, u(x − y) = 0,x − y ∈ Ker(u) et donc nécessairement x − y = 0, d’où x = y ; l’application u est injective. ❑

➤ RemarqueDe ce même calcul, nous pouvons obtenir aussi des informations sur les antécédents d’un vecteur x0 de �m(u) parune application linéaire u quelconque de L(E, F) : tout vecteur x de E tel que u(x) = u(x0) est égal à la somme d’unvecteur de Ker(u) et de x0. En effet nous avons pour tout vecteur x de E

u(x) = u(x0) ⇐⇒ u(x) − u(x0) = 0⇐⇒ u(x − x0) = 0⇐⇒ x − x0 ∈ Ker(u)⇐⇒ ∃z ∈ Ker(u) x = x0 + z.

Si de plus Ker(u) est de dimension k non nulle, c’est-à-dire si u n’est pas injective, on peut en déduire que lesantécédents de u(x0) peuvent tous s’écrire comme la somme de x0 et d’une combinaison linéaire des k vecteursd’une base de Ker(u), autrement dit ils peuvent s’écrire en fonctions de k paramètres réels.

28

Page 36: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications linéaires

Proposition 8

Soient E un espace vectoriel de dimension finie p, (e1, e2, . . . , ep) une base de E, u uneapplication linéaire définie sur E et f1 = u(e1), f2 = u(e2), . . . , fp = u(ep), les images desvecteurs de la base de E.L’application u est injective si, et seulement si, la famille (f1, f2, . . . , fp) est une famille librede F.

Preuve

� Supposons que u soit injective. Soitp∑

i=1

li fi = 0F une combinaison linéaire nulle des vecteurs de la famille

(f1, f2, . . . , fp). Nous avons alors

u

(p∑

i=1

liei

)=

p∑i=1

liu(ei ) =

p∑i=1

li fi = 0F .

Comme u est injective, le seul antécédent de 0F par u est 0E. Nous avons doncp∑

i=1

liei = 0E. La famille

(e1, e2, . . . , ep) est libre, les scalaires (l1, l2, . . . , lp) sont donc tous nuls, la famille (f1, f2, . . . , fp) est libre.

� Réciproquement, soit u une application linéaire définie sur E telle que la famille (f1, f2, . . . , fp) est une famillelibre de F. Soit x un élément de E appartenant au noyau de u et soit (l1, l2, . . . , lp) les coordonnées de xsur la base (e1, e2, . . . , ep). Nous avons

0F = u(x) = u

(p∑

i=1

liei

)=

p∑i=1

li fi.

La famille (f1, f2, . . . , fp) étant libre, les scalaires (l1, l2, . . . , lp) sont tous nuls, x = 0E, le noyau de u estréduit à {0E}, u est injective. ❑

1.4 Isomorphismes de E dans F

Définition 4

Une application linéaire de E vers F bijective est appelée un isomorphisme de E dans F.

➤ RemarqueSoit u un isomorphisme de E vers F. L’application réciproque u−1 de F vers E est aussi un isomorphisme. En effetu−1 est une bijection de F vers E et pour tous scalaires l et m et tous vecteurs y1 et y2 de F nous avons, en posantx1 = u−1(y1) et x2 = u−1(y2)

ly1 + my2 = lu(x1) + mu(x2) = u(lx1 + mx2)

etu−1(ly1 + my2) = u−1(u(lx1 + mx2)

)= lx1 + mx2 = lu−1(y1) + mu−1(y2),

ce qui démontre que u−1 est une application linéaire.

Définition 5

Soit E et F deux espaces vectoriels. S’il existe un isomorphisme u de E vers F, on dit queE et F sont isomorphes et u−1 est l’isomorphisme réciproque de u.

29

Page 37: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Théorème 1

Soient E et F deux espaces vectoriels de dimension finie. Les espaces E et F sont iso-morphes si, et seulement s’ils sont de même dimension. En particuliers, tous les espacesvectoriels sur K de dimensions n sont isomorphes à K

n.

PreuveSoient E et F deux espaces de dimension finie.

� Supposons qu’il existe un isomorphisme u de E vers F. Soit B une base de E, on sait que l’image paru de B est une famille génératrice de F (voir proposition 4) et une famille libre de F (voir proposition 8).On a donc une base de F qui compte autant d’éléments qu’une base de E, on en déduit que dim(E) = dim(F).

� Réciproquement supposons que dim(E) = dim(F). Soient (e1, e2, . . . , en) une base de E et (f1, f2, . . . , fn) unebase de F, on sait qu’il existe une unique application linéaire u de E vers F telle que pour i ∈ �1, n�, u(ei ) = fi

(voir proposition 5) . Comme l’image par u de la base (e1, e2, . . . , en) est la base (f1, f2, . . . , fn), u est unisomorphisme. E et F sont bien isomorphes.

Nous savons de plus que Kn est de dimension n, ce qui achève la démonstration. ❑

Corollaire 1

Soient E et F deux espaces vectoriels de dimension finie et u une application linéaire deE vers F. L’application u est un isomorphisme si, et seulement si, l’image d’une base de Epar u est une base de F.

PreuveConsidérons une base B de E. Nous savons que u est surjective si, et seulement si, l’image de B par u estgénératrice de F (proposition 4) et qu’elle injective si, et seulement si, l’image de B par u est libre dans F(proposition 8). L’application u sera donc bijective si, et seulement si, l’image de B est une base de F. ❑

2. Rang d’une application linéaire

2.1 Théorème du rang

Définition 6

Soit une famille de vecteurs (f1, f2, . . . , fp), on appelle rang de cette famille, et l’on noterg(f1, f2, . . . , fp), la dimension de Vect(f1, f2, . . . , fp) .

Définition 7

Soit u ∈ L(E, F). Si �m(u) est de dimension finie, on appelle rang de u et on note rg(u)la dimension de �m(u).

➤ RemarqueEn particulier si E est de dimension finie, alors le rang de u est défini. En effet, si B = (e1, e2, . . . , ep) est une basede E, alors la famille de vecteurs

(u(e1), u(e2), . . . , u(ep)

)engendre �m(u) qui est donc de dimension finie ; le rang

de u est aussi le rang de cette famille de vecteurs, il ne dépend pas de la base de E choisie pour le déterminer.

30

Page 38: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Rang d’une application linéaire

Théorème 2 (Théorème du rang)

Soit u ∈ L(E, F) où E est de dimension finie. On a

dim(E) = dim(Ker(u)

)+ dim

(�m(u)

).

PreuveSoit (e1, e2, . . . , ek) une base de Ker(u) que l’on complète en une base (e1, e2, . . . , ek, ek+1, . . . , ep) de E. D’aprèsce qui précède, on sait que

(u(e1), u(e2), . . . , u(ek), u(ek+1), . . . , u(ep)

)est génératrice de �m(u). Mais comme

u(e1) = u(e2) = · · · = u(ek) = 0, la famille(u(ek+1), . . . , u(ep)

)est aussi génératrice de �m(u). Montrons que

cette famille est libre. Soient ak+1, . . . , ap des scalaires tels que

ak+1u(ek+1) + ak+2u(ek+2) + · · · + apu(ep) = 0

Par linéarité on a u

(p∑

i=k+1

aiei

)= 0, soit

p∑i=k+1

aiei ∈ Ker(u). Il existe donc des réels a1, . . . , ak tels que

p∑i=k+1

aiei =k∑

i=1

aiei.

On a alorsk∑

i=1

aiei −p∑

i=k+1

aiei = 0. Comme la famille (e1, e2, . . . , ep) est une base, les réels a1, a2, . . . , ap sont

nuls.En résumé, la famille (e1, e2, . . . , ep) est une base de E, la famille (e1, e2, . . . , ek) est une base de Ker(u) et(u(ek+1), . . . , u(ep)

)est une base de �m(u). On a donc

dim(E) = dim(Ker(u)

)+ dim

(�m(u)

).

2.2 Application à la caractérisation des isomorphismes

Théorème 3

Soit u ∈ L(E, F) où E et F sont de dimension finie.

• u est injective si, et seulement si, rg(u) = dim(E).

• u est surjective si, et seulement si, rg(u) = dim(F).

PreuveGrâce au théorème du rang, nous pouvons écrire les équivalences

rg(u) = dim(E) ⇐⇒ dim(�m(u)

)= dim(E)

⇐⇒ dim(E) − dim(Ker(u)

)= dim(E)

⇐⇒ dim(Ker(u)

)= 0

⇐⇒ Ker(u) = {0}⇐⇒ u est injective.

De mêmerg(u) = dim(F) ⇐⇒ dim

(�m(u)

)= dim(F)

⇐⇒ �m(u) = F⇐⇒ u est surjective. ❑

31

Page 39: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Théorème 4

Soient E un espace de dimension finie et u un endomorphisme de E. On a les équivalences

u est injective ⇐⇒ u est surjective ⇐⇒ u est bijective.

PreuveD’après le théorème précédent

u est injective ⇐⇒ rg(u) = dim(E) ⇐⇒ u est surjective.❑

➤ RemarqueNous verrons (voir exercice 3.) que cette propriété est fausse en dimension infinie.

Théorème 5

Soient E un espace de dimension finie et u et v deux endomorphismes de E. On a

u ◦ v = IdE ⇐⇒ u est un isomorphisme de E et v est son isomorphisme réciproque.

PreuveSi l’on a u ◦ v = IdE, l’endomorphisme u est surjectif, donc bijectif. En composant à gauche par u−1, nousobtenons v = u−1. La réciproque ne fait que traduire les définitions d’isomorphisme et d’isomorphisme réci-proque. ❑

➤ Remarques• Rappelons que la définition de u est une bijection de E dans F est qu’il existe une application de F dans E telle

que u ◦ v = IdE et v ◦ u = IdF ; l’intérêt du théorème ci-dessus de réduire à une seule égalité cette définition,dans le cas des endomorphismes d’un espace de dimension finie.

• Nous verrons (voir exercice 3.) que cette propriété est fausse en dimension infinie.

3. L’ensemble des applications linéaires de E dans F

3.1 L’ensemble L(E, F) : aspect vectoriel

Proposition 9

L’ensemble L(E, F) a une structure d’espace vectoriel pour les lois internes et externesinduites par celles de F. En particulier l’ensemble L(E) des endomorphismes de E est unespace vectoriel.

PreuveSoient u, v deux éléments de L(E, F), a un scalaire et x un vecteur de E.Nous définissons de manière naturelle les applications u + v et au de E dans F par

(u + v)(x) = u(x) + v(x)(au)(x) = au(x).

32

Page 40: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’ensemble des applications linéaires de E dans F

Montrons que u + v est linéaire. Soient l, m deux éléments de K et x et y deux vecteurs de E ; on a

(u + v)(lx + my) = u(lx + my) + v(lx + my)

= lu(x) + mu(y) + lv(x) + mv(y)

= l(u + v)(x) + m(u + v)(y).

Montrons maintenant que au est linéaire. Soient l, m deux scalaires et x, y deux vecteurs de E ; on a

(au)(lx + my) = a(u(lx + my

) )= a

(lu (x) + mu (y)

)= l(au)(x) + m(au)(y).

Nous avons donc bien donc une loi de composition interne et une loi de composition externe définies sur L(E, F).

Pour achever la démonstration, nous laissons au lecteur le soin de vérifier les huit propriétés ANSCANDD desespaces vectoriels ; par exemple l’élément neutre pour l’addition est l’application linéaire nulle et l’opposé d’uneapplication linéaire u est l’application −u = (−1)u. ❑

➤ RemarqueLes vérifications que nous proposons au lecteur sont exactement comparables à celles que nous avons faites endétail dans le livre de première année pour les polynômes et pour les matrices.

3.2 Les ensembles L(E, F) : au-delà de l’aspect vectoriel

Composition des applications linéaires, cas général

Proposition 10

Soient E, F et G trois espaces vectoriels, soient u ∈ L(E, F) et v ∈ L(F, G) alorsv ◦ u ∈ L(E, G).

On retiendra que la composition de deux applications linéaires est une applicationlinéaire.

PreuveSoient (x, y) un couple d’éléments de E et l, m deux scalaires. On a

(v ◦ u)(lx + my) = v(u(lx + my

) )= v

(lu (x) + mu (y)

)= lv

(u (x))

+ mv(u(y))

= l(v ◦ u)(x) + m(v ◦ u)(y).❑

Proposition 11

Pour tout couple (u, v) d’applications de L(E, F), tout couple (s, t) d’applications deL(F, G) et tout couple de scalaires (l, m) on a

s ◦ (lu + mv) = ls ◦ u + ms ◦ v(ls + mt) ◦ u = ls ◦ u + mt ◦ u.

33

Page 41: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

PreuveMontrons par exemple la première propriété.Soit x ∈ E, on a (

s ◦ (lu + mv))(x) = s

((lu + mv)(x)

)= s

(lu(x) + mv(x)

)= s

(lu(x))

+ s(mv(x))

= l(s ◦ u)(x) + m(s ◦ v)(x)

d’où s ◦ (lu + mv) = ls ◦ u + ms ◦ v. ❑

➤ RemarquePour simplifier les écritures et s’il n’y a pas d’ambiguïté, nous noterons parfois s ◦ u plus simplement par su ; nousécrirons par exemple s(lu + mv) = lsu + msv.

L’ensemble L(E) des endomorphismesDans l’ensemble L(E) des endomorphismes de E, nous pouvons composer les élé-ments entre eux sans restriction.

Définition 8

Soit u un endomorphisme non nul de L(E).On définit un dans L(E) pour tout entier naturel n par la récurrence{

u0 = IdE,∀n ∈ N, un+1 = u ◦ un.

ExempleSoit a ∈ R, on définit l’application u par{

R[X] → R[X]P → P(X + a)

Pour tous polynômes P et Q et tous réels l et m, (lP + mQ)(X + a) = lP(X + a)+ mQ(X + a) ;l’application u est linéaire, c’est un endomorphisme de R[X].Pour tout polynôme P de R[X], on a u2(P) = u

(P (X + a)

)= P

((X + a) + a

)= P(X + 2a).

Par récurrence, on prouve que pour tout n ∈ N, un(P) = P(X + na).

➤ Remarques• Il est facile de montrer par récurrence sur p les égalités naturelles suivantes un ◦ up = un+p et (un)p = unp où n

et p sont des entiers naturels.

• Si u est un endomorphismes de E et P =n∑

i=0

aiXi un polynôme de K[X], alors l’écriture P(u) représentera

l’endomorphismen∑

i=0

aiui.

34

Page 42: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Projections

• Nous pouvons utiliser les identités remarquables pour exprimer par exemple (u + v)n si u et v sont deux endo-morphismes qui commutent et seulement dans ce cas. Par exemple nous avons

(u + v)2 = (u + v) ◦ (u + v)

= (u + v) ◦ u + (u + v) ◦ v

= u2 + v ◦ u + u ◦ v + v2

= u2 + 2u ◦ v + v2

Cette égalité est fausse si u et v ne commutent pas.

L’ensemble GL(E) des automorphismes muni de la composition

Définition 9

Une application linéaire de E vers E bijective est appelée un automorphisme de E.L’ensemble des automorphismes est noté GL(E).

➤ RemarqueUn automorphisme de E est donc un endomorphisme de E bijectif.

Proposition 12

La composition est une loi de composition interne sur l’ensemble GL(E) des automor-phismes de E.

PreuveIl suffit de remarquer que la composition de deux bijections est bijective et que la composition de deux appli-cation linéaires est une application linéaire. Nous pouvons alors conclure que la composition de deux automor-phismes de E est un automorphisme de E. ❑

4. Projections

4.1 Définition de la projection sur F1 parallèlement à F2

Définition 10

Soit E un espace vectoriel tel que E = F1 ⊕ F2. On appelle projection sur F1 parallèle-ment à F2 l’application p de E dans E qui à tout vecteur x de E s’écrivant sous la formex = x1 + x2 où x1 ∈ F1 et x2 ∈ F2 associe le vecteur p(x) = x1

Pour tout vecteur x de E, nous savons qu’il existe un seul couple (x1, x2) ∈ F1 × F2tel que x = x1 + x2, l’application p est donc bien définie. Notons q la projection surF2 parallèlement à F1. On dit que p et q sont les deux projections associées à la sommedirecte F1 ⊕ F2. Nous avons alors

∀x ∈ E x = p(x) + q(x) avec p(x) ∈ F1 et q(x) ∈ F2.

35

Page 43: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Exemples1. Traçons la figure dans le cas où F1 et F2 sont deux droites vectorielles du plan et x un

vecteur fixé.

F1

F2

O

x

x1 = p(x)

x2 = q(x)

2. On a déjà vu, page 18, que RR = P ⊕ I. La projection sur P parallèlement à I estl’application qui à une fonction f associe la fonction g définie pour tout réel x par

g(x) =f (x) + f (−x)

4.2 Propriétés de la projection sur F1 parallèlement à F2

Proposition 13

Toute projection p est linéaire et vérifie p ◦ p = p.

PreuveSoit E = F1 ⊕ F2, p la projection sur F1 parallèlement à F2 et q la projection sur F2 parallèlement à F1 .Montrons que p est linéaire. Soient x, y deux éléments de E et l, m deux scalaires.Nous avons d’une part

lx + my = p(lx + my)︸ ︷︷ ︸∈F1

+ q(lx + my)︸ ︷︷ ︸∈F2

,

et d’autre part, parce que F1 et F2 sont stables par combinaisons linéaires,

lx + my = l(p(x) + q(x)

)+ m(p(y) + q(y)

)=(lp(x) + mp(y)

)︸ ︷︷ ︸∈F1

+(lq(x) + mq(y)

)︸ ︷︷ ︸∈F2

.

Enfin, parce que l’écriture de tout élément de E comme somme d’un élément de F1 et d’un élément de F2 estunique, nous avons

p(lx + my) = lp(x) + mp(y).

L’application p est donc linéaire.

De plus nous avons pour tout vecteur x de Ep(x) = p(x)︸︷︷︸

∈F1

+ 0︸︷︷︸∈F2

,

doncp ◦ p(x) = p

(p(x))

= p(x). ❑

36

Page 44: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Matrices et applications linéaires

➤ RemarqueNous verrons en exercice que cette propriété caractérise les projections.

Proposition 14

Soit E un espace vectoriel tel que E = F1 ⊕ F2. Soit p la projection sur F1 parallèlementà F2. On a

�m(p) = F1 et Ker(p) = F2.

PreuvePar définition de p, �m(p) ⊂ F1. Inversement si x ∈ F1 alors x = x︸︷︷︸

∈F1

+ 0︸︷︷︸∈F2

, p(x) = x et donc x ∈ �m(p). On

a donc �m(p) = F1.

Soit x un élément de F2 ; on a donc x = 0︸︷︷︸∈F1

+ x︸︷︷︸∈F2

, p(x) = 0 et x ∈ Ker(p). Inversement si x ∈ Ker(p) alors

l’écriture x = 0 + x est la décomposition de x en somme d’un élément de F1 et d’un élément de F2, et doncx ∈ F2. On a donc Ker(p) = F2. ❑

Proposition 15

Soit p la projection sur F1 parallèlement à F2. On a alors

∀x ∈ E x ∈ F1 ⇐⇒ p(x) = x.

PreuveSoit x un vecteur de E.Si x ∈ F1 alors x = x︸︷︷︸

∈F1

+ 0︸︷︷︸∈F2

et p(x) = x.

Si p(x) = x alors x ∈ �m(p) = F1. ❑

5. Matrices et applications linéairesDans toute cette section, E et F sont deux espaces vectoriels de dimensions p et nmunis respectivement des bases BE = (e1, e2, . . . , ep) et BF = (f1, f2, . . . , fn), fixées unefois pour toutes.

5.1 Matrice associée à une application linéaire

Matrice colonne des coordonnées d’un vecteur

Proposition 16

Soit E un espace vectoriel de dimension finie et BE une base de E. L’application qui associeà chaque vecteur de E la matrice colonne de ses coordonnées sur BE est un isomorphismed’espace vectoriel.

Nous définissons l’application MBE de E dans Mp,1(K) qui associe à tout vecteur xde E l’unique matrice colonne X = MBE (x) de ses coordonnées sur BE.

37

Page 45: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Pour tout x =p∑

j=1

xjej nous avons X = MBE (x) =

⎛⎜⎜⎝x1x2...

xp

⎞⎟⎟⎠ .

L’application MBE est bijective de E dans Mp,1(K) puisque tout élément

X = (xj)1�j�p de Mp,1(K) a dans E un unique antécédent x défini par x =p∑

j=1

xjej

tel que X = MBE (x).L’application MBE est linéaire. En effet, pour tout couple (l, m) de scalaires et

pour tous vecteurs x =p∑

j=1

xjej et y =p∑

j=1

yjej de l’espace vectoriel E nous avons

lx + my =p∑

j=1

(lxj + myj)ej et donc

MBE (lx + my) = lMBE (x) + mMBE (y).

L’application MBE est donc un isomorphisme de E vers Mp,1(K).Nous définissons de façon similaire l’isomorphisme MBF de F vers Mn,1(K) qui estentièrement défini dès que la base BF est fixée.Dans la suite de ce chapitre, nous noterons habituellement x, y, z les vecteurs et X,Y , Z les matrices colonnes de leurs coordonnées.

Définition 11

Soient E un espace vectoriel de dimension n, BE une base de E et (v1, v2, . . . , vk) unefamille de k vecteurs de E. On appelle matrice de la famille (v1, v2, . . . , vk) relativement àla base B la matrice de Mn,k(K) notée MB(v1, v2, . . . , vk) dont les vecteurs colonnes sontles matrices colonnes des coordonnées de v1, v2, . . . , vk sur la base B.

ExemplePlaçons nous dans K3[X] et posons v1 = (X − 2)2, v2 = (X − 1)3 et v3 = 7X − 5. La matricedes vecteurs v1, v2 et v3 dans la base canonique Bc est

MBc (v1, v2, v3) =

⎛⎜⎝ 4 −1 −5−4 3 7

1 −3 00 1 0

⎞⎟⎠ .

Définition de la matrice d’une application linéaire

Définition 12

Soient E et F deux espaces vectoriels de dimensions finies sur K, BE = (e1, e2, . . . , ep) unebase de E et BF = (f1, f2, . . . , fn) une base de F. Soit u ∈ L(E, F). Pour j ∈ �1, p�, il existe

38

Page 46: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Matrices et applications linéaires

n scalaires uniques a1,j, a2,j, . . . , an,j tels que

u(ej) =n∑

i=1

ai,jfi.

La matrice A = (ai,j) 1�i�n1�j�p

est appelée matrice de u relativement aux bases BE, BF et est

notée MBE,BF (u).C’est la matrice dont le jeme vecteur colonne est le vecteur colonne des coordonnées deu(ej) dans la base BF .

➤ RemarqueLes bases BE et BF étant fixées, la matrice A d’une application linéaire u ∈ L(E, F) est unique.

Définition 13

Soient E un espace vectoriel de dimension finie, u ∈ L(E) et B une base de E. On appellematrice de u relativement à la base B et l’on note MB(u) la matrice MB,B(u).

ExempleL’application identité IdE est une application linéaire. Si E est de dimension n, la matrice deIdE est In la matrice unité de Mn(K) quelque soit la base de E utilisée. En effet si (e1, . . . , en)est une base de E, nous avons pour tout j ∈ �1, n� IdE(ej) = ej.

➤ RemarqueRéciproquement, étant donnée une matrice A = (ai,j ) de Mn,p(K), on peut considérer l’application u : Kp → Kn

qui à tout p-uplet (x1, x2, . . . , xp) associe le n-uplet (y1, y2, . . . , yn) tel que pour i ∈ �1, n�, on a

yi =

p∑j=1

ai,jxj.

On vérifie facilement que cette application est linéaire. Par construction, cette application a pour matrice A dansles bases canoniques de Kp et Kn. L’application u est appelée l’application linéaire canoniquement associée àA.

Calcul effectif des coordonnées de l’image d’un vecteurTous nos efforts sont couronnés par la proposition suivante où nous utilisons les nota-tions définies dans ce chapitre.

Proposition 17

Soient E et F deux espaces vectoriels de dimensions finies sur K, BE = (e1, e2, . . . , ep) unebase de E et BF = (f1, f2, . . . , fn) une base de F. Soit u ∈ L(E, F).Pour tout vecteur x de E et tout vecteur y de F nous avons

y = u(x) ⇐⇒ Y = AX

où A, X et Y sont les matrices MBE,BF (u), MBE (x) et MBF (y) associées à u, x et yrespectivement.

39

Page 47: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

➤ RemarqueLa matrice A est de taille n × p :

� n lignes, n comme la dimension de l’espace d’arrivée F,

� p colonnes, p comme la dimension de l’espace de départ E et comme le nombre de ligne de X.

PreuveLa matrice A est telle que pour tout j ∈ �1, p� nous avons u(ej ) =

n∑i=1

ai,j fi.

Nous avons pour tout vecteur x =

p∑j=1

xjej de E et y =

n∑i=1

yifi de F, les égalités X = MBE(x) =

⎛⎜⎜⎜⎝x1

x2

...xp

⎞⎟⎟⎟⎠ et

Y = MBF(y) =

⎛⎜⎜⎜⎝y1

y2

...yn

⎞⎟⎟⎟⎠ . Avec ces notations, nous avons les équivalences

y = u(x) ⇐⇒n∑

i=1

yifi = u

⎛⎝ p∑j=1

xjej

⎞⎠⇐⇒

n∑i=1

yifi =

p∑j=1

xju(ej )

⇐⇒n∑

i=1

yifi =

p∑j=1

xj

n∑i=1

ai,j fi

⇐⇒n∑

i=1

yifi =n∑

i=1

⎛⎝ p∑j=1

ai,jxj

⎞⎠ fi

⇐⇒ ∀i ∈ �1, n� yi =

p∑j=1

ai,jxj

⇐⇒ Y = AX. ❑

Exemples1. Reprenons l’exemple de l’application u définie page 24 en début de chapitre.

u :{

K3 → K2

(x1, x2, x3) → (x1 − x2 + 4x3, 3x1 − x3)

L’espace de départ est de dimension 3 et celui d’arrivée est de dimension 2, la matrice deu relativement aux bases canoniques B3 de K

3 et B2 de K2 est donc de taille 3 × 2, ses

vecteurs colonnes sont les images par u de (1, 0, 0), (0, 1, 0) et (0, 0, 1). Nous avons donc

MB3,B2 (u) =(

1 −1 43 0 −1

).

Nous pouvons noter (y1, y2) l’image d’un élément (x1, x2, x3) de K3 par u. Nous avonsalors (

y1

y2

)=(

1 −1 43 0 −1

)⎛⎝ x1

x2

x3

⎞⎠ .

40

Page 48: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Matrices et applications linéaires

2. Nous avons déjà remarqué que la dérivation des polynômes était une application linéaire.Considérons par exemple l’application u de K3[X] (de dimension 4) dans K2[X] (dedimension 3) qui à un polynôme P = a + bX + cX2 + dX3 lui associe sa dérivée P′.Relativement à la base canonique B3 = (1, X, X2, X3) de K3[X] et à la base canoniqueB2 = (1, X, X2) de K2[X], la matrice A de u est

A =

⎛⎝ 0 1 0 00 0 2 00 0 0 3

⎞⎠ .

Par exemple la matrice colonne des coordonnées du polynôme P(X) = 13+11X+7X2+5X3

est

⎛⎜⎝ 131175

⎞⎟⎠ . Les coordonnées de P′(X) sont alors

⎛⎝ 0 1 0 00 0 2 00 0 0 3

⎞⎠⎛⎜⎝ 13

1175

⎞⎟⎠ =

⎛⎝ 111415

⎞⎠dans la base canonique de K2[X] ce qui nous donne P′(X) = 11 + 14X + 15X2.

5.2 Espaces vectoriels de matrices et d’applications linéaires

Base et dimension de L(E, F)

Soient E et F deux espaces vectoriels de dimension finie sur K, BE = (e1, e2, . . . , ep)une base de E et BF = (f1, f2, . . . , fn) une base de F. Pour tout i ∈ �1, n� et toutj ∈ �1, p� nous définissons l’application linéaire ui,j ∈ L(E, F) en donnant les imagesdes vecteurs de la base BE

∀k ∈ �1, p� ui,j(ek) = 0 si k �= jet ui,j(ej) = fi.

Proposition 18

Soient E et F deux espaces vectoriels de dimension n et p. La famille (ui,j) 1�i�n1�j�p

des np

applications linéaires de E dans F définie ci-dessus est une base de L(E, F).Nous avons dim

(L(E, F)

)= dim(F) × dim(E).

Preuve� Soit u un élément quelconque de L(E, F) et soit (ai,j ) 1�i�n

1�j�p

la matrice de u relativement aux bases BE et BF .

Considéronsn∑

i=1

p∑j=1

ai,jui,j . Nous avons

∀k ∈ �1, p�

⎛⎝ n∑i=1

p∑j=1

ai,jui,j

⎞⎠ (ek) =n∑

i=1

p∑j=1

ai,j(ui,j (ek)

)=

n∑i=1

ai,k(ui,k(ek)

)=

n∑i=1

ai,kfi

= u(ek).

41

Page 49: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Nous avons donc u =n∑

i=1

p∑j=1

ai,jui,j puisque ces deux applications linéaires coïncident sur la base

BE = (e1, e2, . . . , ep) de E.La famille (ui,j ) 1�i�n

1�j�p

est donc génératrice de L(E, F).

� Soit d’autre part une famille (li,j ) 1�i�n

1�j�p

de scalaires telle quen∑

i=1

p∑j=1

li,jui,j = 0. Pour tout entier k dans

�1, p� nous avons

0 =

⎛⎝ n∑i=1

p∑j=1

li,jui,j

⎞⎠ (ek) =n∑

i=1

li,kfi.

La famille (fi)1�i�n étant libre, nous avons l1,k = l2,k = · · · = ln,k = 0. Ces égalités étant démontréespour tout k dans �1, p�, tous les scalaires (li,j ) 1�i�n

1�j�p

sont nécessairement nuls. La famille (ui,j ) 1�i�n

1�j�p

elle-même

est libre. ❑

Isomorphisme entre L(E, F) et Mn,p(K)

Proposition 19

Soient E et F deux espaces vectoriels de dimension finie sur K, BE = (e1, e2, . . . , ep)une base de E et BF = (f1, f2, . . . , fn) une base de F. L’application qui à toute applica-tion linéaire u de L(E, F) associe la matrice MBE,BF (u) de Mn,p(K) est un isomorphismed’espace vectoriel.

➤ Remarques• On retiendra que la matrice d’une combinaison linéaire d’applications linéaires est la combinaison linéaire des

matrices des applications.

• Le fait que Mn,p(K) et L(E, F) sont de même dimension nous permet de dire qu’il existe des isomorphismesentre ces deux espaces, cependant une application de l’un dans l’autre n’est pas nécessairement un isomor-phisme, il nous faut donc montrer que l’application MBE ,BF

est bien linéaire et bijective.

Preuve� Soient u et v deux éléments de L(E, F), soient (ai,j ) 1�i�n

1�j�p

= MBE ,BF(u) et (bi,j ) 1�i�n

1�j�p

= MBE ,BF(v) leurs

matrices respectives relativement aux bases BE et BF et soient l et m deux scalaires. Nous avons

∀j ∈ �1, p� (lu + mv)(ej) = lu(ej ) + mv(ej )

= l

(n∑

i=1

ai,j fi

)+ m

(n∑

i=1

bi,j fi

)

=n∑

i=1

(lai,j + mbi,j )fi.

De ce fait la matrice de l’application linéaire lu + mv est donc la matrice (lai,j + mbi,j ) 1�i�n

1�j�p

et donc

MBE ,BF(lu + mv) = lMBE ,BF

(u) + mMBE ,BF(v).

L’application MBE ,BFest linéaire.

� Comme dans la démonstration de la proposition précédente, pour tout i ∈ �1, n� et tout j ∈ �1, p�, nousdéfinissons l’application linéaire ui,j ∈ L(E, F) en donnant les images des vecteurs de la base BE

∀k ∈ �1, p� ui,j (ek) = 0 si k �= jet ui,j (ej ) = fi.

42

Page 50: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Matrices et applications linéaires

Nous savons que (ui,j ) 1�i�n

1�j�p

est une base de L(E, F). La matrice de ui,j est la matrice Ei,j de la base canonique

de Mn,p(K).L’application MBE ,BF

envoie donc les vecteurs d’une base de L(E, F) sur les vecteurs de la base canoniquede Mn,p(K), c’est un isomorphisme. ❑

5.3 Produit de matrices et composée d’applications linéaires

Proposition 20

Soient E, F et G trois espaces vectoriels de dimensions finies munis respectivement desbases BE, BF et BG. Pour toutes applications linéaires u de E dans F et v de F dans G,nous avons

MBE,BG (v ◦ u) = MBF ,BG (v) ×MBE,BF (u)

➤ RemarqueOn retiendra que la multiplication des matrices correspond à la composition des applications linéaires.

PreuvePosons p = dim(E), n = dim(F) et q = dim(G).Soit u ∈ L(E, F) et v ∈ L(F, G) deux applications linéaires.Posons A = MBE ,BF

(u) ∈ Mn,p(K) et B = MBF ,BG(v) ∈ Mq,n(K).

Pour tous vecteurs x, y et z de E, F et G respectivement, nous noterons X, Y et Z les matrices colonnes deleurs coordonnées dans les bases BE, BF et BG respectivement. Les matrices colonnes X, Y et Z ont doncrespectivement p, n et q lignes.Avec ces notations, pour tout vecteur x de E, posons y = u(x) et z = v(y) = u ◦ v(x) et nous avons alorsY = AX et Z = BY = B(AX) = (BA)X. Puisqu’à l’application linéaire v ◦ u ne correspond qu’une seule matricerelativement aux bases BE et BG, il s’agit de la matrice BA ce qui démontre la proposition. ❑

5.4 Matrices carrées et endomorphismes

Matrice d’un automorphisme de E et de sa réciproque

Proposition 21

Soit E un espace vectoriel de dimension finie n.La matrice d’un automorphisme u de E est une matrice carrée inversible de Mn(K) dontl’inverse est la matrice de l’automorphisme réciproque u−1 de E.

PreuveSoient E un espace vectoriel de dimension finie n et u un automorphisme de E, c’est-à-dire une bijectionlinéaire de E dans E, nous savons que la bijection réciproque u−1 de u est aussi un automorphisme.Soient BE = (e1, e2, . . . , en) une base de E.Posons A = MBE

(u) et B = MBE(u−1). Nous avons u−1 ◦ u = IdE et u ◦ u−1 = IdF d’où nous déduisons que

BA = In et AB = In. La matrice A est donc inversible et A−1 = B.❑

43

Page 51: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Exercice 1.Considérons sur R3[X] rapporté à sa base canonique l’application u qui à tout polynôme P(X)associe le polynôme P(X + 2).Vérifier que u est un endomorphisme de R3[X] et déterminer la matrice M de u.La matrice M est elle-inversible ? Calculer son inverse s’il existe.

Solution.Si P(X) est un polynôme de degré inférieur ou égal à 3, le polynôme P(X + 2) sera aussi dedegré inférieur ou égal à 3.Si l et m sont deux scalaires, P et Q deux polynômes dans R3[X] alors on a l’égalité depolynômes (lP+mQ)(X+2) = lP(X+2)+mQ(X+2) c’est-à-dire u(lP+mQ) = lu(P)+mu(Q).L’application u est une application linéaire de R3[X] dans R3[X] donc un endomorphisme.Soit (1, X, X2, X3) la base canonique de R3[X].Les colonnes de la matrice de u sont les coordonnées des images des vecteurs de cette base, parexemple u(X3) = (X + 2)3 = 8 + 12X + 6X2 + X3, donc la quatrième colonne de la matrice

M est

⎛⎜⎝ 81261

⎞⎟⎠ .

La matrice M associée à u est donc

M =

⎛⎜⎝ 1 2 4 80 1 4 120 0 1 60 0 0 1

⎞⎟⎠ .

La matrice M est inversible, puisqu’elle est déjà triangulaire supérieure avec une diagonale depivots tous non nuls.Nous pouvons par ailleurs remarquer que l’application v définie par v

(P(X)

)= P(X − 2)

pour tout polynôme P dans R3[X] est l’application réciproque de u, nous avons en effetu ◦ v = v ◦ u = Id. Nous en déduisons à nouveau que u est un automorphisme, que M estinversible et que son inverse est la matrice de v, donc

M−1 =

⎛⎜⎝ 1 −2 4 −80 1 −4 120 0 1 −60 0 0 1

⎞⎟⎠ .

Isomorphisme entre L(E) et Mn(K)Nous donnons ici une synthèse de certains résultats établis ci-dessus.

Proposition 22

Soient E un espace vectoriel de dimension finie n sur K et B = (e1, e2, . . . , en) une basede E. L’application M qui à toute endomorphisme u de L(E) associe la matrice de u

44

Page 52: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Rang d’une matrice

relativement à B est un isomorphisme d’espace vectoriel et nous avons

∀u ∈ L(E) ∀v ∈ L(E) ∀l ∈ K ∀k ∈ N

M(u + v) = M(u) + M(v)

M(lu) = lM(u)

M(u ◦ v) = M(u)M(v)

M(uk) =(M(u)

)k

De plus, si x et y sont des vecteurs de E et X et Y les matrices colonnes de leurs coordon-nées dans la base B, nous avons

∀u ∈ L(E) ∀x ∈ E ∀y ∈ E y = u(x) ⇐⇒ Y = M(u)X

Enfin la restriction de M à l’ensemble GL(E) des automorphismes de E est une bijectionde GL(E) dans l’ensemble des matrices inversibles de Mn(K) et l’on a

∀u ∈ GL(E) M(u−1) =(M(u)

)−1

➤ RemarqueCette proposition n’est que la traduction dans le cas des endomorphismes de l’ensemble des propositions précé-dentes.

6. Rang d’une matriceSoit n et p deux entiers naturels non nuls ; nous considérons ici les espaces vectorielsMp,1(K) et Mn,1(K) munis de leur base canonique.Un élément X de Mp,1(K) est une matrice colonne égale à la matrice colonne de sescoordonnées sur la base canonique de Mp,1(K).Par exemple, si p = 3, nous avons pour tout élément X de Mp,1(K)

X =

⎛⎝ x1x2x3

⎞⎠ = x1

⎛⎝ 100

⎞⎠ + x2

⎛⎝ 010

⎞⎠ + x3

⎛⎝ 001

⎞⎠Il en est de même pour les élément Y de Mp,1(K).Soit u une application linéaire de Mp,1(K) dans Mn,1(K) et soit A sa matrice relati-vement aux bases canoniques, nous avons

∀X ∈ Mp,1(K) ∀Y ∈ Mn,1(K) Y = u(X) ⇐⇒ Y = AX

Inversement, si A est une matrice de Mn,p(K), l’application uA définie paruA : X −→ AX est une application linéaire de Mp,1(K) dans Mn,1(K).

45

Page 53: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

Définition 14

Soit A une matrice de Mn,p(K). On appelle rang de la matrice A, et l’on note rg(A), ladimension du sous-espace vectoriel engendré dans Mn,1(K) par les p vecteurs colonnesde A.

Proposition 23

Soient A une matrice de Mn,p(K) de rang r et uA l’application de Mp,1(K) dans Mn,1(K)qu’elle définit. On a alors r = rg(A) = rg(uA) et r � inf(n, p).

PreuveNous savons que le sous-espace vectoriel �m(uA) est engendré par la famille des images des vecteurs d’unebase de Mp,1(K), par exemple ceux de la base canonique. Nous remarquons alors que l’image par uA du jème

vecteur de cette base est le jème vecteur colonne de la matrice A.

⎛⎜⎜⎜⎝a1,j

a2,j

...an,j

⎞⎟⎟⎟⎠ =

⎛⎜⎜⎜⎝a1,1 · · · a1,j · · · a1,p

a2,1 · · · a2,j · · · a2,p

......

...an,1 · · · an,j · · · an,p

⎞⎟⎟⎟⎠

⎛⎜⎜⎜⎜⎜⎜⎜⎝

0...1...0

⎞⎟⎟⎟⎟⎟⎟⎟⎠← jième ligne

Il est alors clair que nous avons rg(uA) = dim(�m(uA)

)= rg(A) = r.

Comme �m(uA) est un sous-espace de Mn,1(K) nous avons r � n et comme il est engendré par p vecteurs,nous avons aussi r � p. ❑

Proposition 24

Soient E un espace de dimension n muni d’une base B, f1, f2, . . . , fp des vecteurs de E etM la matrice de ces vecteurs dans la base B. On a rg(f1, . . . , fp) = rg(M).

PreuveSoit MB : E → Mn,1(K) l’application qui à un vecteur x associe le n-uplet de ses coordonnées dans labase B. On a déjà vu que cette application est un isomorphisme. Elle induit en particulier un isomorphisme deVect(f1, f2, . . . , fp) sur Vect

(MB(f1),MB(f2), . . . ,MB(fp)

). On en déduit que

rg(f1, f2, . . . , fp) = rg(MB(f1),MB(f2), . . . ,MB(fp)

).

Mais par définition du rang d’une matrice rg(M) = rg(MB(f1),MB(f2), . . . ,MB(fp)

). On a donc bien

rg(f1, f2, . . . , fp) = rg(M).❑

Théorème 6

Soient E un espace vectoriel muni d’une base BE, F un espace vectoriel muni d’une baseBF et u ∈ L(E, F). On a rg(u) = rg

(MBE,BF (u)

).

Autrement dit, le rang d’une application linéaire est égal au rang de sa matrice quelquesoit le choix des bases de E et de F utilisées.

46

Page 54: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Rang d’une matrice

PreuveNotons BE = (e1, e2, . . . , ep).On sait que �m(u) = Vect

(u(e1), . . . , u(ep)

)d’où rg(u) = rg

(u(e1), . . . , u(ep)

). Mais d’après la proposition

précédenterg(u(e1), . . . , u(ep)

)= rg(MBF

(u(e1), . . . , u(ep)

))et par définition de la matrice d’une application linéaire MBE ,BF

(u) = MBF

(u(e1), . . . , u(ep)

). On en déduit

querg(u(e1), . . . , u(ep)

)= rg(MBE ,BF

(u)).

Corollaire 2

Une matrice A de Mn(K) est inversible si et seulement si rg(A) = n.

PreuveSoit uA l’endomorphisme de Mn,1(K) canoniquement associé à A. On sait alors que

A est inversible ⇐⇒ uA est bijective

⇐⇒ rg(uA) = n

⇐⇒ rg(A) = n.❑

Enfin nous admettons le théorème suivante dont la démonstration est hors pro-gramme.

Théorème 7

Soit une matrice A de Mn,p(K).La matrice A et sa transposée tA ont le même rang.

47

Page 55: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. 1. Dans M3(K), déterminer le rang de la matrice

M =

(1 1 1

b + c c + a a + bbc ca ab

), (a, b, c) ∈ K

3.

2. Dans Mn(K) avec n � 2, déterminer, lorsqu’il existe, l’inverse de la matrice

M =

⎛⎜⎜⎜⎜⎜⎜⎝

a b · · · · · · b

b a. . .

......

. . .. . .

...... a bb · · · · · · b a

⎞⎟⎟⎟⎟⎟⎟⎠ , (a, b) ∈ K2.

On pourra écrire M comme la combinaison linéaire de la matrice unité I et de la matriceJ de Mn(K) dont tous les coefficients sont égaux à 1 et calculer M2.

3. Dans Mn(K), on note I la matrice unité et on considère une matrice nilpotente A, c’est-à-dire qu’il existe un entier k > 1 tel que Ak = 0.a. Rappeler la formule pour la somme des k premiers termes de la suite (rn)n∈N.

b. En donnant son inverse, montrer que I−A est inversible ; de la même manière, montrerque I + A est inversible.

2. Soit A =(

1 30 1

)et soit w l’application de M2(K) dans M2(K) défini par

w : M → MA − AM

1. Montrer que w est une application linéaire.

2. Déterminer la matrice de w dans la base canonique de M2(K).

3. L’endomorphisme w est-il injectif ? surjectif ? Déterminer �m(w) et Ker(w).

4. Que peut-on dire de w2 et de w3?

3. 1. Soit f l’application définie par{R

N → RN

(un)n∈N → (un+1)n∈N

Ce qui peut encore s’écrire f (u0, u1, u2, u3, . . .) = (u1, u2, u3, u4, . . .).a. Montrer que f est linéaire.

b. Déterminer Ker(f ). L’application f est-elle injective ?Peut on en déduire si f est surjective ou non ?

c. Soit k un entier naturel non nul, donner une base de Ker(f k).L’espace RN est-il de dimension finie ?

d. Montrer que f est surjective.Conclure de cette étude qu’en dimension infinie, il existe des endomorphismes surjectifsnon injectifs.

48

Page 56: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

2. Soit g l’application définie par⎧⎨⎩ RN → R

N

(un)n∈N → (vn)n∈N avec

∣∣∣∣ v0 = 0∀n ∈ N∗ vn = un−1

Ce qui peut encore s’écrire g(u0, u1, u2, u3, . . .) = (0, u0, u1, u2, . . .).a. Montrer que g est linéaire, injective et non surjective.

b. Que peut-on dire de f ◦ g ? Peut-on dire que f est la fonction réciproque de g ?Conclure de cette étude qu’en dimension infinie, il existe des endomorphismes injectifsnon surjectifs.

4. Soit f ∈ L(E) où E est de dimension n � 1. On suppose que f est nilpotent,c’est-à-dire qu’il existe un entier k > 1 tel que f k = 0.

1. Montrer que f n’est pas bijective. Peut-on conclure qu’elle est ni injective ni surjective ?

2. Soit p le plus petit entier tel que f p = 0 et x0 ∈ E tel que f p−1(x0) �= 0.a. Montrer que

(x0, f (x0), . . . , f p−1(x0)

)est une famille libre de E.

b. En déduire que p � n.

5. Soit E = Kn[X] l’espace vectoriel des polynôme de degré inférieur ou égal à n(n � 4.), a un élément de K et soit f l’application de E dans E définie par

f : P → (X − a)(P′ − P′(a)

)− 2

(P − P(a)

).

1. Montrer que f est un endomorphisme de E.

2. Déterminer le noyau et l’image de f .Le choix d’une base bien adaptée à f rendra l’exercice très simple.

6. Soit E = un espace vectoriel et f un endomorphisme de E tel que f ◦ f = f .Montrer que f est une projection sur �mf parallèlement à Ker f .

7. Oral ESCP

Soit E un espace vectoriel sur R de dimension n � 2 et soit u un endomorphisme de E .

1. Dans cette question uniquement on suppose qu’il existe un projecteur p de E tel quep ◦ u − u ◦ p = u.a. Montrer que u ◦ p = 0.

b. En déduire que u ◦ u = 0.

2. Dans cette question uniquement on suppose que u ◦ u = 0.a. Montrer que �m(u) ⊂ Ker(u).

b. Soit H un sous-espace vectoriel de E tel que : �m(u) ⊂ H ⊂ Ker(u) et soit S unsupplémentaire de H. Soit q la projection sur H parallèlement à S. Calculer q◦ u− u ◦ q.

49

Page 57: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

3. Donner une condition nécessaire et suffisante pour qu’il existe un projecteur p de E telque p ◦ u − u ◦ p = u. Cette condition étant supposée remplie, y-a-t’il toujours unicité duprojecteur p ?

4. Soit l’espace vectoriel E = R2 et u l’endomorphisme de E dont la matrice dans la base

canonique est égale à U =(

−2 4−1 2

). Déterminer un projecteur p de E tel que

p ◦ u − u ◦ p = u.

8. Soit E un espace vectoriel de dimension n (n � 1.) et f un endomorphisme de E.Montrer que l’on a les équivalence suivante

�mf = Ker f ⇐⇒(f ◦ f = 0 et n = 2 dim(�mf )

)9. 1. Soit E, F et G trois espaces vectoriels sur K et f ∈ L(E, F) et g ∈ L(F, G) deux

endomorphismes. Montrer que l’on a les équivalences suivantes :a. Ker(g ◦ f ) = Ker(f ) ⇐⇒ Ker g ∩ �mf = {0},

b. �m(g ◦ f ) = �m(g) ⇐⇒ Ker g + �mf = F.

2. Soit maintenant E un espace de dimension finie n et f un endomorphisme de E.

Ker(f ◦ f ) = Ker f ⇐⇒ �m(f ◦ f ) = �mf ⇐⇒ Ker f ⊕�mf = E

50

Page 58: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

3Réductiondes endomorphismes

et des matrices

Dans tout ce chapitre E est un espace vectoriel sur K de dimension finie non nulle n.

1. Changement de baseDans le chapitre précédent, nous avons vu comment, en dimension finie, vecteurs etapplications linéaires sont associés à des matrices pourvu que des bases soient choisieset fixées.Nous changeons maintenant de point de vue : dans toute cette section, x est unvecteur fixé une fois pour toutes dans l’espace vectoriel E de dimension finie, u estun endomorphisme de E fixé une fois pour toutes, et nous étudions les effets d’unchangement de base.

1.1 Matrices de passage de l’ancienne base une nouvelle base

Définition 1

Soient B1 = (e1, . . . , en) et B2 = (´1, . . . , ´n) deux bases de E. On appelle matrice depassage de B1 à B2 et l’on note PB1,B2 la matrice MB1 (´1, ´2 . . . , ´n).

➤ Remarques• Le jème vecteur colonne de PB1 ,B2

est donc le vecteur des coordonnées de ´j dans la base B1. En ce sens onpeut dire que la matrice de passage de B1 à B2 est la matrice des coordonnées des vecteurs d’une nouvellebase (B2) écrits dans l’ancienne (B1) qui est la référence de départ.

• Si on note PB1 ,B2= (pi,j ) 1�i�n

1�j�n

, on a alors pour tout j ∈ �1, n� l’égalité ´j =n∑

i=1

pi,jei .

ExempleSoient B1 = (1, X, X2, X3) la base canonique de K3[X] et B2 = (1, (X−1), (X−1)2, (X−1)3)une autre base de cet espace. On sait que

1 = 1X − 1 = −1 + X

(X − 1)2 = 1 − 2X + X2

(X − 1)3 = −1 + 3X − 3X2 + X3.

Page 59: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

On en déduit que

PB1,B2 =

⎛⎜⎝ 1 −1 1 −10 1 −2 30 0 1 −30 0 0 1

⎞⎟⎠ .

Proposition 1

Soient B1 et B2 deux bases de E, la matrice PB1,B2 est inversible et son inverse est PB2,B1 .

PreuveNotons comme précédemment B1 = (e1, . . . , en) et B2 = (´1, . . . , ´n) les deux bases de E, notonsPB1 ,B2

= (pi,j ) 1�i�n

1�j�n

et PB2 ,B1= (qk,i ) 1�k�n

1�i�n

.

Par définition des matrices de passage, nous avons pour tout i, j, k dans �1, n�

´j =n∑

i=1

pi,jei et ei =n∑

k=1

qk,i´k.

D’où nous avons ´j =n∑

i=1

pi,j

(n∑

k=1

qk,i´k

)

=n∑

i=1

n∑k=1

(pi,jqk,i )´k

=n∑

k=1

(n∑

i=1

(qk,ipi,j )´k

)

=n∑

k=1

(n∑

i=1

qk,ipi,j

)´k

Dans la base (´1, . . . , ´n), l’écriture unique de ´j est ´j = 0´1 + · · · + 1´j + · · · + 0´n.

Donc pour tout k et j dans �1, n�, les sommesn∑

i=1

qk,ipi,j sont nulles sauf si j = k où elles sont égales à 1. Nous

pouvons reconnaître dans ces sommes les coefficients du produit de matrices (PB2 ,B1)(PB1 ,B2

) qui est donc égalà la matrice unité In.Par un calcul similaire, nous obtenons (PB1 ,B2

)(PB2 ,B1) = In, ce qui démontre la proposition. ❑

1.2 Les nouvelles et anciennes coordonnées d’un même vecteur

Proposition 2

Soit E un espace vectoriel muni d’une base B1 et x un vecteur de E. Soit B2 une nouvellebase de E. On note

X =

⎛⎜⎜⎝x1

x2...

xn

⎞⎟⎟⎠ et X ′ =

⎛⎜⎜⎝x′1x′2...

x′n

⎞⎟⎟⎠ les coordonnées de x dans les bases B1 et B2 respective-

ment.Soit P la matrice de passage de B1 à B2.On a la relation

X = PX ′.

52

Page 60: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Changement de base

➤ RemarqueAttention, on retiendra que la matrice de passage P d’une ancienne base vers une nouvelle base a pour vecteurscolonnes les coordonnées des nouveaux vecteurs sur l’ancienne base, c’est logique nous construisons le nouveausur l’existant.Ceci bien retenu, la matrice P permet de retrouver les anciennes coordonnées en fonction des nouvelles ; pourtrouver les nouvelles coordonnées, nous multiplions à gauche par P−1 l’égalité ci-dessus pour obtenir X′ = P−1X.

PreuveIl suffit d’écrire la décomposition du vecteur x sur les deux bases. Avec les mêmes notations que précédemment,nous avons

d’une part x =n∑

i=1

xiei

d’autre part x =n∑

j=1

x′j ´j

=n∑

j=1

x′j

(n∑

i=1

pi,jei

)

=

n∑i=1

⎛⎝ n∑j=1

pi,jx′j

⎞⎠ ei

L’unicité des coordonnées de x sur la base B1 = (e1, . . . , en) nous permet de conclure que pour tout i ∈ �1, n�

nous avons xi =

n∑j=1

pi,jx′j , c’est-à-dire que X = PX′. ❑

1.3 La nouvelle et l’ancienne matrice d’un endomorphisme

Proposition 3

Soit E un espace vectoriel muni d’une base B1 et u ∈ L(E) un endomorphisme de E. SoitB2 une nouvelle base de E.On note M = MB1 (u) l’ancienne matrice de u relativement à la base B1 et M ′ = MB2 (u)la nouvelle matrice de u relativement à la base B2.Soit P la matrice de passage de B1 à B2.On a la relation

M = PM ′P−1.

➤ RemarqueAttention, on retiendra que la matrice de passage P d’une ancienne base vers une nouvelle base a pour vecteurscolonnes les coordonnées des nouveaux vecteurs sur l’ancienne base, c’est logique nous construisons le nouveausur l’existant.

Ceci bien retenu, la relation ci-dessus permet de retrouver l’ancienne matrice de u en fonction de la nouvelle ;pour trouver la nouvelle matrice de u, nous multiplions à gauche par P−1 et à droite par P l’égalité ci-dessus pourobtenir M′ = P−1MP.

PreuvePour tout vecteur x ∈ E, notons y = u(x) son image par l’endomorphisme u ; notons aussi X et Y les matricescolonnes des anciennes coordonnées de x et y et encore X′ et Y ′ les matrices colonnes de leur nouvelles

53

Page 61: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

coordonnées. Écrivons de deux façons différentes la matrice Y .

d’une part Y = MX

d’autre part Y = PY ′

= P(M′X′)

= (PM′)X′

= (PM′)(P−1X)

= (PM′P−1)X

L’unicité de la matrice de u relativement à la base B1 nous donne M = PM′P−1. ❑

1.4 Matrices semblables

Définition 2

Deux matrices M et M ′ de Mn(K) sont dites semblables s’il existe une matrice P inversiblede Mn(K) telle que

M = PM ′P−1.

➤ RemarqueLa définition n’est apparemment pas symétrique en M et M′. Cependant, si l’on a M = PM′P−1, alors en multi-pliant par P−1 à gauche et P à droite, on trouve que PMP−1 = M′. En posant Q = P−1, on a donc M′ = Q−1MQ,ce qui prouve que l’ordre est en fait indifférent dans la définition.

Proposition 4

Deux matrices de Mn(K) sont semblables si, et seulement si, elles sont les matrices d’unmême endomorphisme.

PreuveD’après la proposition 3, on sait que si M et M′ sont les matrices d’un même endomorphisme, alors M et M′

sont des matrices semblables.

Réciproquement soient M et M′ deux matrices de Mn(K) et P une matrice inversible de Mn(K) telles queM = PM′P−1. On note u l’application linéaire canoniquement associée à M qui est un endomorphisme de Kn

et B1 la base canonique de Kn.Définissons les n vecteurs (´1, . . . , ´n) dont les coordonnées sur la base canonique B1 deKn sont respectivementles n vecteurs colonnes de la matrice P. La matrice P étant inversible, ses vecteurs colonnes forment une baseB2 de Kn et P est la matrice de passage de la base B1 à la base B2. Nous avons MB1

(u) = M, et d’après laproposition 3, on a

MB2(u) = P−1MB1

(u)P = P−1MP = M′.

Les matrices M et M′ sont donc les matrices d’un même endomorphisme u. ❑

Signalons enfin la propriété suivante :

Proposition 5

Soient A, B deux matrices de Mn(K) et P une matrice inversible de Mn(K) telles queB = P−1AP, alors

∀k ∈ N, Bk = P−1AkP.

54

Page 62: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Valeurs et vecteurs propres d’un endomorphisme

➤ RemarqueIl s’agit d’une forme de produit télescopique.

PreuveProuvons-la par récurrence sur k.Au rang 0, on a bien B0 = In et P−1A0P = P−1InP = P−1P = In.Supposons que l’on ait Bk = P−1AkP, alors

Bk+1 = BBk = P−1APP−1AkP = P−1AAkP = P−1Ak+1P,

ce qui prouve la propriété au rang k + 1.On en déduit que ∀k ∈ N, Bk = P−1AkP. ❑

2. Valeurs et vecteurs propres d’un endomorphismeMaintenant que nous savons comment calculer la matrice d’un endomorphisme u en cas dechangement de base, il devient intéressant de rechercher les bases dans lesquelles la matrice de userait aussi simple que possible.

2.1 Définitions

Définition 3

Soit u ∈ L(E) un endomorphisme de E. Un scalaire l ∈ K est une valeur propre de us’il existe un vecteur x ∈ E non nul tel que u(x) = lx. Un tel vecteur x est alors appeléun vecteur propre de u associé à la valeur propre l.

➤ Remarques• Dans cette définition, la condition x �= 0 est essentielle. Si nous n’imposions pas au vecteur propre x d’être non

nul, tout réel l conviendrait et nous n’aurions rien défini.

• Un vecteur propre x associé à une valeur propre l est un vecteur pour lequel l’endomorphisme u a un compor-tement extrêmement simple.

• L’ensemble des valeurs propres d’un endomorphisme u est appelé le spectre de u et est noté Sp(u).

Proposition 6

Soit u ∈ L(E) un endomorphisme et l une valeur propre de u. L’ensemble El défini par

El = {x ∈ E | u(x) = lx}est un sous-espace vectoriel de E.El s’appelle le sous-espace propre de u associé à la valeur propre l ; on aEl = Ker(u − l IdE).

➤ Remarques• En toute rigueur il faudrait noter cet ensemble El(u) puisqu’il dépend aussi de u, mais, s’il n’y a pas d’ambiguïté,

on écrira seulement El.

• Le scalaire l est valeur propre de u si et seulement si l’ensemble {x ∈ E | u(x) = lx} n’est pas réduit à{0}. Dans ce cas El est l’ensemble des vecteurs propres de u associés à la valeur propre l auquel on ajoute levecteur nul.

• L’espace E étant de dimension finie, le sous-espace El est de dimension finie. Comme il contient au moins unvecteur non nul, sa dimension est au moins égale à 1.

55

Page 63: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

PreuveSoit l une valeur propre de u.Nous avons pour x ∈ E

x ∈ El ⇐⇒ u(x) − lx = 0⇐⇒ (u − l IdE)(x) = 0⇐⇒ x ∈ Ker(u − l IdE).

Nous avons donc El = Ker(u − l IdE) qui est un espace vectoriel. ❑

➤ RemarqueOn en déduit que

l est valeur propre de u ⇐⇒ Ker(u − l IdE) �= {0}⇐⇒ u − l IdE n’est pas injective

⇐⇒ u − l IdE n’est pas bijective.

Proposition 7

Soit u ∈ L(E) un endomorphisme de E.L’endomorphisme u est injectif (et donc bijectif) si, et seulement si, u n’admet pas 0comme valeur propre.

PreuveIl suffit de reprendre la remarque ci-dessus avec 0 substitué à l. ❑

2.2 Vecteurs propres associés à des valeurs propres distinctes

Proposition 8

Soient u ∈ L(E) un endomorphisme de E et l1, l2, . . . , lk des valeurs propres de u dis-tinctes deux à deux et x1, x2, . . . , xk des vecteurs propres associés respectivement associésà l1, l2, . . . , lk. La famille (x1, x2, . . . , xk) est une famille libre.

PreuveProuvons-le par récurrence sur k.C’est vrai pour k = 1 puisqu’un vecteur propre n’est pas nul.Supposons la propriété vérifiée au rang k et montrons qu’elle est vraie au rang k + 1. Soit (x1, x2, . . . , xk+1) desvecteurs propres de u associés à des valeurs propres distinctes l1, l2, . . . , lk+1 et considérons une combinaisonlinéaire nulle de ces vecteurs avec les scalaires a1, a2, . . . , ak+1

k+1∑i=1

aixi = 0. L1

En composant cette égalité par u, on obtientk+1∑i=1

aiu(xi ) = 0 soit

k+1∑i=1

ailixi = 0. L2

56

Page 64: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Valeurs et vecteurs propres d’un endomorphisme

En effectuant lk+1L1 − L2, on trouvek∑

i=1

ai (lk+1 − li )xi = 0.

D’après l’hypothèse de récurrence, la famille (x1, . . . , xk) est libre. Nous en déduisons que ai (lk+1 − li ) = 0pour i ∈ �1, k�. Comme les valeurs propres sont distinctes lk+1 −li �= 0 et donc ai = 0 pour i ∈ �1, k�. Il restedonc finalement ak+1xk+1 = 0. Puisque xk+1 est un vecteur propre, il est non nul, nous avons donc égalementak+1 = 0. Cela prouve que la famille (x1, . . . , xk+1) est libre. La propriété est donc prouvée par récurrence. ❑

Corollaire 1

Tout endomorphisme d’un espace de dimension n a au plus n valeurs propres.

Proposition 9

Soit u un endomorphisme d’un espace vectoriel E admettant pour valeurs propresl1, . . . , lk. Soient B1, . . . ,Bk des bases de El1 , . . . , Elk . La famille de vecteurs obtenueen juxtaposant les vecteurs des bases B1, . . . ,Bk est une famille libre de vecteurs de E.

PreuvePour tout i ∈ �1, k�, notons Bi = (ei

1, ei2, . . . , ei

pi) une base du sous espace propre Eli .

Soit F la famille de vecteur obtenue en juxtaposant les vecteurs de ces bases.Considérons une combinaison linéaire nulle des vecteurs de F avec les scalaires (ai,j ) 1�i�k

1�j�pi

k∑i=1

pk∑j=1

ai,jeij = 0.

Pour i ∈ �1, k�, posons xi =

pi∑j=1

ai,jeij ; pour chaque valeur propre li , nous regroupons ainsi tous les termes

associés à cette même valeur propre ; xi est donc un vecteur de Eli .

Nous avons alorsk∑

i=1

xi = 0 avec xi ∈ Eli . Si l’un des vecteurs xi était non nul, on aurait alors une combinaison

linéaire nulle non triviale de vecteurs propres de u associés à des valeurs propres distinctes. C’est impossiblepuisque ces vecteurs forment une famille libre d’après la proposition précédente.Pour tout i ∈ �1, k�, on a donc xi = 0 ; comme la famille Bi est une base de Eli , il vient pour tout i ∈ �1, k� ettout j ∈ �1, pk�, l’égalité ai,j = 0. Cela prouve que F est une famille libre. ❑

Corollaire 2

Soit u un endomorphisme d’un espace vectoriel E admettant pour valeurs propresl1, . . . , lk et soit El1 , . . . , Elk les espaces propres associés.On a

k∑i=1

dim(Eli ) � dim(E).

57

Page 65: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

Preuve

Il suffit de remarquer, avec les notations de la démonstration précédente, que Card(F ) =k∑

i=1

dim(Eli ) ❑

Théorème 1

Tout endomorphisme d’un espace vectoriel sur l’ensemble des nombres complexes C admet aumoins une valeur propre.

PreuveNous admettons ce théorème dont la démonstration est hors programme. ❑

➤ RemarqueUn endomorphisme d’un espace vectoriel sur R peut ne pas avoir de valeur propre.

Exemples1. Considérons deux sous-espaces vectoriels F1 et F2 non réduits à {0} d’un espace vectoriel

E de dimension finie tels que E = F1 ⊕ F2.Nous savons que x ∈ F1 ⇐⇒ p(x) = x, donc 1 est une valeur propre de p et F1 est le sousespace propre associé à la valeur propre 1.Nous avons aussi Ker(p) = F2 non réduit à {0}, 0 est donc une valeur propre de p et F2

est le sous espace propre qui lui est associé.

2. Soit D, l’endomorphisme de Rn[X], qui à tout polynôme P de Rn[X] associe son polynômedérivé P′. Le noyau de D est l’ensemble R0[X] des polynômes constants, 0 est donc unevaleur propre de D et R0[X] est le sous-espace propre qui lui est associé.Considérons maintenant dans Rn[X] un polynôme P non constant dont le degré est doncsupérieur ou égal à 1 et un réel non nul l. on a alors

deg(lP) = deg(P) > deg(P′).

L’égalité P′ = D(P) = lP est donc impossible, l’endomorphisme D a donc 0 comme seulevaleur propre.

3. Réduction des endomorphismes

3.1 Endomorphismes diagonalisables

Définition 4

Un endomorphisme u ∈ L(E) est dit diagonalisable s’il existe une base de E formée devecteurs propres de u, c’est-à-dire s’il existe une base (e1, e2, . . . , en) de E telle que pourtout i ∈ �1, n�, ei soit un vecteur propre de u.

ExempleSoient E un espace vectoriel de dimension finie non nulle, k un réel fixé et u l’endomorphismede E défini par u : x → kx. L’endomorphisme u est appelé homothétie de rapport k, tout

58

Page 66: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Réduction des endomorphismes

vecteur non nul est un vecteur propre associé à la valeur propre k, toute base de E est constituéede vecteurs propres et u est diagonalisable.

➤ RemarqueAttention, il existe des endomorphisme qui ne sont pas diagonalisables.Par exemple l’endomorphisme D de Kn[X] qui à un polynôme P associe son polynôme dérivé P′ (dernier exempleci-dessus) a comme unique valeur propre le réel 0 ; les seuls vecteurs propres de D sont les polynômes constantsdont la dérivée est nulle, il n’est pas possible de trouver parmi eux les éléments d’une base de Kn[X] si n estsupérieur à 0 et l’endomorphisme D de Kn[X] n’est pas diagonalisable pour n > 0.

Proposition 10

Un endomorphisme u ∈ L(E) est diagonalisable si et seulement s’il existe une base B deE dans laquelle la matrice de u est diagonale.

PreuveSupposons que u soit diagonalisable. Il existe une base B = (e1, . . . , en) de E formée de vecteurs propres de E.Notons l1, l2, . . . , ln les scalaires associés aux vecteurs de la base tels que u(ei ) = liei pour i ∈ �1, n�. On aalors

MB(u) =

⎛⎜⎜⎜⎜⎜⎝l1 0 . . . 0

0 l2

. . ....

.... . .

. . . 00 . . . 0 ln

⎞⎟⎟⎟⎟⎟⎠ .

Réciproquement, si B = (e1, . . . , en) est une base de E telle que la matrice de u dans cette base s’écrive⎛⎜⎜⎜⎜⎜⎝l1 0 . . . 0

0 l2

. . ....

.... . .

. . . 00 . . . 0 ln

⎞⎟⎟⎟⎟⎟⎠ ,

alors pour i ∈ �1, n�, comme ei appartient à une base ei �= 0 et par définition de la matrice d’une applicationlinéaire u(ei ) = liei . Autrement dit les vecteurs de la base B sont des vecteurs propres de u. ❑

3.2 Diagonalisation : une condition nécessaire et suffisante

Théorème 2

Soit u ∈ L(E) un endomorphisme d’un espace E de dimension n dont les valeurs propressont l1, l2, . . . , lk. On a alors l’équivalence

k∑i=1

dim(Eli ) = n ⇐⇒ u est diagonalisable .

Preuve

=⇒ Supposons que l’on aitk∑

i=1

dim(Eli ) = dim(E) = n.

Notons, pour tout i ∈ �1, k�, Bi une base de Eli ; nous savons que la famille B obtenue en juxtaposant les

59

Page 67: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

familles B1,B2, . . . ,Bk est une famille libre de vecteurs de E. Cette famille comptek∑

i=1

dim(Eli ) vecteurs.

C’est une famille libre de n vecteurs dans un espace de dimension n, c’est donc une base de E constituée devecteurs propres de u, u est diagonalisable.

⇐= Réciproquement, supposons que u soit un endomorphisme diagonalisable de E.Soient B une base de vecteurs propres de u et l1, l2, . . . , lk les valeurs propres de u.Pour i ∈ �1, k�, si la famille B contient pi vecteurs de Eli , alors ces pi vecteurs forment une famille libre deEli ; On en déduit que dim(Eli ) � pi . Par suite

k∑i=1

dim(Eli ) �k∑

i=1

pi = Card(B) = dim(E).

Comme on a égalementk∑

i=1

dim(Eli ) � dim(E), on en déduit finalement que

k∑i=1

dim(Eli ) = dim(E).❑

3.3 Diagonalisation : une condition suffisante

Théorème 3

Soit u ∈ L(E) un endomorphisme d’un espace E de dimension n.On a alors l’implication

l’endomorphisme u possède n valeurs propres distinctes =⇒ u est diagonalisable.

PreuveSoient x1, x2, . . . , xn des vecteurs propres de u associés aux n valeurs propres distinctes de u. On sait que lafamille (x1, x2, . . . , xn) est une famille libre de E. Cette famille étant une famille libre de n vecteurs dans unespace de dimension n, c’est une base de E, qui est bien formée de vecteurs propres de u. ❑

➤ RemarqueLa réciproque de ce théorème n’est pas vraie. Par exemple 1 est la seule valeur propre de IdE, or IdE est dia-gonalisable. Nous pouvons donc dire qu’avoir n valeurs propres distinctes est une condition suffisante (mais pasnécessaire) pour que u soit diagonalisable.

4. Diagonalisation des matrices carrées

4.1 Valeurs propres et vecteurs propres d’une matrice

Définition 5

Soit A ∈ Mn(K). Un scalaire l ∈ K est dit valeur propre de A s’il existe un vecteurcolonne X ∈ Mn,1(K) non nul telle que AX = lX. Un tel vecteur colonne est alorsappelé vecteur propre de A associé à la valeur propre l.

60

Page 68: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Diagonalisation des matrices carrées

Exemple

Soit A =

⎛⎝ 3 1 11 3 11 1 3

⎞⎠.

On a⎛⎝ 3 1 11 3 11 1 3

⎞⎠⎛⎝ 111

⎞⎠ =

⎛⎝ 555

⎞⎠ et

⎛⎝ 3 1 11 3 11 1 3

⎞⎠⎛⎝ 1−1

0

⎞⎠ =

⎛⎝ 2−2

0

⎞⎠ .

Le vecteur

⎛⎝ 111

⎞⎠ est un vecteur propre de A associé à la valeur propre 5 et le vecteur⎛⎝ 1−1

0

⎞⎠ est un vecteur propre de A associé à la valeur propre 2.

Proposition 11

Soit A ∈ Mn(K) une matrice carrée et l ∈ K une valeur propre de A. L’ensemble El

défini parEl = {X ∈ Mn,1(K) | AX = lX}

est un sous-espace vectoriel de Mn,1(K).El s’appelle le sous-espace propre de A associé à la valeur propre l.

➤ Remarques• En toute rigueur il faudrait noter cet ensemble El(A), puisqu’il dépend aussi de A ; s’il n’y a pas d’ambiguïté,

on écrit seulement El.

• On remarquera que l’équation AX = lX équivaut (A − lIn)X = 0.

PreuveSoit l une valeur propre de A. L’application u de Mn,1(K) dans lui-même définie par u : X �→ (A− lIn)X est unendomorphisme quelque soit le réel l.L’ensemble El est le noyau de l’application linéaire u, c’est donc un sous-espace vectoriel de Mn,1(K). De plusEl �= {0} puis qu’il contient au moins un vecteur colonne non nul. Il est donc au moins de dimension 1. ❑

Exemple

Reprenons la matrice A =

⎛⎝ 3 1 11 3 11 1 3

⎞⎠. Déterminons une base de E2. Soit X ∈ M3,1(K)

avec X =

⎛⎝ xyz

⎞⎠, on a

X ∈ E2 ⇐⇒ (A − 2I)X = 0 ⇐⇒

⎛⎝ 3 1 11 3 11 1 3

⎞⎠⎛⎝ xyz

⎞⎠ = 0

⇐⇒

⎧⎨⎩ x + y + z = 0x + y + z = 0x + y + z = 0

⇐⇒ x = −y − z.

61

Page 69: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

On en déduit que

E2 =

⎧⎨⎩⎛⎝ −y − z

yz

⎞⎠ | y, z ∈ K

⎫⎬⎭=

⎧⎨⎩y

⎛⎝ −110

⎞⎠ + z

⎛⎝ −101

⎞⎠ | y, z ∈ K

⎫⎬⎭= Vect

⎛⎝⎛⎝ −110

⎞⎠ ,

⎛⎝ −101

⎞⎠⎞⎠ .

Les deux vecteurs étant non colinéaires, ils forment une base de E2.

Proposition 12

Soit E un espace de dimension n muni d’une base B et u un endomorphisme de E dematrice A ∈ Mn(K) relativement à la base B.

1. Un scalaire l est valeur propre de A si et seulement s’il est valeur propre de u.

2. Un vecteur x ∈ E est vecteur propre de u associé à la valeur propre l si et seulementsi le vecteur X des coordonnées de x dans la base B est un vecteur propre de A associéà la valeur propre l.

PreuveSoit x ∈ E un vecteur propre de u associé à la valeur propre l. On note X les coordonnées de x dans la base B.Comme u(x) = lx, on a AX = lX et comme x �= 0, X �= 0. Donc X est un vecteur propre de A associé à lavaleur propre l.Réciproquement soit X est un vecteur propre de la matrice A associé à la valeur propre l. Soit x ∈ E le vecteurde coordonnées X dans la base B. Comme X �= 0, on a x �= 0, et comme AX = lX, on a u(x) = lx. Le vecteurx est donc un vecteur propre de u associé à la valeur propre l. ❑

➤ RemarqueLa proposition précédente est notamment très souvent utilisée dans le cas où u est l’endomorphisme de Kn

canoniquement associé à A.

Théorème 4

Soit A ∈ Mn(K), un scalaire l est une valeur propre de A si, et seulement si, A − lIn

n’est pas inversible.

PreuveSoit u l’endomorphisme de Kn canoniquement associé à A, on a alors

l est valeur propre de A ⇐⇒ l est valeur propre de u

⇐⇒ (u − l Id) n’est pas bijectif

⇐⇒ (A − lIn) n’est pas inversible.❑

62

Page 70: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Diagonalisation des matrices carrées

➤ RemarqueEn particulier 0 est valeur propre de A si et seulement si A n’est pas inversible.

Corollaire 3

Les valeurs propres d’une matrice triangulaire sont ses coefficients diagonaux.

PreuveSoit A ∈ Mn(K) une matrice triangulaire supérieure, avec

A =

⎛⎜⎜⎜⎜⎜⎝a1,1 a1,2 . . . a1,n

0 a2,2

. . ....

.... . .

. . . an−1,n

0 . . . 0 an,n

⎞⎟⎟⎟⎟⎟⎠ .

On a alors

A − lIn =

⎛⎜⎜⎜⎜⎜⎝a1,1 − l a1,2 . . . a1,n

0 a2,2 − l. . .

......

. . .. . . an−1,n

0 . . . 0 an,n − l

⎞⎟⎟⎟⎟⎟⎠ .

Cette matrice est non inversible si, et seulement si, l’un de ses coefficients diagonaux est nul, c’est-à-dire si,et seulement s’il existe un entier i ∈ �1, n� tel que l = ai,i . Les valeurs propres de A sont donc les sca-laires a1,1, a2,2, . . . , an,n.La démonstration est analogue pour une matrice triangulaire inférieure. ❑

4.2 Matrice diagonalisable

Définition 6

Une matrice A ∈ Mn(K) est dite diagonalisable s’il existe une matrice inversibleP ∈ Mn(K) telle que P−1AP soit une matrice diagonale.

➤ RemarqueAutrement dit, une matrice A ∈ Mn(K) est diagonalisable si elle est semblable à une matrice diagonale.

Proposition 13

Soit u ∈ L(E), B1 une base de E et A = MB1 (u).

1. Soit B2 une base de vecteurs propres de u associés aux valeurs propres l1, . . . , ln. Ennotant P la matrice de passage de B1 à B2, on a P−1AP = Diag(l1, . . . , ln).

2. Soit P une matrice inversible de Mn(K) telle que P−1AP = Diag(l1, . . . , ln). Onnote B2 la base de E telle que P soit la matrice de passage de B1 à B2. Cette base B2

est une base de vecteurs propres de u associés aux valeurs propres l1, . . . , ln.

En particulier u est diagonalisable si, et seulement si, A est diagonalisable.

63

Page 71: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

Preuve1. Soit B2 une telle base. On sait que MB2

(u) = Diag(l1, . . . , ln). Mais on sait aussi que si l’on note P lamatrice de passage de B1 à B2, on a MB2

(u) = P−1AP. D’où le résultat.

2. Soit P une telle matrice et B2 la base de E telle que P soit la matrice de passage de B1 à B2. On sait alors queMB2

(u) = P−1AP. On a donc MB2(u) = Diag(l1, . . . , ln), autrement dit B2 est une base de E formée de

vecteurs propres de u associés aux valeurs propres l1, . . . , ln. ❑

4.3 Les matrices symétriquesNous rappelons ces définitions de première année.

Définition 7

Soit A = (ai,j) ∈ Mn,p(K). On appelle transposée de A et on note tA, la matriceB = (bi,j) ∈ Mp,n(K) définie par bi,j = aj,i pour i ∈ �1, p� et j ∈ �1, n�.

Exemplet ( 2 1 −5

−1 0 6

)=

⎛⎝ 2 −11 0

−5 6

⎞⎠ .

➤ RemarqueSoient A une matrice de Mn,p(K), il est clair que l’on a t ( tA) = A.

Définition 8

On dit qu’une matrice est symétrique si elle est égale à sa transposée.

➤ RemarqueNous pouvons remarquer qu’une matrice symétrique A = (ai,j ) est nécessairement carrée et que par rapport à ladiagonale, les coefficients qui se correspondent sont égaux, c’est-à-dire pour tout i et j, ai,j = aj,i .

Conformément au programme, nous admettons le théorème suivant.

Théorème 5

Toute matrice symétrique réelle de Mn(R) est diagonalisable.

Nous verrons dans les exercices des exemples d’utilisation de ce théorème qui nousgarantit qu’une matrice symétrique réelle est diagonalisable. L’hypothèse matrice réelleest indispensable voici un contre-exemple.Exemple

Soit A =(

1 − 2i 22 1 + 2i

). Déterminer les valeurs propres de la matrice symétrique A de

M2(C) et une base des sous-espaces propres de A ; la matrice A est-elle diagonalisable ?

Nous avons

A − lI2 =(

1 − 2i − l 22 1 + 2i − l

).

64

Page 72: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Diagonalisation des matrices carrées

Nous voulons déterminer les valeurs de l pour les quelles A − lI2 n’est pas inver-sible ; pour cela nous cherchons à l’inverser par la méthode du pivot sans pour autantcalculer effectivement la matrice inverse. Échangeons les lignes L1 et L2 afin d’utiliser2 comme pivot.(

2 1 + 2i − l

1 − 2i − l 2

)L1 ↔ L2

(2 1 + 2i − l

0 P(l)

)L2 ← (1 − 2i − l)L1 − 2L2

avec P(l) = (1 − l − 2i)(1 − l + 2i) − 4= (1 − l)2(

2 1 + 2i − l

0 (1 − l)2

)La matrice A − lI2 n’est pas inversible si et seulement si l = 1, elle n’a donc qu’uneseule valeur propre : 1. Déterminons maintenant une base du sous-espace propreassocié à 1. (

1 − 2i 22 1 + 2i

)(xy

)= 1

(xy

)⇐⇒

{−2ix + 2y = 0

2x + 2iy = 0

⇐⇒(

xy

)=(

1i

).

La matrice A n’a qu’une seule valeur propre à laquelle est associé un espace proprede dimension 1 ; la somme des dimensions des espaces propres est inférieur à 2 ; lamatrice A n’est pas diagonalisable.

4.4 La pratique de la diagonalisation des matrices

Nous avons par la proposition 13 ci-dessus établi le lien entre la réduction des endo-morphismes et celle des matrices carrées ; nous pouvons donc utiliser les théorèmessur la diagonalisation des endomorphismes pour la diagonalisation des matrices enremarquant que toute matrice A de Mn(K) peut être considérée comme la matricede l’endomorphisme de Mn,1(K) qui lui est canoniquement associée. En particulierles théorèmes 2 et 3 (pages 59, 60) nous permettrons de conclure quant à la possibilitéde diagonaliser une matrice.Le théorème 5 lorsqu’il s’applique est très efficace.

En général, la diagonalisation d’une matrice A de Mn(K) débute par la recherchede ses valeurs propres : on utilise la méthode du pivot de Gauss pour rechercherles valeurs du scalaire l pour lesquelles la matrice A − lIn n’est pas inversible (voirproposition 4 ci-dessus).Pour chaque valeur propre découverte, on recherche une base du sous-espace proprequi lui est associé.

65

Page 73: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

La juxtaposition des différentes bases ainsi trouvées forment une famille libre de vec-teurs (voir le corollaire 2 page 57). Si cette famille contient n vecteurs elle est alorsaussi génératrice de Mn,1(K), elle constitue une base de vecteurs propres de la matriceA qui est alors diagonalisable.La matrice de passage P de la base canonique de Mn,1(K) à la nouvelle base a pourvecteurs colonnes les vecteurs propres de A. La matrice diagonale P−1AP a pourtermes diagonaux les valeurs propres associées aux différents vecteurs propres dansl’ordre correspondant à celui des vecteurs colonnes de P.

Exercice 1.

Soit A =

⎛⎝ 5 2 4−6 −1 −6−3 −2 −2

⎞⎠ . Déterminer les valeurs propres de la matrice A et si possible

diagonaliser A, on précisera la matrice de passage et son inverse.

Solution. Nous commençons, comme dans la recherche de l’inverse d’une matrice, par trian-guler A − lI3 où l est un réel quelconque ; dans ce calcul, nous ne cherchons pas à calculerun inverse mais seulement à déterminer pour quelle valeur de l la matrice A − lI3 n’est pasinversible.Nous avons

A − lI3 =

⎛⎝ 5 − l 2 2−6 −1 − l −6−3 −2 −2 − l

⎞⎠ .

Échangeons en première étape les lignes L1 et L3 afin d’utiliser −3 comme coefficient non nul(plutôt que 5−l qui peut être nul) pour annuler les autres coefficients de la première colonne.⎛⎝ −3 −2 −2 − l

−6 −1 − l −65 − l 2 2

⎞⎠ L1 ↔ L3

⎛⎝ −3 −2 −2 − l

0 l − 3 2 − 2l

0 2l − 4 l2 − 3l + 2

⎞⎠ L2 ← 2L1 − L2

L3 ← 3L3 + (5 − l)L1

Attention, si possible, il est recommandé d’éliminer l du coefficient diagonal de la deuxièmecolonne de façon à pouvoir poursuivre le calcul avec un coefficient diagonal non nul.⎛⎝ −3 −2 −2 − l

0 2 l2 + l − 20 2l − 4 l2 − 3l + 2

⎞⎠ L2 ← L3 − 2L2

⎛⎝ −3 −2 −2 − l

0 2 l2 + l − 20 0 f (l)

⎞⎠L3 ← L3 − (l − 2)L2 ,

avec f (l) = (l2 − 3l + 2) − (l − 2)(l2 + l − 2)= −l3 + 2l2 + l − 2= (l − 2)(1 − l)(1 + l)

66

Page 74: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Diagonalisation des matrices carrées

Nous avons factoriser f (l) en notant que 1 et −1 sont des racines évidentes du polynôme f (l).La matrice A − lI3 n’est pas inversible si, et seulement si, f (l) est nul, la matrice A a donc 3valeurs propres qui sont 2, 1 et −1 ; nous sommes en dimension 3, nous en déduisons que Aest diagonalisable (voir théorème 3).

Posons M(l) =

⎛⎝ −3 −2 −2 − l

0 2 l2 + l − 20 0 (l − 2)(1 − l)(1 + l)

⎞⎠ .

Soient l un scalaire et un vecteur X ∈ M3,1(K) avec X =

⎛⎝ xyz

⎞⎠. On a alors

X ∈ El ⇐⇒ (A − lI3)X = 0

et d’après l’étude des systèmes linéaires, puisque M(l) est déduit de A−lI3 à l’aide d’opérationsélémentaires sur les lignes, on sait que ce système équivaut à M(l)X = 0.On en déduit en particulier que

X ∈ E2 ⇐⇒ M(2)X = 0 ⇐⇒

⎛⎝ −3 −2 −40 2 40 0 0

⎞⎠⎛⎝ xyz

⎞⎠ = 0

⇐⇒{

−3x − 2y − 4z = 02y + 4z = 0 ⇐⇒

⎧⎨⎩ x = 0y = −2zz = z

Soit E2 = Vect(0,−2, 1).

De même une équation de E1 est{−3x − 2y − 3z = 0

2y = 0 ⇐⇒

⎧⎨⎩ x = −zy = 0z = z

d’où E1 = Vect(−1, 0, 1).

Enfin une équation de E−1 est

{−3x − 2y − z = 0

2y − 2z = 0 ⇐⇒

⎧⎨⎩ x = −zy = zz = z

d’où E−1 = Vect(−1, 1, 1).La famille B =

((0,−2, 1), (−1, 0, 1), (−1, 1, 1)

)est une famille de trois vecteurs propres

associés aux trois valeurs propres distinctes 2, 1 et −1. C’est donc une famille libre de K3,

espace de dimension 3. On en déduit que B est une base de K3. Soit P la matrice de passage

67

Page 75: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

de la base canonique à la base B, c’est-à-dire

P =

⎛⎝ 0 −1 −1−2 0 1

1 1 1

⎞⎠ .

Nous avons P−1AP = Diag(2, 1,−1).

Le calcul de l’inverse de P nous donne P−1 =

⎛⎝ 1 0 1−3 −1 −2

2 1 2

⎞⎠ .

Exercice 2.

Soit B =

⎛⎝ 4 −3 −14 −3 −2

−1 1 2

⎞⎠ . Déterminer si la matrice B peut être diagonalisée dans R.

Solution. Commençons par chercher les valeurs propres de B en triangulant la matrice B−lI3

(où l ∈ R) ⎛⎝ 4 − l −3 −14 −3 − l −2−1 1 2 − l

⎞⎠⎛⎝ −1 1 2 − l

4 −3 − l −24 − l −3 −1

⎞⎠ L1 ↔ L3

⎛⎝ −1 1 2 − l

0 1 − l 6 − 4l

0 1 − l (4 − l)(2 − l) − 1

⎞⎠ L2 ← L2 + 4L1

L3 ← L3 + (4 − l)L1⎛⎝ −1 1 2 − l

0 1 − l 6 − 4l

0 0 l2 − 2l + 1

⎞⎠L3 ← L3 − L2

Les valeurs propres de B sont les solutions des équations 1 − l = 0 et l2 − 2l + 1 = 0.La seule valeur propre est donc 1.Déterminons une base de E1. Une équation de E1 est{

−x + y + z = 02z = 0 ⇐⇒

{x = yz = 0

On en déduit que E1 = Vect(1, 1, 0). En particulier dim(E1) = 1. La somme des dimen-sions des sous-espaces propres, qui vaut 1, est différente de la dimension de R3, B n’est pasdiagonalisable.

68

Page 76: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications de la réduction

Exercice 3.

La matrice B =(

1 −11 1

)est-elle diagonalisable dans R ? dans C ?

Solution. Commençons par chercher les valeurs propres de B en triangulant la matrice B−lI2(1 − l −1

1 1 − l

)(

1 1 − l

1 − l −1

)L1 ↔ L2

(1 1 − l

0 (1 − l)2 + 1

)L2 ← (1 − l)L1 − L2

La matrice(

1 − l −11 1 − l

)est non inversible si et seulement si (1 − l)2 + 1 = 0, soit

encore (1 − l − i)(1 − l + i) = 0. Et donc B n’a pas de valeur propre réelle, elle n’est pasdiagonalisable dans R. Comme B possède 2 valeurs propres distinctes complexes et que noussommes en dimension 2, la matrice B est bien diagonalisable sur C.

5. Applications de la réduction

5.1 Calcul de la puissance nème d’une matrice

Soit A une matrice de Mn(K). Supposons avoir trouvé une matrice inversible Pde Mn(K) telle que P−1AP = Diag(l1, . . . , ln). Nous avons alors pour tout entiernaturel k

Ak = P

⎛⎜⎜⎜⎝l1 0 . . . 0

0 l2. . .

......

. . . . . . 00 . . . 0 ln

⎞⎟⎟⎟⎠k

P−1 = P

⎛⎜⎜⎜⎝lk

1 0 . . . 0

0 lk2

. . ....

.... . . . . . 0

0 . . . 0 lkn

⎞⎟⎟⎟⎠P−1.

Exercice 4.

Soit A =(

3 −4−2 1

). Déterminer la valeur de An pour n ∈ N.

Solution. Recherchons les valeurs propres de A en triangulant la matrice A − lI2.(3 − l −4−2 1 − l

)(

−2 1 − l

3 − l −4

)L1 ↔ L2

(−2 1 − l

0 l2 − 4l − 5

)L2 ← 2L2 + (3 − l)L1

69

Page 77: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

La matrice(

3 − l −4−2 1 − l

)n’est pas inversible si et seulement si l2 − 4l − 5 = 0. Les

valeurs propres de A sont les solutions de cette équation du deuxième degré dont le discrimi-nant vaut D = 42 + 4 × 5 = 9.D’où les valeurs propres sont l1 = 2 +

√9 = 5 et l2 = 2 −

√9 = −1.

Une équation de E5 est

(A − 5I2)(

xy

)= 0 ⇐⇒

{−2x − 4y = 0−2x − 4y = 0 ⇐⇒ x = −2y

d’où E5 = Vect(−2, 1).

De même une équation de E−1 est

(A + I2)(

xy

)= 0 ⇐⇒

{4x − 4y = 0

−2x + 2y = 0 ⇐⇒ x = y

d’où E−1 = Vect(1, 1).

Nous savons alors qu’en posant P =(

−2 11 1

), on a P−1AP =

(5 00 −1

).

Le calcul nous donne P−1 =13

(−1 1

1 2

).

Nous en déduisons finalement que

An =(

−2 11 1

)(5n 00 (−1)n

)13

(−1 1

1 2

)=

13

(−2 1

1 1

)(−5n 5n

(−1)n 2(−1)n

)=

13

(2 · 5n + (−1)n −2 · 5n + 2(−1)n

−5n + (−1)n 5n + 2(−1)n

).

5.2 Suites récurrentes linéaires croisées

Supposons avoir deux suites (un) et (vn) données par leur premier terme u0, v0 et lesrelations

∀n ∈ N,{

un+1 = aun + bvnvn+1 = cun + dvn

où a, b, c, d sont des scalaires fixés.

En posant A =(

a bc d

)et Xn =

(unvn

)pour n ∈ N, nous constatons que les

deux relations équivalent à la relation matricielle Xn+1 = AXn pour n ∈ N. Nous endéduisons par une récurrence que Xn = AnX0. Il suffit donc de connaître An pourexprimer un et vn en fonction de n, u0 et v0.On peut d’ailleurs étendre ce raisonnement à un nombre quelconque de suites.

70

Page 78: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications de la réduction

Exercice 5.Soient (un) et (vn) deux suites définies par u0 = 0, v0 = 1 et les relations

∀n ∈ N,{

un+1 = −5un + 3vn

vn+1 = −6un + 4vn

Déterminer la valeur de un et vn en fonction de n.

Solution. Posons A =(

−5 3−6 4

)et pour n ∈ N, Xn =

(un

vn

).

Les relations de récurrence vérifiées par les suites (un) et (vn) se traduisent par la relationmatricielle Xn+1 = AXn pour n ∈ N. Par une récurrence nous pouvons montrer que pourn ∈ N, on a Xn = AnX0.

Déterminons la valeur de An. Commençons par déterminer les valeurs propres de A en trian-gulant la matrice A − lI2.(

−5 − l 3−6 4 − l

)(

−6 4 − l

−5 − l 3

)L1 ↔ L2

(−6 4 − l

0 l2 + l − 2

)L2 ← 6L2 − (5 + l)L1

La matrice A − lI2 n’est pas inversible si et seulement si l2 + l − 2 = 0. Ce trinôme a pourracines évidentes 1 et −2, ce sont les valeurs propres de A.

Une équation de E1 est {−6x + 3y = 0−6x + 3y = 0 ⇐⇒ y = 2x

d’où E1 = Vect(1, 2).

De même une équation de E−2 est{−3x + 3y = 0−6x + 6y = 0 ⇐⇒ x = y

d’où E−2 = Vect(1, 1).

Nous en déduisons qu’en posant P =(

1 12 1

), on a

P−1AP =(

1 00 −2

).

71

Page 79: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

Le calcul nous donne P−1 =(

−1 12 −1

). Par suite

An = P(

1 00 −2

)n

P−1

=(

1 12 1

)(1 00 (−2)n

)(−1 1

2 −1

)=

(1 12 1

)(−1 1

2(−2)n −(−2)n

)=

(−1 + 2(−2)n 1 − (−2)n

−2 + 2(−2)n 2 − (−2)n

).

Nous en déduisons que pour n ∈ N, on a

Xn = AnX0

=(

−1 + 2(−2)n 1 − (−2)n

−2 + 2(−2)n 2 − (−2)n

)(01

)=

(1 − (−2)n

2 − (−2)n

).

Autrement dit pour n ∈ N, on a

un = 1 − (−2)n et vn = 2 − (−2)n.

5.3 Suite récurrente linéaire

Supposons que (un) soit une suite récurrente linéaire d’ordre 3, telle que pour toutn ∈ N on ait

un+3 = aun+2 + bun+1 + cun

Posons A =

⎛⎝ 0 1 00 0 1c b a

⎞⎠ et pour n ∈ N, Xn =

⎛⎝ unun+1un+2

⎞⎠.

Nous vérifions que l’on a pour tout n ∈ N, Xn+1 = AXn.Nous en déduisons par une récurrence que Xn = AnX0. En s’intéressant à la premièreligne de cette équation matricielle, nous trouvons une expression de un en fonctionde n, u0, u1 et u2.Là encore, on étend facilement ce raisonnement à une suite récurrente linéaire d’ordrequelconque.

Exercice 6.Soient (un) une suite définie par u0 = 0, u1 = 1, u2 = 2 et la relation

∀n ∈ N, un+3 = un+2 + 4un+1 − 4un

Déterminer la valeur de un en fonction de n.

72

Page 80: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Applications de la réduction

Solution. Posons A =

⎛⎝ 0 1 00 0 1

−4 4 1

⎞⎠ et pour n ∈ N, Xn =

⎛⎝ un

un+1

un+2

⎞⎠.

La relation de récurrence vérifiée par la suite (un) se traduit par la relation matricielleXn+1 = AXn pour n ∈ N. Par une récurrence nous pouvons montrer que pour n ∈ N, on aXn = AnX0.Déterminons la valeur de An. Commençons par déterminer les valeurs propres de A entriangulant la matrice A − lI3.⎛⎝ −l 1 0

0 −l 1−4 4 1 − l

⎞⎠ →

⎛⎝ −4 4 1 − l

0 −l 1−l 1 0

⎞⎠ L1 ↔ L3

⎛⎝ −4 4 1 − l

0 −l 10 4 − 4l l2 − l

⎞⎠L3 ← 4L3 − lL1

⎛⎝ −4 4 1 − l

0 4 l2 − l − 40 4 − 4l l2 − l

⎞⎠ L2 ← L3 − 4L2

⎛⎝ −4 4 1 − l

0 4 l2 − l − 40 0 f (l)

⎞⎠L3 ← L3 + (l − 1)L2 ,

avec f (l) = l2 − l + (l − 1)(l2 − l − 4)= l3 − l2 − 4l + 4= (l − 1)(l − 2)(l + 2)

Nous avons factoriser f (l) au vue des racines évidentes 1, 2,−2.

La matrice A − lI3 n’est pas inversible si et seulement si f (l) = 0, les valeurs propres de Asont donc 1, 2 et −2.Une équation de E1 est ⎧⎨⎩ −x + y = 0

−y + z = 0−4x + 4y = 0

⇐⇒ x = y = z

d’où E1 = Vect(1, 1, 1).

Une équation de E2 est⎧⎨⎩ −2x + y = 0−2y + z = 0

−4x + 4y − z = 0⇐⇒

{y = 2xz = 2y

d’où E2 = Vect(1, 2, 4).

73

Page 81: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

Une équation de E−2 est⎧⎨⎩ 2x + y = 02y + z = 0

−4x + 4y + 3z = 0⇐⇒

{y = −2xz = −2y

d’où E−2 = Vect(1,−2, 4).

Nous en déduisons qu’en posant P =

⎛⎝ 1 1 11 2 −21 4 4

⎞⎠, on a

P−1AP =

⎛⎝ 1 0 00 2 00 0 −2

⎞⎠ .

Le calcul nous donne P−1 =112

⎛⎝ 16 0 −4−6 3 3

2 −3 1

⎞⎠.

Par suite

An = P

⎛⎝ 1 0 00 2 00 0 −2

⎞⎠n

P−1

=

⎛⎝ 1 1 11 2 −21 4 4

⎞⎠⎛⎝ 1 0 00 2n 00 0 (−2)n

⎞⎠ 112

⎛⎝ 16 0 −4−6 3 3

2 −3 1

⎞⎠=

112

⎛⎝ 1 1 11 2 −21 4 4

⎞⎠⎛⎝ 16 0 −4−6 · 2n 3 · 2n 3 · 2n

2 · (−2)n −3 · (−2)n (−2)n

⎞⎠=

112

⎛⎝ 16 − 6(2)n + 2(−2)n 3(2)n − 3(−2)n −4 + 3(2)n + (−2)n

16 − 12(2)n − 4(−2)n 6(2)n + 6(−2)n −4 + 6(2)n − 2(−2)n

16 − 24(2)n + 8(−2)n 12(2)n − 12(−2)n −4 + 12(2)n + 4(−2)n

⎞⎠ .

Nous en déduisons que pour n ∈ N, on a

Xn = AnX0

=112

⎛⎝ 16 − 6(2)n + 2(−2)n 3(2)n − 3(−2)n −4 + 3(2)n + (−2)n

16 − 12(2)n − 4(−2)n 6(2)n + 6(−2)n −4 + 6(2)n − 2(−2)n

16 − 24(2)n + 8(−2)n 12(2)n − 12(−2)n −4 + 12(2)n + 4(−2)n

⎞⎠⎛⎝ 012

⎞⎠=

112

⎛⎝ −8 + 9(2)n − (−2)n

−8 + 18(2)n + 2(−2)n

−8 + 36(2)n − 4(−2)n

⎞⎠ .

Donc nous avons pour n ∈ N, on a un =−8 + 9(2)n − (−2)n

12·

74

Page 82: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. 1. Soit A =(

2 41 −1

). Déterminer les valeurs propres de la matrice A ; est-elle

diagonalisable ? Déterminer une base de vecteurs propres de A.

2. La matrice B =(

1 10 1

)est-elle diagonalisable dans R ? dans C ?

3. La matrice C =(

1 1−4 1

)est-elle diagonalisable dans R ? dans C ?

4. Soit a ∈ R et

A =(

a 11 a

).

a. Calculer les valeurs propres de A et déterminer une base de vecteurs propres de A.

b. Soit n ∈ N, donner la valeur de An.

2. Pour chacune des matrices suivantes, déterminer leurs valeurs propres et une basedes sous-espaces propres.

1.

(1 0 10 1 01 1 3

)2.

( −1 2 −2−6 7 −5−6 6 −4

)3.

(1 −2 2

−2 1 2−2 −2 5

)

3. Déterminer les éléments propres de la matrice

A =

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

1 1 . . . . . . . . . 1 11 0 . . . . . . . . . 0 1...

......

......

... (0)...

......

......

...1 0 . . . . . . . . . 0 11 1 . . . . . . . . . 1 1

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠∈ Mn(R)

4. Soit n ∈ N∗ et a ∈ R, déterminer les éléments propres de la matrice

A =

⎛⎜⎜⎜⎝a 1 . . . 1

1. . .

. . ....

.... . .

. . . 11 . . . 1 a

⎞⎟⎟⎟⎠ ∈ Mn(R)

5. Couple de suites récurrentes linéaires

Soit A =(

7 2−4 1

).

1. Déterminer les valeurs propres de A et une base de vecteurs propres de A.

2. En déduire une expression de An.

75

Page 83: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

3. Soient (un), (vn) deux suites définies par u0 = 1, v0 = 1 et{un+1 = 7un + 2vnvn+1 = −4un + vn

On pose pour n ∈ N, Xn =(

unvn

).

Exprimer Xn+1 en fonction de Xn.

4. En déduire une expression de Xn en fonction de A et de X0.

5. Exprimer le terme général de un et vn en fonction de n.

6. Soit

A =

(7 3 −9

−2 −1 22 −1 −4

).

1. Soit Q(X) = X3 − 2X2 − 5X + 6.a. Résoudre dans K l’équation Q(x) = 0.

b. Calculer la matrice A3 − 2A2 − 5A + 6I avec I la matrice unité deM3(K).

c. Déduire de ces calculs des réels dont font partie les éventuelles valeurs propres de A.On dit dans cette situation que Q est un polynôme annulateur de A.

2. Déterminer si les réels mis en évidence à la question précédente sont effectivement desvaleurs propres de A en recherchant des vecteurs propres associés à ces valeurs. (On prendra,si c’est le cas, des vecteurs propres tels que leurs troisièmes coordonnées soient égales à 1).

3. La matrice A est-elle diagonalisable ? Si oui, donner une matrice P et son inverse P−1 tellesque P−1AP soit diagonale.

7. Soit E un espace vectoriel sur R, rapporté à une base B = (e1, e2, e3).Pour tout réel a, on considère l’endomorphisme fa de E défini par

fa(e2) = 0 et fa(e1) = fa(e3) = a e1 + e2 − a e3.

1. a. Déterminer une base de �mfa.

b. Montrer qu’une base de Kerfa est (e2, e1 − e3).

2. Écrire la matrice A de fa dans B et calculer A2. En déduire sans calcul fa ◦ fa3. On pose e′1 = fa(e1), e′2 = e1 − e3, e′3 = e3.

a. Montrer que (e′1, e′2, e′3) est une base de E.

b. Donner la matrice A′ de fa dans cette base.

c. En déduire que 0 est la seule valeur propre de A. A est-elle inversible ? A est-ellediagonalisable ?

4. Pour tout réel x non nul, on pose B(x) = A−xI , I désignant la matrice identité de M3(R).a. Montrer sans calcul que B(x) est inversible.

b. Calculer (A − xI)(A + xI) puis écrire (B(x))−1 en fonction de x, I et A.

c. Pour tout n de N, déterminer (B(x))n en fonction de x, n, I et A.

76

Page 84: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

8. Soient a, b, c trois réels tous non nuls, et M la matrice carrée d’ordre 3 suivante

M =

⎛⎜⎜⎜⎜⎜⎝1

ab

ac

ba

1bc

ca

cb

1

⎞⎟⎟⎟⎟⎟⎠1. a. Montrer M2 = 3M

b. En déduire que l’ensemble des valeurs propres de M est inclus dans {0, 3}.

2. a. Déterminer les valeurs propres de M et, pour chaque valeur propre, une base du sous-espaces propre associé.

b. La matrice M est-elle diagonalisable ?On note

P =

(a a ab −b 0c 0 −c

)D =

(3 0 00 0 00 0 0

)Q =

⎛⎜⎜⎜⎜⎜⎜⎝

1a

1b

1c

1a

−2b

1c

1a

1b

−2c

⎞⎟⎟⎟⎟⎟⎟⎠3. a. Calculer PQ. Montrer que P est inversible. Quel est son inverse ?

b. Vérifier : M = PDP−1

4. Déterminer l’ensemble des matrices Y de M3 (R) telles que DY − YD = 3Y

5. Montrer que l’ensemble des matrices X de M3 (R) telles que MX − XM = 3X est unespace vectoriel de dimension 2 sur R.

9. On considère une matrice carrée d’ordre 3

J =

(0 2 10 −1 20 1 0

)

et l’endomorphisme f de R3 de matrice J dans la base canonique de R

3.On considère, pour tout nombre réel a, la matrice carrée réelle d’ordre 3

Ma =

(a 2 10 a − 1 20 1 a

).

1. a. Déterminer les valeurs propres et les sous-espaces propres de f .

b. Montrer que J est diagonalisable. Déterminer une matrice réelle diagonale D d’ordretrois et une matrice réelle inversible P d’ordre trois telles que J = PDP−1

c. En déduire que, pour tout nombre réel a, il existe une matrice réelle diagonale Dad’ordre trois, que l’on calculera, telle que Ma = PDaP−1.

d. Quel est l’ensemble des nombres réels a tels que Ma soit inversible ?

77

Page 85: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

2. On se propose, dans cette question, de déterminer l’ensemble des nombres réels a tels qu’ilexiste une matrice carrée réelle d’ordre trois vérifiant X2 = Ma.a. Soient a un nombre réel et X une matrice carrée réelle d’ordre trois tels que X2 = Ma

i. Montrer que X commute avec Ma, puis que X commute avec J.

ii. On note h l’endomorphisme de R3 de matrice X dans la base canonique de R3.Déduire de la question précédente que tout vecteur propre de f est vecteur proprede h.

iii. Établir qu’il existe une matrice réelle diagonale D d’ordre trois telle queX = PDP−1 et montrer : D2 = Da.

iv. En déduire : a � 2.

b. Réciproquement, montrer que, pour tout nombre réel a supérieur ou égal à 2, il existeune matrice carrée réelle X d’ordre trois telle que X2 = Ma.

c. Conclure.

10. Polynôme annulateurSoit E un espace vectoriel sur K de dimension finie.

1. Soient u1, u2 deux endomorphismes de E.Montrer que dim(Ker(u1 ◦ u2)) � dim(Ker(u1)) + dim(Ker(u2)).

2. Généraliser le résultat précédent en prouvant que quels que soient les endomorphismes u1,u2, . . . , un de E, on a

dim(Ker(u1 ◦ u2 ◦ · · · ◦ un)) �n∑

k=1

dim(Ker(uk)).

3. On suppose dans cette question que K = C et on considère u ∈ L(E) tel que u3− IdE = 0.Montrer que u est diagonalisable.

4. Plus généralement, soit u ∈ L(E) tel qu’il existe un polynôme à racines simples

P =q∑

i=0

aiXi vérifiantq∑

i=0

aiui = 0. (On dit dans cette situation que P est un polynôme

annulateur de u, cette définition est hors programme.)Montrer que u est diagonalisable.

5. Réciproquement, soit u un endomorphisme de E diagonalisable. Montrer que u admet unpolynôme annulateur à racines simples.

11. CodiagonalisationSoient u, v deux endomorphismes diagonalisables d’un R-espace vectoriel E.

1. On suppose que uv = vu.a. Montrer que les sous-espaces propres de u sont stables par v.

b. En déduire qu’il existe une base B de E dans laquelle la matrice de u et la matrice de vsont diagonales.

2. On suppose maintenant qu’il existe une base B de E dans laquelle la matrice de u et lamatrice de v sont diagonales.Montrer que uv = vu.

78

Page 86: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

12. Soit u un endomorphisme d’un espace vectoriel réel E de dimension n. On supposeque u admet n valeurs propres.Montrer que pour tout v ∈ L(E), uv = vu si et seulement si les vecteurs propres de u sont desvecteurs propres de v.

13. Dans ce problème, n désigne un entier naturel non nul et E désigne l’espacevectoriel des polynômes à coefficients réels, de degré inférieur ou égal à 2n.

Si a0, a1, . . . , a2n sont 2n + 1 réels et Q est le polynôme : Q(x) =2n∑

k=0

akXk,

on définit le polynôme s(Q) par : s(Q)(X) =2n∑

k=0

a2n−kXk.

Autrement dit, s(Q) est le polynôme obtenu à partir de Q en « inversant l’ordre des coefficients ».Par exemple, si n est égal à 2 et si Q(x) = 4X4 + 7X3 + 2X2 + 1,on obtient s(Q)(X) = X4 + 2X2 + 7X + 4.

1. Linéarité de sMontrer que l’application s : Q → s(Q) est une application linéaire de E dans lui-même.

2. Diagonalisation dans un cas particulier

a. On considère la matrice carrée d’ordre 3 : M =

(0 0 10 1 01 0 0

).

Justifier sans calcul que la matrice M est diagonalisable. Déterminer les valeurs propresde M et, pour chacune d’entre elles, donner une base du sous-espace propre associé.

b. Vérifier que, dans le cas particulier n = 1, M est la matrice de l’application linéaire sdans la base (1, X, X2). Donner alors une base de vecteurs propres pour s.

3. Étude du cas généralOn définit la famille de polynômes (A0, ...., A2n) par⎧⎨⎩ Ak(X) = X2n−k + Xk si 0 � k � n − 1

An(X) = Xn

Ak(x) = Xk − X2n−k si n + 1 � k � 2n

a. Déterminer l’endomorphisme s ◦ s.

b. En déduire que les valeurs propres de s appartiennent à {1,−1}.

c. Déterminer s(Ak) pour tout entier k vérifiant 0 � k � 2n.

d. Montrer que la famille (A0, ...., A2n) est libre.

e. En déduire que l’endomorphisme s est diagonalisable, préciser ses valeurs propres et ladimension de chacun de ses sous-espaces propres.

14. Soit E l’espace vectoriel des fonctions continues sur R, à valeurs réelles. Soit a > 0un réel donné. A tout f ∈ E on associe la fonction Ta(f ) définie pour tout x réel par

Ta(f )(x) =12a

∫ x+a

x−af (t)dt

1. Montrer que pour tout f ∈ E, Ta(f ) est bien définie et est de classe C1 sur R.

79

Page 87: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction des endomorphismes et des matrices

2. Montrer que Ta(f ) est constante si et seulement si f est périodique de période T = 2a.

3. Montrer que l’application Ta est un endomorphisme de E. Déterminer son noyau. Ta est-ilsurjectif ?

4. Soit n � 2 un entier naturel et Rn[X] l’espace vectoriel des fonctions polynômes de degréinférieur ou égal à n. Montrer que la restriction de Ta à Rn[X] est un endomorphisme deRn[X].On notera encore Ta cette restriction.

5. a. Montrer que la matrice associée à Ta dans la base canonique de Rn[X] est triangulairesupérieure. En déduire les valeurs propres de Ta. Cet endomorphisme est-il diagonali-sable ?

b. Soit f ∈ Rn[X]. Montrer que si le degré de f est égal à 2, f n’est pas vecteur propre deTa.

c. Montrer que si f est vecteur propre de Ta, sa dérivée f ′ l’est également. En déduire lessous-espaces propres de Ta.

15. Soit f l’endomorphisme de Rn dont la matrice dans la base canonique est

A =

⎛⎜⎝ 1 −12 2

1 1 1

4 8 3

⎞⎟⎠ .

1. Déterminer les valeurs propres de f .

2. Montrer que Ker(f − 3 Id)2 et Ker(f + Id) sont supplémentaires.

3. Déterminer une base B′ de R3 dans laquelle la matrice de f est

B =

( −1 0 00 3 10 0 3

).

4. Déterminer Bn pour n ∈ N.

5. En déduire la valeur de An.

16. Commutant d’un endomorphisme diagonalisableSoit u un endomorphisme diagonalisable de E, espace vectoriel sur R.On pose

C(u) ={

v ∈ L(E)/

uv = vu}

Soit v un endomorphisme de E.

1. Montrer que C(u) est un sous-espace vectoriel de L(E).

2. Montrer que si uv = vu, alors v laisse stable les sous-espaces propres de u.

3. Réciproquement, montrer que si v laisse stable les sous-espaces propres de u, alors u et vcommutent.

4. En déduire la dimension de C(u) en fonction des dimensions des sous-espaces propres de u.

80

Page 88: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

17. On note M3(R) l’espace vectoriel réel des matrices carrées d’ordre 3 à coefficientsréels. On considère la matrice A définie par

A =

(0 −1 −11 0 −11 1 0

)

1. Déterminer la matrice B = A2 + 2I . La matrice B est-elle diagonalisable ?

2. Montrer que B2 = B + 2I .

3. Déterminer les valeurs propres de B. En déduire les sous-espaces propres associés.

4. Vérifier que si l est une valeur propre de A, alors l2 + 2 est une valeur propre de B. Endéduire que A n’est pas diagonalisable dans M3(R).

5. Montrer que B est inversible et exprimer B−1 en fonction des matrices B et I .

6. On s’intéresse maintenant aux puissances de B.a. On pose, pour tout n � 2, Xn = (X2 − X − 2)Qn(X) + Rn(X) où Qn et Rn sont deux

polynômes tels que deg(Rn) < 2.On note Rn(X) = anX + bn. Déterminer le couple (an, bn).

b. En déduire l’expression de Bn en fonction de I , B et n, pour n � 0.

c. Montrer que l’expression de Bn en fonction de I , de B et de n, qui a été obtenue pourn � 0, est encore valable pour les entiers négatifs.

18. 1. Soit n � 2 un entier naturel et A une matrice carrée d’ordre n sur C telle que,pour tout i ∈ �1, . . . , n�

|ai,i| >∑j �=i

|ai,j|

Montrer que la matrice A est inversible (on pourra raisonner par l’absurde et considérerune colonne X non nulle telle que AX = 0).

2. Soit A une matrice carrée d’ordre n quelconque. Soit l une valeur propre de A. Montrerque

l ∈n⋃

i=1

D(ai,i,∑j �=i

|ai,j|)

où pour a ∈ C, R > 0, D(a, R) = {z ∈ C / |z − a| � R}.

3. Soit n � 2 et A la matrice

A =

⎛⎜⎜⎜⎜⎜⎜⎝

0 1 0 . . . 0

1 0 1. . .

...

0. . .

. . .. . . 0

.... . . 1 0 1

0 . . . 0 1 0

⎞⎟⎟⎟⎟⎟⎟⎠a. Montrer que si l est une valeur propre réelle de A, alors |l| � 2.

On pose alors l = 2 cos(u), u ∈ [0, p].

b. Déterminer les valeurs propres et les vecteurs propres de A.

81

Page 89: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

4Séries numériques

Tout au long de ce chapitre, N désigne l’ensemble des entiers naturels. Le corps desnombres réels est noté R et celui des nombres complexes est noté C. Par ailleurs, K

désignera soit R, soit C. Enfin, on dira d’une suite à valeurs dans K qu’elle est unesuite numérique.

1. Généralités1.1 Définitions

Définition 1

Soit (an) une suite à valeurs dans K. La série (numérique) de terme général an, notée∑an, est la suite (Sn), où

∀n ∈ N Sn =n∑

k=0

ak.

Dans ce contexte, pour tout entier naturel n, on dit que Sn est la ne somme partielle (oula somme partielle d’indice n, ou encore d’ordre n) de la série

∑an.

➤ Remarques• Ainsi, une série n’est autre qu’une suite dont le terme général est la somme des premiers termes d’une autre

suite.

• Toute suite numérique peut être interprétée comme une série. En effet, si (an) est une suite numérique, ennotant pour tout entier naturel n

bn =

{an − an−1, si n > 0 ;a0, si n = 0,

on a

∀n ∈ N an = a0 +n∑

k=1

(ak − ak−1

)=

n∑k=0

bk.

En d’autres termes, la suite (an) est la série de terme général bn.

• On peut définir des séries à valeurs dans un ensemble E, dès lors que celui-ci est muni d’une « addition ». Onpeut en particulier, lorsque (an) est une suite à valeurs dans un K-espace vectoriel, introduire la série

∑an.

• Il arrive qu’une suite (an) ne soit définie qu’à partir d’un rang n0. La série de terme général an est alors⎛⎝ n∑k=n0

ak

⎞⎠n�n0

.

Page 90: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Généralités

Définition 2

Soit (an) une suite numérique. On dit que la série∑

an est convergente (ou qu’elleconverge) lorsque la suite (Sn) des sommes partielles est convergente ; on dira qu’elle estdivergente (ou qu’elle diverge) sinon.Lorsque la série de terme général an est convergente, on appelle somme de la série

∑an

la limite des sommes partielles. On note+∞∑k=0

ak la somme, c’est-à-dire

+∞∑k=0

ak = limn→+∞

n∑k=0

ak.

Étudier la nature d’une série c’est déterminer si elle converge ou non.

Exemples

1. La série∑ 1

2n+1est convergente. En effet, pour tout entier naturel n

Sn =n∑

k=0

12k+1

= 1 − 12n+1

·

La suite géométrique(

12n+1

)étant convergente, de limite nulle, la suite (Sn) est conver-

gente, et+∞∑k=0

12k+1

= 1.

2. La série∑

1 est divergente. En effet, pour tout entier naturel n, Sn = n + 1.

➤ Remarques• Il est important de remarquer que la notation

∑an désigne une suite (celle des sommes partielles) et que la

notation+∞∑k=0

ak désigne une limite, la somme de la série.

• Puisque+∞∑k=0

ak désigne une limite, il est impératif de justifier la convergence de la série pour pouvoir utiliser et

manipuler cette notation.

Proposition 1

Soit (an) et (bn) deux suites numériques qui différent d’un nombre fini de termes, i.e. tellesque an = bn sauf pour un nombre fini de valeurs.Alors les séries

∑an et

∑bn sont de même nature, c’est-à-dire que l’une est convergente

si, et seulement si, l’autre l’est.En revanche, dans le cas où l’une est convergente, leur somme sont a priori différentes.

PreuveImmédiate. ❑

83

Page 91: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Définition 3

Soit∑

an une série convergente. Pour tout entier naturel n, le reste d’ordre n est

Rn =+∞∑

k=n+1

ak.

➤ RemarqueIl est clair que le reste d’ordre n d’une série convergente est bien défini.

Proposition 2

Soit∑

an une série convergente de somme S. On note, pour tout entier naturel n, Sn etRn respectivement la somme partielle et le reste d’ordre n. Alors

• pour tout entier naturel n, S = Sn + Rn ;

• de plus limn→+∞

Rn = 0.

PreuveImmédiate. ❑

1.2 Premières propriétés

Le résultat suivant, bien que très simple, donne une très importante conditionnécessaire de convergence.

Théorème 1

Soit (an) une suite numérique. Si la série∑

an est convergente, alors limn→+∞

an = 0.

Attention ! la réciproque est fausse.

PreuvePuisque la suite des sommes partielles (Sn) est convergente, de limite S,

limn→+∞

Sn − Sn−1 = S − S = 0 = limn→+∞

an.❑

➤ RemarqueLorsque la suite (an) ne tend pas vers zéro, on dit que la série

∑an est grossièrement divergente.

Il est bon de connaître l’exemple suivant, bien qu’il soit hors programme. Il montreen particulier que la réciproque du théorème précédent est fausse.

ExempleSérie harmonique

La série∑ 1

nest divergente.

84

Page 92: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Généralités

Première démonstration

On raisonne par l’absurde. Notons pour tout entier naturel n non nul, Sn =n∑

k=1

1k· Pour tout

n ∈ N∗, on a

S2n − Sn =2n∑

k=n+1

1k

�2n∑

k=n+1

12n

=12·

Si la série harmonique converge, de somme S, on aurait, par passage à la limite dans lesinégalités,

limn→+∞

S2n − Sn = S − S = 0 � 12

,

ce qui est absurde.

Seconde démonstrationOn sait que pour tout réel x > −1, ln (1 + x) � x. Ainsi, pour tout entier naturel non nul

ln (n + 1) − ln n = ln

(1 +

1n

)� 1

Il s’ensuit que pour tout entier naturel non nul n,

ln (n + 1) =n∑

k=1

(ln (k + 1) − ln k

)�

n∑k=1

1k·

Ainsi, limn→+∞

n∑k=1

1k

= +∞ et la série∑ 1

nest divergente.

Proposition 3

L’ensemble E des suites (an) à valeurs dans K telles que la série∑

ak soit convergente estun K-espace vectoriel pour les lois usuelles.De plus, pour toutes les suites (an) et (bn) éléments de E et pour tout scalaire l

+∞∑n=0

(an + bn) =+∞∑n=0

an ++∞∑n=0

bn, (1)

+∞∑n=0

(lan) = l

+∞∑n=0

an ; (2)

i.e. l’application (an) →+∞∑k=0

ak, définie sur E, est linéaire.

PreuveMontrons que E est sous-espace vectoriel de KN. Il est clair que la série de terme général nul est convergenteet donc la suite nulle est un élément de E. Soit (an) et (bn) deux éléments de E et l ∈ K. Alors pour tout entiernaturel n

(i)n∑

k=0

(ak + lbk) =

n∑k=0

ak + l

n∑k=0

bk.

85

Page 93: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Par linéarité de la convergence, le terme de droite dans l’égalité précédente ayant une limite, la suite(n∑

k=0

(ak + lbk)

)est convergente ; ainsi l’ensemble E est stable par combinaisons linéaires. Les relations (1) et

(2) sont obtenues par passage à la limite dans (i). ❑

➤ RemarqueAttention ! L’égalité

+∞∑n=0

(an + bn) =+∞∑n=0

an ++∞∑n=0

bn

n’est licite que lorsqu’on sait qu’au moins deux des trois séries sont convergentes. On ne peut pas « séparer » des

sommes de séries sans précaution : l’écriture 0 =+∞∑n=0

(1 − 1) =+∞∑n=0

1 −+∞∑n=0

1 est évidemment une ineptie.

Proposition 4

Soit (an) une suite positive.

• Si la série∑

an est convergente, alors

+∞∑k=0

ak � 0.

• Si de plus la suite (ak) n’est pas identiquement nulle, alors

+∞∑k=0

ak > 0.

PreuveImmédiate. ❑

Exercice 1. Série harmonique alternée

• Montrer que pour tout entier naturel non nul n

ln 2 =n∑

k=1

(−1)k−1

k+ (−1)n

∫ 1

0

tn

1 + tdt.

• En déduire que+∞∑k=1

(−1)k+1

k= ln 2.

Solution.

• Pour tout entier naturel non nul n et pour tout t ∈ [0, 1], la formule exprimant la sommedes n − 1 premiers termes d’une suite géométrique donne

n∑k=1

(−t)k−1 =1 − (−t)n

1 + t(remarquer que −t �= 1).

86

Page 94: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Généralités

En intégrant, on obtient

n∑k=1

(−1)k−1

k=

n∑k=1

∫ 1

0(−1)k−1tk−1 dt =

∫ 1

0

1 − (−t)n

1 + tdt = ln 2 − (−1)n

∫ 1

0

tn

1 + tdt.

La relation demandée en découle.

• Il suffit de démontrer que limn→+∞

∫ 1

0

tn

1 + tdt = 0. Or, pour tout t ∈ [0, 1], 0 � 1

1 + t� 1

et donc par monotonie de l’intégrale

0 �∫ 1

0

tn

1 + tdt �

∫ 1

0tndt =

1n + 1

·

On conclut alors facilement.

L’exercice suivant généralise partiellement le résultat de l’exercice précédent.

Exercice 2. Séries alternéesSoit (an) une suite réelle, décroissante et de limite nulle. On note, pour tout entier naturel n,

Sn =n∑

k=0

(−1)kak.

1. Montrer que les suites (S2n) et (S2n+1) sont adjacentes.

2. Montrer que la série∑

(−1)kak est convergente. On note S la somme de cette série.

3. Montrer que pour tout entier naturel∣∣∣∣∣n∑

k=0

(−1)kak − S

∣∣∣∣∣ � an+1.

Solution.

1. Soit n un entier naturel. Alors

S2n+2 − S2n = a2n+2 − a2n+1 � 0 ;

S2n+3 − S2n+1 = a2n+2 − a2n+3 � 0.

Il s’ensuit que la suite (S2n) est décroissante et que la suite (S2n+1) est croissante. Puisque lasuite (an) tend vers zéro,

limn→+∞

S2n − S2n+1 = limn→+∞

a2n+1 = 0.

Le résultat en résulte.

2. Puisque les sous-suites (S2n) et (S2n+1) sont convergentes et qu’elles ont même limite, lasuite (Sn) est convergente, i.e. la série

∑(−1)kak est convergente.

3. De ce qui précède et du théorème des suites adjacentes on obtient que pour tous les entiersnaturels p et q

S2p+1 � S � S2q.

87

Page 95: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

En particulier, pour tout entier naturel n

−a2n+1 � S − S2n � 0

(en posant p = q = n ) et0 � S − S2n+1 � a2n+2

(en posant p = n et q = n + 1). Le résultat s’en déduit.

1.3 Des séries de référence

Séries géométriques

Définition 4

Une série géométrique est une série∑

an, où (an) est une suite géométrique.

Théorème 2 (Séries géométriques)

Soit q un nombre complexe.La série

∑qn est convergente si, et seulement si, |q| < 1.

Lorsque |q| < 1,+∞∑k=0

qk =1

1 − q·

PreuveOn sait que la suite géométrique (qn) converge vers zéro si, et seulement si, |q| < 1.Ainsi, d’après le théorème 1 page 84, une condition nécessaire de convergence de la série

∑qn est que

|qn| < 1.Si |qn| < 1, du fait que pour tout entier naturel n,

n∑k=0

qk =1 − qn+1

1 − q,

il vient que

limn→+∞

n∑k=0

qk =1

1 − q,

ce qui établit le résultat recherché. ❑

Séries télescopiques

Définition 5

Une série télescopique est une série de la forme∑

(an+1 − an), où (an) est une suitecomplexe.

88

Page 96: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Généralités

Théorème 3 (Séries télescopiques)

Soit (an) une suite complexe.La série télescopique

∑(an+1 − an) est convergente si, et seulement si, la suite (an) est

convergente.

PreuveIl suffit de remarquer que pour tout entier naturel n,

n∑k=0

(ak+1 − ak) = an+1 − a0. ❑

1.4 Un exemple : développement décimal d’un réel positif

Le lecteur manipule — plus ou moins consciemment — les séries depuis longtemps.La représentation d’un réel par une écriture décimale signifie que ce réel est lasomme d’une série d’un certain type. Précisons cela.

Soit x un réel positif. On rappelle que pour tout entier naturel n, xn = 10−n�10nx�est l’approximation décimale de x à 10−n près par défaut. On a vu en première annéeque lim

n→+∞xn = x. Il s’ensuit que

x = �x� ++∞∑k=1

(�10kx�

10k − �10k−1x�10k−1

)= �x� +

+∞∑k=1

ak

10k ,

où, pour tout entier naturel non nul k, ak = �10kx� − 10�10k−1x�. Par définition dela partie entière, on a pour tout entier naturel non nul k

�10k−1x� � 10k−1x < �10k−1x� + 1,

soit10�10k−1x� � 10kx < 10�10k−1x� + 10,

et donc,10�10k−1x� � �10kx� � 10�10k−1x� + 9.

Il s’ensuit que ak est un élément de �0, 9�.Supposons que la suite (ak)k�1 soit constante, égale à 9, à partir d’un certain rang. Onintroduit alors un indice k tel que ai = 9 pour tout i supérieur ou égal à k. D’aprèsl’expression de la somme d’une série géométrique

x = �x� +k−1∑i=1

ai

10i + 9+∞∑i=k

110i = �x� +

k−1∑i=1

ai

10i +1

10k−1 ·

Mais alorsak =

⌊10kx

⌋− 10

⌊10k−1x

⌋= 0,

contredisant la définition de l’indice k.

89

Page 97: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

En résumé

Proposition 5

Pour tout réel positif x, il existe une unique suite (an) vérifiant

(1) a0 est un entier naturel ;

(2) pour tout entier n � 1, an ∈ �0, 9� ;

(3) x =+∞∑k=0

ak

10k;

(4) la suite (an) n’est pas constante égale à 9 à partir d’un certain rang.

PreuveSeule l’unicité est à démontrer. Soit donc un réel positif x et une suite (bn) vérifiant les quatre propriétés. Alorspour tout entier naturel n,

10nx =

(n∑

k=0

bk10n−k

)+

+∞∑k=1

bk+n

10k·

Puisque la suite (bk+n)k�1 n’est pas constante égale à 9, d’après la proposition 4 page 86, on a

+∞∑k=1

bk+n

10k<

+∞∑k=1

9

10k= 1,

et donc

�10nx� =n∑

k=0

bk10n−k.

Il s’ensuit que, pour tout entier naturel non nul n

an = �10nx� − 10�10n−1x� =n∑

k=0

bk10n−k −n−1∑k=0

bk10n−k = bn,

et on vérifie de même que a0 = b0, ce qui garantit l’unicité. ❑

Avec les notations de la proposition précédente, toute suite (an) vérifiant les proprié-tés de (1) à (3) est un développement décimal de x et l’unique suite (an) véri-fiant les propriétés de (1) à (4) est le développement décimal propre de x. Onnote x = a0, a1a2 . . . . Certains réels ont deux développements décimaux. À titre

d’exemple, 1 =+∞∑k=1

910k , c’est-à-dire 1, 000 . . . = 0, 999 . . . . Un développement

décimal constant égal à 9 à partir d’un certain rang est dit être un développementimpropre.

90

Page 98: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries à terme général positif

2. Séries à terme général positif

2.1 Le théorème de comparaison

On dispose pour les séries à terme général positif d’un certain nombre de résultatsà la fois extrêmement importants et faciles d’utilisation. Il est clair qu’en passant àl’opposé, on peut utiliser, par linéarité, les résultats qui suivent pour étudier les sériesà terme général négatif.

Remarquons que si la suite réelle (an) est positive à partir d’un certain rang, alors lasuite (Sn) des sommes partielles est croissante à partir d’un certain rang ; on peut doncappliquer le théorème des suites monotones à la suite (Sn), qui peut ici s’énoncer dela manière suivante.

Proposition 6

Soit (an) une suite réelle, positive à partir d’un certain rang. La série∑

an est convergente si,

et seulement si, la suite

(n∑

k=0

ak

)est majorée.

ExempleSoit (an) une suite vérifiant les propriétés (1) , (2) et (4) de la proposition 5 page 90. Alors lasuite (an) est effectivement le développement décimal d’un réel positif. Pour le voir il suffit demontrer que la série

∑ ak

10kest convergente. Or pour tout entier naturel non nul n,

Sn =n∑

k=0

ak

10k� a0 +

n∑k=1

910k

= a0 + 1 − 110n

� a0 + 1,

et donc d’après la proposition précédente, la série∑ ak

10kest convergente.

Sans doute, le principal résultat de ce chapitre est le théorème suivant (et ses corol-laires).

Théorème 4 (Théorème de comparaison)

Soit (an) et (bn) deux suites réelles, positives à partir d’un certain rang.On suppose qu’il existe un entier n0 tel que pour tout entier n supérieur à n0

an � bn.Alors {

si la série∑

bn est convergente, alors la série∑

an est convergente ;

si la série∑

an est divergente, alors la série∑

bn est divergente.

91

Page 99: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

PreuveIl suffit de démontrer la première assertion, la seconde n’étant autre que la contraposée de la première.Supposons donc que la série

∑bn est convergente. Puisque les premiers termes n’interviennent pas dans la

nature d’une série, on peut supposer sans perte de généralité que an � bn, pour tout entier n.

Notons alors, pour tout entier naturel n, Sn =n∑

k=0

ak et S′n =n∑

k=0

bk. Il est immédiat que Sn � S′n. La suite (S′n)

étant convergente, elle est majorée et donc la suite (Sn) est majorée ; d’après la proposition précédente, la série∑an est convergente. ❑

➤ RemarqueLe lecteur est prié d’énoncer un résultat analogue pour les suites négatives.

Il est alors clair qu’il est plus qu’utile de connaître la nature de quelques séries, pourpouvoir utiliser ce dernier théorème. Les séries de références — dont la nature et leursomme éventuelle sont à connaître par cœur — sont

� les séries géométriques (cf. page 88) ;

� les séries « dérivées » des séries géométriques (cf. infra page 106) ;

� les séries télescopiques (cf. page 88) ;

� les séries exponentielles (cf. infra page 103).

Corollaire 1

Soit (an) et (bn) deux suites réelles, positives à partir d’un certain rang.On suppose que an = o (bn). Alors{

si la série∑

bn est convergente, alors la série∑

an est convergente ;

si la série∑

an est divergente, alors la série∑

bn est divergente.

PreuveRappelons que pour tout ´ strictement positif, il existe un rang n0 tel que pour tout entier n supérieur à n0 onait an � ´bn. En choisissant ´ = 1, on conclut immédiatement en appliquant le théorème de comparaison. ❑

Règle des équivalents

Soit (an) et (bn) deux suites réelles, telles que an soit positifs à partir d’un certain rang, et que

an ∼ bn.

Alors les séries∑

an et∑

bn sont de même nature.

PreuveIl s’agit de montrer que la série

∑an converge si, et seulement si, la série

∑bn converge. Remarquons d’abord

que les hypothèses an ∼ bn et la suite (an) est positive à partir d’un certain rang impliquent que la suite (bn) estégalement positive à partir d’un certain rang.

La série∑

an convergePar définition, |an − bn| = o (an) et donc d’après le corollaire précédent, la série

∑|bn − an| est convergente.

92

Page 100: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries à terme général positif

Par ailleurs, pour tout entier naturel n

0 � bn = (bn − an) + an � |bn − an| + an.

Par linéarité, la série∑(

|bn − an| + an)

est convergente et d’après le théorème de comparaison, la série∑

bn

est convergente.

La série∑

bn convergeEn échangeant le rôle des suites (an) et (bn) dans la démonstration ci-dessus, on obtient que la série

∑an est

convergente. ❑

L’exemple suivant, bien que hors-programme, est à connaître.Exemple

La série∑ 1

n2est convergente.

En effet la série télescopique∑(

1n− 1

n + 1

)=

∑ 1n (n + 1)

est évidemment convergente.

Puisque1

n(n + 1)∼ 1

n2et que les deux séries sont à terme général positif, la série

∑ 1n2

est

convergente. Nous verrons en exercice (exercice 13. page 117) que+∞∑k=1

1k2

=p2

Nous l’avons déjà signalé, le théorème de comparaison est extrêmement pratique ;voici d’autres exemples d’utilisation de celui-ci.

Exemples

1. La série∑

sin(

12n

)est convergente.

En effet limn→+∞

12n

= 0 et donc sin(

12n

)∼ 1

2n· Puisque les séries sont à terme général

positif et que la série géométrique∑ 1

2nest convergente, la série

∑sin

12n

converge

d’après la règle des équivalents.

2. La série∑

ln(

1 +1n

)est divergente.

En effet limn→+∞

1n

= 0 et donc ln

(1 +

1n

)∼ 1

n· Puisque les séries sont à terme général

positif et que la série harmonique est divergente, la série∑

ln(

1 +1n

)diverge d’après la

règle des équivalents.

3. Pour tout q ∈ [0, 1[, la série∑

qn2est convergente.

En effet, pour tout entier naturel n, n � n2, et donc qn2 � qn. Puisque la série géométrique∑qn est convergente, le théorème de comparaison permet de conclure.

4. Si (an) est une suite positive telle que la série∑

an soit convergente, alors la série∑ √

an

nest convergente.

93

Page 101: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

En effet, en utilisant l’inégalité ab � a2 + b2

2, on a pour tout entier naturel non nul

√an

n� 1

2

(an +

1n2

On conclut en utilisant le théorème de comparaison et en remarquant que par linéarité la

série∑(

an +1n2

)est convergente.

5. Pour tout réel a strictement supérieur à 0, la série∑ 1

n1+aest convergente.

En effet, le développement limité à l’ordre 1 de la fonction x → (1 + x)−a donne

1na

− 1(n + 1)a

=1na

(1 −

(1 +

1n

)−a)

=a

n1+a+ o

(1

na+1

)et donc

1na+1

∼ 1a

(1na

− 1(n + 1)a

On conclut avec la règle des équivalents en remarquant que la série télescopique∑(1na

− 1(n + 1)a

)est convergente. Nous redémontrerons ce résultat en exercice plus

bas (cf. page 96).

2.2 Plan d’étude d’une série à terme général positif

Pour déterminer la nature d’une série à terme général positif∑

an, on peut

• expliciter les sommes partielles Sn et calculer la limite ; cette méthode n’est que trèsrarement utilisée en pratique ;

• majorer (indépendamment de n) les sommes partielles ;

• utiliser le théorème de comparaison et ses avatars.

On pourra également utiliser les deux résultats suivants, qu’il faut savoir redémontrerau cas par cas, puisqu’ils ne sont pas au programme officiel.

Proposition 7 (Sommation par paquets)

Soit w : N → N une application strictement croissante et (an) une suite positive.

Alors les séries∑

an et∑⎛⎝ w(n)∑

k=w(n−1)+1

ak

⎞⎠ sont de même nature (avec la convention

w(−1) = −1).

PreuveNotons, pour tout entier naturel n, Sn =

n∑k=0

ak. La suite(Sw(n))

est extraite de la suite (Sn) ; cette dernière ayant

une limite dans R, les deux suites ont la même limite dans R. Or, pour tout entier naturel n, Sw(n) est la n-ième

somme partielle de la série∑⎛⎝ w(n)∑

k=w(n−1)−1

ak

⎞⎠, ce qui permet de conclure. ❑

94

Page 102: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries à terme général positif

➤ RemarqueOn ne peut pas étendre ce résultat aux suites de signe quelconque. En effet en notant an = (−1)n, la série

∑an

est évidemment divergente alors que la série∑(

2n+1∑k=2n

ak

)est convergente.

Exemples

1. Soit (an) une suite positive. Alors les séries∑

an et∑

(a2n + a2n+1) sont de même nature.Dans le cas de convergence, puisque pour tout entier naturel n, a2n � (a2n + a2n+1) eta2n+1 � (a2n + a2n+1), les deux séries

∑a2n et

∑a2n+1 sont convergentes, et

+∞∑k=0

ak =+∞∑k=0

a2k ++∞∑k=0

a2k+1.

Cette dernière formule parait évidente ; cependant on peut avoir une série convergente∑an sans avoir la possibilité d’écrire

+∞∑k=0

ak =+∞∑k=0

a2k ++∞∑k=0

a2k+1 comme le montre

l’exemple de la série harmonique alternée.

2. On a vu en exemple page 94 que la série∑ 1

naest convergente pour tout réel a > 1. On

note traditionnellement z (a) =+∞∑k=1

1ka

· Avec ce qui précède, on peut écrire

z (a) =+∞∑k=1

12aka

++∞∑k=0

1(2k + 1)a =

12a

z (a) ++∞∑k=0

1(2k + 1)a ,

soit+∞∑k=0

1(2k + 1)a =

(1 − 1

2a

)z (a) .

La proposition suivante permet d’obtenir un encadrement, souvent pertinent, dessommes partielles ou des restes d’un certain type de séries que l’on rencontre fré-quemment.

Proposition 8 (Comparaison avec une intégrale)

Soit a un réel positif et f : [a, +∞[ → R une fonction continue par morceaux, décroissante.Alors pour tout entier n tel que n � a + 1∫ n+1

nf (t) dt � f (n) �

∫ n

n−1f (t) dt.

95

Page 103: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

PreuvePour tout t � n, on a f (t) � f (n). Par monotonie de l’intégrale,∫ n+1

nf (t) dt �

∫ n+1

nf (n) dt = f (n).

De même, pour tout t � n, on a f (t) � f (n) et∫ n

n−1f (t) dt �

∫ n

n−1f (n) dt = f (n).

➤ Remarques• Le résultat précédent s’interprète facilement en termes d’aires.

nn − 1 n + 1 x

y

f (n)

Figure 4.1 Comparaison série/intégrale

• Le lecteur énoncera un résultat similaire pour les fonctions croissantes.

• Sous les mêmes hypothèses, en sommant les encadrements précédents, la relation de Chasles donne pour tousles entiers p et q vérifiant a + 1 � p � q

∫ q+1

pf (t) dt �

q∑k=p

f (k) �∫ q

p−1f (t) dt.

• On fera le lien entre séries convergentes et intégrales convergentes (Voir le chapitre 6).

• L’intérêt de ce dernier résultat vient de ce qu’il est en général difficile d’expliciter simplement les sommespartielles, alors qu’on sait plus souvent — mais pas toujours — calculer des primitives.

Exercice 3. Séries de RiemannSoit a un réel.

Montrer, en comparant avec des intégrales, que la série∑ 1

naest convergente si, et seulement

si, a > 1.

Solution. Pour tout a > 0, la fonction t → 1ta

est continue, décroissante sur [1, +∞[. Donc,

pour tout entier naturel n, n � 2∫ n+1

2

dtta

�n∑

k=2

1ka

�∫ n

1

dtta·

96

Page 104: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries à terme général positif

Ainsi, pour a ∈ ]1, +∞[ et n entier supérieur ou égal à 2

n∑k=2

1ka

� 1a − 1

(1 − 1

na−1

)� 1

a − 1,

et d’après la proposition 6, la série∑ 1

naà terme général positif converge.

Lorsque a = 1, on a pour tout entier n supérieur ou égal à 2

ln (n + 1) − ln 2 �n∑

k=2

1k

,

et en faisant tendre n vers +∞, par passage à la limite dans les inégalités, on retrouve ladivergence de la série harmonique.

Lorsque a < 1, on a1n

= o(

1na

)et donc, d’après un des corollaires du théorème de

comparaison, la série∑ 1

naest divergente.

Exercice 4.

1. Donner, pour a > 1, un équivalent simple de Rn =+∞∑

k=n+1

1ka

·

2. Donner, pour a < 1, un équivalent simple de Sn =n∑

k=1

1ka

·Solution.

1. Pour tout entier k supérieur ou égal à 2, on a∫ k+1

k

dtta

� 1ka

�∫ k

k−1

dtta

,

soit1

a − 1

(1

ka−1− 1

(k + 1)a−1

)� 1

ka� 1

a − 1

(1

(k − 1)a−1− 1

ka−1

).

En sommant, les trois séries étant convergentes, on obtient pour tout entier naturel nsupérieur ou égal à 1

1a − 1

1(n + 1)a−1

�+∞∑

k=n+1

1ka

� 1a − 1

1na−1

,

soit encore ( nn + 1

)a−1� (a − 1) na−1Rn � 1.

Le théorème des gendarmes donne alors limn→+∞

(a − 1) na−1Rn = 1, c’est-à-dire

Rn ∼1

a − 11

na−1·

97

Page 105: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

2. De même, pour tout entier n supérieur ou égal à 1, lorsque a ∈ [0, 1[,

1 +1

1 − a

((n + 1)1−a − 21−a

)� Sn � 1 +

11 − a

(n1−a − 1

)et lorsque a < 0, du fait que la fonction x → 1

xaest croissante,

1 +1

1 − a

(n1−a − 1

)� Sn � 1 +

11 − a

((n + 1)1−a − 21−a

On en déduit que pour tout a < 1

Sn ∼1

1 − an1−a·

Exercice 5.

1. Soit (an) et (bn) deux suites positives telles que la série∑

an soit convergente et an ∼ bn.

Montrer que+∞∑

k=n+1

ak ∼+∞∑

k=n+1

bk.

2. On a vu en première année (cf. chapitre XI, paragraphe 2.4.) que la constante d’Euler est

définie par limn→+∞

n∑k=1

1k− ln n = g.

Vérifier que g =+∞∑k=1

(1k− ln

(1 +

1k

))·

3. Montrer quen∑

k=1

1k− ln n − g ∼ 1

2n·

Solution.

1. Soit ´ un réel strictement positif. Par définition de l’équivalence, il existe un rang n0 telque pour tout entier n � n0, on ait

(1 − ´) an � bn � (1 + ´) an.

En sommant, d’après le proposition 4, il vient que pour tout entier n � n0

(1 − ´)+∞∑

k=n+1

ak �+∞∑

k=n+1

bk � (1 + ´)+∞∑

k=n+1

ak,

ce qui achève la démonstration.

2. Puisque pour tout entier naturel n � 1 on a l’égalité ln(n + 1) =n∑

k=1

(ln(k + 1) − ln k

), et

puisque limn→+∞

ln(

1 +1n

)= 0

g = limn→+∞

n∑k=1

1k− ln (n + 1) + ln

(1 +

1n

)=

+∞∑k=1

(1k− ln

(1 +

1k

)).

98

Page 106: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries à terme général positif

3. Ainsi, pour tout entier supérieur ou égal à 1,n∑

k=1

1k− ln(n + 1) − g = −

+∞∑k=n+1

(1k− ln

(1 +

1k

)).

Puisque1k− ln

(1 +

1k

)∼ 1

2k2, d’après la question 1. et l’exercice précédent

−+∞∑

k=n+1

(1k

+ ln(

1 − 1k

))∼ −1

2

+∞∑k=n+1

1k2

∼ − 12n

·

Ainsi, en utilisant à nouveau un développement limité de la fonction x → ln(1 + x)n∑

k=1

1k− ln n − g = − 1

2n+ o

(1n

)+ ln

(1 +

1n

)=

12n

+ o(

1n

).

Exercice 6. Formule de StirlingOn utilisera les résultats des trois exercices précédents.

On note, pour tout entier naturel n, In l’intégrale de Wallis∫ p

2

0sinn t dt. On rappelle que

I2n =

(2nn

)22n

p

2et que In ∼

√p

2n· (On pourra se reporter au chapitre 15, exercice 10 du tome

I.)Pour tout entier naturel non nul n, on pose

un =n!en

nn+ 12

·

1. Montrer que la suite (un) est convergente. On étudiera la série∑

(ln un − ln un−1).

2. Montrer, en utilisant les intégrales de Wallis, que limn→+∞

un =√

2p.

3. Montrer que

n ! =√

2pnn+ 12 e−n

(1 +

112n

+ o(

1n

)). (Formule de Stirling)

Solution.

1. On a, pour tout entier naturel n � 2,un

un−1= e

(1 − 1

n

)n− 12

et donc, en utilisant le

développement limité en 0 de x → ln (1 + x) à l’ordre 3,

ln un − ln un−1 = ln(

un

un−1

)= 1 +

(n − 1

2

)ln(

1 − 1n

)= 1 +

(n − 1

2

)(−1

n− 1

2n2− 1

3n3+ o

(1n3

))= − 1

12n2+ o

(1n2

99

Page 107: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Puisque ln un − ln un−1 ∼ − 112n2

, les deux suites sont négatives et puisque la série de

Riemann∑ 1

n2est convergente, la règle des équivalents nous permet de conclure à la

convergence de la série∑

(ln un − ln un−1).En notant respectivement, pour n � 2, Sn, Rn et S la somme partielle d’ordre n, le rested’ordre n et la somme de la série

∑(ln un − ln un−1), on a Sn + Rn = S, ce qui se traduit

par(i) ln un = K − Rn,

où K = S − 1. Il est alors immédiat que limn→+∞

un = eK .

2. D’après la question précédente, n! ∼ Lnn+ 12 e−n, avec L = eK (remarquer que L �= 0). Il

s’ensuit que

I2n =(2n)!n!22n

p

2∼ 1

Lp√2n

·

En utilisant les deux équivalents de I2n, on obtient

limn→+∞

√nI2n =

√p

2=

1L

p√2

,

c’est-à-dire L =√

2p.

3. La relation (i) se traduit en passant à l’exponentielle par un =√

2pe−Rn . Puisque

ln un − ln un−1 ∼ − 112n2 , les deux exercices précédents donnent

−Rn ∼112

+∞∑k=n+1

1k2

∼ 112n

·

Ainsi, à l’aide du développement limité en 0 à l’ordre 1 de la fonction exponentielle

n!en

nn+ 12

=√

2p exp

(1

12n+ o

(1n

))=

√2p

(1 +

112n

+ o(

1n

))·

➤ Remarques

• Il existe une méthode pour obtenir un développement limité en1

nà tout ordre de un.

• L’équivalent n! ∼√

2pnn+ 12 e−n est en général attribué au mathématicien écossais James Stirling (1692-1770),

mais elle est essentiellement dû à Abraham de Moivre (1667-1754), Stirling n’étant redevable « que » du«√

2p ». Moivre — huguenot réfugié en Angleterre — l’utilise en 1733 pour démontrer le résultat connuaujourd’hui sous le nom de théorème de Moivre-Laplace (cf. chapitre 12).

100

Page 108: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Séries absolument convergentes

3. Séries absolument convergentes

Définition 6

Soit (an) une suite à valeurs dans K. La série∑

an est absolument convergente si, etseulement si, la série

∑|an| est convergente.

Théorème 5

Toute série absolument convergente est convergente.La réciproque est fausse.

PreuveSoit (an) une suite numérique telle que la série

∑an soit absolument convergente.

Cas réelRappelons, pour tout réel x, les notations

x+ =|x| + x

2=

{|x| , si x � 0 ;0, sinon ;

et x− =|x| − x

2=

{|x| , si x � 0 ;0, sinon.

On rappel également que pour tout x réel

0 � x+ � |x| ; 0 � x− � |x| ; x = x+ − x−.

D’après le théorème de comparaison, il s’ensuit que les séries∑

a+n et∑

a−n sont convergentes et, par linéarité,

la série∑(

a+n − a−n

)=∑

an est convergente.

Cas complexeOn rappelle les inégalités

|� (z)| � |z| , |� (z)| � |z| ,

valables pour tout nombre complexe z. D’après le théorème de comparaison, les séries∑

� (an) et∑� (an) sont ainsi absolument convergentes et, d’après le cas réel, convergentes. Par linéarité, la série∑(� (an) + i� (an)

)=∑

an est convergente.❑

Exemple

La série harmonique alternée∑ (−1)n+1

nest convergente, mais elle n’est pas absolument

convergente.

➤ Remarques• En cherchant à démontrer la convergence d’une série en montrant qu’elle est absolument convergente, on

ramène l’étude de la convergence d’une série à l’étude de la convergence d’une série à terme général positif.On y gagne souvent, du fait du nombre important de résultats dont nous disposons sur les séries à termegénéral positif.

• On dit qu’une série convergente∑

an qui n’est pas absolument convergente est, bien que la formule ne soitguère heureuse, semi-convergente.

101

Page 109: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Proposition 9

On note �1 (K) l’ensemble des suites à valeurs dans K telles que la série∑

an soit absolumentconvergente.L’ensemble �1 (K) est un K-espace vectoriel pour les lois usuelles.

PreuveIl suffit de montrer que �1 (K) est un sous-espace vectoriel de KN. Il est clair que la série

∑0 est absolument

convergente. Il est quasi immédiat que si la suite (an) est un élément de �1 (K), alors pour tout scalaire l, la série∑lan est absolument convergente et donc (lan) ∈ �1 (K). Enfin, si les séries

∑an et

∑bn sont absolument

convergentes, puisque∀n ∈ N |an + bn| � |an| + |bn| ,

par linéarité et par le théorème de comparaison, la série∑

|an + bn| est convergente. Ainsi, �1 (K) est stable parcombinaisons linéaires. ❑

Proposition 10 (Inégalité triangulaire pour les séries)

Soit (an) une suite à valeurs dans K telle que la série∑

an soit absolument convergente. Alors∣∣∣∣∣+∞∑k=0

ak

∣∣∣∣∣ �+∞∑k=0

|ak| .

PreuvePuisque la série

∑|an| est convergente et à terme général positif, la suite

(n∑

k=0

|ak|)

est croissante et, pour

tout entier naturel n,n∑

k=0

|ak| �+∞∑k=0

|ak| .

Ainsi, l’inégalité triangulaire donne ∣∣∣∣∣n∑

k=0

ak

∣∣∣∣∣ �n∑

k=0

|ak| �+∞∑k=0

|ak| .

On obtient l’inégalité annoncée en passant à la limite dans l’inégalité

∣∣∣∣∣n∑

k=0

ak

∣∣∣∣∣ �+∞∑k=0

|ak|. ❑

4. D’autres séries de référence

4.1 Séries exponentielles

Définition 7

Une série exponentielle (réelle) est une série de terme généralxn

n!, où x est un nombre

réel quelconque.

102

Page 110: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

D’autres séries de référence

Théorème 6

Pour tout réel x,+∞∑k=0

xk

k!= ex.

PreuveSoit x un réel. Pour tout entier naturel n, du fait que la fonction exponentielle est de classe C∞, la formule deTaylor-Lagrange à l’ordre n permet d’établir l’existence d’un réel un ∈ ]0, 1[ tel que

ex =n∑

k=0

xk

k!+

xn+1

(n + 1)!eunx. (1)

En particulier, si t est un réel positif — de par la positivité de la fonction exponentielle —, on an∑

k=0

tk

k!� et .

Ainsi,n∑

k=0

|x|k

k!� e|x|,

et donc la série∑ xn

n!est absolument convergente. En particulier, lim

n→+∞|x|n

n!= 0.

D’autre part, puisque unx � |x| et puisque la fonction exponentielle est croissante, pour tout x réel et pour toutentier naturel n ∣∣∣∣ xn+1

(n + 1)!eunx

∣∣∣∣ � |x|n+1

(n + 1)!e|x|.

On conclut alors facilement, en faisant tendre n vers +∞, dans la relation (1). ❑

➤ RemarqueOn retrouve en particulier un résultat vu en exercice (cf. cours de première année, chapitre XI, paragraphe 2.3,exercice XI.2), à savoir que pour tout réel x

limn→+∞

xn

n!= 0.

Exercice 7.

Calculer, pour tout réel x, les sommes+∞∑k=0

x2k

(2k)!et

+∞∑k=0

x2k+1

(2k + 1)!·

Solution. On remarque que

ex =+∞∑k=0

xk

k!;

e−x =+∞∑k=0

(−1)kxk

k!·

En sommant (et retranchant) ces deux équations, on obtient

ex + e−x =+∞∑k=0

(1 + (−1)k

) xk

k!;

ex − e−x =+∞∑k=0

(1 − (−1)k

) xk

k!·

103

Page 111: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

En constatant que

1 + (−1)k ={

2, si k est pair ;0, si k est impair ;

(resp. 1 − (−1)k =

{0, si k est pair ;2, si k est impair ;

)on obtient les formules suivantes, valables pour tout réel x

+∞∑k=0

x2k

(2k)!=

ex + e−x

2et

+∞∑k=0

x2k+1

(2k + 1)!=

ex − e−x

Exercice 8.Montrer, pour tout réel x que

(a) cos x =+∞∑k=0

(−1)kx2k

(2k)!;

(b) sin x =+∞∑k=0

(−1)kx2k+1

(2k + 1)!·

Solution.

(a) Soit x un réel et n un entier naturel. La fonction cosinus étant de classe C∞, la formule deTaylor-Lagrange à l’ordre 2n + 1 assure l’existence d’un réel un ∈ ]0, 1[ tel que

cos x =n∑

k=0

(−1)kx2k

(2k)!+ (−1)n+1 x2n+2

(2n + 2)!cos (unx) .

Ainsi, pour tout entier naturel n,∣∣∣∣∣cos x −n∑

k=0

(−1)kx2k

(2k)!

∣∣∣∣∣ � |x|2n+2

(2n + 2)!·

On conclut alors facilement en utilisant la remarque qui suit le théorème 6 page 103.

(b) Cette formule se démontre de la même manière.

4.2 Séries dérivées des séries géométriques

Définition 8

Une série « dérivée » d’une série géométrique est une série de terme généraln (n − 1) · · · (n − p + 1) zn−p où z est un nombre complexe quelconque et p est un entiernaturel.(On convient que n (n − 1) · · · (n − p + 1) 0n−p = 0 lorsque n < p. )

Ainsi, une série « dérivée » d’une série géométrique est une série∑

u(p)n (z), où un est

le polynôme défini sur C par un : z → zn.

104

Page 112: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

D’autres séries de référence

➤ RemarqueUne série géométrique est une série « dérivée » d’une série géométrique.

On pourrait définir de même une série « dérivée p-ième » d’une série∑

vn, où (vn)est une suite de polynômes définie sur C, comme étant une série

∑v(p)

n (z), pourun nombre complexe z. Avec ces notations, supposons que le série

∑v′n(z) soit

convergente pour tout nombre complexe tel que |z| < R, où R est un réel stric-

tement positif. Notons alors f (z) =+∞∑k=0

vk(z). Le lecteur pourrait être tenté d’écrire

f ′(z) =+∞∑k=0

v′k(z). Une telle formule ne peut pas être justifiée en toute généralité

— et donc est interdite —, cela pour plusieurs raisons.

� Le programme ne nous permet pas de dériver d’autres types de fonctions queles polynômes complexes et certaines fonctions de la variable réelle. Même si lafonction f est définie, il n’est pas sûr qu’elle soit dérivable en tant que fonctionde la variable réelle ou en tant que polynôme.

� Il arrive que la fonction f soit dérivable sans que la série∑

v′n(z) soit conver-gente.

En résumé, « dériver une somme de série en dérivant terme à terme » estinterdit.

Proposition 11

La série∑

n (n − 1) · · · (n − p + 1) zn−p, avec (z, p) ∈ C × N, converge si, et seulementsi, |z| < 1.

PreuveLorsque p = 0 il s’agit d’une série géométrique et donc il est nécessaire et suffisant que |z| < 1 pourque la série converge. Lorsque p est un entier naturel non nul, et lorsque |z| � 1, on a, du fait quen(n − 1) · · · (n − p + 1) ∼ np,

limn→+∞

∣∣n(n − 1) · · · (n − p + 1)zn−p∣∣ = lim

n→+∞np|z|n−p = +∞,

et la série diverge grossièrement.Supposons maintenant |z| < 1. Choisissons un réel r tel que |z| < r < 1. Alors

|n (n − 1) · · · (n − p + 1) zn|rn

∼ np

( |z|r

)n

·

Puisque 0 <|z|r

< 1, limn→+∞

np

( |z|r

)n

= 0, c’est-à-dire

n (n − 1) · · · (n − p + 1) |z|n−p = o(rn) .

D’après le théorème de comparaison, la série géométrique∑

rn étant convergente, la sérien (n − 1) · · · (n − p + 1) zn−p est absolument convergente, et donc convergente. ❑

105

Page 113: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Théorème 7

Soit p un entier naturel. Alors pour tout nombre complexe z tel que |z| < 1

+∞∑k=p

k(k − 1) · · · (k − p + 1)zk−p =p!

(1 − z)p+1 ·

PreuveLa convergence a été établie à la proposition précédente.Notons, pour tout nombre complexe z de module strictement inférieur à 1 et pour tout entier naturel p,

Sp (z) =+∞∑k=p

k(k − 1) · · · (k − p + 1)

p !zk−p

⎛⎝=+∞∑j=0

(j + p

p

)zj

⎞⎠ .

Soit p un entier naturel. Alors, pour tout nombre complexe z, |z| < 1,

(1 − z) Sp+1 (z) =+∞∑j=0

(j + p + 1

p + 1

)zj −

+∞∑j=0

(j + p + 1

p + 1

)zj+1

=+∞∑j=0

(j + p + 1

p + 1

)zj −

+∞∑j=1

( j + p

p + 1

)zj (décalage d’indices)

=+∞∑j=0

((j + p + 1

p + 1

)−( j + p

p + 1

))zj

=+∞∑j=0

(j + p

p

)zj. (formule de Pascal)

En d’autres termes, (1 − z)Sp+1(z) = Sp(z). D’après le théorème 2, on a S0 (z) =1

1 − z· Il vient alors facilement

par récurrence que, pour tout entier naturel p,

∀z ∈ C |z| < 1 =⇒+∞∑j=0

(j + p

p

)zj =

1

(1 − z)p+1 ;

ce qui correspond au résultat recherché. ❑

➤ RemarqueOn retient que la formule obtenue est dérivant formellement p fois par rapport à z la relation

+∞∑k=0

zk =1

1 − z

est valable pour tout nombre complexe de module strictement inférieur à 1.

Exemples1. Pour tout nombre complexe z tel que |z| < 1

+∞∑k=0

kzk =z

(1 − z)2·

106

Page 114: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Appendice : complément en vue des probabilités

2. Pour tout nombre complexe z tel que |z| < 1

+∞∑k=0

k2zk =z + z2

(1 − z)3·

Pour le voir, il suffit de remarquer que

+∞∑k=0

k2zk =+∞∑k=0

(k (k − 1) + k

)zk = z2

+∞∑k=2

k (k − 1) zk−2 + z+∞∑k=1

kzk−1.

5. Appendice : complément en vue des probabilités

5.1 Position du problème

Du fait que l’addition est associative et commutative, l’ordre dans lequel on réalise lesopérations sur un nombre fini de termes n’a aucune importance.En particulier, si I est un ensemble fini de cardinal n et (ai)i∈I est une famille denombres complexes, en notant I = {i1, . . . , in}, on peut définir

∑i∈I

ai par

∑i∈I

ai =n∑

k=1

aik .

Cette définition est intrinsèque, dans la mesure où elle ne dépend pas de la numéro-tation k → ik de l’ensemble I choisie. Rappelons que par convention

∑i∈∅

ai = 0.

On vérifie sans difficulté les propriétés suivantes.

LinéaritéLorsque I est un ensemble fini, l’application (ai)i∈I →

∑i∈I

ai de KI à valeurs dans K

est linéaire.

Interversion de l’ordre de sommationLorsque I et J sont deux ensembles finis, alors pour toute famille (ai,j)(i,j)∈I×J

∑(i,j)∈I×J

ai,j =∑i∈I

⎛⎝∑j∈J

ai,j

⎞⎠ =∑j∈J

(∑i∈I

ai,j

).

Additivité par rapport aux ensembles d’indicesLorsque I et J sont deux ensembles finis disjoints, alors pour toute famille (ai)i∈I∪J∑

i∈I∪J

ai =∑i∈I

ai +∑i∈J

ai.

107

Page 115: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Sommation par paquetsPlus généralement, si I et J sont des ensembles finis et si

(Ij)

j∈J est une famille departies de I telle que

� les Ij sont deux à deux disjoints ;

� on a I =⋃j∈J

Ij ;

alors ∑i∈I

ai =∑j∈J

⎛⎝∑i∈Ij

ai

⎞⎠ .

La situation est beaucoup plus délicate lorsque l’ensemble I des indices est infini pourattribuer une somme à la famille (ai)i∈I . Traitons par exemple le cas où I = N. Le plus

naturel serait alors de poser, du moins lorsque la série∑

an converge,∑n∈N

an =+∞∑n=0

an.

Pour que cette définition soit satisfaisante, il faudrait qu’elle soit indépendante de lanumérotation, c’est-à-dire que si s : N → N est une bijection, il faudrait avoir

+∞∑n=0

an =+∞∑n=0

as(n),

pour toute suite (an) telle que la série∑

an est convergente. Malheureusement, iln’en n’est rien, comme le montre l’exemple suivant.

Exemple

Notons, pour tout entier naturel non nul n, an =(−1)n+1

n· On sait que la série harmonique

alternée est convergente et+∞∑n=1

(−1)n+1

n= ln 2,

(cf. exercice 1, page 86). Considérons l’application s : N∗ → N∗ définie, pour tout k ∈ N∗,par ⎧⎨⎩ s(3k − 2) = 4k − 2,

s(3k − 1) = 4k,s(3k) = 2k − 1,

et la suite (bn)n�1 définie par bn = as(n). En d’autres termes, la suite (bn)n�1 est obtenue à partir

de la suite

((−1)n+1

n

)n�1

en prenant les deux premiers termes d’indice pair, puis le premier

terme d’indice impair, puis les deux premiers termes d’indice pair suivants et le second termed’indice impair, etc. Il est quasi immédiat que l’application s est une bijection. Notons, pour

108

Page 116: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Appendice : complément en vue des probabilités

tout entier naturel non nul, Sn =n∑

k=1

bk. On a pour tout entier naturel non nul

S3n =n∑

k=1

(1

2k − 1− 1

4k − 2− 1

4k

)

=12

n∑k=1

(1

2k − 1− 1

2k

)

=12

2n∑k=1

(−1)k+1

On en déduit alors facilement que la série∑

bn est convergente et+∞∑n=1

bn =12

ln 2. Ainsi

+∞∑n=1

as(n) =12

+∞∑n=1

an.

Cet exemple montre qu’il est parfois possible de « modifier l’ordre des termes d’une série demanière à modifier la somme de la série ».

➤ RemarqueOn peut exhiber des bijections s : N∗ → N∗ telles que la série

∑as(n) soit divergente.

5.2 Séries doubles

Nous donnons ici un résultat technique, analogue au théorème de Fubini pour lesintégrales multiples (cf. chapitre 6). Il s’agit de montrer que sous certaines conditions quisont données plus bas, on peut manipuler les sommes d’une infinité dénombrable determes de la même manière que les sommes d’un nombre fini de termes.

Proposition 12 ( Fubini pour les séries )

Soit(an,m

)(n,m)∈N2 une suite double complexe. On suppose que

i) pour tout entier n, la série∑

an,m est absolument convergente ;

ii) la série∑⎛⎝+∞∑

j=0

∣∣an,j

∣∣⎞⎠ est convergente.

Alors

i) pour tout entier m, la série∑

an,m est absolument convergente ;

ii) la série∑(

+∞∑i=0

|ai,m|)

est convergente et

+∞∑i=0

⎛⎝+∞∑j=0

ai,j

⎞⎠ =+∞∑j=0

(+∞∑i=0

ai,j

).

109

Page 117: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Preuve

Notons S =+∞∑i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠. Il est clair, les termes étant positifs, que pour tout n et m entiers

n∑i=0

|ai,m| �+∞∑i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠, ce qui implique que la série∑

|an,m|, pour m fixé, est convergente. On a

également

0 �m∑

j=0

(n∑

i=0

|ai,j|)�

+∞∑i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠ ;

en faisant tendre n vers +∞, on obtient 0 �m∑

j=0

(+∞∑i=0

|ai,j |)�

+∞∑i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠, ce qui assure la

convergence de la série∑(

+∞∑i=0

|ai,m|)

.

Le théorème de comparaison et l’inégalité triangulaire pour les séries garantissent alors l’existence de

S′ =+∞∑i=0

⎛⎝+∞∑j=0

ai,j

⎞⎠ et de S′′ =+∞∑j=0

(+∞∑i=0

ai,j

).

Soit ´ un réel strictement positif. Les termes étant positifs, il existe un entier n0 tel que

S − ´

2�

n0∑i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠ � S.

En fixant n0, il existe un entier m0 tel que

0 �n0∑

i=0

⎛⎝+∞∑j=0

|ai,j|

⎞⎠−n0∑

i=0

⎛⎝ m0∑j=0

|ai,j|

⎞⎠ � ´

2,

et donc S − ´ �n0∑

i=0

⎛⎝ m0∑j=0

|ai,j|

⎞⎠ � S. Toujours du fait que tous les termes sont positifs, on a pour tout n et m

entiers, avec n � n0 et m � m0,

S − ´ �n∑

i=0

⎛⎝ m∑j=0

|ai,j|

⎞⎠ � S.

Puisque ∣∣∣∣∣∣S′ −m∑

j=0

(n∑

i=0

ai,j

)∣∣∣∣∣∣ =∣∣∣∣∣∣

n∑i=0

⎛⎝ +∞∑j=m+1

ai,j

⎞⎠ ++∞∑

i=n+1

⎛⎝+∞∑j=0

ai,j

⎞⎠∣∣∣∣∣∣

�n∑

i=0

⎛⎝ +∞∑j=m+1

|ai,j|

⎞⎠ ++∞∑

i=n+1

⎛⎝+∞∑j=0

|ai,j|

⎞⎠= S −

n∑i=0

⎛⎝ m∑j=0

|ai,j|

⎞⎠ � ´,

en faisant d’abord tendre n vers +∞, puis m, on obtient donc |S′ − S′′| � ´. Cette dernière inégalité étantvérifiée pour tout ´ strictement positif, on en déduit que S′ = S′′. ❑

110

Page 118: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Appendice : complément en vue des probabilités

Corollaire 3

Soit (an) une suite complexe telle que la série∑

an soit absolument convergente ets : N → N une bijection. Alors la série

∑as(n) est absolument convergente et

+∞∑n=0

an =+∞∑n=0

as(n).

PreuveIntroduisons la suite double (bn,m) définie par

bn,m =

{an, si s(m) = n ;0, sinon.

Il est clair que pour tout entier naturel n, la série∑

bn,m est absolument convergente et+∞∑j=0

|bn,j| = |an|. On

peut appliquer le théorème précédent et puisque pour tout entier naturel m,+∞∑i=0

bi,m = as(m), on a

+∞∑i=0

ai =+∞∑i=0

⎛⎝+∞∑j=0

bi,j

⎞⎠ =+∞∑j=0

(+∞∑i=0

bi,j

)=

+∞∑j=0

as(j). ❑

Ainsi, lorsque qu’une série∑

an est absolument convergente, sa somme ne dépend pasde l’ordre dans lequel on prend les termes.

Définition 9

Soit I est un ensemble au plus dénombrable et (ai)i∈I est une famille de nombres com-plexes.On dit que la famille est sommable lorsque l’une des deux conditions suivantes est véri-fiée.

� L’ensemble I est fini.

� L’ensemble I est dénombrable et il existe une indexation — c’est-à-dire une bijection— w : k → ik de N sur I telle que la série

∑aik soit absolument convergente. On note

alors ∑i∈I

ai =+∞∑k=0

aik .

Il est important de retenir que la notation∑i∈I

ai ne peut être utilisée que dans le

cas où l’ensemble d’indices est fini, ou lorsque la série∑

aik , où i → ik est uneindexation de I par N, est absolument convergente.

➤ Remarques• Le théorème 3 garantit dans le cas où I est dénombrable que le réel noté

∑i∈I

ai est intrinsèquement lié à la

famille (ai )i∈I, c’est-à-dire qu’il ne dépend pas de l’indexation k �→ ik, ou encore qu’il est indépendant de toutprocédé de sommation.

• Si il existe qu’un nombre fini d’indices i tels que ai est non nul, alors la famille (ai )i∈I est sommable.

111

Page 119: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

• On peut démontrer, à l’aide du théorème 3, que la possibilité de « sommer par paquets » est conservée pourles familles sommables. Plus précisément :Soit I et J deux ensembles au plus dénombrables et

(Kj)

j∈June famille de parties de I. On suppose de plus que

• les ensembles Kj sont deux à deux disjoints ;

• l’ensemble I est l’union des Kj , i.e. I =⋃j∈J

Kj .

Alors pour toute famille de complexes (ai )i∈I, la famille (ai )i∈I est sommable si, et seulement si, les conditionssuivantes sont vérifiées• pour tout j ∈ J, (ai )j∈Kj est sommable ;

• la famille

⎛⎝∑i∈Kj

|ai|

⎞⎠j∈J

est sommable.

De plus dans le cas de sommabilité, on a∑i∈I

ai =∑j∈J

⎛⎝∑i∈Kj

ai

⎞⎠.

112

Page 120: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. On pourra utiliser le résultat concernant les séries de Riemann donné à l’exercice 3page 96. Donner la nature de la série de terme général

a) an =(

1 − 1n

)n2

;

b) an = e−na

, avec a > 0 ;

c) an = sin((

2 +√

3)n

p)

;

(Montrer que(2 +

√3)n

+(2 −

√3)n

est un entier pair)

d) un =an

(1 + a0) · · · (1 + an), où (an) est une suite positive ;

(Écrire un = vn − vn−1, avec vn bien choisi.)

e) an = ln(

1 +ln nn

);

f) an =1! + 2! + · · · + n !

(n + p)!, où p est un entier naturel ;

(Montrer que 1! + 2! + · · · + n! � 2 n!.)

g) an =

{0, si l’écriture décimale de n contient un 5 ou n = 0 ;1n

, sinon.

2. Nature et somme éventuelle de la série de terme général an, avec

a) an =n

n4 + n2 + 1;

(Écrire an = un−1 − un, avec un choix convenable de un)

b) an = Arctan(

2(n + 1)2

);

(Écrire an = Arctan un+2 − Arctan un, avec un choix convenable de un)

c) an = ln

(cos

(u

2n

)), où u ∈

]0,

p

2

[;

(Exprimer les sommes partielles à l’aide de sin (2u))

d) an =1 + 2 + · · · + n1 + 8 + · · · + n3

;

e) an =+∞∑

k=n+1

qk, où q ∈ ]−1, 1[ ;

f) an =un

un+1, où la suite (un) est définie par u0 ∈ R∗

+ et un+1 = un + u2n ;

g) an =1

n(n + p), où p est un entier naturel non nul ;

h) an =1

n(n2 − 1

) ;

(Déterminer trois réels a, b et g tels que an =a

n − 1+

b

n+

g

n + 1)

113

Page 121: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

i) an =

⎧⎪⎪⎨⎪⎪⎩1n

, si n n’est pas divisible par 3 ;

−2n

, si n est un multiple non nul de 3 ;

0 si n = 0 ;

(Montrer que limn→+∞

3n∑k=n+1

1k

= ln 3)

3. Soit a et b deux nombres complexes et (un) une suite récurrente linéaire d’ordre 2,vérifiant pour tout entier naturel n la relation

un+2 = a uu+1 + b un.

On suppose de plus que les racines de P = X2 − aX − b sont toutes de module strictementinférieur à un.

1. Montrer que la série∑

un est convergente.

2. Calculer, en fonction de u0 et u1,+∞∑k=0

uk.

4. Séries de Bertrand

1. Déterminer, pour b réel positif, la nature de la série∑ 1

n lnb n· On pourra comparer avec

une intégrale.

2. Déterminer, en fonction de a et b réels, la nature de la série∑ 1

na lnb n·

5. Principe de condensationSoit (an)n�1 une suite réelle décroissante.

1. Montrer que les séries∑

an et∑

2na2n sont de même nature.

2. Retrouver ainsi la nature de la série∑ 1

na, avec a � 0.

3. Retrouver ainsi la nature de la série∑ 1

n lnb n, avec b � 0.

6. Règles de Cauchy et de d’AlembertSoit (an) une suite réelle, à valeurs positives.

1. On suppose que limn→+∞

n√

an = L. Montrer que

la série∑

an est{

convergente si L < 1 ;divergente si L > 1. (Règle de Cauchy)

114

Page 122: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

2. On suppose que la suite (an) est à valeurs strictement positive. Montrer que silim

n→+∞

an+1

an= L, alors

la série∑

an est{

convergente si L < 1 ;divergente si L > 1. (Règle de d’Alembert)

3. Soit a un réel et (un) la suite définie par un =1

(n + 1)a. Calculer lim

n→+∞n√

an et limn→+∞

an+1

an.

Commentaires ?

7. Soit (ak) une suite à valeurs strictement positives. On note, comme d’habitude,

Sn =n∑

k=0

ak.

1. Calculer, pour tout entier naturel non nul n

n∏k=1

(1 − ak

Sk

).

2. Montrer que les séries∑

an et∑ an

Snsont de même nature.

3. On suppose que la série∑

an diverge. Montrer que la série∑ an

San

, où a est un réel,

converge si, et seulement si, a > 1.

(Remarquer, lorsque a > 1, quean

San

�∫ Sn

Sn−1

dtta·)

8. Transformation d’AbelSoit (an) une suite complexe et (bn) une suite réelle. On note, pour tout entier naturel n,

Sn =n∑

k=0

ak. On suppose que

i) la suite (Sn) est bornée ;

ii) la suite (bn) est décroissante, convergeant vers 0.

1. Montrer que pour tout entier naturel n

n∑k=0

akbk = bnSn +n−1∑k=0

Sk (bk − bk+1) .

2. En déduire que la série∑

anbn est convergente.

3. Soit u ∈ ]0, 2p[. Montrer que les séries∑ sin (nu)

net∑ cos (nu)

nsont convergentes.

115

Page 123: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

9. Pour tout entier naturel non nul n, on note cn le nombre de chiffre de l’écrituredécimale de n.

Donner la nature des séries∑ 1

cn,∑ 1

ncn,∑(

1cn

)n

et∑(

1cn

)cn

·

10. Formules de Leibniz et de Machin ; logarithmesSoit a un réel strictement positif.

1. Montrer, pour tout entier naturel n et pour tout réel x positif, que

n∑k=0

(−1)kxak+1

ak + 1=∫ x

0

1 − (−ta)n+1

1 + tadt.

2. Montrer, pour tout x ∈ [0, 1], que

+∞∑k=0

(−1)kxak+1

ak + 1=∫ x

0

dt1 + ta

·

Préciser cette formule lorsque a = 1 et a = 2.

3. Soit un entier p supérieur ou égal à 2.a. Montrer que

ln p =+∞∑k=1

1k

(p − 1

p

)k

et pour tout entier naturel non nul n∣∣∣∣∣ln p −n∑

k=1

1k

(p − 1

p

)k∣∣∣∣∣ � p

n + 1

(p − 1

p

)n+1

·

b. Écrire une fonction Scilab, n’utilisant que les opérations arithmétiques, donnant unevaleur approchée à ´ près de ln p.

4. Calculer+∞∑k=0

(−1)k

2k + 1(formule de Leibniz).

5. Montrer que

p

4= 4 Arctan

15− Arctan

1239

· (formule de Machin)

6. Écrire une fonction Scilab, prenant en argument un réel strictement positif ´ et n’utilisantque les opérations arithmétiques, qui donne une valeur approchée de p à ´ près. On pourrautiliser l’exercice 2 page 87 sur les séries alternées.

11. 1. Montrer que 1! + 2! + · · · + n! ∼ n!.

2. Montrer que+∞∑k=n

1k!

∼ 1n!·

116

Page 124: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

12. Dérivation terme à termeSoit a et b deux réels, avec a < b et (fn) une suite de fonctions de classe C2, définies sur [a, b],à valeurs réelles. On pose, pour tout entier naturel n,

an = maxx∈[a,b]

|f ′′n (x)| .On suppose que

� pour tout x ∈ [a, b], la série∑

fn (x) est convergente ;

� la série∑

an est convergente.

On note enfin, pour tout x ∈ [a, b], f (x) =+∞∑k=0

fk(x).

1. Soit x ∈ [a, b] et h un réel non nul tel que x + h ∈ [a, b]. Montrer que la série∑

f ′n (x) estconvergente et que ∣∣∣∣∣f (x + h) − f (x) − h

+∞∑k=0

f ′k (x)

∣∣∣∣∣ � h2

2

+∞∑k=0

ak.

En déduire que f est une fonction dérivable et que, pour tout x ∈ [a, b], f ′(x) =+∞∑k=0

f ′k (x).

2. Soit (cn) une suite réelle. On suppose qu’il existe un réel strictement positif r tel que la suite(|cn|rn

)soit bornée. Montrer que l’application x →

+∞∑k=0

ckxk est bien définie, de classe C∞

sur ]−r, r[.

3. Soit (bn) une suite réelle. On suppose que la série∑

e−bn est convergente. Montrer que

l’application x →+∞∑k=0

e−bnx est bien définie sur [1, +∞[ et de classe C∞ sur ]1, +∞[.

13. Inégalité de Bessel et une somme due à EulerSoit f : [−p, p] → C une fonction continue par morceaux. On pose, pour tout entierrelatif n,

cn (f ) =1

2p

∫ p

−p

f (t) e−int dt

et, pour tout entier naturel n, Pn (f ) l’application définie par

Pn (f ) (x) =n∑

k=−n

ck (f ) eikx.

1. Montrer, pour tout entier naturel n, que1

2p

∫ p

−p

|Pn (f ) (x) |2 dx =n∑

k=−n

|ck (f ) |2.

2. Vérifier, pour tout entier naturel n que

12p

∫ p

−p

|f (x) − Pn (f ) (x) |2 dx =1

2p

∫ p

−p

|f (x)|2 dx −n∑

k=−n

|ck (f ) |2.

117

Page 125: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

3. En déduire que les séries∑

|cn (f ) |2 et∑

|c−n (f ) |2 sont convergentes.

4. Montrer que pour toute fonction continue par morceaux g : [−p, p] → C,

limn→+∞

∫ p

−p

g(t) sin (nt) dt = limn→+∞

∫ p

−p

g(t) cos (nt) dt = 0.

(Lemme de Riemann-Lebesgue)

5. Calculer, pour tout réel t

Dn (t) =n∑

k=−n

eikt.

6. Montrer que limn→+∞

∫ p

−p

t2Dn (t) dt = 0.

7. En déduire la valeur de+∞∑k=1

(−1)k+1

k2et de

+∞∑k=1

1k2·

14. Encore la constante d’EulerSoit f : R+ → R+ une fonction de classe C2, soit convexe, soit concave. On suppose de plusque lim

x→+∞f ′(x) = 0.

1. Montrer que pour tout a et b éléments de R+, a < b,∣∣∣∣∫ b

af (t) dt − (b − a) f (c)

∣∣∣∣ � (b − a)2

8|f ′ (b) − f ′ (a) |,

où c =a + b

2· On utilisera la relation de Chasles et on fera deux intégrations par parties.

2. En déduire que la série∑(

f (n) −∫ n+ 1

2

n− 12

f (t) dt

)est convergente. En notant S la somme,

vérifier que pour tout entier naturel non nul n

(i)n∑

k=1

f (k) =∫ n+ 1

2

12

f (t) dt + S − Rn,

|Rn| � 18

∣∣∣∣f ′(n +12

)∣∣∣∣ ·3. On rappelle que la constante d’Euler est définie par g = lim

n→+∞

n∑k=1

1k− ln n. Montrer que

n∑k=1

1k

= ln

(n +

12

)+ g − rn,

avec |rn| � 1

2 (2n + 1)2·

4. Écrire une fonction Scilab donnant une valeur approchée de g à ´ près.

118

Page 126: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

5Fonctions réellesde plusieurs variables

Dans ce chapitre, n désignera un entier naturel non nul. On cherche à étudier lesfonctions réelles définies sur une partie non vide A de R

n.On notera, comme d’habitude, pour tout n-uplet x = (x1, . . . , xn) de réels, ||x|| lanorme euclidienne de x, c’est-à-dire

||x|| =

√√√√ n∑k=1

x2k .

Par ailleurs, on adoptera les conventions suivantes.

• Lorsque une lettre x désigne un élément de Rp, où p est un entier naturel non nul,

xk désigne la k-ième composante de x, où bien entendu k un élément de �1, p�.

• Lorsque f est une application d’un ensemble E à valeurs dans Rp, où p est un entiernaturel non nul, et lorsque k est un élément de �1, p�, fk désigne la k-ième appli-cation composante associée. Rappelons que les applications composantes associéessont définies par la relation f (x) =

(f1(x), . . . , fp(x)

).

• On dira qu’un intervalle de R est non trivial lorsqu’il est non vide et non réduit àun point.

1. LimitesOn commence par étendre aux fonctions de plusieurs variables les notions de limiteet de continuité.

1.1 Définitions

Pour parler de la limite d’une fonction définie sur un ensemble A, il est d’abordnécessaire de définir en quels points on peut considérer une limite éventuelle.

Page 127: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

Définition 1

Soit A une partie de Rn. On dit que a ∈ Rn est adhérent à A lorsque pour tout réelr > 0, il existe un élément x de A tel que ||x − a|| � r.On note A l’ensemble des points adhérents à A. On dit que A est l’adhérence de A.

➤ RemarqueIl est clair que A ⊂ A.

Sur la figure 5.1, les points M et N sont adhérents à A, alors que P ne l’est pas.

A

M

N

P

Figure 5.1 Points adhérents et non adhérents

Exemples1. L’adhérence de l’ensemble vide est l’ensemble vide.

2. Si n = 1 et si f est définie au voisinage d’un réel x0, alors x0 est adhérent au domaine dedéfinition de f .

3. Si A ={

(x, y) ∈ R2 | x > 0}

, alors A ={

(x, y) ∈ R2 | x � 0}

.

4. Si A ={

(x, y) ∈ R2∣∣ x2 + y2 � 1

}, alors A = A.

Définition 2

Soit A une partie non vide de Rn, f une application de A dans R, a un élément de Rn

adhérent à A et L un réel.On dit que L est une limite de la fonction f en a si et seulement si

∀´ ∈ R∗+ ∃h ∈ R

∗+ ∀x ∈ A ||x − a|| � h =⇒ |f (x) − L| � ´.

On démontre, de la même manière que pour les fonctions de la variable réelle, quesi L et L′ sont deux limites de f en a, alors L et L′ sont égaux. En d’autres termes,on a l’unicité d’une limite éventuelle. On note alors lim

x→af (x) = L, ou lim

af = L, ou

encore f (x) −→x→a

L.

120

Page 128: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Limites

➤ Remarques• Lorsque n = 1 et que f est définie au voisinage d’un réel a, cette définition coïncide avec celle qui a été vue en

première année.

• Il est clair qu’une fonction n’a pas nécessairement de limite en un point adhérent au domaine de définition. Ilfaut toujours justifier la notation lim.

• Étant donnée une application f : A → R, où A est une partie non vide de Rn et a un point adhérent à A, ilsuffit, pour montrer que la limite de f en a est L, d’exhiber une application g : [0, +∞[ → R+ telle que• pour tout x ∈ A, |f (x) − L| � g

(||x − a||

);

• la limite de g en 0 est nulle.

• Caractère local de la limite. Soit f : A → R une application et B ⊂ A une partie non vide. Si a est adhérent à Bet si lim

x→af (x) = L, alors lim

x→af|B(x) = L.

• Soit f : A → R une application. Si a est un élément de A et si f admet une limite en a, alors cette limite estnécessairement f (a).

Exercice 1.Soit f : R2 � { (0, 0) } → R l’application définie par

f (x, y) =x2y

x2 + y2 ·

Déterminer la limite de f en (0, 0).On posera, pour (x, y) �= (0, 0), x = r cos u et y = r sin u.

Solution. Soit (x, y) ∈ R2 � {(0, 0)}. On sait qu’il existe un réel u tel que x = r cos u ety = r sin u, avec r = ||(x, y)||. Il s’ensuit que

f (x, y) =r3 cos2 u sin u

r2= r cos2 u sin u ;

et donc|f (x, y)| � ||(x, y)|| .

D’après une remarque ci-dessus, lim(x,y)→(0,0)

f (x, y) = 0.

1.2 Propriétés

Théorème 1 (Composition des limites)

Soit p un entier naturel non nul, A une partie non vide de Rn et B une partie de R

p.On considère une application g définie sur A à valeurs dans B, et f une application définiesur B à valeurs réelles.Si, lorsque a est adhérent à A,

i) pour tout k ∈ �1, p�, l’application composante associée gk a une limite bk en a ;

ii) la fonction f a pour limite L en b =(b1, . . . , bp

);

alorslimx→a

f(g1(x), . . . , gp(x)

)= L.

121

Page 129: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

PreuveSoit ´ un réel strictement positif. Il existe d’après l’hypothèse ii) un réel strictement positif d tel que pour touty ∈ B tel que ||y − b|| � d, on ait |f (x) − L| � ´. Fixons un tel d. Pour tout k ∈ �1, p�, l’hypothèse i)garantit qu’il existe un réel strictement positif hk tel que pour tout x ∈ A tel que ||x − a|| � hk, on ait

|gk(x) − bk| �d√

p· Posons h = min{h1, . . . , hp}. Pour tout x élément de A tel que ||x − a|| � h, on a de

part la croissance de la fonction racine carrée,

||g(x) − b|| =

√√√√ p∑k=1

(gk(x) − bk

)2 �√√√√ p∑

k=1

d2

p= d,

et donc∣∣∣∣f(g(x)

)− L∣∣∣∣ � ´. Cela correspond au résultat annoncé. ❑

Théorème 2 (Opérations algébriques sur les limites)

Soit A une partie non vide de Rn, a un point adhérent à A, f et g deux applications de Adans R.On suppose que f et g ont des limites en a et on note L = lim

x→af (x) et L′ = lim

x→ag(x).

Alors les applications f + g, f · g, lf et, si L �= 0,1f

ont des limites en a. De plus

a) limx→a

f (x) + g(x) = L + L′ ;

b) limx→a

f (x) · g(x) = L · L′ ;

c) limx→a

lf (x) = lL ;

d) limx→a

1f (x)

=1L·

PreuveOn procède de la même manière que pour les fonctions réelles de la variable réelle. ❑

2. Continuité

2.1 Définition

Définition 3

Soit A une partie non vide de Rn, a un point de A et f : A → R une application.

On dit que f est continue en a, si et seulement si limx→a

f (x) = f (a).

L’application f est continue si et seulement si elle est continue en tout point de A.On note C0 (A, R) l’ensemble des fonctions continues définies sur A, à valeurs réelles.

Exemples1. Les fonctions constantes sont continues.

2. Caractère local de la continuité : la continuité est stable par restriction. Soit f : A → R uneapplication continue et B ⊂ A une partie non vide. Alors f|B est continue.

122

Page 130: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Continuité

3. Soit i ∈ �1, n�. L’application projection pi : Rn → R définie par pi (x1, . . . , xn) = xi est

continue. En effet, soit x ∈ Rn et ´ un réel strictement positif. Alors, pour tout y ∈ Rn telque ||x − y|| � ´, on a

|pi(y) − pi(x)| = |yi − xi| � ||y − x|| � ´.

2.2 Propriétés

Le théorème 2 permet d’obtenir très facilement le théorème suivant.

Théorème 3

Soit A une partie non vide de Rn, f et g deux applications continues de A dans R.

Alors les applications f +g, f ·g, lf et, si f ne s’annule pas,1f

sont des applications continues.

Corollaire 1

Soit A une partie non vide de Rn. Alors C0 (A, R) est un R-espace vectoriel.

PreuveIl est clair, d’après ce qui précède, que C0 (A,R) est un sous-espace vectoriel de RA. ❑

Définition 4

Pour tout n-uplet d’entiers naturels a = (a1, . . . , an), on note ma : Rn → R l’application

définie parma (x1, . . . , xn) = xa1

1 · · · xann .

Une fonction ma est un monôme (de n variables).Une fonction polynôme ou polynomiale (de n variables) est une combinaison linéairede monômes ma.On note R [X1, . . . , Xn] l’ensemble des fonctions polynômes.

Proposition 1 (Continuité des applications polynômiales)

On a l’inclusion R [X1, . . . , Xn] ⊂ C0 (Rn, R), c’est-à-dire que toute fonction polynômeest continue.

PreuvePuisque l’ensemble des fonctions continues est stable par combinaisons linéaires, il suffit de montrer que lesfonctions ma sont continues, pour tout a ∈ Nn. Par ailleurs, pour tout a = (a1, . . . , an), ma = pa1

1 · · · pann et

donc, du fait que les fonctions projections pi et les fonctions constantes sont continues, les fonctions ma sontcontinues. ❑

Le théorème 1 page 121 donne immédiatement le résultat suivant.

123

Page 131: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

Théorème 4 (Composition des fonctions continues)

Soit p un entier naturel non nul et A une partie non vide de Rn.

Soit de plus p fonctions réelles continues g1, . . . , gp définies sur A.Soit enfin une application continue f : B → R, où B est une partie de Rp telle que

∀x ∈ A(g1(x), . . . , gp(x)

)∈ B.

Alors l’application h : A → R définie par h(x) = f(g1(x), . . . , gp(x)

)est continue.

Un cas particulier important est celui où g est une application continue d’un inter-valle non trivial I de R à valeurs dans une partie A de Rn et f est une applicationcontinue de A dans R. Alors f ◦ g est une application continue de I dans R.

Exemple

Soit (a, b) ∈(R

2)2

. Si f : R2 → R est une application continue, l’application

h : t → f (a + bt) définie sur R est continue.

Un autre cas particulier important est celui où g ∈ C0 (A, R) et où f ∈ C0 (I, R),avec g (A) ⊂ I . Dans ces conditions, f ◦ g ∈ C0 (A, R).

Exemple

L’application f définie sur R2 par f (x, y) =sin

(ex + xy2

)ln(2 + x2 + y2

) est continue.

Rappelons que si A est une partie de Rn, a = (a1, . . . , an) est un élément de A, f est

une application définie sur A et que k est un entier compris entre 1 et n, la k-ièmeapplication partielle de f en a est l’application définie sur

Aa,k = {t ∈ R | (a1, . . . , ak−1, t, ak+1, . . . , an) ∈ A}

part → f (a1, . . . , ak−1, t, ak+1, . . . , an)

(Voir tome I, chapitre 18, paragraphe 1.4).

Continuité des applications partielles

Soit A une partie non vide Rn et f une application réelle continue définie sur A.

Alors pour tout (a1, . . . , an) élément de A et pour tout k ∈ �1, n�, l’application partiellet → f (a1, . . . , ak−1, t, ak+1, . . . , an), est continue.

PreuveIl suffit, avec les notations du théorème précédent, de considérer l’application projection gk : x �→ xk et lesapplications constantes gi = ai , pour i ∈ �1, n�� {k}, afin de conclure. ❑

124

Page 132: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

2.3 Une erreur commune

On l’a vu, si une fonction réelle f définie sur une partie non vide A de Rn est continue,

alors les applications partielles sont continues. La réciproque est fausse.Considérons en effet l’application f définie sur R

2 par

f (x, y) =

{ xyx2 + y2 , si (x, y) �= (0, 0) ;

0, sinon.

Il est immédiat que, pour tout réel b non nul et pour tout réel a, la première appli-

cation partielle en (a, b), c’est-à-dire l’application x → f (x, b)(

=xb

x2 + b2

)est conti-

nue sur R. Il est clair que l’application x → f (x, 0), est continue (c’est l’applica-tion nulle). Ainsi, en tout point, la première application partielle est continue. Demanière symétrique, en tout point la seconde application partielle est continue. Enrevanche f n’est pas continue. Si elle l’était, on aurait, par composition des limites,

limx→0+

f (x, x) = f (0, 0) = 0, alors que pour tout x non nul, f (x, x) =12·

3. Dérivées partielles, fonctions de classe C1

3.1 Partie ouverte

Définition 5

1. Soit a ∈ Rn et r un réel positif. La boule ouverte (resp. fermée) de centre a et derayon r, notée BO(a, r) (resp. BF (a, r)), est

BO(a, r) = {x ∈ Rn | ||x − a|| < r }

(resp. BF (a, r) = {x ∈ Rn | ||x − a|| � r }).

2. On dit qu’une partie V de Rn est ouverte (ou qu’elle est un ouvert) si et seulementsi pour tout a ∈ V, il existe un réel strictement positif r tel que la boule BO(a, r) soitincluse dans V.

Sur la figure 5.2 ci-dessous, la partie A est ouverte alors que la partie B, obtenue enadjoignant à A son « bord », ne l’est pas.

B

A�

Figure 5.2 Ensemble ouvert et non ouvert

125

Page 133: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

Exemples

1. L’ensemble Rn est ouvert. Le vide est ouvert.

2. La boule ouverte de centre a ∈ Rn et de rayon r est ouverte.

3. Une intersection finie d’ouverts est un ouvert.

4. Un ensemble fini non vide n’est jamais ouvert.

5. Une droite dans le plan R2 n’est pas un ouvert.

3.2 Rappels

Soit V un ensemble ouvert non vide et f une application définie sur V à valeursréelles.

• Pour tout élément a de V et pour tout k de �1, n�, le k-ième nombre dérivépartiel en a est — si ce nombre existe — le nombre dérivé en ak de l’application

t → f (a1, . . . , ak−1, t, ak+1, . . . , an). On le note∂f∂xk

(a), ou ∂kf (a), ou bien encore

f ′xk(a) ; cette liste de notations n’est pas exhaustive et le lecteur est susceptible d’en

rencontrer d’autres. Si, pour tout a ∈ V, le nombre∂f∂xk

(a) est défini, l’application

∂f∂xk

: a → ∂f∂xk

(a) est la k-ième application dérivée partielle.

➤ RemarqueLe fait d’imposer que le domaine de définition de f soit un ouvert garantit que pour tout élément a de V,la k-ième application partielle est définie au voisinage de ak. On peut néanmoins parfois définir les dérivéespartielles de fonctions définies un ensemble qui n’est pas ouvert. Il existe par exemple des fonctions définiessur [0, 1]2 ayant des dérivées partielles. Il est en revanche impossible de définir les dérivées partielles d’unefonction qui serait définie sur le cercle

{(x, y) ∈ R2

∣∣ x2 + y2 = 1}

.

• Lorsque l est un réel, lorsque f et g sont des applications de V dans R, ayant en aun k-ième nombre dérivé partiel, on a

∂(lf )∂xk

(a) = l∂f∂xk

(a) ;

∂(f + g)∂xk

(a) =∂f∂xk

(a) +∂g∂xk

(a) ;

∂(f × g)∂xk

(a) =∂f∂xk

(a) × g(a) + f (a) × ∂g∂xk

(a) ;

(1f

)∂xk

(a) = − 1f 2(a)

× ∂f∂xk

(a),

cette dernière formule n’étant évidemment valable que dans le cas où la fonction fne s’annule pas en a.

126

Page 134: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

• Lorsque f est à valeurs dans un intervalle I , ayant en a un k-ième nombre dérivépartiel, et que w est une fonction dérivable à valeurs réelles, alors

∂(w ◦ f )∂xk

(a) = w′(f (a))× ∂f

∂xk(a).

• La notation∂

∂xidésigne, pour tout entier naturel n � i et pour toute partie A de

Rn, l’application f → ∂f

∂xi, définie sur Di (A, R) à valeurs dans R

A, où Di (A, R) est

l’ensemble des fonctions réelles définies sur A dont la i-ième dérivée partielle estégalement définie sur A.

• Lorsque tous les nombres dérivés partiels sont définis en a, le gradient de f en a,noté ∇f (a) ou

−−→gradaf , est l’élément de R

n

∇f (a) =(

∂f∂x1

(a), . . . ,∂f∂xn

(a))

.

➤ Remarque

Lorsque n = 2, on note souvent∂f

∂x(a) et

∂f

∂y(a) pour

∂f

∂x1(a) et

∂f

∂x2(a) respectivement. On adopte des conventions

similaires lorsque n = 3.

3.3 Fonctions de classe C1

Dans ce paragraphe, V est un ouvert non vide de Rn.

Définition 6

Une fonction définie sur V à valeurs réelles sera dite de classe C1 lorsque toutes les dérivéespartielles sont définies sur V, et qu’elles sont toutes continues.On note C1 (V, R) l’ensemble des fonctions de classe C1 définies sur V à valeurs réelles.

➤ RemarqueLe caractère C1 est une propriété locale.Si V′ ⊂ V est un ouvert et si f ∈ C1

(V,R), alors f|V′ ∈ C1

(V′,R

)Proposition 2

L’ensemble C1 (V, R) est un R-espace vectoriel pour les lois usuelles.

PreuveEn vertu des calculs rappelés au paragraphe précédent, on vérifie facilement que C1

(V,R)

est un sous-espacevectoriel de RV. ❑

127

Page 135: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

ExempleLes fonctions polynômes de n variables sont de classe C1 sur R

n. Il suffit de démontrer cerésultat sur les monômes ma, pour tout n-uplet d’entiers a = (a1, . . . , an)(cf. page 123). Soitdonc a = (a1, . . . , an) fixé. Pour tout k de �1, n� et pour tout x = (x1, . . . , xn) de R

n

∂ma

∂xk(x) =

{akx

a11 · · · xak−1

k · · · xann , si ak �= 0 ;

0, sinon.

Dans tous les cas, toutes les dérivées partielles∂ma

∂xksont définies et sont des fonctions poly-

nômes, donc elles sont continues. Cela correspond à ce qui devait être démontré.

3.4 Théorème d’approximation. Applications

Comme précédemment, V est un ouvert non vide de Rn.

Théorème 5

Soit f une fonction réelle de classe C1 définie sur V et a un élément de V. Alors, il existeune fonction ´ : Rn → R telle que

• pour tout h tel que a + h soit un élément de V,

f (a + h) = f (a) +n∑

k=1

∂f∂xk

(a)hk + ||h|| ´ (h) ;

• limh→0

´(h) = 0.

PreuveOn définit la fonction ´ par

´(h) =

⎧⎪⎨⎪⎩1

||h||

(f (a + h) − f (a) −

n∑k=1

∂f

∂xk(a)hk

), si h �= 0 et a + h ∈ V ;

0, sinon.

Il s’agit de démontrer que limh→0

´(h) = 0. Soit donc a un réel strictement positif. Par continuité des dérivées

partielles, il existe h strictement positif tel que pour tout k ∈ �1, n�

(i) ∀h′ ∈ Rn(

a + h′ ∈ V et∣∣∣∣h′∣∣∣∣ � h

)⇒∣∣∣∣ ∂f

∂xk(a + h′) − ∂f

∂xk(a)

∣∣∣∣ � a

Fixons un tel h. Notons, pour k ∈ �0, n� et h = (h1, . . . , hn) ∈ Rn, h′k = (h1, . . . , hk, 0, . . . , 0). Ainsi, lorsquea + h ∈ V

f (a + h) − f (a) =n∑

k=1

f(a + h′k

)− f(a + h′k−1

),

et donc, après avoir fixé h non nul, en appliquant le théorème des accroissements finis aux fonctionst �→ f

(a1 + h1, . . . , ak−1 + hk−1, t, ak+1, . . . , an

), il existe (u1, . . . , un) ∈ ]0, 1[n tel que

f (a + h) − f (a) −n∑

k=1

∂f

∂xk(a)hk =

n∑k=1

(∂f

∂xk(a + h′′k ) − ∂f

∂xk(a)

)hk,

128

Page 136: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

où h′′k =(h1, . . . , hk−1, ukhk, 0, . . . , 0

). Donc, pour tout h ∈ Rn tel que ||h|| � h et a + h ∈ V, puisque pour

tout k ∈ �1, n� on a∣∣∣∣h′′k ∣∣∣∣ � ||h|| � h, il vient de (i) et de l’inégalité triangulaire que∣∣∣∣∣f (a + h) − f (a) −

n∑k=1

∂f

∂xk(a)hk

∣∣∣∣∣ �n∑

k=1

∣∣∣∣ ∂f

∂xk(a + h′′k ) − ∂f

∂xk(a)

∣∣∣∣ |hk|

�n∑

k=1

∣∣∣∣ ∂f

∂xk(a + h′′k ) − ∂f

∂xk(a)

∣∣∣∣ ||h||�

n∑k=1

a

n||h|| = a ||h|| .

Le résultat annoncé en découle. ❑

Corollaire 3

Toute fonction réelle définie sur V de classe C1 est continue.

PreuveAvec les notations précédentes, la continuité des fonctions polynômes donne facilement lim

h→0f (a + h) = f (a). ❑

➤ RemarqueOn sait que si I est un intervalle non trivial et que si f et une fonction réelle dérivable en a ∈ I, alors f est continueen a. En revanche, l’existence de toutes les dérivées partielles d’une fonction réelle f de plusieurs variables en unpoint a n’est pas suffisante pour garantir la continuité de f en a. Par exemple, on a vu que la fonction f définie par

f (x, y) =xy

x2 + y2lorsque (x, y) �= (0, 0) et f (0, 0) = 0 est discontinue en (0, 0) (cf. page 125). Pour cette fonction

le lecteur vérifiera que les dérivées partielles sont définies sur R2, avec, en particulier,∂f

∂x(0, 0) =

∂f

∂y(0, 0) = 0.

Corollaire 4

L’ensemble C1 (V, R) est stable par produit, i.e. pour toutes fonctions réelles f et g declasse C1 définies sur V, la fonction f · g est de classe C1.L’ensemble C1 (V, R) est stable par passage à l’inverse, i.e. pour toute fonction réelle f de

classe C1 définie sur V, ne s’annulant pas, la fonction1f

est de classe C1.

Composition des fonctions de classe C1 (I)

Soit f une fonction à valeurs réelles de classe C1 définie sur V et w : I → V une fonctionde classe C1, où I est un intervalle non trivial de R.Alors la fonction f ◦ w est de classe C1 et

(1) ∀t ∈ I (f ◦ w)′ (t) =n∑

k=1

∂f∂xk

(w(t)

)× w′

k(t).

PreuveSoit t ∈ I et posons, pour h réel non nul tel que t + h ∈ I,

d(h) = w (t + h) − w (t) =(d1(h), . . . , dn(h)

).

129

Page 137: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

Il est clair que, pour tout k ∈ �1, n�, limh→0h �=0

dk (h)

h= w′

k(t) et que limh→0h �=0

||d (h)|||h|

=∣∣∣∣w′(t)

∣∣∣∣ .D’autre part, f étant de classe C1, il existe une fonction ´ : Rn → R, telle que lim

x→0´(x) = 0 et telle que

f ◦ w (t + h) − f ◦ w (t) =n∑

k=1

∂f

∂xk

(w(t))dk(h) + ||d (h)|| ´

(d(h)).

Par continuité, la limite en 0 de d est nulle, et donc

limh→0h �=0

∣∣∣∣∣ f(w(t + h)

)− f(w(t))

h−

n∑k=1

∂f

∂xk

(w(t))dk(h)

h

∣∣∣∣∣ = limh→0h �=0

||d(h)|||h|

´(d(h))

= 0.

On en déduit alors que f ◦ w est dérivable en t et la formule (1), cela pour tout t de I. L’expression de la dérivéeet les résultats relatifs à la composition et aux opérations algébriques sur les fonctions continues garantissent lecaractère C1 de f ◦ w. ❑

ExempleSoit f : V → R une application de classe C1, a un élément de V et b un élément de R

n. Alorsl’application g : t → f (a + tb) est définie au voisinage de 0 et

g′(0) =n∑

k=1

∂f∂xk

(a) bk.

Composition des fonctions de classe C1 (II)

Soit f une fonction réelle de classe C1 définie sur V et g : V′ → V une fonction, où V′ estun ouvert non vide de R

p. On suppose que les applications composantes de g sont toutesde classe C1.Alors la fonction f ◦ g est de classe C1 et

∀i ∈ �1, p� ∀u ∈ V′ ∂ (f ◦ g)∂ui

(u) =n∑

k=1

∂f∂xk

(g(u)

)× ∂gk

∂ui(u).

PreuvePour l’existence des dérivées partielles, il suffit d’appliquer le corollaire précédent à l’application

t �→ f(

g1(u1, . . . , ui−1, t, ui+1 . . . , up

), . . . , gn

(u1, . . . , ui−1, t, ui+1, . . . , up

)).

L’expression des dérivées partielles trouvées montre qu’elles sont continues, par composition, somme et produitde fonctions continues. ❑

NotationsSoit V un ouvert non vide de Rn et V′ un ouvert non vide de Rp. Soit de plus f unefonction à valeurs réelles de classe C1 définie sur V. On pose pour tout u ∈ V′⎧⎨⎩ x1 = c1(u1, . . . , up)

· · · · · · · · ·xn = cn(u1, . . . , up),

130

Page 138: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

où c = (c1, . . . , cn) est un n-uplet de fonctions réelles, définies sur V′ et de classeC1, tel que c(V′) ⊂ V.On pose enfin g

(u1, . . . , up

)= f

(c1(u1, . . . , up), . . . , cn(u1, . . . , up)

), i.e. g = f ◦ c.

On note souvent de manière condensée, et bien que cela constitue un abus, la formuledu corollaire précédent donnant les dérivées partielles de g, par

∀i ∈ �1, p�∂g∂ui

=n∑

k=1

∂f∂xk

× ∂xk

∂ui·

Cette formule est connue sous le nom de formule (ou règle) des chaînes. Il estextrêmement important de retenir cette formule et de bien en comprendre la signifi-cation (avec les abus de notations).

3.5 Exemples

Exercice 2.

1. Soit a, b, c et d quatre réels et f une fonction réelle de classe C1 définie sur R2. On pose,pour tout (u, v) ∈ R2 {

x = au + bvy = cu + dv

et g(u, v) = f (x, y). Calculer les dérivées partielles de g.

2. Déterminer les fonctions réelles de classe C1 définies sur R2, vérifiant

∂f∂x

+∂f∂y

= 0.

Solution.

1. Les fonctions (u, v) → au + bv et (u, v) → cu + dv sont des fonctions polynômes et donc declasse C1. On peut ainsi appliquer la règle des chaînes, et donc, pour tout couple de réels(u, v),

∂g∂u

(u, v) = a∂f∂x

(x, y) + c∂f∂y

(x, y),

∂g∂v

(u, v) = b∂f∂x

(x, y) + d∂f∂y

(x, y).

2. Posons a = c = 1, b =12

et d = −12

et soit f une fonction réelle de classe C1 définie

sur R2 solution du problème. Alors g est une fonction réelle de classe C1, définie sur R

2,

vérifiant∂g∂u

= 0. Il s’ensuit qu’il existe une fonction F définie sur R telle que

∀(u, v) ∈ R2 g(u, v) = F(v).

131

Page 139: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

De plus, puisque g est de classe C1, il en est de même de F. Puisque l’application

(u, v) →(

u +v2

, u − v2

)est une bijection de R2 sur R2, on en déduit que si f est une

solution du problème, il existe alors une fonction F de classe C1 sur R telle que pour tout(x, y) ∈ R2

f (x, y) = g(

x + y2

, x − y)

= F(x − y).

Réciproquement, si F est une fonction de classe C1 définie sur R, il est facile de vérifierque f : (x, y) → F (x − y) est une solution du problème.

Exercice 3.On note V = R

∗+ × R. Déterminer les fonctions réelles f de classe C1 définies sur V vérifiant

x∂f∂x

= y∂f∂y

·

On posera x = u et y =vu·

Solution. Soit f une solution du problème. On vérifie sans difficulté que V est un ouvert. Les

fonctions (u, v) → u et (u, v) → vu

, définies sur V sont de classe C1 et c : (u, v) →(

u,vu

)est

une bijection sur V, d’application réciproque c−1 : (x, y) → (x, xy).En appliquant la règle des chaînes, g = f ◦ c est de classe C1 et, pour tout (u, v) ∈ V

∂g∂u

(u, v) =∂f∂x

(x, y) − vu2

∂f∂y

(x, y) =∂f∂x

(x, y) − yx

∂f∂y

(x, y) = 0.

Ainsi, de la même manière que dans l’exercice précédent, il existe une fonction réelle F declasse C1 sur R telle que pour tout (u, v) ∈ V, g(u, v) = F(v) et donc telle que pour tout(x, y) ∈ V

f (x, y) = F(xy).

Il est facile de vérifier que toute fonction définie sur V par (x, y) → F(xy), où F est unefonction réelle de classe C1 sur R, est une solution du problème.

Exercice 4.On note D− l’ensemble

{(x, 0) ∈ R2 | x � 0

}et V = R2 � D−. Déterminer les fonctions

réelles f de classe C1 définies sur V vérifiant

x∂f∂x

+ y∂f∂y

= 0.

On posera x = r cos u et y = r sin u.

Solution. Soit f une solution du problème. Notons V′ = R∗+ × ]−p, p[. On vérifie sans

difficulté que V et V′ sont ouverts. Les applications définies sur V′ par (r, u) → r cos u et(r, u) → r sin u sont clairement de classe C1. On vérifie aisément que l’application C : V′ → V

définie par C(r, u) = (r cos u, r sin u) est une bijection sur V.

132

Page 140: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

En posant g : (r, u) → f (r cos u, r sin u), g est une fonction réelle de classe C1 sur V′ et la règledes chaînes donne, pour tout (r, u) ∈ V′

∂g∂r

(r, u) =∂f∂x

(x, y) cos u +∂f∂y

(r, u) sin u =1r

(x∂f∂x

(x, y) + y∂f∂y

(r, u))

= 0.

r

u+p

+−p

C

D−x

y

Figure 5.3 L’application C

Comme précédemment, on en conclut qu’il existe nécessairement une fonction réelle F1 declasse C1 telle que pour tout (r, u) ∈ V′

g(r, u) = F1(u).

Par ailleurs, pour tout (x, y) ∈ V, C−1(x, y) =

(√x2 + y2, 2 Arctan

y

x +√

x2 + y2

). En effet

soit (x, y) ∈ V et posons Z = x + iy = reiu. Alors

Z + |Z| = 2 cos(

u

2

)ei u

2 =(

x +√

x2 + y2)

+ iy = x′ + iy,

et puisque u ∈ ]−p, p[, 2 cosu

2est positif et donc

u

2est un argument de Z + |Z|. La formule

annoncée en découle du fait que x′ est positif et donc qu’une mesure de l’argument de x′ + iyest donnée par Arctan

yx′· Ainsi, si f est une solution du problème, il existe une fonction F

(= F1 ◦ 2 Arctan) définie sur R, de classe C1, vérifiant

f (x, y) = F

(y

x +√

x2 + y2

).

Réciproquement, on vérifie facilement que toute fonction réelle définie sur V par

f (x, y) = F

(y

x +√

x2 + y2

),

où F ∈ C1 (R, R), est une solution du problème.

133

Page 141: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

3.6 Extrema

On définit pour les fonctions de plusieurs variables les notions d’extremum relatif(strict ou pas) et d’extremum global (strict ou pas) de la même manière que pour lesfonctions d’une seule variable.

Définition 7

Soit A une partie non vide de Rn et f une fonction réelle définie sur A.

1. On dit que l’élément a de A est un maximum (global) (resp. maximum (global) strict)de f si, et seulement si,

∀x ∈ A f (x) � f (a)

(resp. ∀x ∈ A � {a} f (x) < f (a) )

2. On dit que l’élément a de A est un maximum local (resp. maximum local strict) de fsi, et seulement si, il existe un réel strictement positif r tel que

∀x ∈ A ∩ BO(a, r) f (x) � f (a)

(resp. ∀x ∈(A ∩ BO(a, r)

)� {a} f (x) < f (a) )

(BO(a, r) est la boule ouverte de centre a et de rayon r.)

On définit de même un minimum, un minimum strict, un minimum local, un minimumlocal strict.

Théorème 6 (Condition nécessaire d’extremum)

Soit f une fonction réelle de classe C1, définie sur un ouvert non vide V de Rn. Si a est unextremum de f , alors

∇f (a) = 0.

La réciproque est fausse.Un élément a de V tel que ∇f (a) = 0 est appelé un point critique.

PreuveSoit a un extremum de f . Puisque V est un ouvert, pour tout k ∈ �1, n�, l’application partiellet �→ f (a1, . . . , ak−1, t, ak+1, . . . , an) est définie au moins sur un intervalle ouvert contenant ak. De plus ak doit

être un extremum de l’application partielle. Il s’ensuit que∂f

∂xk(a) = 0. ❑

➤ Remarques• Dans l’énoncé précédent, le fait que le domaine de définition soit ouvert est capital. Considérons en effet

l’application f : [0, 1]2 → R définie par f (x, y) = x + y. Il est clair que (0, 0) est un minimum et (1, 1) est un

maximum, alors que∂f

∂x=

∂f

∂y= 1.

• En revanche, on peut simplement supposer l’existence de toutes les dérivées partielles sur V — sans supposerleur continuité — pour obtenir la même conclusion.

• Il arrive parfois qu’en un point critique, toutes les applications partielles aient des extrema locaux stricts, maisqu’ils ne soient pas tous de même nature, i.e. certains sont des maxima, d’autres des minima. On parle alorsde col ou de point selle. La figure suivante illustre le col en (0, 0) de f : (x, y) �→ y2 − x2.

134

Page 142: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

−1.0

−0.8

−0.6

−0.4

−0.2

0.0

0.2

0.4

0.6

0.8

1.0

Z

−1.0

−0.6

−0.2

0.2

0.6

1.0

X

−1.0−0.8−0.6−0.4−0.20.00.20.40.60.81.0

Y

Figure 5.4 Un col ou point selle représenté à l’aide de Scilab

La méthode la plus courante pour étudier les extrema d’une fonction réelle de plu-sieurs variables définie sur un ouvert consiste à d’abord chercher les points critiquespuis, par des encadrements, déterminer la nature du point critique (maximum, mini-mum, col, autre).

Exercice 5.Déterminer les extrema locaux sur R2 de la fonction définie par f (x, y) = x4 + y4 − x2 + y2.

Solution. L’ensemble R2 est ouvert et f est une fonction polynôme, donc de classe C1.Pour tout couple (x, y) de R

2 on a⎧⎪⎪⎨⎪⎪⎩∂f∂x

(x, y) = 2x(2x2 − 1)

∂f∂x

(x, y) = 2y(2y2 + 1)

Ainsi les point critiques sont ceux qui vérifient x(2x2 − 1) = y(2y2 + 1) = 0. On en déduit

que O(0, 0), A =(

1√2

, 0)

et B =(− 1√

2, 0)

sont les trois seuls points critiques.

• Le point (0, 0) est un col. En effet, l’étude de l’application x → f (x, 0), montre que celle-ciadmet un maximum local strict en 0, alors que l’application y → f (0, y) admet un minimumlocal strict.

135

Page 143: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

• Le point A est un minimum local strict. Posons x =1√2

+ h et y = k. Alors, en notant

g(h, k) = f (x, y), on obtient

g(h, k) =(

1√2

+ h)4

+ k4 −(

1√2

+ h)2

+ k4 + k2 + g(0, 0)

= h2(

h2 + 23/2h + 2)

+ k2 (k2 + 1)

+ g(0, 0).

Or, lorsque |h| � 2−3/2,h2 + 23/2h + 2 � 2 − 23/2 |h| � 1,

et donc pour tout (h, k) ∈ BF(O, 2−3/2

), non nul,

g(h, k) − g(0, 0) � h2 + k4 + k2 > 0.

On en déduit le résultat annoncé.

• Puisque f est paire en x, on en déduit que B est également un minimum local strict.

Exercice 6.Dans cette exercice, P est le plan muni d’un repère orthonormé direct (O,�ı,�j).

1. Soit ABC un « vrai » triangle du plan P . On note a, b, c respectivement les côtés BC, CA,

AB et p =a + b + c

2le demi-périmètre. Montrer que l’aire du triangle est

aire(ABC) =√

p (p − a) (p − b) (p − c). (formule de Héron)

2. Déterminer, parmi les triangles de périmètre 1, ceux dont l’aire est maximale.

3. Montrer que pour tout triangle d’aire A et de périmètre �, on a

A �√

336

�2.Solution.

1. On sait que

aire(ABC) =12

AB × AC × sin A =bc2

sin A,

où A ∈ [0, p] est déterminé par son cosinus, à savoir

BC2 = AB2 + AC2 − 2AB × AC × cos A.

(Voir par exemple le chapitre 8, paragraphe 7 du cours de première année.) Il s’ensuit que

cos A =b2 + c2 − a2

2bcet donc

aire(ABC)2 =b2c2

4

(1 − cos2 A

)=

116

(4b2c2 −

(b2 + c2 − a2

)2)

=

(2bc − b2 − c2 + a2

) (2bc + b2 + c2 − a2

)16

=

(a2 − (b − c)2

) ((b + c)2 − a2

)16

=(a + b − c)(a + c − b)(b + c − a)(a + b + c)

16·

136

Page 144: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Dérivées partielles, fonctions de classe C1

On obtient alors immédiatement la formule annoncée.

A

B

C

c

b

aA +

+x

y

V′

1

1

OFigure 5.5 Inégalité isopérimétrique

2. On sait que trois réels positifs a, b et c sont les côtés d’un triangle si et seulement si|a − b| � c � a + b (cf. exercice 8.3 du paragraphe 2 du chapitre 8 du cours de pre-mière année). Le triangle sera « vrai » si et seulement si les inégalités sont strictes (penseraux cas d’égalité dans l’inégalité triangulaire). Ainsi, deux réels a et b sont les côtés d’un« vrai » triangle de périmètre 1 si et seulement si |a − b| < 1 − a − b < a + b, i.e.⎧⎨⎩

12 < a + b

et2 max{a, b} = |a − b| + (a + b) < 1,

soit encore (a, b) ∈]0,

12

[2

et12

< a + b. Notons donc

V =

{(a, b) ∈

]0,

12

[2 ∣∣∣∣ 12

< a + b

}.

On vérifie facilement que V est un ouvert. Il s’agit de trouver, s’il existe, le maximum dela fonction f définie sur V par

f (a, b) =

√(1 − 2a

)(1 − 2b

)(2(a + b) − 1

)4

=√

P(2a, 2b)4

,

où P(x, y) = (1 − x)(1 − y)(x + y − 1) est définie sur V′ ={

(x, y) ∈ ]0, 1[2 |1 < x + y}

.Par stricte croissance de la fonction

√, il s’agit de trouver le maximum de P. La fonction

P est polynomiale, donc de classe C1. Les points critiques sont caractérisés par⎧⎪⎪⎪⎨⎪⎪⎪⎩∂P∂x

(x, y) = −(1 − y)(x + y − 1) + (1 − x)(1 − y) = 0

∂P∂y

(x, y) = −(1 − x)(x + y − 1) + (1 − x)(1 − y) = 0.

137

Page 145: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

En soustrayant ces deux équations, on obtient (x − y)(x + y − 1) = 0. Si x + y − 1 = 0, lapremière (et la seconde) équation donne (x − 1)(y − 1) = 0, et donc x = 1 ou y = 1, ce

qui est impossible. On obtient nécessairement x = y, puis que(

23

,23

)est l’unique point

critique de P.Pour tout x ∈ ]0, 1[, l’application y → P(x, y) est une fonction polynôme du second degré

dont les racines sont 1 et 1 − x ; le maximum de celle-ci est atteint en2 − x

2et vaut

x2

4(1 − x). Une brève étude de la fonction g : x → x2

4(1 − x) montre que le maximum

de celle-ci sur [0, 1] est atteint en23· Ainsi, pour tout (x, y) ∈ V

P(x, y) � g(x) � 127

= P(

23

,23

),

et donc le point critique(

23

,23

)est le maximum (global strict) de P. On en déduit que

les triangles d’aire maximale de périmètre 1 sont les triangles équilatéraux.

3. On déduit de la question précédente que parmi tous les triangles de périmètre �, les tri-

angles équilatéraux de côté�

3sont ceux qui ont l’aire maximale. On obtient alors l’inégalité

annoncée en utilisant le fait que l’aire d’un triangle équilatéral de côté�

3est

√3

36�2.

➤ Remarques• On peut reformuler le résultat en disant que parmi tous les triangles d’aire donnée, les triangles équilatéraux

sont ceux qui minimisent le périmètre.

• On appelle inégalité isopérimétrique (dans le plan) toute inégalité A � C �2, où A et � respectivement dési-gnent l’aire et le périmètre d’un domaine borné D. Elles sont établies pour des ensembles de domaines. Dans

notre cas particulier l’ensemble des domaines est celui des triangles et la constante est

√3

36. Pour des ensembles

plus généraux de domaines, on peut démontrer que A � 4p �2, le cas d’égalité correspondant au disque. Ilexiste des inégalités analogues liant la surface et le volume d’un domaine borné de l’espace.

4. Fonctions de classe C2

Dans cette partie V est un ouvert non vide de Rn.

4.1 Généralités

Définition 8

Une fonction réelle f définie sur V est de classe C2 si et seulement si toutes les dérivéespartielles sont définies sur V et qu’elles sont toutes de classe C1.On note C2 (V, R) l’ensemble des fonctions réelles de classe C2 définies sur V.Les dérivées partielles des dérivées partielles sont les dérivées partielles secondes.

138

Page 146: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Fonctions de classe C2

On note, pour tout (i, j) élément de �1, n�2,

∂2f∂xi∂xj

=∂

∂xi

(∂f∂xj

)les dérivées partielles secondes de f . On trouve également les notation ∂2

ij f ou encoref ′′xi,xj

. Là encore le lecteur est susceptible de rencontrer d’autres notations. On noteplus simplement, pour tout i ∈ �1, n�

∂2f∂x2

i=

∂2f∂xi∂xi

·

➤ RemarqueD’après le corollaire 3 du théorème d’approximation, toute fonction de classe C2 est de classe C1.

Proposition 3

• Soit f et g deux fonctions réelles de classe C2 définies sur V et l un réel.

Alors f + g, lf , f · g et1f

(lorsque celle-ci est définie) sont des fonctions de classe C2.

• L’ensemble C2 (V, R) est un R-espace vectoriel pour les lois usuelles.

• Soit f une fonction réelle de classe C2 définie sur V et g : V′ → V une fonction, oùV′ est un ouvert non vide de R

p. On suppose de plus que les applications composantesde g sont toutes de classe C2. Alors la fonction f ◦ g est de classe C2.

PreuveImmédiate d’après les propriétés des fonctions de classe C1. ❑

4.2 Théorème de Schwarz

Commençons par un exercice.

Exercice 7.Soit P une fonction polynôme de n variables (définie sur R

n).

1. Montrer que pour tout couple (i, j) à valeurs dans �1, n�2,

∂2P∂xi∂xj

=∂2P

∂xj∂xi·

2. Soit g une fonction réelle définie sur R, de classe C2 et f = g ◦ P. Comparer∂2f

∂xi∂xjet

∂2f∂xj∂xi

·

Solution.

1. La formule est immédiate lorsque i = j. Soit donc i et j deux éléments distincts de �1, n�.On peut supposer i < j. Par linéarité, il suffit de vérifier la formule sur les monômes

139

Page 147: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

ma : x → xa11 · · · xan

n , où a = (a1, . . . , an) ∈ Nn. Or, pour tout x ∈ R

n

∂2ma

∂xi∂xj(x) =

{aiaj xa1

1 · · · xai−1i · · · xaj−1

j · · · xann , si ai �= 0 et aj �= 0 ;

0, sinon.

On obtient la même expression pour∂2ma

∂xj∂xi(x), ce qui assure le résultat.

2. Pour tout (i, j) élément de �1, n�2, on vérifie facilement que

∂2f∂xi∂xj

=∂P∂xi

× ∂P∂xj

× g′′ ◦ P +∂2P

∂xi∂xj× g′ ◦ P.

On conclut immédiatement.

L’exercice précédent montre que les « dérivées partielles croisées »∂2f

∂xi∂xjet

∂2f∂xj∂xi

coïncident dans un certain nombre de cas. Il s’agit en fait d’un résultat général, qui estl’objet du théorème ci-dessous, dont la démonstration peut être admise.

Théorème 7 (Théorème de Schwarz)

Soit V un ouvert non vide de Rn et f une fonction réelle de classe C2 définie sur V. Alorspour tout (i, j) élément de �1, n�

∂2f∂xi∂xj

=∂2f

∂xj∂xi·

PreuvePour alléger les notations, nous supposerons que n = 2.Soit a ∈ V. Puisque V est ouvert, il existe un réel strictement positif r tel que pour tout h ∈ R2 tel que ||h|| � r

on ait a + h ∈ V. Ainsi, pour tout r ∈]

0,r√2

], en notant

Ir = f (a1 + r, a2 + r) − f (a1 + r, a2) − f (a1, a2 + r) + f (a1, a2),on a

Ir =(

f (a1 + r, a2 + r) − f (a1 + r, a2))−(

f (a1, a2 + r) − f (a1, a2))

=

∫ a2+r

a2

∂f

∂x2(a1 + r, v) dv −

∫ a2+r

a2

∂f

∂x2(a1, v) dv

=

∫ a2+r

a2

(∂f

∂x2(a1 + r, v) − ∂f

∂x2(a1, v)

)dv

=

∫ a2+r

a2

(∫ a1+r

a1

∂2f

∂x1∂x2(u, v) du

)dv.

En remarquant que Ir =(f (a1 + r, a2 + r) − f (a1, a2 + r)

)−(f (a1 + r, a2) − f (a1, a2)

), on obtient

Ir =

∫ a1+r

a1

(∫ a2+r

a2

∂2f

∂x2∂x1(u, v) dv

)du =

∫ a2+r

a2

(∫ a1+r

a1

∂2f

∂x1∂x2(u, v) du

)dv.

140

Page 148: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Fonctions de classe C2

Soit maintenant ´ un réel strictement positif. Par continuité, il existe un réel h strictement positif tel queBF (a, h) ⊂ V et tel que pour tout h ∈ R2 vérifiant ||h|| � h∣∣∣∣ ∂2f

∂x1∂x2(a + h) − ∂2f

∂x1∂x2(a)

∣∣∣∣ � ´

2; (1)∣∣∣∣ ∂2f

∂x2∂x1(a + h) − ∂2f

∂x2∂x1(a)

∣∣∣∣ � ´

2· (2)

Ainsi, pour tout r ∈]

0,h√2

], on déduit de (1) que

∣∣∣∣∫ a2+r

a2

(∫ a1+r

a1

∂2f

∂x1∂x2(u, v) −

∂2f

∂x1∂x2(a)du

)dv

∣∣∣∣�∫ a2+r

a2

(∫ a1+r

a1

∣∣∣∣ ∂2f

∂x1∂x2(u, v) −

∂2f

∂x1∂x2(a)

∣∣∣∣ du

)dv

�∫ a2+r

a2

(∫ a1+r

a1

´

2du

)dv =

´

2r2,

soit

∣∣∣∣Ir − ∂2f

∂x1∂x2(a)r2

∣∣∣∣ � ´

2r2. De (2) on obtient que

∣∣∣∣Ir − ∂2f

∂x2∂x1(a)r2

∣∣∣∣ = ∣∣∣∣∫ a1+r

a1

(∫ a2+r

a2

∂2f

∂x2∂x1(u, v) −

∂2f

∂x2∂x1(a)dv

)du

∣∣∣∣ � ´

2r2.

Puisque r est strictement positif, il s’ensuit que∣∣∣∣ ∂2f

∂x1∂x2(a) − ∂2f

∂x2∂x1(a)

∣∣∣∣ = 1

r2

∣∣∣∣ ∂2f

∂x1∂x2(a)r2 − Ir + Ir − ∂2f

∂x2∂x1(a)r2

∣∣∣∣� 1

r2

∣∣∣∣ ∂2f

∂x1∂x2(a)r2 − Ir

∣∣∣∣ + 1

r2

∣∣∣∣Ir − ∂2f

∂x2∂x1(a)r2

∣∣∣∣ � ´.

Ainsi,

∣∣∣∣ ∂2f

∂x1∂x2(a) − ∂2f

∂x2∂x1(a)

∣∣∣∣ � ´, et cela pour tout réel ´ strictement positif. La conclusion en découle. ❑

Exercice 8. Équation d’ondeSoit c un réel non nul. Déterminer les fonctions f de classe C2 définies sur R2 vérifiant

∂2f∂x2

=1c2

∂2f∂t2

·

On posera x =u + v

2et t =

u − v2c

·

Solution. Soit f une fonction de classe C2 quelconque définie sur R2 et posons, pour tout

(u, v) ∈ R2, g(u, v) = f

(u + v

2,

u − v2c

). Il est clair que g est de classe C2. D’après la règle des

141

Page 149: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

chaînes, on a sur R2, avec les abus usuels de notations,

∂g∂u

=12

(∂f∂x

+1c∂f∂t

)∂g∂v

=12

(∂f∂x

− 1c∂f∂t

)et donc

4∂2g

∂u∂v=

∂x

(∂f∂x

− 1c∂f∂t

)+

1c

∂t

(∂f∂x

− 1c∂f∂t

)=

∂2f∂x2

+1c

(∂2f∂t∂x

− ∂2f∂x∂t

)− 1

c2∂2f∂t2

=∂2f∂x2

− 1c2

∂2f∂t2

·

En d’autres termes, si f est une solution du problème, alors∂2g

∂u∂v= 0. Il s’ensuit qu’il existe

une fonction c définie sur R, nécessairement de classe C1 telle que, pour tout (u, v) ∈ R2,∂g∂v

= c(v) et donc il existe deux fonctions définies sur R, nécessairement de classe C2, telles

que pour tout (u, v) ∈ R2

g(u, v) = F(u) + C(v).

Ainsi, puisque g (u, v) = f(

u + v2

,u − v

2c

), i.e. f (x, t) = g (x + ct, x − ct), pour tout (x, y) ∈ R2

f (x, t) = F (x + ct) + C (x − ct) .

Réciproquement, il est facile de vérifier que toute fonction (x, y) → F (x + ct) + C (x − ct),où F et C sont des fonctions réelles de classe C2 définies sur R, est une solution du problème.

5. Notation différentielle, formes différentielles

5.1 Notations

Soit V un ouvert non vide de Rn, a un élément de V et f une application réelle de

classe C1 définie sur V.Rappelons que le théorème 5 d’approximation affirme qu’il existe une application´ : Rn → R telle que lim

h→0´ (h) = 0 et telle pour h « assez petit »

f (a + h) = f (a) + 〈∇f (a), h〉 + ||h|| ´ (h) ,

ce que l’on notef (a + h) = f (a) + 〈∇f (a), h〉 + o

(||h||

).

L’application définie sur Rn par h → 〈∇f (a), h〉 est, de part la bilinéarité du produitscalaire, une application linéaire. Cette application est appelée différentielle de f au

142

Page 150: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notation différentielle, formes différentielles

point a. On la note df (a), ou Df (a) ; de même que pour les dérivées partielles, ilexiste encore d’autres notations. L’application df , qui est la différentielle de f , estl’application a → df (a) ; c’est donc une application de V dans L (Rn, R).

Par soucis de simplicité d’écriture, la valeur de df (a) en h ∈ Rn est notée df (a).h au

lieu de df (a)(h) ou pire — bien que ceci soit correct —(df (a)

)(h).

Un cas particulier concerne les applications projection pi. Dans ce cas, pour touta ∈ R

n,∇pi(a) = (0, . . . , 0, 1, 0, . . . , 0)

↑i-ème

,

et donc dpi(a) est l’application pi, c’est-à-dire l’application x → xi. Pour cela, on note,pour tout i ∈ �1, n�, dxi l’application linéaire définie sur Rn

dxi : (h1, . . . , hn) → hi

En résumé :

• la différentielle en a d’une fonction f de classe C1, est

df (a) : h →n∑

k=1

∂f∂xk

(a)hk

• le théorème d’approximation s’écrit

f (a + h) = f (a) + df (a).h + o(||h||

)• la différentielle de f est donnée par

df =n∑

k=1

∂f∂xk

× dxk

5.2 Formes différentielles

Dans ce paragraphe, V est un ouvert non vide de Rn. On notera de plus

B : (e1, . . . , en) la base canonique de Rn.

Définition 9

Une forme différentielle (d’ordre un) sur V est une application v à valeurs dansL (Rn, R) définie sur V par

v(x) =n∑

k=1

Pk(x) dxk,

où P1, . . . , Pn sont des fonctions réelles définies sur V.Lorsque P1, . . . , Pn sont des fonctions de classe Cp, avec p ∈ {0, 1, 2}, on dit que v estune forme différentielle de classe Cp.

143

Page 151: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

ExempleSi f est une fonction réelle de classe C1 définie sur V, alors v = df est une forme différentiellecontinue.

➤ Remarques• Avec les notations de la définition, pour tout a ∈ V et k ∈ �1, n�, on a v(a)(ek) = Pk(a), ce qui démontre

l’unicité des applications Pi . Les Pi sont les composantes de la forme.

• On notera encore v(a).h pour — la peu sémillante notation —(v(a))(h).

Définition 10

Soit v =n∑

k=1

Pk dxk une forme différentielle définie sur V.

1. On dit v est exacte lorsqu’il existe une fonction réelle f de classe C1 définie sur V

telle quev = df .

On dit alors que f est une primitive de v.

2. Lorsque v est de classe C1, on dit qu’elle est fermée lorsque pour tout (i, j) ∈ �1, n�

∂Pi

∂xj=

∂Pj

∂xi·

Exemples1. Lorsque n = 2, la forme différentielle v = P dx + Q dy de classe C1 définie sur V est

fermée si et seulement si∂P∂y

=∂Q∂x

·

2. Lorsque n = 3, la forme différentielle v = P dx + Q dy + R dz de classe C1 définie sur V

est fermée si et seulement si

∂P∂y

=∂Q∂x

;∂Q∂z

=∂R∂y

;∂R∂x

=∂P∂z

·

Proposition 4

Soit v une forme différentielle définie sur V de classe C1.Si v est exacte, alors v est fermée.La réciproque est fausse.

PreuveNotons P =

n∑k=1

Pk dxk. Si v est exacte, il existe une fonction réelle f au moins de classe C1 telle que v = df .

Par unicité des composantes d’une forme, on a, pour tout k ∈ �1, n�, Pk =∂f

∂k. Puisque v est de classe C1, f

est de classe C2. Ainsi, d’après le théorème de Schwarz (7), pour tout (i, j) ∈ �1, n�2

∂Pi

∂xj=

∂2f

∂xj∂xi=

∂2f

∂xi∂xj=

∂Pj

∂xi· ❑

144

Page 152: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notation différentielle, formes différentielles

5.3 Pourquoi s’intéresser aux formes exactes ?

Soit V un ouvert non vide de Rn.

Définition 11

Un champ de vecteurs de classe Cp, avec p ∈ {0, 1, 2} est une application X de V dansRn telle que les applications composantes Xi sont toutes de classe Cp.

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5−1.5

−1.0

−0.5

0.0

0.5

1.0

1.5

Figure 5.6 Le champ X : (x, y) �→ (−y,−x) visualisé à l’aide de Scilab

Il est clair que X →n∑

k=0

Xk dxk définit une bijection de l’ensemble des champs de

vecteurs de classe Cp sur V sur l’ensemble des formes différentielles de classe Cp

définies sur V.

En physique, on définit le travail dans le champ X le long d’un chemin (continu, declasse C1 par morceaux) g : [a, b] → V par

W =∫ b

a

⟨X(g(t)

), g′(t)

⟩dt =

∫ b

a

n∑k=1

Xk(g(t)

)g′

k(t) dt.

S’il existe une fonction f telle que ∇f = X, ou, ce qui revient au même — après avoiridentifié le champ X avec une forme différentielle v —, lorsque la forme différentielleassociée est exacte, on a

W =∫ b

a

n∑k=1

∂f∂xk

(g(t)

)g′

k(t) dt.

145

Page 153: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

D’après la proposition 5, on a donc

W =∫ b

a

n∑k=1

∂f∂xk

(g(t)

)g′

k(t) dt =∫ b

a

(f ◦ g

)′(t) dt = f(g(b)

)− f

(g(a)

).

Cela est la justification du principe utilisé en physique du fait que si un champ dérived’un potentiel (i.e. il existe f tel que X = ∇f ), le travail le long d’un chemin nedépend que des extrémités du chemin (et du potentiel f ).En particulier, le travail le long d’un chemin fermé g (i.e. g(a) = g(b)) est nul.L’exercice suivant montre que la réciproque de la proposition 4 est fausse.

Exercice 9.Soit V = R2 � {(0, 0)} et v la forme définie sur V par

v(x, y) =x dy − y dx

x2 + y2·

1. La forme différentielle v est-elle fermée ?

2. Calculer I =∫ 2p

0v(g (u)

).g′ (u) du, où g : u → (cos u, sin u).

3. Conclure.

Solution.

1. On vérifie que V est un ouvert. Ici, v = P dx + Q dy avec P : (x, y) → − yx2 + y2

et

Q : (x, y) → xx2 + y2 · La forme v est de classe C1 et pour tout (x, y) ∈ V

∂P∂y

(x, y) =y2 − x2(x2 + y2

)2 ;

∂Q∂x

(x, y) =y2 − x2(x2 + y2

)2 ·

La forme v est donc fermée.

2. On a facilement

I =∫ 2p

0v(g (u)

).g′ (u) du =

∫ 2p

0

(− sin u)(− sin u) + (cos u)(cos u)cos2 u + sin2 u

du = 2p.

3. La courbe g étant fermée et puisque I �= 0, la forme différentielle v ne peut pas êtreexacte.

5.4 Théorème de Poincaré

On vient de le voir, une propriété intéressante pour un champ de vecteurs est dedériver d’un potentiel, ou, en terme de formes différentielles, d’être exacte.

146

Page 154: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notation différentielle, formes différentielles

On le sait, calculer une primitive — c’est-à-dire déterminer si une forme est exacte— est une chose difficile.Une condition nécessaire pour qu’une forme différentielle soit exacte est qu’elle soitfermée, ce qui correspond à une condition facile à vérifier. Une réciproque seraitintéressante. On sait malheureusement que la réciproque est fausse. Cependant, ilexiste une réciproque partielle, que nous admettons sans démonstration.

Théorème 8 (Théorème de Poincaré)

Soit v une forme différentielle de classe C1, fermée sur V = I1 × · · · × In, où les Ik sontdes intervalles ouverts non vides. Alors v est exacte.

➤ Remarques• Le « forme géométrique » du domaine de v (à savoir un produit d’intervalles) est une hypothèse importante.

• On trouvera, en exercice, une démonstration dans le cas n = 2, utilisant le théorème de Fubini.

• Le théorème de Poincaré assure que toute forme différentielle fermée est localement exacte. Par exemple, on

sait que la forme v(x, y) =x dy − y dx

x2 + y2n’est pas exacte sur V = R2 � {(0, 0)} ; elle est en revanche exacte

sur V′ = R∗+ × R. Le lecteur vérifiera que f : (x, y) �→ Arctan

( y

x

)en est une primitive.

147

Page 155: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Déterminer si la fonction f définie sur R2

� {(0, 0)} admet un prolongement parcontinuité en (0, 0) et si oui, le prolongement est-il de classe C1 ?

a) f (x, y) =x2y2

x2 + xy + y2

b) f (x, y) =x3 − y3

x2 + y2

c) f (x, y) =x2y2

x4 + y4

2. Soit f une fonction réelle de classe C2 définie sur R. On pose

g(x, y) =

⎧⎨⎩f (x) − f (y)

x − y, si x �= y ;

f ′(x), sinon.

1. Montrer que g est de classe C1 sur R2 � D, où D = {(x, x) |x ∈ R}.

2. Montrer que g est de classe C1 sur R2. On utilisera la formule de Taylor-Lagrange.

3. Équation d’EulerOn dit que f : Rn → R, est homogène de degré a, où a est un réel, lorsque, pour toutx ∈ R

n et t ∈ R∗+, f (tx) = taf (x).

Montrer qu’une fonction de classe C1 définie sur Rn est homogène de degré a si et seulement

si pour tout x ∈ Rn

n∑k=1

xk∂f∂xk

(x) = af (x).

4. LaplacienSoit V un ouvert non vide R

n. On définit, lorsque f : V → R est une fonction de classe C2,

Df (x) =n∑

k=1

∂2f∂x2

k(x).

1. Calculer Df , lorsque w : R∗+ → R est une fonction de classe C2 et f : x → w

(||x||

).

2. On suppose n = 3 et soit l ∈ R. Déterminer les fonctions f de la forme f : x → w(||x||

)vérifiant Df = lf . On montrera que t → tw(t) est une solution d’une équation différentiellesimple.

5. Déterminer les extrema locaux et globaux sur R2 de

1. f : (x, y) → x3 + xy + y3

148

Page 156: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

2. f : (x, y) → w(x) + c(y), où w : R → R et c : R → R sont des fonctions de classe C2.On suppose que w′ ne s’annule qu’en a et que w′′(a) �= 0 ; on suppose de même que c′ nes’annule qu’en b et que c′′(b) �= 0.

3. f (x, y) = x2 + 2axy + y2 + 2bx + 2gy, où (a, b, g) ∈ R3.

6. Le plan P est muni d’un repère R(O,�ı,�j).

1. Pour tout u ∈ [0, 2p], on pose A(u) le point de coordonnées(

cos u, sin u). Pour tout u et

u′ vérifiant 0 � u � u′ � 2p, calculer f(u, u′) le périmètre du triangle A(0)A(u)A(u′).

2. Déterminer les triangle inscrit dans un cercle de périmètre maximal. On admettra qu’ilexiste au moins un tel triangle.

7. Un exemple dû à F. RieszSoit f la fonction définie sur R2 par

f (x, y) =

⎧⎨⎩ xyx2 − y2

x2 + y2 , si (x, y) �= (0, 0) ;

0, sinon.

1. Montrer que f est de classe C1.

2. Calculer∂2f

∂x∂y(0, 0) et

∂2f∂y∂x

(0, 0).

3. Conclusion ?

8. Soit V = R∗+ × R.

Déterminer les fonctions réelles f de classe C2 définies sur V vérifiant

x2 ∂2f∂x2

+ 2xy∂2f

∂x∂y+ y2 ∂2f

∂y2= 0.

On posera x = u et y = uv.

9. Régression linéairePour tout entier naturel non nul n et pour tout (X, Y ) ∈ (Rn)2, on pose par analogie avec lesprobabilités les notations

m(X) =1n

n∑k=1

xk ; s2(X) =1n

n∑k=1

(xk − m(X)

)2 =

(1n

n∑k=1

x2k

)− m(X)2

g(X, Y ) =1n

n∑k=1

(xk − m(X)

)(yk − m(Y )

)=

(1n

n∑k=1

xkyk

)− m(X)m(Y ),

où X = (x1, . . . , xn) et Y = (y1, . . . , yn). On pose enfin X =(x1 − m(X), . . . , xn − m(X)

).

149

Page 157: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions réelles de plusieurs variables

On se donne n points M1, . . . , Mn dont les abscisses ne sont pas toutes égales, avec n � 2. Onnote Mi (xi, yi), pour tout i ∈ �i, n� et on pose pour tout (a, b) ∈ R

2

f (a, b) =n∑

i=1

(yi − axi − b)2 .

Montrer que f (a, b) = s2(Y − aX

)+(b + am(X) − m(Y )

)2.

Montrer que f admet un unique minimum global, à déterminer.Écrire une fonction Scilab donnant le couple (a, b).La droite D d’équation Y = a0X + b0 dans la base canonique, où (a0, b0) est le minimum de f ,est la droite de régression de y en x.

10. Cas particulier du théorème de PoincaréSoit v = P dx + Q dy une forme différentielle, fermée et continue sur R

2.

1. Vérifier que pour tout (x, y) ∈ R2∫ x

0

(∫ y

0

∂P∂y

(u, v) dv)

du =∫ x

0

(P(u, y) − P(u, 0)

)du =

∫ y

0

(Q(x, v) − Q(0, v)

)dv

2. Montrer que l’application F définie sur R2 par

F(x, y) =∫ y

0Q(x, v) dv +

∫ x

0P(u, 0) du

vérifie dF = v.

150

Page 158: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

6Extensionsde la notion d’intégrale

Dans tout ce qui précède, la notion d’intégrale est définie pour des fonctions réellesd’une variable réelle, définies et continues sur un intervalle fermé borné de R, ou desréunions de tels intervalles. Dans ce cas particulièrement simple, la notion d’intégralen’apporte rien de vraiment nouveau par rapport à la notion de primitive.Il existe beaucoup d’extensions de la notion d’intégrale. Dans le présent chapitre onétudie l’extension de la notion à des fonctions définies sur un intervalle semi-ouvert,ou ouvert de R, puis à des fonctions réelles de deux variables réelles.

1. L’intégrale impropre∫ +∞

af(t)dt

1.1 Définitions

Soient a ∈ R et f une fonction continue de [a, +∞[ dans R. On sait que l’application

F : x ∈ [a, +∞[ →∫ x

af (t)dt est la primitive de f sur [a, +∞[ qui s’annule au point a.

Cette primitive peut ou non admettre une limite lorsque x tend vers plus l’infini. Ondonne alors les définitions suivantes

Définition 1

Soient a ∈ R et f une application continue de [a, +∞[ dans R.

• On dit que l’intégrale impropre∫ +∞

af (t)dt converge si l’application

F : x ∈ [a, +∞[ →∫ x

af (t)dt, admet une limite finie l lorsque x tend vers

plus l’infini, on note alors :∫ +∞

af (t)dt = l.

On dit aussi que l’intégrale existe, ou encore, qu’elle a un sens.

Page 159: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

• On dit que l’intégrale impropre∫ +∞

af (t)dt diverge si l’application

F : x ∈ [a, +∞[ →∫ x

af (t)dt n’admet pas de limite finie lorsque x tend

vers plus l’infini.

On dit aussi que l’intégrale∫ +∞

af (t)dt n’existe pas, ou encore, qu’elle n’a pas de sens.

➤ Remarques• Attention

Une même notation :∫ +∞

af (t)dt est utilisée comme symbole abstrait, (énoncé raccourci de la question : la

fonction : x ∈ [a, +∞[ �→∫ x

af (t)dt a-t-elle une limite finie lorsque x tend vers plus l’infini), et aussi pour

désigner, lorsqu’elle existe, limx→+∞

∫ x

af (t)dt. Il est clair que l’on peut additionner ou multiplier des réels, c’est

à dire lorsqu’elles existent, les valeurs des intégrales généralisées, mais pas des symboles ! On note ici unedifférence par rapport aux notions sur les séries : le symbole est noté

∑an, et dans le cas où la série converge,

sa somme est notée+∞∑n=0

an.

• Certains auteurs parlent d’intégrales généralisées au lieu d’intégrales impropres, la nature de l’intégrale est soncaractère convergent ou divergent.

• L’intégrale est divergente si F admet une limite infinie (voir ci dessous l’exemple 4), ou si F n’admet de limite nifinie ni infinie (voir ci dessous l’exemple 2), lorsque x tend vers plus l’infini .

Exemples

1.∫ +∞

0

11 + t2

dt.

Pour tout x ∈ [0, +∞[,∫ x

0

11 + t2

dt = Arctan x on a limx→+∞

Arctan x = p/2, l’intégrale∫ +∞

0

11 + t2

dt est donc convergente et de plus∫ +∞

0

11 + t2

dt = p/2.

2.∫ +∞

0sin tdt.

Pour tout x ∈ [0, +∞[,∫ x

0sin tdt = 1 − cos x, et la fonction x → 1 − cos x n’a pas de

limite lorsque x tend vers l’infini, l’intégrale impropre étudiée n’est donc pas convergente.

3.∫ +∞

0e−ltdt.

Si l �= 0, pour tout x ∈ [0, +∞[,∫ x

0e−ltdt =

1l

(1 − e−lx).

• Si l > 0, limx→+∞

(1 − e−lx) = 1, l’intégrale∫ +∞

0e−ltdt est convergente et∫ +∞

0e−ltdt =

1l·

152

Page 160: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’intégrale impropre∫ +∞

af (t)dt

• Si l < 0, limx→+∞

e−lx = +∞, l’intégrale impropre étudiée diverge.

• Si l = 0,∫ x

0dt = x et l’intégrale impropre étudiée diverge.

En résumé∫ +∞

0e−ltdt converge si et seulement si l > 0 on a alors

∫ +∞

0e−ltdt =

1l·

4.∫ +∞

1

1√tdt·

Pour tout x ∈ [0, +∞[,∫ x

1

1√tdt = 2(

√x − 1) et lim

x→+∞

√x = +∞, l’intégrale impropre

étudiée n’est donc pas convergente.

➤ RemarqueDans tous ces exemples, l’étude de l’intégrale impropre est aisée, car on a pu exprimer F à l’aide des « fonctionsusuelles », il n’en est pas toujours ainsi ; dans la suite nous allons rencontrer des critères simples permettantd’étudier la nature d’une intégrale impropre sans avoir besoin d’expliciter F à l’aide des fonctions usuelles.

1.2 Premières propriétés

Proposition 1 (Relation de Chasles)

Soient a ∈ R et f une fonction continue de [a, +∞[ dans R , pour tout c de la demi-

droite [a, +∞[ l’intégrale impropre∫ +∞

af (t)dt converge si et seulement si

∫ +∞

cf (t)dt

converge, on a alors : ∫ +∞

af (t)dt =

∫ c

af (t)dt +

∫ +∞

cf (t)dt

PreuvePour tout x ∈ [a, +∞[,

∫ x

af (t)dt =

∫ c

af (t)dt +

∫ x

cf (t)dt, donc

∫ x

af (t)dt a une limite finie lorsque x tend vers

l’infini si et seulement si∫ x

cf (t)dt a une limite finie lorsque x tend vers l’infini, on a alors

∫ +∞

af (t)dt =

∫ c

af (t)dt +

∫ +∞

cf (t)dt

Nous aurons très souvent recours à cette propriété, car un « bon choix » de c peut

rendre l’étude de∫ +∞

cf (t)dt plus simple que celle de

∫ +∞

af (t)dt.

153

Page 161: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Proposition 2

L’ensemble des fonctions continues de [a, +∞[ dans R dont l’intégrale sur [a, +∞[converge est un sous espace vectoriel de l’espace des fonctions continues de [a, +∞[ dans

R et l’application f →∫ +∞

af (t)dt est une forme linéaire sur ce sous espace.

PreuveL’ensemble des fonctions continues de [a, +∞[ dans R dont l’intégrale sur [a, +∞[ converge n’est pas vide, ilcontient la fonction : t ∈ [a, +∞[ �→ 0.

Soient f, g deux fonctions continues de [a, +∞[ dans R dont l’intégrale sur [a, +∞[ converge. Quels que soientles réels l et m , d’après les propriétés de linéarité des limites, on a∫ x

a

(lf (t) + mg(t)

)dt = l

∫ x

af (t)dt + m

∫ x

ag(t)dt,

on en déduit que

limx→+∞

∫ x

a

(lf (t) + mg(t)

)dt = l

∫ +∞

af (t)dt + m

∫ +∞

ag(t)dt,

ainsi ∫ +∞

a

(lf(t) + mg(t)

)dt = l

∫ +∞

af(t)dt + m

∫ +∞

ag(t)dt.

Proposition 3

Soient a ∈ R et f une fonction continue de [a, +∞[ dans R, telle que∫ +∞

af (t)dt

converge. Si f admet en plus l’infini, une limite finie l, une condition nécessaire pour

que∫ +∞

af (t)dt converge est que l = 0.

PreuveSi l �= 0, quitte à changer f en −f , on peut supposer l > 0. Il existe alors un réel c tel que

∀t � c, f (t) � l

2, et ∀x � c,

∫ x

cf (t)dt �

∫ x

c

l

2dt, on a

∫ x

c

l

2dt =

l

2(x − c), et lim

x→+∞x − c = +∞,

l’intégrale n’est donc pas convergente. ❑

➤ Remarques• Attention

Si limt→+∞

f (t) = 0, on ne peut rien dire au sujet de la convergence de∫ +∞

af (t)dt. Voici deux exemples bien

simples :

1.∫ +∞

1

1

tdt, pour tout x ∈ [1, +∞[,

∫ x

1

1

tdt = ln x, donc l’intégrale impropre étudiée diverge.

2.∫ +∞

1

1

t2dt, pour tout x ∈ [1, +∞[,

∫ x

1

1

t2dt = 1− 1

x, et lim

x→+∞1

x= 0, donc l’intégrale impropre étudiée

converge.

• Il existe des fonctions continues f de [a, +∞[ dans R telles que :1. f n’a pas de limite à l’ infini ;

2.∫ +∞

af (t)dt converge.

comme le montre l’exemple ci-dessous :

154

Page 162: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’intégrale impropre∫ +∞

af (t)dt

Exemple

On considère la fonction f : [34

, +∞[ → R définie de la façon suivante :⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩f (t) = 4nn2

(t − (n − 1

4n))

si t ∈ [n − 14n

, n], n ∈ N∗

f (t) = 4nn2

((n +

14n

) − t)

si t ∈ [n, n +14n

], n ∈ N∗

f (t) = 0 sinon

On trouvera ci-après une partie de la représentation graphique de la fonction f .

Ox

y

n2

nn − 14n

n +14n

Tn

Figure 6.1 Graphe de f

On note que la fonction f n’a pas de limite à l’infini, et même, qu’aux points de coordonnéesentières, elle est « grande » (f (n) = n2).

On a∫ n+ 1

4n

34

f (t)dt =n∑

k=1

∫ k+ 14k

k− 14k

f (t)dt

Or,∫ k+ 1

4k

k− 14k

f (t)dt est égale à l’aire de Tk soitk2

4k,

on en déduit que∫ n+ 1

4n

34

f (t)dt =n∑

k=1

k2

4k.

Étudions la nature de la série∑n�1

n2

4n. On sait que lim

n→+∞

n2

2n= 0, il existe donc n0 ∈ N tel que

pour tout n � n0,n2

4n� 1

2n.

Or, la série géométrique∑n�1

12n

est convergente et par comparaison la série∑n�1

n2

4nconverge.

155

Page 163: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Pour tout réel x ∈ [34

, +∞[, il existe un entier n tel que x �(

n +14n

)ainsi∫ x

34

f (t)dt �∫ n+ 1

4n

34

f (t)dt �+∞∑n=1

n2

4n

l’intégrale∫ +∞

34

f (t)dt est donc convergente. (Voir ci-dessous le théorème 1.)

En résumé, la condition limt→+∞

f (t) = 0 est une condition ni nécessaire, ni suffi-

sante pour que∫ +∞

af (t)dt converge.

1.3 Cas d’une fonction à valeurs positives

Théorème 1

Soient a ∈ R et f une fonction continue positive de [a, +∞[ dans R,∫ +∞

af (t)dt converge

si et seulement si l’application F : x ∈ [a, +∞[ →∫ x

af (t)dt est majorée. On a alors

∫ +∞

af (t)dt = sup

a�x<+∞F(x)

PreuveSi f est à valeurs positives sur [a, +∞[, l’application F est monotone croissante et l’on sait que :

� ou bien elle est majorée sur [a, +∞[, elle admet alors une limite finie lorsque x tend vers l’infini :l = sup

a�x<+∞F(x).

� ou bien elle n’est pas majorée sur [a, +∞[, et limx→+∞

F(x) = +∞. ❑

Proposition 4

Soient a ∈ R et f une fonction continue positive de [a, +∞[ dans R, telle que∫ +∞

af (t)dt

converge, alors∫ +∞

af (t)dt � 0 et

∫ +∞

af (t)dt = 0 si et seulement si f = 0.

PreuvePour tout x ∈ [a, +∞[, on sait que

∫ x

af (t)dt � 0.

Par passage à la limite, on a donc∫ +∞

af (t)dt � 0.

Supposons que∫ +∞

af (t)dt = 0. Sachant que

∫ x

af (t)dt �

∫ +∞

af (t)dt, on a alors pour tout x ∈ [a, +∞[,∫ x

af (t)dt = 0 et, puisque f est continue positive, ∀t ∈ [a, x], f (t) = 0 c’est-à-dire f = 0. ❑

156

Page 164: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’intégrale impropre∫ +∞

af (t)dt

Théorème 2 (Critères de comparaison)

Soient f et g deux applications continues de [a, +∞[ dans [0, +∞[ telles que 0 � f � g.

• Si∫ +∞

ag(t)dt converge, alors

∫ +∞

af (t)dt converge et

∫ +∞

af (t)dt �

∫ +∞

ag(t)dt

• Si∫ +∞

af (t)dt diverge , alors

∫ +∞

ag(t)dt diverge.

Preuve

� Si∫ +∞

ag(t)dt converge, pour tout x ∈ [a, +∞[, on a

∫ x

af (t)dt �

∫ x

ag(t)dt �

∫ +∞

ag(t)dt.

D’après les critères de comparaison,∫ +∞

af (t)dt converge et, par passage à la limite des inégalités, on a :∫ +∞

af (t)dt �

∫ +∞

ag(t)dt.

� Pour tout x ∈ [a, +∞[,∫ x

ag(t)dt �

∫ x

af (t)dt. Si

∫ +∞

af (t)dt diverge, lim

x→+∞

∫ x

af (t)dt = +∞ donc

limx→+∞

∫ x

ag(t)dt = +∞, l’intégrale impropre diverge. ❑

➤ Remarques• Si la fonction f est négative sur [a, +∞[, on appliquera les résultats précédents à la fonction−f .

• Il se peut que f ne soit pas positive sur toute la demi droite [a, +∞[, mais qu’elle reste positive « au voisinagede l’infini », il existe alors c ∈ [a, +∞[ tel que pour tout t ∈ [c, +∞[, f (t) � 0, on pourra utiliser les théorèmes

précédents pour déterminer la nature de∫ +∞

cf (t)dt et conclure ensuite grâce à la relation de Chasles.

• Soient f et g deux applications continues de [a, +∞[ dans R vérifiant l’hypothèse suivante : il existe un réel A tel

que ∀t ∈ [A, +∞[, 0 � f (t) � g(t). Si∫ +∞

ag(t)dt converge,

∫ +∞

af (t)dt converge et si

∫ +∞

af (t)dt diverge,

alors∫ +∞

ag(t)dt diverge.

Le lecteur vérifiera ce résultat en utilisant la relation de Chasles : F(x) =

∫ A

af (t)dt +

∫ x

Af (t)dt, et

G(x) =

∫ A

ag(t)dt +

∫ x

Ag(t)dt , et en appliquant le précédent théorème de comparaison.

• Intégrales dites « de Riemann »Pour appliquer les théorèmes de comparaison, on fait très souvent appel à des intégrales impropresde référence, en particulier à celles qui font intervenir les fonctions « dites fonctions de Riemann » :

t ∈ [1, +∞[ �→ 1

ta·, et dont la nature fait l’objet des lignes qui suivent.

– Si a �= 1, pour tout x ∈ [1, +∞[, on a∫ x

1

1

tadt =

1

1 − a(x1−a − 1),

∫ +∞

1

1

tadt converge si et seulement

si a > 1, et, dans ce cas∫ +∞

1

1

tadt =

1

a − 1·

– Si a = 1, pour tout x ∈ [1, +∞[,∫ x

1

dt

t= ln x, l’intégrale est donc divergente.

157

Page 165: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Exercice 1.

Étudier la nature de∫ +∞

1

(ln tt

)2

dt.

L’application t ∈ [1, +∞[ →(

ln tt

)2

est continue, positive et limt→+∞

(ln t)2√t

= 0, il

existe donc un réel A tel que ∀t ∈ [A, +∞[, (ln t)2 �√

t, donc pour tout t � A on

a(

ln tt

)2

� 1t3/2

, le calcul montre que∫ +∞

1

1t3/2

dt = 2 ,∫ +∞

1

(ln tt

)2

dt est donc

convergente.

➤ RemarqueAttention ! En dépit de sa simplicité, l’étude systématique des intégrales impropres des fonctions de Riemannne figure pas au programme de la classe. On devra donc, chaque fois que l’on utilise une comparaison avec unefonction de Riemann, ne pas omettre de refaire les calculs permettant (comme à la quatrième remarque ci-dessus)de déterminer la nature de l’intégrale impropre de Riemann que l’on est conduit à utiliser.

Corollaire 1

Si f et g sont deux applications continues de [a, +∞[ dans [0, +∞[ telles que f (t) ∼+∞

g(t),

alors∫ +∞

af (t)dt et

∫ +∞

ag(t)dt sont de même nature.

PreuveLes fonctions f et g étant équivalentes au voisinage de l’infini, on sait qu’il existe c ∈ [a, +∞[ tel que pour tout

t � c, 0 � 1

2g(t) � f (t) � 3

2g(t).

� Si∫ +∞

ag(t)dt converge, d’après la relation de Chasles,

∫ +∞

cg(t)dt converge et pour tout

t � c, f (t) � 3

2g(t), donc

∫ +∞

cf (t)dt converge et

∫ +∞

af (t)dt converge.

� Si∫ +∞

ag(t)dt diverge, d’après la relation de Chasles,

∫ +∞

cg(t)dt diverge et pour tout t � c, f (t) � 1

2g(t),

donc∫ +∞

cf (t)dt diverge de même que

∫ +∞

af (t)dt. ❑

Corollaire 2

Soient f et g deux applications continues de [a, +∞[ dans [0, +∞[ telles que

f (x) = o+∞

(g(x)), si∫ +∞

ag(t)dt converge, alors

∫ +∞

af (t)dt converge.

PreuvePuisque f (x) = o

+∞(g(x)), il existe un réel A tel que ∀t ∈ [A, +∞[, 0 � f (t) � g(t), il suffit alors d’appliquer le

résultat de la remarque ci-dessus. ❑

158

Page 166: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’intégrale impropre∫ +∞

af (t)dt

➤ RemarqueAttention ! Il est important d’avoir ces deux corollaires présents à l’esprit lorsque l’on veut étudier une intégraleimpropre, cependant ils ne figurent pas au programme de la classe, il faudra donc les démontrer dans chaque casparticulier où l’on sera amené à les utiliser.

1.4 Thème d’étude : comparaison série-intégrale

Soit f une fonction continue, positive, monotone décroissante sur [0, +∞[ , on se

propose de comparer la nature de la série∑n�0

f (n) et celle de l’intégrale∫ +∞

0f (t)dt.

On peut en effet remarquer quen∑

k=0

f (k) =∫ n+1

0g(t)dt, la fonction g étant la fonc-

tion en escalier définie de la façon suivante : pour tout k ∈ �0, n� et pour toutt ∈ [k, k + 1[ g(t) = f (k), et g(n + 1) = f (n + 1).

Exercice 2. LemmeSoient a un réel, F : [a, +∞[ → R une fonction continue monotone croissante, et (xn) unesuite de réels de [a, +∞[ strictement croissante telle que lim

n→+∞xn = +∞, alors F a une limite

finie l lorsque x tend vers l’infini si et seulement si la suite (F(xn)) converge.

Solution. Nous savons déjà que, si limx→+∞

F(x) = l, alors limn→+∞

F(xn) = l.

Prouvons que la réciproque est vraie.D’après les hypothèses, pour tout x ∈ [a, +∞[ , il existe un indice n tel que xn � x < xn+1,donc F(xn) � F(x) � F(xn+1) ; lorsque x tend vers l’infini, il en va de même de xn et de xn+1,donc lim

x→+∞F(x) = lim

n→+∞F(xn).

Exercice 3. Théorème de comparaisonSoit f : [0, +∞[ → R une fonction continue, positive, monotone décroissante. Prouver que

1. La série∑n�0

(f (n) −

∫ n+1

nf (t)dt

)est convergente ;

2. La série∑n�0

f (n) et l’intégrale∫ +∞

0f (t)dt sont de même nature.

Solution. La fonction f est monotone décroissante, minorée par 0, elle admet donc à l’infini,une limite finie l � 0.

Pour tout n ∈ N et pour tout t ∈ [n, n + 1[, on a : f (n + 1) � f (t) � f (n), et donc∫ n+1

nf (n + 1)dt �

∫ n+1

nf (t)dt �

∫ n+1

nf (n)dt

soit f (n + 1) �∫ n+1

nf (t)dt � f (n).

159

Page 167: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Pour tout n ∈ N, posons un = f (n) −∫ n+1

nf (t)dt. D’après les inégalités précédentes, on a

0 � un � f (n) − f (n + 1).

On sait que limt→+∞

f (t) = l, la série télescopique∑n�0

(f (n) − f (n + 1)) est donc convergente de

même que la série∑n�0

un.

Posonsn∑

k=0

f (k) = Sn et∫ n

0f (t)dt = In,

on an∑

k=0

uk = Sn − In+1 et 0 �n∑

k=0

uk �n∑

k=0

(f (k) − f (k + 1)),

soit :In � In+1 � Sn � In+1 + f (0) − f (n + 1) � In+1 + f (0).

Ce sont ces inégalités qu’il faut savoir démontrer en vue d’exercices d’application.

Posons+∞∑n=0

un = C.

On a Sn − In+1 = C + o+∞

(1), Sn+1 − In+1 = C + f (n + 1) + o+∞

(1) = C + l + o+∞

(1),

on en déduit que Sn a une limite finie lorsque n tend vers l’infini si et seulement si In a unelimite finie lorsque n tend vers l’infini.

On peut appliquer le résultat de l’exercice précédent à la fonction x ∈ [0, +∞[ →∫ x

0f (t)dt,

ainsi la série∑n�0

f (n) converge si et seulement si l’intégrale∫ +∞

0f (t)dt converge.

Il est important de noter que, si la série et l’intégrale divergent, Sn et In tendent tous lesdeux vers +∞ lorsque n tend vers l’infini mais que leur différence admet une limitefinie lorsque n tend vers l’infini.

➤ RemarqueOn peut utiliser les résultats précédents si f : [a, +∞[ �→ R est une fonction continue, positive, monotonedécroissante, il suffit pour cela de définir la fonction g par g : u ∈ [0, +∞[ �→ g(u) = f (u + a), la fonction g vérifiealors les hypothèses du théorème.

1.5 L’intégrale impropre∫ a

−∞f (t)dt

Définition 2

Soient a ∈ R et f une application continue de ]−∞, a] dans R.

• On dit que l’intégrale impropre∫ a

−∞f (t)dt converge si l’application

F : x ∈ ]−∞, a] →∫ a

xf (t)dt, admet une limite finie l′ lorsque x tend vers

160

Page 168: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’ intégrale impropre∫ b

af (t)dt

moins l’infini, on note alors ∫ a

−∞f (t)dt = l′

On dit aussi que l’intégrale existe, ou encore, qu’elle a un sens.

• On dit que l’intégrale impropre∫ a

−∞f (t)dt diverge si l’application

F : x ∈ ]−∞, a] →∫ a

xf (t)dt n’admet pas de limite finie lorsque x tend

vers moins l’infini. On dit aussi que l’intégrale∫ a

−∞f (t)dt n’existe pas, ou encore,

qu’elle n’a pas de sens.

L’étude de l’intégrale∫ a

−∞f (t)dt se ramène à celle de

∫ +∞

−af (−u)du en utilisant le

changement de variable u = −t.

2. L’ intégrale impropre∫ b

af(t)dt

2.1 Définitions

Soient (a, b) ∈ R2 (avec a < b) et f une fonction continue de [a, b[ dans R. On sait

que l’application F : x ∈ [a, b[ →∫ x

af (t)dt est la primitive de f sur [a, b[ qui s’annule

en a.Si la fonction f admet une limite finie en b, en accord avec les théorèmes généraux,l’intégrale de f sur [a, b[ sera égale à l’intégrale de son prolongement par continuitésur [a, b].Si la fonction f admet une limite infinie, ou n’admet pas de limite en b, la primitive Fpeut ou non admettre une limite lorsque x tend vers b. On donne alors les définitionssuivantes

Définition 3

Soient [a, b[ un intervalle de R et f une application continue de [a, b[ dans R telle que fadmet une limite infinie, ou n’admet pas de limite en b.

• On dit que l’intégrale impropre∫ b

af (t)dt converge si l’application

F : x ∈ [a, b[ →∫ x

af (t)dt, admet une limite finie l lorsque x tend vers b,

on note alors :∫ b

af (t)dt = l.

On dit aussi que l’intégrale impropre∫ b

af (t)dt existe, ou encore, qu’elle a un sens.

161

Page 169: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

• On dit que l’intégrale impropre∫ b

af (t)dt diverge si l’application

F : x ∈ [a, b[ →∫ x

af (t)dt n’admet pas de limite finie lorsque x tend vers b.

On dit aussi que l’intégrale impropre∫ b

af (t)dt n’existe pas, ou encore, qu’elle n’a pas

de sens.

➤ Remarques

• Attention ! Comme dans ce qui précède, une même notation :∫ b

af (t)dt peut être utilisée comme symbole

abstrait, (énoncé raccourci de la question : la fonction : x ∈ [a, b[ �→∫ x

af (t)dt a-t-elle une limite finie lorsque

x tend vers b), et aussi pour désigner cette limite, lorsqu’elle existe. Il est clair que l’on peut additionner oumultiplier des réels, c’est à dire lorsqu’elles existent, les valeurs des intégrales généralisées, mais pas dessymboles !

• Insistons sur le fait que, si la fonction f possède une limite finie au point b, elle admet un prolongement par

continuité f sur [a, b] et l’on sait que∫ b

af (t)dt =

∫ b

af (t)dt, la fonction : x ∈ [a, b] �→

∫ x

af (t)dt est continue

et pour tout x ∈ [a, b[, on a∫ x

af (t)dt =

∫ x

af (t)dt, donc l’intégrale impropre

∫ b

af (t)dt converge et sa valeur

est égale à∫ b

af (t)dt.

Dans ce cas, on dit parfois que l’intégrale étudiée est « faussement impropre ».

• Certains auteurs parlent d’intégrales généralisées au lieu d’intégrales impropres, la nature de l’intégrale est soncaractère convergent ou divergent.

• À la section précédente, l’intégrale est généralisée parce que l’intervalle considéré n’est pas borné, ici, l’intégraleest généralisée parce que la fonction considérée sur [a, b[ n’admet pas de limite finie au point b. Avant de selancer dans quelque étude que c e soit, il est bon de vérifier que l’intégrale que l’on va étudier est vraimentimpropre.

Exemples

1. Étudions :∫ 1

0

1√1 − t2

dt.

Pour tout x ∈ [0, 1[ ,∫ x

0

1√1 − t2

dt = Arcsin x.

L’intégrale impropre∫ 1

0

1√1 − t2

dt converge, et de plus,

∫ 1

0

1√1 − t2

dt = p/2.

2. Étudions∫ p/2

0tan t dt.∫ x

0tan t dt = − ln(cos x) et lim

x→p/2ln(cos x) = −∞

L’intégrale impropre∫ p/2

0tan t dt est donc divergente.

162

Page 170: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’ intégrale impropre∫ b

af (t)dt

➤ RemarqueDans ces exemples, l’étude de l’intégrale impropre est aisée, car on a pu exprimer F à l’aide des « fonctionsusuelles », il n’en est pas toujours ainsi ; dans la suite nous allons rencontrer des critères simples permettantd’étudier la nature d’une intégrale impropre sans avoir besoin d’expliciter F à l’aide des fonctions usuelles.

2.2 Premières propriétés

Proposition 5 (La relation de Chasles)

Soient [a, b[ un intervalle de R et f une fonction continue de [a, b[ dans R, pour tous c et x

de l’intervalle [a, b[, on a∫ x

af (t)dt =

∫ c

af (t)dt +

∫ x

cf (t)dt, l’intégrale impropre

∫ b

af (t)dt

converge si et seulement si∫ b

cf (t)dt converge et dans ce cas

∫ b

af (t)dt =

∫ c

af (t)dt +

∫ b

cf (t)dt.

Proposition 6

L’ensemble des fonctions continues de [a, b[ dans R dont l’intégrale sur [a, b[ converge estun sous espace vectoriel de l’espace des fonctions continues de [a, b[ dans R et l’application

f →∫ b

af (t)dt est une forme linéaire sur ce sous espace.

PreuveLes démonstrations de ces deux propositions sont tout à fait analogues aux démonstrations des propositionscorrespondantes du 1.1.2 en remplaçant +∞ par b. Nous laissons le soin au lecteur de les réécrire. ❑

2.3 Cas d’une fonction f à valeurs positives sur [a, b[

Théorème 3

Soient [a, b[ un intervalle de R et f une fonction continue positive de [a, b[ dans R,∫ b

af (t)dt converge si et seulement si l’application F : x ∈ [a, b[ →

∫ x

af (t)dt est majorée,

on a alors ∫ b

af (t)dt = sup

a�x<bF(x).

PreuveSi f est à valeurs positives sur [a, b[, l’application F est monotone croissante et l’on sait que :

� ou bien elle est majorée sur [a, b[, elle admet alors une limite au point b : l = supa�x<b

F(x);

� ou bien elle n’est pas majorée sur [a, b[ et limx→b

F(x) = +∞. ❑

163

Page 171: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Proposition 7

Soient a ∈ R et f une fonction continue positive de [a, b[ dans R, telle que∫ b

af (t)dt

converge, alors∫ b

af (t)dt � 0 et

∫ b

af (t)dt = 0 si et seulement si f = 0.

PreuveLa démonstration de cette proposition est tout à fait analogue à la démonstration de la proposition correspon-dante rencontrée plus haut. Nous laissons le soin au lecteur de la réécrire. ❑

Théorème 4 (Critères de comparaison)

Soient f et g deux applications continues de [a, b[ dans [0,∞[ telles que 0 � f � g.

• Si∫ b

ag(t)dt converge,

∫ b

af (t)dt converge et

∫ b

af (t)dt �

∫ b

ag(t)dt;

• Si∫ b

af (t)dt diverge , alors

∫ b

ag(t)dt diverge.

PreuveLà encore, la démonstration de cet théorème est tout à fait analogue à la démonstration du théorème corres-pondant rencontré plus haut. Nous laissons le soin au lecteur de la réécrire. ❑

➤ Remarques• Si la fonction f est négative sur [a, b[, on appliquera les résultats précédents à la fonction−f .

• Il se peut que f ne soit pas positive sur tout l’intervalle [a, b[, mais qu’elle reste positive « au voisinage de b »,il existe alors c ∈ [a, b[ tel que pour tout t ∈ [c, b[ , f (t) � 0, on pourra utiliser les théorèmes précédents pour

déterminer la nature de∫ b

cf (t)dt et conclure ensuite grâce à la relation de Chasles.

• Soient f et g deux applications continues de [a, b[ dans R vérifiant l’hypothèse suivante : il existe un réelc ∈ [a, b[ tel que ∀t ∈ [c, b[ , 0 � f (t) � g(t).

Si∫ b

cg(t)dt converge,

∫ b

af (t)dt converge et si

∫ b

cf (t)dt diverge, alors

∫ b

ag(t)dt diverge.

Le lecteur vérifiera ce résultat en utilisant la relation de Chasles, et en appliquant le précédent théorème decomparaison.

• Intégrales dites « de Riemann »On utilise souvent des fonctions de comparaison de référence dites « fonctions de Riemann » :

t ∈ [a, b[ �→1

(b − t)a·

(i) Si a �= 1, pour x ∈ [a, b[ ,∫ x

a

1

(b − t)adt =

1

1 − a

((b − a)1−a − (b − x)1−a

)Il en résulte que

∫ b

a

1

(b − t)adt converge si et seulement si a < 1 et, dans ce cas,

∫ b

a

1

(b − t)a=

1

1 − a(b − a)1−a·

164

Page 172: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

L’ intégrale impropre∫ b

af (t)dt

(ii) Si a = 1, pour x ∈ [a, b[ ,∫ x

a

1

b − tdt = ln(b−a)− ln(b−x), l’intégrale

∫ b

a

1

b − tdt est donc divergente.

Mais attention ! L’étude des intégrales impropres des fonctions de Riemann ne figurant pas au programme

de la classe, il faut, un jour d’examen, justifier le résultat annoncé en calculant∫ b

a

1

(b − t)adt dans le cas

particulier de la question traitée, comme nous le faisons dans l’exercice suivant.

Exercice 4.

Étudier la nature de l’intégrale∫ 1

0

1√1 − t3

dt.

Solution. Soit f : t ∈ [0, 1[ → 1√1 − t3

, f est une fonction continue et positive ; pour

tout t ∈ [0, 1[, 1 − t3 = (1 − t)(1 + t + t2). Comme 1 − t3 � 1 − t, on en déduit que

0 � f (t) � 1√1 − t

.

Pour tout x ∈ [0, 1[ ,∫ x

0

1√1 − t

dt = 2(1 −√

1 − x) et limx→1

2(1 −√

1 − x) = 2, l’intégrale

impropre∫ 1

0

1√1 − t3

dt est donc convergente.

2.4 Cas d’une fonction continue sur l’intervalle ]a, b]

Définition 4

Soient ]a, b] un intervalle de R et f une application continue de ]a, b] dans R.

• On dit que l’intégrale impropre∫ b

af (t)dt converge si l’application

F : y ∈ ]a, b] →∫ b

yf (t)dt, admet une limite finie l lorsque y tend vers a,

on note alors ∫ b

af (t)dt = l.

On dit aussi que l’intégrale existe, ou encore, qu’elle a un sens.

• On dit que l’intégrale impropre∫ b

af (t)dt diverge si l’application

F : y ∈ ]a, b] →∫ b

yf (t)dt n’admet pas de limite finie lorsque y tend

vers a.

On dit aussi que l’intégrale∫ b

af (t)dt n’existe pas, ou encore, qu’elle n’a pas de sens.

Nous savons que pour tout y ∈ ]a, b] ,∫ a

yf (t)dt =

∫ −y

−af (−u)du, on peut donc se

ramener au cas traité plus haut.

165

Page 173: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Exercice 5.

Étudier la nature de l’intégrale∫ 1

0ln tdt.

Solution. La fonction t ∈ ]0, 1] → ln t est continue sur ]0, 1] ; calculons∫ 1

yln tdt, grâce à une

intégration par parties, on a∫ 1

yln tdt = y(1− ln y)−1, et lim

y→0(y(1− ln y)−1) = −1, l’intégrale

impropre étudiée est donc convergente et∫ 1

0ln tdt = −1.

3. Intégrales plusieurs fois impropres

3.1 L’intégrale doublement impropre∫ b

a

f (t)dt

Définition 5

Soient a et b deux éléments de R = R ∪ {−∞, +∞} et soit f une fonction continue de]a, b[ dans R, avec −∞ � a < b � +∞.

• S’il existe c ∈ ]a, b[ tel que les intégrales impropres∫ c

a

f (t)dt et∫ b

cf (t)dt convergent,

on dit que∫ b

a

f (t)dt converge et l’on pose

∫ b

a

f (t)dt =∫ c

a

f (t)dt +∫ b

cf (t)dt.

• S’il n’en est pas ainsi, on dit que∫ b

a

f (t)dt diverge.

Montrons que cette définition est licite. Elle ne dépend pas du choix de c ∈ ]a, b[ .En utilisant la relation de Chasles, on vérifie que s’il existe c ∈ ]a, b[ tel que les

intégrales impropres∫ c

a

f (t)dt et∫ b

cf (t)dt convergent, alors pour tout d dans ]a, b[,

les intégrales impropres∫ d

a

f (t)dt et∫ b

df (t)dt convergent, et

∫ c

a

f (t)dt +∫ b

cf (t)dt =

∫ d

a

f (t)dt +∫ b

df (t)dt.

166

Page 174: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales plusieurs fois impropres

Proposition 8

Soient I un intervalle de R de la forme ]a, b[ avec −∞ � a < b � +∞ et f une

fonction continue de ]a, b[ dans R. L’intégrale∫ b

a

f (t)dt converge si et seulement si∫ x

yf (t)dt admet une limite lorsque (y, x) tend vers (a, b) ; on a alors :∫ b

a

f (t)dt = lim(y,x)→(a,b)

∫ x

yf (t)dt.

PreuveCe résultat est une simple conséquence des définitions et de la relation de Chasles. ❑

Proposition 9

L’ensemble des fonctions continues de ]a, b[ dans R dont l’intégrale sur ]a, b[ convergeest un sous espace vectoriel de l’espace des fonctions continues de ]a, b[ dans R et l’ap-

plication f →∫ b

a

f (t)dt est une forme linéaire sur ce sous espace.

PreuveCe résultat est une simple conséquence des définitions et de la relation de Chasles. ❑

➤ Remarques• L’étude de ces intégrales deux fois impropres se ramène, en utilisant la relation de Chasles, à l’étude de deux

intégrales impropres comme celles qu’on a rencontrées au début de ce chapitre.

• Dans la dernière proposition ci-dessus, il est important de noter que, lorsque l’on écrit (y, x) tend vers (a, b),cela signifie que, d’une part, y tend vers a et que, d’autre part, et de manière indépendante, x tend vers b

(voir ci-dessous l’exemple donné dans la preuve de la proposition concernant les propriétés de parité).

Exercice 6.

Étudier la nature de l’intégrale∫ 1

0

ln t1 − t

dt.

Notons que la fonction à intégrer n’est définie ni en 0, ni en 1. L’intégrale étudiée estdoublement impropre.

Solution. La fonction f : t ∈ ]0, 1[ → ln t1 − t

est continue et négative sur l’intervalle ]0, 1[, on

pourra donc appliquer les résultats obtenus au début du chapitre.

Choisissons un point c ∈ ]0, 1[, par exemple c =12·

• Pour tout t ∈ ]0, c[, on a 0 <1

1 − t� 1

1 − c, soit −f (t) � 1

1 − c(− ln t) ; nous avons

démontré en exercice que∫ c

0ln t dt converge, donc

∫ c

0

ln t1 − t

dt converge.

167

Page 175: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

• On a limt→1−

ln t1 − t

= −1, donc f se prolonge par continuité sur ]0, 1] et l’intégrale∫ 1

c

ln t1 − t

dt converge (elle est faussement impropre).

L’intégrale∫ 1

0

ln t1 − t

dt est donc convergente.

Proposition 10 (Propriétés liées à la parité)

Supposons a = −b

• Soit f une fonction continue et paire sur ]−b, b[. Alors∫ b

−b

f (t)dt converge si et

seulement si∫ b

0f (t)dtconverge. Dans ce cas

∫ b

−b

f (t)dt = 2∫ b

0f (t)dt.

• Soit f une fonction continue et impaire sur ]−b, b[. Alors∫ b

−b

f (t)dt converge si et

seulement si∫ b

0f (t)dt converge. Dans ce cas

∫ b

−b

f (t)dt = 0.

PreuveCes propriétés résultent clairement des propriétés de l’intégrale et de la relation de Chasles.

Mais attention à ne pas croire que ∀x ∈ [0, b[ ,∫ x

−xf (t)dt = 0, entraîne que

∫ b

−b

f (t)dt converge. On aurait

ainsi démontré que∫ b

−b

f (t) dt converge pour toute fonction impaire sur ]−b, b[ ! ( Ce qui est bien clairement

faux ; pour le prouver, il suffit d’examiner simplement l’intégrale∫ +∞

−∞t dt). ❑

Exemples

1.∫ +∞

−∞

11 + t2

dt.

On a démontré dans les exemples du début du chapitre, que∫ +∞

0

11 + t2

dt converge,

donc∫ +∞

−∞

11 + t2

dt converge et∫ +∞

−∞

11 + t2

dt = 2 × p

2= p.

168

Page 176: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales plusieurs fois impropres

2.∫ 1

−1

1√1 − t2

dt.

On a de même démontré dans les exemples du début du chapitre, que∫ 1

0

1√1 − t2

dt

converge, et que∫ 1

0

1√1 − t2

dt =p

2.

Donc∫ 1

−1

1√1 − t2

dt converge et∫ 1

−1

1√1 − t2

dt = 2 × p

2= p.

3.2 Cas où f est à valeurs positives sur]a, b

[Proposition 11

Soit f une fonction continue positive de ]a, b[ dans R, dont l’intégrale sur ]a, b[ converge,

alors∫ b

a

f (t)dt � 0 et∫ b

a

f (t)dt = 0 si et seulement si f = 0.

PreuveCette proposition résulte clairement des définitions et des résultats démontrés plus haut ❑

Théorème 5

Critères de comparaisonSoient f et g deux applications continues de ]a, b[ dans [0, +∞[ telles que 0 � f � g.

• Si∫ b

a

g(t)dt converge,∫ b

a

f (t)dt converge et∫ b

a

f (t)dt �∫ b

a

g(t)dt;

• Si∫ b

a

f (t)dt diverge , alors∫ b

a

g(t)dt diverge.

PreuveCette conclusion résulte également clairement des définitions et des critères de comparaison rencontrés plushaut. ❑

3.3 Cas où f est une fonction continue sur]a, b

[sauf en un nombre fini de

points

Définition 6

Soient k ∈ N, k � 1 et (ch)1�h�k une famille croissante de points de ]a, b[, posons

c0 = a, ck+1 = b, si ∀h ∈ �0, k�,∫ ch+1

ch

f (t)dt converge, on dit que∫ b

a

f (t)dt converge et

l’on a : ∫ b

a

f (t)dt =k∑

h=0

∫ ch+1

ch

f (t)dt.

169

Page 177: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

➤ Remarques• Notons que cette définition est cohérente avec la relation de Chasles

• Si∫ b

a

f (t)dt converge, on dit que f est intégrable sur ]a, b[

Exemple en vue du calcul des probabilitésSoient l ∈ [0, +∞[ et f : t ∈ R → 1l[0,+∞[(t)e−lt, f est continue sur [−∞, 0[ et [0, +∞[ on a∫ 0

−∞f (t)dt = 0 et lim

x→+∞

∫ x

0f (t)dt = lim

x→+∞

1l

(1 − e−lt) =1l

.

La fonctionf est donc intégrable sur ]−∞, +∞[ et∫ +∞

−∞f (t)dt =

1l

.

4. Pratique des intégrales impropres

4.1 Convergence absolue d’une intégrale impropre

Définition 7

Soient un intervalle de R de la forme ]a, b[ avec −∞ � a < b � +∞ et f une fonctioncontinue de ]a, b[ dans R.

On dit que∫ b

a

f (t)dt est absolument convergente si et seulement si∫ b

a

|f (t)|dt converge.

Proposition 12

L’ensemble des fonctions continues de l’intervalle ]a, b[ dans R, dont l’intégrale sur ]a, b[est absolument convergente est un sous espace vectoriel de l’espace des fonctions continuessur ]a, b[ .

PreuveL’ensemble des fonctions continues de ]a, b[ dans R dont l’intégrale sur ]a, b[ est absolument convergenten’est pas vide, il contient la fonction t ∈ ]a, b[ �→ 0. Soient f et g deux fonctions de ]a, b[ dans R d’intégraleabsolument convergente, pour tous réels l, m, on a pour tout t ∈ ]a, b[ , |lf (t) + mg(t)| � |l||f (t)| + |m||g(t)|,donc l’intégrale de |lf + mg| sur ]a, b[ converge, d’où le résultat. ❑

Théorème 6

Soit f : ]a, b[ → R une fonction continue dont l’intégrale est absolument convergentesur ]a, b[, alors

1.∫ b

a

f (t)dt converge ;

2.

∣∣∣∣∣∫ b

a

f (t)dt

∣∣∣∣∣ �∫ b

a

|f (t)|dt.

170

Page 178: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Pratique des intégrales impropres

PreuveSoit f une application continue de ]a, b[ dans R. Posons f+ = max{f, 0} et f− = max{−f, 0}.

On a :

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

f = f+ − f−| f |= f+ + f−

f+ =1

2(f + |f |)

f− =1

2(|f | − f )

Les fonctions f+ et f− sont continues et positives sur ]a, b[, de plus f+ �| f | et f− �| f |, les intégrales∫ b

a

f+(t)dt et∫ b

a

f−(t)dt sont donc convergentes, par linéarité∫ b

a

f (t)dt est convergente.

On a∫ b

a

f (t)dt =

∫ b

a

(f+(t) − f−(t)

)dt =

∫ b

a

f+(t)dt −∫ b

a

f−(t)dt, donc

∣∣∣∣∫ b

a

f (t)dt

∣∣∣∣ � ∫ b

a

f+(t)dt +∫ b

a

f−(t)dt,

d’où le résultat. ❑

➤ Remarques• Pour montrer qu’une intégrale impropre converge, on pourra étudier d’abord son absolue convergence. Ainsi,

on sera amené à étudier la convergence de l’intégrale d’une fonction positive, ce qui simplifie la tâche ; onpeut, en particulier, utiliser les critères de comparaison. Si l’on a pu montrer que l’intégrale est absolumentconvergente, on pourra affirmer qu’elle est convergente, mais si l’intégrale n’est pas absolument convergente,on ne pourra pas conclure, comme le montre l’exemple ci-dessous.

• Attention ! Il existe des intégrales impropres convergentes, mais non absolument convergentes. On en trou-vera un exemple ci-dessous

Exemple

Considérons l’intégrale impropre∫ +∞

1

sin tt

dt

• Montrons que∫ +∞

1

| sin t|t

dt diverge.

Soit H : x ∈ [1, +∞[ →∫ x

p

| sin t |t

dt.

On a H(np) =∫ np

p

| sin t |t

dt =n−1∑k=1

∫ (k+1)p

kp

| sin t |t

dt.

Pour tout k ∈ �1, n − 1�,∫ (k+1)p

kp

| sin t |t

dt =∫ p

0

sin uu + kp

du (faire le changement de

variable t = u + kp).

Si 0 � u � p, on a1

u + kp� 1

(k + 1)p, on en déduit :

∫ p

0

sin uu + kp

du �∫ p

0

sin u(k + 1)p

du.

On a∫ p

0sin u du = 2, donc H(np) � 2

n∑k=1

1(k + 1)p

.

On sait que la série harmonique est divergente, donc limn→+∞

H(np) = +∞, l’intégrale∫ +∞

1

| sin t |t

dt est divergente.

171

Page 179: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

• Montrons que∫ +∞

1

sin tt

dt est convergente.

Soit F : x ∈ [1, +∞[ →∫ x

1

sin tt

dt. En effectuant une intégration par parties, on a

F(x) = cos 1 − cos xx

−∫ x

1

cos tt2

dt.

Pour tout x � 1,∣∣∣cos x

x

∣∣∣ � 1x

, donc limx→+∞

cos xx

= 0.

Étudions maintenant l’intégrale impropre∫ +∞

1

cos tt2

dt. Pour tout t ∈ [1, x],∣∣∣cos t

t2

∣∣∣ � 1t2

et∫ x

1

1t2

dt = 1 − 1x

, limx→+∞

1x

= 0.

D’après les théorèmes de comparaison,∫ +∞

1

cos tt2

dt est convergente, d’où la convergence

de∫ +∞

1

sin tt

dt.

4.2 Calcul des intégrales impropres

Parmi les méthodes qui permettent de calculer des intégrales impropres, citons entrois.

Recours à une primitiveSoit f une fonction continue sur l’intervalle ]a, b[, si l’on peut exprimer une primitive

F de f sur ]a, b[, à l’aide des « fonctions usuelles », on sait que∫ b

a

f (t)dt converge si

et seulement si F admet une limite en chacun des points a, b et l’on a∫ b

a

f (t)dt = limx→b

F(x) − limx→a

F(x).

On note limx→b

F(x) − limx→a

F(x) = [F(x)]ba .

Nous avons déjà utilisé cette méthode dans de nombreux cas.

Recours à une intégration par parties

Soient u, v deux fonctions de classe C1 sur l’intervalle ]a, b[, pour tous x, y tels quea < y < x < b on a∫ x

yu(t)v′(t)dt = u(x)v(x) − u(y)v(y) −

∫ x

yu′(t)v(t)dt.

172

Page 180: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Pratique des intégrales impropres

Si la fonction uv admet une limite en chacun des points a, b alors∫ b

a

u(t)v′(t)dt

converge si et seulement si∫ b

a

u(t)v′(t)dt converge. Dans certains cas il peut être

judicieux de choisir v+C (C constante bien choisie) pour primitive de v′. Un exempleest donné dans l’exercice 4.

Changement de variable

Proposition 13

Soient w une fonction de classe C1, strictement croissante de ]a, b[ sur ]w(a), w(b)[ et f une

application continue sur ]w(a), w(b)[ . L’intégrale∫ w(b)

w(a)f (u)du converge si et seulement si∫ b

af (w(t))w′(t)dt converge, dans ce cas on a

∫ w(b)

w(a)f (u)du =

∫ b

af (w(t))w′(t)dt.

PreuveLa fonction w est une bijection de ]a, b[ sur

]w(a), w(b)

[, nous noterons w−1 son application réciproque.

On sait que, quels que soient les réels y et x tels que a < y < x < b,∫ w(x)

w(y)f (u)du =

∫ x

yf(w(t))

w′(t)dt

et que quels que soient les réels v et w tels que w(a) < v < w < w(b), on a

∫ w

vf (u)du =

∫ w−1(w)

w−1(v)f(w(t))

w′(t)dt.

Le résultat s’en déduit par passage à la limite. ❑

➤ RemarqueSi w est monotone décroissante, le théorème reste vrai, en remplaçant

]w(a), w(b)

[par]w(b), w(a)

[.

Exemple

Étude de∫ 1

0

ln t√1 − t

dt.

On utilise le changement de variable u =√

1 − t, on est alors ramené à l’étude de∫ 1

0ln(1 − u2)du.

173

Page 181: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

On a :ln(1 − u2) = ln(1 + u) + ln(1 − u)∫ 1

0ln(1 + u) du =

∫ 2

1ln vdv,∫ 1

0ln(1 − u) du =

∫ 1

0ln vdv.

On a démontré, dans un des exercices du début de ce chapitre, que∫ 1

0ln vdv converge.

L’intégrale∫ 1

0

ln t√1 − t

dt est donc convergente et∫ 1

0

ln t√1 − t

dt = 2∫ 2

0ln vdv = 2

[v(ln v − 1)

]2

0= 4(ln 2 − 1).

4.3 Intégrale de Gauss, intégrales d’Euler

Le programme de probabilités de la classe comporte une partie dédiée aux variablesaléatoires à densité. Pour mener à bien cette étude, on a besoin des intégralesimpropres, et en particulier de certains résultats importants que nous allons rencontrerdans cette section.Il est important de garder ces résultats présents à l’esprit, mais il est au moins aussiimportant de savoir les redémontrer.

L’intégrale de Gauss

L’intégrale de Gauss est l’intégrale impropre∫ +∞

−∞e−t2dt. Elle est liée à une courbe

célèbre, connue sous le nom de « courbe en cloche ». Nous démontrons ci-dessous saconvergence, et nous donnerons une méthode de calcul de sa valeur dans la fin de cechapitre.

La fonction t ∈ ]−∞, +∞[ → e−t2 est paire, il suffit donc d’étudier∫ +∞

0e−t2dt.

Pour tout t ∈ [1, +∞[ , t2 � t donc e−t2 � e−t, on sait que∫ +∞

1e−tdt converge,

d’après la relation de Chasles et le théorème comparaison,∫ +∞

0e−t2dt converge et∫ +∞

−∞e−t2dt = 2

∫ +∞

0e−t2dt.

On ne connaît pas de fonction usuelle, primitive de e−t2 (on peut d’ailleurs montrerqu’il n’en existe pas), nous verrons plus loin un procédé de calcul de l’intégrale deGauss. Nous admettrons le résultat∫ +∞

−∞e−t2dt =

√p.

174

Page 182: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Pratique des intégrales impropres

En calcul des probabilités, on étudie l’intégrale impropre∫ +∞

−∞e−

(t−m)2

2s2 dt, avec m ∈ R

et s ∈ ]0, +∞[ .En faisant le changement de variable t − m =

√2su, le lecteur montrera que∫ +∞

−∞e−

(t−m)2

2s2 dt = s√

2p.

La fonction Gamma

La fonction G

Soient x ∈ R et f : t ∈ ]0, +∞[ → tx−1e−t, la fonction f est intégrable sur ]0, +∞[ si etseulement si x ∈ ]0, +∞[.

La fonction x ∈ ]0, +∞[ →∫ +∞

0tx−1e−tdt est appelée fonction Gamma et notée G.

G : x > 0 �→∫ +∞

0tx−1e−tdt.

PreuvePour tout x ∈ R la fonction f : t ∈ ]0,∞[ �→ tx−1e−t est continue et positive.

� Étudions la nature de l’intégrale∫ 1

0f (t)dt.

Pour tout t ∈ ]0, 1] , e−1 � e−t � 1, et1

etx−1 � f (t) � tx−1, on sait que

∫ 1

0tx−1dt converge si et

seulement si 1 − x < 1 soit x > 0.

� Étudions maintenant∫ +∞

1f (t)dt.

Pour tout x ∈ R, limt→+∞

e−t/2tx−1 = 0, il existe donc c ∈ [1, +∞[ tel que :

∀t ∈ [c, +∞[ , 0 � e−t/2tx−1 � 1 et 0 � f (t) � e−t/2.

On sait que∫ +∞

ce−t/2dt converge, donc

∫ +∞

1f (t)dt converge.

On en déduit que∫ +∞

0tx−1e−tdt converge si et seulement si[ :] x > 0. ❑

Proposition 14 (Premières propriétés)

(i) Pour tout x > 0, G(x + 1) = xG(x).

(ii) Quel que soit l’entier naturel n, G(n + 1) = n!.

(iii) G(1/2) =√

p.

Preuve(i) Pour tout réel strictement positif x et quels que soient les réels positifs y et z , une intégration par parties

conduit à ∫ z

ytxe−tdt = e−yyx − e−zzx + x

∫ z

ytx−1e−tdt

Or, limy→0

e−yyx = 0 et limz→+∞

e−zzx = 0.

Le résultat annoncé en découle.

175

Page 183: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

(ii) On a G(1) =

∫ +∞

0e−tdt = 1. Le résultat annoncé en découle clairement, à l’aide d’une démonstration

par récurrence utilisant le (i).

(iii) G(1/2) =

∫ +∞

−∞e−t2

dt

Pour tout x > 0, en effectuant le changement de variable u = t2, on obtient, pour tout

y > 0,∫ y

0e−t2

dt = 1/2∫ y2

0u−1/2e−udu.

Ainsi G(1/2) = 2∫ +∞

0e−t2

dt =

∫ +∞

−∞e−t2

dt, d’où G(1/2) =√

p. ❑

La fonction Bêta

La fonction Bêta

Soient p, q ∈ R réels, et g : t ∈ ]0, 1[ → tp−1(1 − t)q−1, la fonction g est intégrable sur]0, 1[ si et seulement si p > 0, q > 0.

La fonction (p, q) ∈ ]0, +∞[× ]0, +∞[ →∫ 1

0tp−1(1− t)q−1dt est appelée fonction Beta et

notée B.

B : (p, q) ∈ ]0, +∞[ × ]0, +∞[ �→∫ 1

0tp−1(1 − t)q−1dt.

PreuvePour tous p, q réels, la fonction g : t ∈ ]0, 1[ �→ tp−1(1 − t)q−1 est continue et positive.

Soit c ∈ ]0, 1[, étudions∫ c

0tp−1(1 − t)q−1dt.

L’application t �→ (1 − t)q−1 est continue sur [0,c], donc bornée sur cet intervalle, posonsM = sup

0�t�c(1 − t)q−1, m = inf

0�t�c(1 − t)q−1, on a : m > 0 et mtp−1 � tp−1(1 − t)q−1 � Mtp−1, on sait que∫ c

0tp−1dt converge si et seulement si 1 − p < 1 soit p > 0, d’après le théorème 4,

∫ c

0tp−1(1 − t)q−1dt

converge si et seulement si p > 0.

Un raisonnement analogue montre que∫ 1

ctp−1(1 − t)q−1dt converge si et seulement si q > 0. ❑

➤ Remarques• La lettre B est la lettre grecque b majuscule.

• La fonction B est une fonction de deux variables.

• On prouve aisément, grâce au changement de variable u = 1 − t, que B(p, q) = B(q, p).

5. Intégrales doubles

5.1 Intégrale double sur un pavé

Définition 10

Un pavé de R2 est un produit de deux segments de R.

Nous admettons le théorème suivant.

176

Page 184: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

Théorème 7

Soient P = [a, b] × [c, d] et f une fonction continue de P dans R, on a∫ b

a

(∫ d

cf (x, y)dy

)dx =

∫ d

c

(∫ b

af (x, y)dx

)dy.

À partir de ce résultat, on donne la définition suivante

Définition 11

Soient P = [a, b] × [c, d] et f une fonction continue de P dans R. La valeur commune

des deux intégrales∫ b

a

(∫ d

cf (x, y)dy

)dx et

∫ d

c

(∫ b

af (x, y)dx

)dy est appelée intégrale

double de f sur le pavé P , et notée∫∫P

f ou∫∫

[a,b]×[c,d]f ou

∫∫P

f (x, y)dxdy ou∫∫

[a,b]×[c,d]f (x, y)dxdy.

➤ Remarques• Dans ce qui précède, nous admettons que les applications

G : x ∈ [a, b] �→∫ d

cf (x, y)dy et H : y ∈ [c, d] �→

∫ b

af (x, y)dx sont des fonctions continues, ce qui permet de

définir à la fois∫ b

aG(x)dx et

∫ d

cH(y)dy.

• Il est clair que, si f (x, y) = g(x)h(y),∫∫

Pf =

∫ b

ag(x)dx ×

∫ d

ch(y)dy.

Exemple

Calcul de∫∫

[0,1]×[0,1]

11 + x2y

dxdy.

On a : ∫ 1

0

11 + x2y

dy =1x2

ln(1 + x2), si x �= 0

= 1 si x = 0.

Sur cet exemple, et puisque limx→0

ln(1 + x2) = 1, on constate que l’application G est continue.

On calcule alors∫ 1

0

1x2

ln(1 + x2) dx en utilisant une intégration par parties et l’on obtient :

∫ 1

0

1x2 ln(1 + x2) dx =

[−1

xln(1 + x2)

]1

0

+∫ 1

0

21 + x2 dx

= − ln 2 + [2 Arctan x]10

= − ln 2 +p

2.

177

Page 185: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

On aurait pu calculer d’abord∫ 1

0

11 + x2y

dx, et l’on aurait alors obtenu :

∫ 1

0

11 + x2y

dx =1√

yArctan

√y, si y �= 0

= 1 si y = 0.

On vérifie ici que, puisque limy→0

1√

yArctan

√y = 1, l’application H est continue. Ici encore,

on calcule∫ 1

0

1√

yArctan

√y dy en utilisant une intégration par parties, et l’on obtient :

∫ 1

0

1√

yArctan

√y dy =

[2√

y Arctan√

y]1

0−∫ 1

0

11 + y

dy

=p

2− ln 2.

Les intégrales doubles (et plus généralement les intégrales multiples) sont d’une grandeutilité dans de nombreux domaines de la physique. Nous donnons ci dessous deuxexemples d’interprétation.

Interprétation géométrique

Dans le cas où f (x, y) = a, avec a > 0, on a∫∫

Pf = a(b−a)(c−d), et a(b−a)(c−d)

est le volume du parallélépipède de base P et de hauteur a.Nous admettrons que l’ ensemble des points (x, y, z) de R

3 tels que : (x, y) ∈ P et0 � z � f (x, y)constitue un domaine de l’espace dont le volume (exprimé en unité

de volume) est égal à∫∫

Pf .

Interprétation statique

Si f (x, y) = a avec a > 0, on peut aussi considérer que∫∫

Pf = a(b − a)(c − d)est la

masse de la plaque de superficie P de densité de surface égale à a

Nous admettrons que∫∫

Pf est égale à la masse d’une plaque solide de surface P et

dont la densité au point de coordonnées (x, y) est f (x, y).

Les propriétés de l’intégrale simple et la définition de l’intégrale double permettent dedémontrer sans peine les propriétés faisant l’objet de la proposition suivante.

Proposition 15

• Quels que soient les réels l et m, et quelles que soient les fonctions f et g continues surle pavé P on a ∫∫

P(lf + mg) = l

∫∫P

f + m

∫∫P

g.

178

Page 186: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

• Si f est positive sur le pavé P , alors∫∫

Pf � 0.

• Si f � g sur le pavé P alors∫∫

Pf �

∫∫P

g.

PreuveNous laissons le soin au lecteur de rédiger la preuve de ces propriétés. ❑

5.2 Intégrale double sur un domaine élémentaire de R2

Définition 12

• On dit qu’une partie D de R2 est un domaine Dx, s’il existe des fonctions w1 et w2

continues sur [a, b] telles que w1 � w2 et

D ={

(x, y) ∈ R2 tels que a � x � b et w1(x) � y � w2(x)

}• On dit qu’une partie D de R

2 est un domaine Dy, s’il existe des fonctions c1 et c2

continues sur [c, d] telles que c1 � c2 et

D ={

(x, y) ∈ R2; c � y � d et c1(y) � x � c2(y)

}• On dit qu’une partie D de R

2 est un domaine élémentaire s’il est un domaine Dx ouDy.

Un domaine D peut être à la fois un domaine Dx et Dy (voir illustration graphiquepage suivante).

O

w1(x)�

w2(x)�

c1(y)�

c2(y)�

x

y

D

Figure 6.2 Exemple de domaine élémentaire à la fois Dx et Dy.

179

Page 187: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Exemples1. Un pavé de R

2 est un domaine Dx et Dy.

2. D ={

(x, y) ∈ R2; x � 0, y � 0 x + y � 1

}est un domaine Dx et Dy.

3. D ={

(x, y) ∈ R2; x2 � y � 2x

}est un domaine Dx et Dy.

4. D ={

(x, y) ∈ R2; x2 � y2, −2 � y � 2

}est un domaine Dy, mais il n’est pas Dx.

Nous admettrons le théorème suivant, qui utilise les notations de la définition ci-dessus.

Théorème 8

Soient D un domaine de R2 à la fois Dx et Dy et f une fonction continue de D dans R.

• La fonction G : x ∈ [a, b] →∫ w2(x)

w1(x)f (x, y)dy est continue ;

• La fonction H : y ∈ [c, d] →∫ c2(y)

c1(y)f (x, y)dx est continue.

• De plus∫ b

aG(x)dx =

∫ d

cH(y)dy.

À partir de ce résultat, on donne la définition suivante, avec les notations de la défi-nition ci-dessus

Définition 13

Soient D un domaine de R2 à la fois Dx et Dy et f une fonction continue de D dans R.

La valeur commune des deux intégrales∫ b

a

(∫ w2(x)

w1(x)f (x, y)dy

)dx et∫ d

c

(∫ c2(y)

c1(y)f (x, y)dx

)dy est appelée intégrale double de f surD et notée∫∫

Df =

∫∫D

f (x, y)dxdy.

Si D est ou seulement Dx ou seulement Dy, et toujours avec les notations de ladéfinition ci-dessus, nous admettrons le résultat suivant.

Proposition 16

Soient D un domaine élémentaire de R2 et f une fonction continue sur D. Alors

• Si D est un domaine Dx, la fonction G : x ∈ [a, b] →∫ w2(x)

w1(x)f (x, y)dy est continue,

• Si D est un domaine Dy, la fonction H : y ∈ [c, d] →∫ c2(y)

c1(y)f (x, y)dx est continue.

180

Page 188: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

À partir de ce résultat, on donne la définition suivante.

Définition 14

Soient D un domaine élémentaire de R2 et f une fonction continue sur D. Alors

• Si D est un domaine Dx, on définit « l’ intégrale de f sur D » par∫∫D

f =∫ b

a

(∫ w2(x)

w1(x)f (x, y)dy

)dx

• Si D est un domaine Dy, on définit « l’ intégrale de f sur D » par∫∫D

f =∫ d

c

(∫ c2(y)

c1(y)f (x, y)dx

)dy.

• Dans ces deux cas, on note aussi∫∫D

f =∫∫

Df (x, y)dxdy

Les propriétés de l’intégrale simple et la définition de l’intégrale double permettent dedémontrer sans peine les propriétés faisant l’objet de la proposition suivante.

Proposition 17

Soit D un domaine élémentaire de R2.

• Pour tous l, m, réels et f, g fonctions continues sur D on a∫∫D

(lf + mg) = l

∫∫D

f + m

∫∫D

g.

• Si f est positive sur D, alors∫∫

Df � 0.

• Si f � g sur le domaine D, alors∫∫

Df �

∫∫D

g.

PreuveNous laissons le soin au lecteur de rédiger la preuve de ces propriétés ❑

➤ Remarque

Si le domaine élémentaire est à la fois Dx et Dy , on choisira de calculer∫ b

a

(∫ w2(x)

w1(x)f (x, y)dy

)dx ou∫ d

c

(∫ c2(y)

c1(y)f (x, y)dx

)dy, en tenant compte de la fonction et du domaine, comme le montrent les exemples

suivants.

Exemples

1. Calculer∫∫

D(x + y)dxdy, avec D = {(x, y) ∈ R

2 ; x + y � 0, |x| � 1, |y| � 1}

181

Page 189: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

On vérifie que D est un domaine élémentaire à la fois Dx et Dy, x et y ont des rôlessymétriques, à la fois dans la définition de f et dans celle de D, on peut donc choisir l’uneou l’autre des deux intégrales. On a∫∫

D(x + y)dxdy =

∫ 1

−1

(∫ 1

−x(x + y)dy

)dx =

∫ 1

−1

12

(x + 1)2 dx,

on en déduit∫∫

D(x + y)dxdy =

43.

2. Soit D = {(x, y) ∈ R2 ;

√3x − 18 � y �

√x}, calculer

∫∫D

f (x, y)dxdy.

On a : ∫∫D

f (x, y)dxdy =∫ 6

0

(∫ √x

0f (x, y)dy

)dx +

∫ 9

6

(∫ √x

√3x−18

f (x, y)dy)

dx

ou ∫∫D

f (x, y)dxdy =∫ 3

0

⎛⎝∫ y2

3 +6

y2

f (x, y)dx

⎞⎠dy.

Il est donc plus simple de considérer D comme un domaine Dy.

3. Soit D = {(x, y) ∈ R2 ;

√y � x � 2}, calculer

∫∫D

y cos(x5)dxdy. Le domaine est Dx et

Dy, on a ∫∫D

y cos(x5)dxdy =∫ 4

0

(∫ 2

√yy cos(x5)dx

)dy

ou ∫∫D

y cos(x5)dxdy =∫ 2

0

(∫ x2

0y cos(x5)dy

)dx

Le premier calcul nécessiterait la connaissance d’une primitive de cos(x5), alors que lesecond se fait aisément, on obtient∫∫

Dy cos(x5)dxdy =

12

∫ 2

0x4 cos(x5)dx =

110

[sin(x5)

]2

0=

110

sin 32·

5.3 Intégrale double sur une réunion de domaines élémentaires

Définition 15

Soit D une partie de R2, réunion de domaines élémentaires Dk, 1 � k � n, tels que pour

tout couple (i, j) ∈ �0, n�2,∫∫

Di∩Dj

dxdy = 0.

Pour toute fonction f continue sur D, on pose∫∫D

f (x, y)dxdy =n∑

k=1

∫∫Dk

f (x, y)dxdy.

182

Page 190: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

La figure ci-dessous illustre cette définition.

D2

D1

D3 D4

Figure 6.3∫∫

D1∪D2∪D3∪D4

f =

∫∫D1

f +∫∫

D2

f +∫∫

D3

f +∫∫

D4

f

T1

T2

Figure 6.4 D = T1 ∪ T2

Exemple

Calculer∫∫

D|x + y|dxdy , avec D = {(x, y) ∈ R

2 ;−1 � x � 1, −1 � y � 1.}

On a D = T1 ∪ T2, où T1 = {(x, y) ∈ R2 ; x + y � 0, |x| � 1, |y| � 1} et

T2 = {(x, y) ∈ R2 ; x + y < 0, |x| � 1, |y| � 1} (voir figure)

Et alors∫∫

D|x + y|dxdy =

∫∫T1

(x + y)dxdy −∫∫

T2

(x + y)dxdy.

On sait (voir l’exemple ci-dessus) que∫∫T1

(x + y)dxdy =43

,

et ∫∫T2

(x + y)dxdy =∫ 1

−1

(∫ −x

−1(x + y)dy

)dx = −4

3.

on a donc ∫∫D|x + y|dxdy =

83·

5.4 Calcul d’aires et de volumes

Ainsi que nous l’avons déjà noté, les applications des intégrales doubles sont nom-breuses. Donnons deux définitions concernant les applications de la notion à la géo-métrie.

183

Page 191: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Définition 16

Soit D un domaine élémentaire de R2,∫∫

Ddxdy est appelée aire de D et notée A(D).

➤ RemarqueSi f est une fonction continue et positive sur [a, b],et si D = {(x, y) ; a � x � b, 0 � y � f (x)},on vérifie que

A(D) =

∫∫D

dxdy =

∫ b

af (x)dx.

Et l’on constate que, si f est constante égale à c(c > 0), on retrouve la notion usuelle d’aire d’un rectangle dontles dimensions sont c et b − a.

Définition 17

Soient D un domaine élémentaire de R2, et f une fonction continue positive sur D.

Si V ={

(x, y, z) ∈ R3; (x, y) ∈ D, 0 � z � f (x, y)

}, l’intégrale

∫∫D

f (x, y)dxdy est, par

définition, le volume de V et noté V(V )

Dans le cas où D est un pavé, on retrouve la définition donnée plus haut.

5.5 Intégrales doubles impropres

Dans ce qui précède, les intégrales doubles que nous avons rencontrées mettaienten jeu des domaines plans bornés. Dans la présente section, nous nous intéressons àl’intégrale double d’une fonction, continue, positive sur un produit d’intervalles, nonnéssairement bornés.

Nous admettrons tout d’abord le théorème suivant.

Théorème 9 (Théorème de Fubini)

Soient I et J deux intervalles de R non réduits à un point, et f une fonction continue,positive sur I × J . On suppose que

1. pour tout x ∈ I,∫

Jf (x, y)dy converge ;

2. pour tout y ∈ J,∫

If (x, y)dx converge ;

3. les fonctions G : x ∈ I →∫

Jf (x, y)dy et H : y ∈ J →

∫If (x, y)dx sont continues.

Alors∫

IG(x)dx converge si et seulement si

∫JH(y)dy converge, dans ce cas on a∫

IG(x)dx =

∫JH(y)dy.

184

Page 192: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

➤ RemarqueNous avons déjà rencontré des cas particuliers de ce théorème.

À partir de ce résultat, on donne la définition suivante.

Définition 18

Soient I et J deux intervalles de R non réduits à un point, et f une fonction continue,positive sur I × J . On suppose que

• pour tout x ∈ I,∫

Jf (x, y)dy converge ;

• pour tout y ∈ J,∫

If (x, y)dx converge ;

• les fonctions G : x ∈ I →∫

Jf (x, y)dy et H : y ∈ J →

∫If (x, y)dx sont continues.

La valeur commune des intégrales∫

J

(∫If (x, y)dx

)dy et

∫I

(∫Jf (x, y)dy

)dx est appelée

intégrale double de f sur I × J et notée∫∫I×J

f ou∫∫

I×Jf (x, y)dxdy.

La proposition ci-dessous est une généralisation des théorèmes analogues rencontrésdans le cas d’un pavé ou d’un domaine élémentaire.

Proposition 18

Soient I et J deux intervalles de R non réduits à un point, g une fonction continue positive

sur I et h une fonction continue positive sur J . Si∫

Ig(x)dx et

∫Jh(y)dy convergent, on a∫∫

I×Jg(x)h(y) dxdy =

∫Ig(x)dx ×

∫Jh(y)dy.

Ici, nous nous proposons de définir∫∫

Af (x, y)dxdy, f étant une fonction continue et

positive sur une pertie A ⊂ R2, dans quelques cas particuliers de partie A.

Cette notion a été définie dans le cas où :

1. A est un domaine élémentaire

2. A est un produit d’intervalles.

Nous étudions maintenant quelques exemples où A peut être considérée commeun domaine élémentaire non borné, et nous mènerons des calculs analogues à ceuxmenés dans ces cas, sous réserve, bien sûr , que les intégrales impropres écrites soientconvergentes. De tels exemples sont importants en vue du calcul des probabilités.

185

Page 193: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Exemples

1.∫∫

Af (x, y) dxdy, avec A = {(x, y) ∈ R

2; x + y � 1}.Ici, A est un demi-plan limité par la droite d’équation x + y = 1. Définissons

G : x ∈ R →∫ +∞

1−xf (x, y) dy.

On a :

⎧⎪⎪⎨⎪⎪⎩G(x) =

∫ +∞

1f (x, u − x) dx∫

R

G(x)dx =∫

R

(∫ +∞

1f (x, u − x) du

)dx =

∫∫R×[1,+∞[

g(x, u) dxdu

avec g(x, u) = f (x, u − x). On est donc ramené au cas d’un produit d’intervalles.

2.∫∫

Axye−xdxdy, avec A = {(x, y) ∈ R

2 ; 0 � y � x}.Dans ce cas, la partie A est un secteur angulaire limité par la droite d’équation y = x et parl’axe des abscisses, on peut considérer A comme un domaine élémentaire non borné.

Définissons G : x ∈ [0, +∞[ →∫ x

0xye−x dy,

on a G(x) =12

x3e−x et∫ +∞

0G(x) dx =

12

G(4) = 3.

Définissons H : y ∈ [0, +∞[ →∫ +∞

yxy e−x dx,

on a H(y) = y(1 + y)e−y et∫ +∞

0H(y) dy = G(3) + G(2) = 3.

On aura∫∫

Axy e−x dxdy =

∫ +∞

0G(x) dx =

∫ +∞

0H(y) dy = 3.

3.∫∫

A

1(1 + x + y)2

dxdy, avec A = {(x, y) ∈ R2 ; x � 0, y � x2}.

Dans ce cas la partie A est limitée par l’axe des ordonnées et la parabole d’équation y = x2,elle peut encore être considérée comme un domaine élémentaire non borné.

O x

y

x2

√y

A

Figure 6.5 Représentation de la partie A

186

Page 194: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Intégrales doubles

Définissons G : x ∈ [0, +∞[ →∫ +∞

x2

1(1 + x + y)2

dy.

On a :

⎧⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎩

G(x) = −[

11 + x + y

]+∞

x2

=1

1 + x + x2,∫ +∞

0G(x)dx =

2√3

∫ +∞

1√3

dv1 + v2 , (poser x + 1/2 =

√3

2v),

∫ +∞

0G(x)dx =

2√3

(p

2− p

6) =

2p

3√

Définissons H : y ∈ [0, +∞[ →∫ √

y

0

1(1 + x + y)2

dx.

On a :

⎧⎪⎪⎨⎪⎪⎩H(y) = −

[1

1 + x + y

]√y

0

=1

1 + y− 1

1 + y +√

y.∫ +∞

0H(y) dy =

∫ +∞

0

2u2

(1 + u2)(1 + u + u2)du, (poser y = u2).

On vérifie que2u2

(1 + u2)(1 + u + u2)=

2u1 + u2 − 2u + 1

1 + u + u2 +1

1 + u + u2 ·

On a donc : ∫ +∞

0H(y) dy =

[ln

1 + u2

1 + u + u2

]+∞

0

+∫ +∞

0

du1 + u + u2

=∫ +∞

0

du1 + u + u2

=2p

3√

3.

On aura ∫∫A

1(1 + x + y)2

dxdy =∫ +∞

0G(x)dx =

∫ +∞

0H(y) dy =

2p

3√

➤ RemarqueDans chacun des cas évoqués ci-dessus, on peut définir l’application ~f : R2 �→ R prolongée de l’application f dela façon suivante

∀x ∈ A f (x) = f (x), ∀x ∈ R2� A, f (x) = 0.

On pose alors ∫∫R2

f (x, y) dxdy =

∫∫A

f (x, y) dxdy.

5.6 Changement de variables en coordonnées polaires

Dans cette section, on notera w l’application

(r, u) ∈ [0, +∞[ × R → (r cos u, r sin u).

187

Page 195: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

Les théorèmes généraux sur le changement de variable permettent de conclure que

Proposition 19

Soient un réel a et D un domaine élémentaire de [0, +∞[ × [a, a + 2p].Si w(D) est un domaine élémentaire de R

2, pour toute fonction f continue sur w(D), on a∫∫w(D)

f (x, y)dxdy =∫∫

Df (r cos u, r sin u)rdrdu.

On admettra que cette proposition est encore vraie si D et w(D) sont des produitsd’intervalles quelconques sous réserve que les intégrales puissent être définies.Par exemple, D = [0, +∞[ × [0, 2p], et alors w(D) = R

2,ou encore D = [0, +∞[ × [0, p/2], et w(D) = [0, +∞[×[0, +∞[.

Exemples1. Calculer le volume de V =

{(x, y, z) ∈ R

3; 0 � z � 4 − (x2 + y2)}

. On note que :

4− (x2 +y2) = 0 si et seulement si x2 +y2 = 4, on a donc V(V ) =∫∫

D(4− (x2 +y2))dxdy,

avec D ={

(x, y) ∈ R2; x2 + y2 � 4

}. En utilisant les coordonnées polaires, on a :

V =∫∫

[0,2]×[0,2p](4 − r2)rdrdu

= 2p

∫ 2

0(4 − r2)rdr

= 8p.

2. L’intégrale de Gauss

Nous avons démontré plus haut que l’intégrale∫ +∞

0e−t2dt converge. Comme

e−(x2+y2) = e−x2

e−y2

on peut affirmer que∫∫[0,+∞[×[0,+∞[

e−(x2+y2)dxdy =(∫ +∞

0e−t2dt

)2

D’autre part, en utilisant les coordonnées polaires, on aura :

w([0, +∞[ × [0, p/2]

)= [0, +∞[×[0, +∞[

et∫∫

[0,+∞[×[0,+∞[e−(x2+y2)dxdy =

∫∫[0,+∞[×[0,p/2]

re−r2

drdu.

Or ∫∫[0,+∞[×[0,p/2]

re−r2

drdu =∫ p/2

0du ×

∫ +∞

0re−r2

dr =p

2× 1

On en déduit que ∫ +∞

0e−t2dt =

√p

188

Page 196: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. 1. Montrer que l’intégrale∫ ∞

1

(1t− Arcsin

1t

)dt converge et la calculer.

2. Soit n ∈ N∗, montrer que l’intégrale

∫ 1

0(ln t)n dt converge et la calculer.

3. Déterminer l’ensemble I des réels x tels que∫ 1

0t−x ln t dt converge. Pour tout x dans I

calculer∫ 1

0t−x ln t dt.

4. Déterminer l’ensemble I des réels x tels que∫ ∞

0e−xt sin t dt converge. Pour tout x dans I

calculer∫ ∞

0e−xt sin t dt.

2. Déterminer, dans chacun des cas suivants, l’ensemble des réels x tels que l’intégraleproposée converge.

1.∫ +∞

0

Arctan xt

1 + t2dt. 2.

∫ +∞

0e−xt sin t

tdt.

3.∫ +∞

0

e−xt2

1 + t2dt. 4.

∫ +∞

0

1 − cos txt2

e−t dt.

5.∫ 1

0

1 − tln t

tx dt. 6.∫ 1

0

ln t ln(1 − t)t

t−x dt.

3. Intégrale de Gauss

1. Montrer que pour tout n ∈ N∗, et pour tout t ∈

[0,√

n[

on a(1 − t2

n

)n

� e−t2 � 1(1 +

t2

n

)n ·

2. Montrer que ∫ √n

0

(1 − t2

n

)n

dt =√

n∫ p/2

0(sin u)2n+1 du;

∫ √n

0

1(1 +

t2

n

)n dt =√

n∫ p/4

0(cos u)2n−2du.

3. On rappelle (voir le cours de première année) que∫ p/2

0(sint)n dt ∼

+∞

√p

2n·

Montrer que ∫ ∞

0e−t2 dt =

√p

189

Page 197: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

4. 1. En utilisant une intégration par parties, montrer que l’intégrale∫ +∞

0

sin tt

dt

converge et que∫ +∞

0

sin tt

dt =∫ +∞

0

1 − cos tt2

dt·

2. Montrer que∫ ∞

0

sin tt

dt =∫ +∞

0

sin2 tt2

dt·

5. Intégrales de Bertrand

Soit (a, b) ∈ R2, on se propose d’étudier la nature de l’intégrale

∫ +∞

e

(ln t)b

tadt·

1. On suppose a > 1 et l’on pose a = 1 + 2h. On a alors(ln t)b

ta=

(ln t)b

th1

t1+h, en déduire la

nature de∫ +∞

e

(ln t)b

tadt·

2. On suppose a < 1 et l’on pose a = 1 − 2h. On a alors(ln t)b

ta= th(ln t)b 1

t1−h, en déduire

la nature de∫ +∞

e

(ln t)b

tadt·

3. Étudier maintenant le cas où a = 1.

6. 1. Soit c un réel strictement positif, montrer que quels que soient les réels ´ et x tels

que 0 < ´ < x, on a∫ x

´

e−t − e−ct

tdt =

∫ c´

´

e−t

tdt −

∫ cx

x

e−t

tdt.

2. Montrer que limx→+∞

∫ cx

x

e−t

tdt = 0.

3. Montrer que lim´→+∞

∫ c´

´

e−t

tdt = ln c.

4. En déduire que∫ +∞

0

e−t − e−ct

tdt converge et que

∫ +∞

0

e−t − e−ct

tdt = ln c.

5. Soient a et b deux réels tels que 0 < a < b, montrer que∫ +∞

0

e−at − e−bt

tdt converge et

que∫ +∞

0

e−at − e−bt

tdt = ln

ba·

7. Montrer que l’intégrale∫ +∞

0

Arctan pt − Arctan tt

dt converge et calculer sa

valeur. (On utilisera des méthodes analogues à celles qui sont utilisées dans l’exerciceprécédent).

190

Page 198: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

8. 1. Soit (a, b) ∈ R2, montrer que l’intégrale

∫ 1

0(− ln t)a(1 − t)bdt converge si et

seulement si a + b > −1. On notera D = {(a, b) ∈ R2 ; a + b > −1}.

2. Montrer que pour tout n ∈ N∗ et pour tout (a, n) ∈ D, on a :∫ 1

0(− ln t)a(1 − t)ndt = G(a + 1)

n∑k=0

(−1)k(n

k

)(k + 1)a+1 ·

3. On suppose a = 1 et b = −1.

Montrer que pour tout t ∈ [0, 1[ ,1

1 − t=

n∑k=0

tk +tn+1

1 − t,

en déduire que∫ 1

0

− ln t1 − t

dt =∞∑

n=1

1n2·

9. Soit a un réel strictement positif.

1. Montrer que la série∑n∈N

e−a√

n est convergente.

2. On pose Sn(a) =n∑

k=0

e−a√

k, S(a) =+∞∑k=0

e−a√

k et In(a) =∫ n

0e−a

√t dt.

Montrer que Sn(a) − 1 � In(a) � Sn(a).

En déduire que S(a) − 1 � 2a2

� S(a).

3. Déterminer un équivalent de S(a) au voisinage de zéro.

10. 1. Soit a un réel non nul, calculer∫ p/2

0

dt1 + a2 sin2 t

·

2. Montrer que pour tout n ∈ N,∫ (n+1)p

np

1

1 + et sin2 tdt �

∫ p

0

dt1 + enp sin2 t

·

3. Montrer que la série∑n∈N

∫ p

0

dt1 + enp sin2 t

converge.

4. En déduire que l’intégrale∫ ∞

0

dt1 + etsin2t

converge.

11. 1. Soit D ={

(x, y) ∈ R2; y + x � 0, y − 2x � 0, 0 � y � 4

},

calculer∫∫

De

xy dxdy.

2. Soit D ={

(x, y) ∈ R2; y − x � 0, x2 + y � 0

},

calculer∫∫

D

√y − x dxdy.

191

Page 199: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extensions de la notion d’intégrale

3. Soit D ={

(x, y) ∈ R2; x � 0, y � 0, y + x � 1

},

calculer∫∫

Dln(1 + x + y) dxdy.

12. 1. Soit D ={

(x, y) ∈ R2; x2 + y2 − 2y � 0

},

calculer∫∫

D(x + y) dxdy.

2. Soit D ={

(x, y) ∈ R2; y � x, x2 + y2 − 2x � 0

},

calculer∫∫

D

√x2 + y2 dxdy.

3. Soit D l’intérieur du triangle de sommets (0, 0), (3, 0), (3, 3),

calculer∫∫

D

√x2 + y2 dxdy.

4. Soit D ={

(x, y) ∈ R2; x � 0, x2 + y2 � 4

},

calculer∫∫

Dcos(x2 + y2) dxdy.

13. 1. Soit D ={

(x, y) ∈ R2; x2 + y2 � 1, x2 + y2 − 2y � 0

},

calculer l’aire de D.

2. Soit D ={

(x, y) ∈ R2; x � 0, y � 0, x2 + y2 � √

xy}

,calculer l’aire de D.

3. Soient a un réel strictement positif et soitV =

{(x, y, z) ∈ R

3; x2 + y2 + z2 � a2, x2 + y2 − ax � 0}

,calculer le volume de V .

14. Montrer que l’intégrale∫∫

[0,∞[×[0,∞[e−(x+y)(x + y)2 dxdy converge et calculer sa

valeur.

15. 1. Montrer que l’intégrale∫∫

[0,∞[×[0,∞[

dxdy(1 + xy2)(1 + x)

converge et calculer sa

valeur, soit I cette valeur.

2. Comparer I et∫ 1

0

ln tt2 − 1

dt.

192

Page 200: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

16. On se propose de montrer que pour tous réels p, q strictement positifs

B(p, q) =G(p)G(q)G(p + q)

·

1. Montrer que∫∫

]0,+∞[×]0,+∞[e−(x2+y2)x2p−1y2q−1 dxdy converge, et que

∫∫]0,+∞[×]0,+∞[

e−(x2+y2)x2p−1y2q−1 dxdy = G(p)G(q).

2. En utilisant les coordonnées polaires montrer que

G(p)G(q) = 2G(p + q)∫ p

20

(cos u)2p−1(sin u)2q−1 du.

3. Grâce à un changement de variable bien choisi, montrer que

B(p, q) =G(p)G(q)G(p + q)

·

193

Page 201: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

7Espaces probabilisés

En première année, nous avons présenté la notion d’espace probabilisé dans le casparticulier d’un univers fini. Nous allons généraliser les définitions à un univers quel-conque, en nous concentrant sur le cas où l’univers n’est pas fini. La théorie est pluscompliquée : une partie de l’univers n’est pas nécessairement un événement ; l’additi-vité de la probabilité s’étend aux réunions dénombrables d’événements incompatibles ;les systèmes complets d’événements peuvent être dénombrables et pas seulement finis.

1. Espaces probabilisables

1.1 Expérience aléatoire

On rappelle qu’on appelle expérience aléatoire une expérience dont le résultat ne peutpas être prévu de manière certaine. En général, l’ensemble des résultats possibles d’uneexpérience aléatoire est connu ou peut au moins être inclus dans un ensemble connu.

Définition 1

L’ensemble des résultats possibles d’une expérience aléatoire est appelé univers (ou uni-vers des possibles, ou ensemble fondamental), noté en général V.Un élément de cet ensemble V est appelé un possible ou une éventualité.Il est dit réalisé s’il est effectivement constaté lors d’un déroulement particulier de l’ex-périence.

Exemples1. Soit l’expérience consistant à lancer une pièce de monnaie et à s’arrêter dés que l’on obtient

pile pour la première fois. Si l’on obtient pile au n-ième lancer, le résultat obtenu pourraêtre représenté par la suite (F, . . . , F, P)︸ ︷︷ ︸

n termes

. Mais il se peut que l’on obtienne jamais pile,

résultat qu’on peut représenter par une infinité de F. En notant v0 ce résultat, on obtient

V = {(F, . . . , F, P︸ ︷︷ ︸n termes

, n ∈ N∗} ∪ {v0}.

Page 202: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisables

Cet ensemble est infini et dénombrable. On rappelle qu’un ensemble est dénombrable s’ilpeut être mis en bijection avec N.

2. Observons la durée de vie d’une ampoule électrique. Le résultat est un réel positif ou nul.Il est assez délicat de majorer simplement cette durée de vie ; en effet, si nous imposionsdans notre expérience une durée de vie maximale donnée M , l’ampoule que nous étudionspourrait être fort exceptionnelle et continuer à fonctionner après cette durée M .C’est pourquoi nous prendrons ici V = R

∗+ =]0, +∞[, même s’il est clairement absurde

d’envisager des ampoules encore en activité dans un million d’années !Cette fois-ci, l’univers V est un ensemble infini non dénombrable.

Notation

Les éléments de V sont en général notés v.Si V est un ensemble fini contenant n éléments, alors on pose V = {v1, . . . , vn} ;si V est dénombrable, on pose V = {vi, i ∈ N} (nous serons parfois amenés parcommodité à choisir N∗ plutôt que N).

1.2 Les événements

Un événement est une propriété attachée à l’expérience qui peut être vérifiée ounon. On identifie un tel événement avec l’ensemble des résultats pour lesquels elleest vérifiée. Un événement est donc une partie de l’univers V, c’est-à-dire unélément de P(V).ExempleReprenons l’expérience consistant à lancer une pièce de monnaie jusqu’à l’obtention du pre-mier pile.

L’événement « l’expérience se termine avant le quatrième lancer » est

{(P), (F, P), (F, F, P), (F, F, F, P)}.

L’événement « l’expérience ne se termine pas » est le singleton {v0}.

On ne sait pas a priori si toute partie de V est un événement. Ceci sera précisé plusloin. Mais certaines parties de V peuvent être considérées raisonnablement commedes événements.

Définition 2

• V est un événement de V, appelé événement certain.

• ∅ est un événement de V, appelé événement impossible.

• Un événement contenant un seul élément, si c’est possible, est appelé événementélémentaire de V.

Définition 3

Soit A un événement. On dit que A est réalisé si le résultat de l’expérience appartient à A.

195

Page 203: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Définition 4

Pour tous événements A et B d’un univers V, on dit que l’événement A impliquel’événement B si A ⊂ B, c’est-à-dire si, lorsque A est réalisé, B est réalisé aussi.

Définition 5

Soit V un univers. Deux événements A et B de V tels que A ∩ B = ∅ sont dits incom-patibles.

➤ RemarqueSi A est un événement, alors A et son contraire A sont incompatibles.

Opérations sur les événementsSi A et B sont deux événements liés à la même expérience, il est naturel de considérerque la non réalisation de A, la réalisation simultanée de A et B, la réalisation de l’unau moins des événements A et B sont des événements.

Définition 6

Soit V un univers.Pour tout événement A de V, le complémentaire de A dans V, noté A, est un événement,appelé l’événement contraire de A.La réunion A∪B de deux événements A et B de V est un événement, appelé « A ou B ».L’intersection A ∩ B de deux événements A et B de V est un événement, appelé « A etB ».

➤ RemarqueOn rappelle les lois de Morgan, utiles dans les démonstrations qui suivent : toutes parties A et B de V vérifientles relations

A ∪ B = A ∩ B et A ∩ B = A ∪ B.

Du fait que la réunion et l’intersection de deux événements et le complémentaired’un événement est un événement, on tire les proposition suivantes.

Proposition 1

L’intersection et la réunion d’un nombre fini d’événements sont des événements.

PreuveSoit A1, . . . , An des événements.

On montre par récurrence sur n ∈ N que A1 ∪ . . . ∪ An est un événement. C’est vrai pour n = 1 et si c’est vraiau rang n, on considère des événements A1, . . . , An+1. Alors A1 ∪ . . .∪An est un événement, par hypothèse derécurrence, et

A1 ∪ . . . ∪ An+1 =(A1 ∪ . . . ∪ An

)∪ An+1

est un événement car réunion de deux événements.

Comme le complémentaire d’un événement est événement, A1, . . . , An sont des événements donc A1∪. . .∪An

est un événement d’après le premier point et donc

A1 ∩ . . . ∩ An = A1 ∪ . . . ∪ An

est un événement car complémentaire d’un événement. ❑

196

Page 204: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisables

➤ RemarqueDans le cas où V n’est pas fini, il apparaît nécessaire de considérer des réunions dénombrables d’événements.

ExempleReprenons l’expérience consistant à lancer une pièce de monnaie jusqu’à l’obtention du pre-mier pile. L’événement An : « l’expérience se termine après le n-ième lancer » s’écrit

An =+∞⋃

k=n+1

{(F, . . . , F︸ ︷︷ ︸k−1 termes

, P)}.

C’est une réunion dénombrables d’événements élémentaires.

Il semble donc nécessaire, en plus des propriétés précédentes de supposer que l’en-semble des événements est stable par réunion dénombrable, c’est-à-dire que,si (An)n∈N est une suite d’événements, alors

⋃n∈N

An est un événement.

1.3 L’ensemble des événements

On note T l’ensemble des événements. C’est un sous-ensemble de P(V). Dans lecas où V est fini ou dénombrable, nous considérerons que toute partie de V est unévénement et prendrons T = P(V), ensemble de toutes les parties de V. Mais si V

n’est pas dénombrable, il n’est pas possible de prendre T = P(V), car cela interdit dedéfinir une probabilité raisonnable ; T sera alors une partie stricte de P(V) qui vérifietoutes les propriétés mises en évidence précédemment.

Cela nous conduit à la définition suivante.

Définition 7

On appelle espace probabilisable un couple (V, T ) constitué d’un ensemble V et d’unsous-ensemble T de P(V) vérifiant les propriétés suivantes :

• V appartient à T ;

• T est stable par passage au complémentaire, c’est-à-dire que, pour tout élément A deT , A appartient à T ;

• T est stable par réunion dénombrable, c’est-à-dire que, si (An)n∈N est une suite d’élé-ments de T , alors

⋃n∈N

An appartient à T .

L’ensemble V est appelé l’univers ; tout élément de T est appelé un événement de V.

Le théorème suivant nous montre que l’on retrouve ainsi toutes les propriétés quel’on souhaitait voir vérifiées par l’ensemble des événements.

197

Page 205: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Proposition 2

Soit (V, T ) un espace probabilisable. Alors

• ∅ appartient à T ;

• T est stable par intersection dénombrable, c’est-à-dire que, si (An)n∈N est une suited’éléments de T , alors

⋂n∈N

An appartient à T ;

• T est stable par réunion et intersection finie, c’est-à-dire que, étant donné un nombrefini A1, . . . , An d’éléments de T , A1 ∪ . . . ∪ An et A1 ∩ . . . ∩ An appartiennent à T ;

• pour tous éléments A et B de T , A \ B et ADB appartiennent à T .

Preuve

• ∅ appartient à T car V appartient à T et T est stable par passage au complémentaire.

• Soit (An)n∈N d’éléments de T . Pour tout entier n, An appartient à T , donc+∞⋃n=0

An appartient à T . Comme

+∞⋃n=0

An =+∞⋂n=0

An, on en déduit que+∞⋂n=0

An appartient à T , par passage au complémentaire.

• Si A1, . . . , An sont des éléments de T , en posant Ai = ∅ si i = 0 ou i > n, on obtient, par stabilité par

réunion dénombrable+∞⋃i=0

Ai ∈ T , c’est-à-dire A1 ∪ . . . ∪ An ∈ T .

De même, en posant A0 = V et Ai = V pour i > n, on obtient, par stabilité par intersection dénombrable,+∞⋂i=0

Ai ∈ T , c’est-à-dire A1 ∩ . . . ∩ An ∈ T .

• Si A et B appartiennent à T , il en est de même de A \ B = A ∩ B et ADB = (A ∩ B) ∪ (B ∩ A), d’après lespropriétés précédentes.

➤ Remarques• Soit V un ensemble et T une partie de P (V). On dit que T est une tribu de V si

• V appartient à T ;

• T est stable par passage au complémentaire, c’est-à-dire que, pour tout élément A de T , A appartient àT ;

• T est stable par réunion dénombrable,

On pourrait donc dire qu’un espace probabilisable est un couple (V,T ), où T est une tribu sur V. Cependant,la notion de tribu n’est pas au programme.

• Dans le cas où l’univers V est fini ou dénombrable, l’ensemble des événements est P (V) et l’espaceprobabilisé est

(V,P (V)

).

On peut noter également que si V est un ensemble fini, alors P (V) est également fini. Toute intersection (resp.réunion) au plus dénombrable d’éléments de T se réduit à une intersection (resp. une réunion finie). La sta-bilité par réunion ou intersection dénombrable est une notion inutile dans un espace probabilisablefini.

• Dans le cas où V n’est pas dénombrable, construire un espace probabilisable (V,T ) qui permette de décrirela situation est très difficile. Dans la pratique l’existence d’un tel espace probabilisable sera une donnée del’énoncé.

198

Page 206: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

1.4 Systèmes complet d’événements

Définition 8

Soit (V, T ) un espace probabilisable.On appelle système complet d’événements de cet espace probabilisable toute famillefinie ou dénombrable (Ai)i∈I d’événements, où I = N ou I = [[1, n]] (n ∈ N

∗), telle que

• pour tout couple (i, j) d’éléments distincts de I , Ai ∩ Aj = ∅ ;

•⋃i∈I

Ai = V.

➤ Remarques• Si (Ai )i∈I est un système complet d’événements de V, alors (Ai )i∈I est une partition de V si, et seulement si,

tous les Ai sont différents de∅. Certains auteurs ajoutent cette condition à la définition des systèmes complets.

• Si le système complet d’événements est dénombrable, on prend souvent I = N∗ plutôt que N.

Proposition 3

Soit (V, T ) un espace probabilisable.

• Pour tout événement A de V, la famille (A, A) est un système complet d’événements.

• Si l’univers est fini V = {v1, . . . , vn}, alors la famille({v1}, {v2}, . . . , {vn}

), for-

mée des événements élémentaires, est un système complet d’événements.

• Plus généralement, pour tout univers au plus dénombrable V = {vi, i ∈ N}, la famille({vi}

)i∈N

, formée des événements élémentaires est un système complet d’événements.

2. Espaces probabilisésDans le cas d’un univers fini, on a défini une probabilité comme une applicationde P(V) dans [0, 1] additive, c’est-à-dire vérifiant P(A ∪ B) = P(A) + P(B), pourtout couple d’événements incompatibles (A, B). Pour traiter le cas où V est infini, onimpose une condition d’additivité plus forte.

2.1 Probabilité

Définitions

Définition 9

On appelle probabilité sur l’espace probabilisable (V, T ) toute application P de T dansR+ vérifiant

• P(V) = 1,

199

Page 207: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

• pour toute suite (Ai)i∈N d’événements deux à deux incompatibles, la série de termegénéral P(Ai) converge et

P

(⋃i∈N

Ai

)=

+∞∑i=0

P(Ai).

Pour tout A élément de T , P(A) est appelée la probabilité de l’événement A.

➤ Remarques

• Le nombre+∞∑i=0

P(Ai ) est la somme d’une série à termes positifs.

• La seconde propriété est appelée la s-additivité.

• Il résulte de la définition que les événements sont les parties de V auxquelles on peut associer une probabilité.

Définition 10

Un espace probabilisé est un triplet (V, T , P), où (V, T ) est un espace probabilisable etP une probabilité sur (V, T ).

Propriétés

Théorème 1

Soit (V, T , P) un espace probabilisé. On a alors :

1. P(∅) = 0 ;

2. pour toute famille finie (A1, A2, . . . , An) d’événements deux à deux incompatibles,

P (A1 ∪ . . . ∪ An) =n∑

k=1

P(Ak).

En particulier, pour tout couple (A, B) d’événements incompatibles

P(A ∪ B) = P(A) + P(B) ;

3. pour tout événement A,P(A) = 1 − P(A)

et0 � P(A) � 1;

4. pour tout couple (A, B) d’événements vérifiant A ⊂ B, on a

P(B \ A) = P(B) − P(A)et donc

P(A) � P(B) ;

on dit que l’application P est croissante ;

5. pour tout couple (A, B) d’événements,

P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

200

Page 208: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

Preuve1. Considérons la famille d’événements incompatibles (Ai )i∈N où Ai = ∅ pour tout entier naturel i. Alors, par

définition d’une probabilité, la série de terme général constant P(∅) converge, d’où P(∅) = 0.

2. Soit (A1, . . . , An) une famille finie d’événements deux à deux incompatibles. La suite (Ak)k∈N, où Ak = ∅pour tout entier k � n + 1 et pour k = 0, est une famille d’événements deux à deux incompatibles.Alors, par définition de la probabilité,

P

(+∞⋃k=0

Ak

)=

+∞∑k=0

P(Ak) = P(A0) +n∑

k=0

P(Ak) ++∞∑

i=n+1

P(Ak).

Comme P(∅) = 0 et+∞⋃k=0

Ak = A1 ∪ . . . ∪ An, on obtient

P(A1 ∪ . . . ∪ An) =n∑

k=1

P(Ak).

Ainsi la seconde propriété de la définition d’une probabilité est vraie pour une réunion finie. En particulier,pour deux événements incompatibles, on trouve

P(A ∪ B) = P(A) + P(B).

3. On a par définition, puisque A et A sont incompatibles,

P(A) + P(A) = P(A ∪ A

)= P(V) = 1

et donc P(A) = 1 − P(A). Comme P(A) � 0, on en déduit P(A) � 1 et donc P(A) ∈ [0, 1].

4. Si A ⊂ B, B est la réunion des événements incompatibles A et B \ A et donc

P(B) = P(A) + P(B \ A) � P(A).

On en déduit P(B \ A) = P(B) − P(A).

5. L’événement A ∪ B est la réunion des deux événements incompatibles A et B \ A ; d’autre part, B est laréunion des événements incompatibles A ∩ B et B \ A. On a donc

P(A ∪ B) = P(A) + P(B \ A) et P(B) = P(A ∩ B) + P(B \ A).

On en déduit queP(A ∪ B) = P(A) + P(B) − P(A ∩ B). ❑

➤ RemarqueAinsi toute probabilité est une application à valeurs dans [0, 1].

Corollaire 1

Pour tout couple d’événements (A, B) de l’espace probabilisé (V, T , P), on a

P(A ∪ B) � P(A) + P(B).

PreuveCela découle directement du point 5 du théorème précédent. ❑

201

Page 209: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Définition 11

Soit (V, T , P) un espace probabilisé. Tout événement A tel que P(A) = 0, différent de∅, est dit négligeable ou quasi-impossible.Tout événement de probabilité 1, différent de V, est dit presque certain ou quasi-certain.Toute propriété vérifiée sur un ensemble de probabilité 1 est dite presque sûrementvraie ou presque sûre.

➤ RemarqueNous verrons que dans le cas d’un univers infini, un événement A peut être quasi-impossible, c’est-à-dire deprobabilité nulle, sans que A = ∅ (cf l’étude du jeu de pile ou face, paragraphe 2.4.2 page 210). L’événementcontraire est alors quasi-certain, c’est-à-dire de probabilité 1, sans être égal à V.

Propriétés des systèmes complets d’événements

Proposition 4

Pour tout système complet fini d’événements (A1, . . . , An) de l’espace probabilisé(V, T , P), on a

n∑i=1

P(Ai) = 1.

Pour tout système complet dénombrable d’événements (Ai)i∈N de V, la série de termegénéral P(Ai) converge et

+∞∑i=0

P(Ai) = 1.

Preuve• Soit (A1, . . . , An) un système complet d’événements de V.

Par additivité finie, comme la famille (A1, . . . , An) est une famille d’événements deux à deux incompatibles,

P(n⋃

i=1Ai ) =

n∑i=1

P(Ai ).

De l’égalitén⋃

i=0Ai = V découle

n∑i=1

P(Ai ) = 1.

• Soit (Ai )i∈N un système complet d’événements de V.Les événements Ai sont deux à deux incompatibles, donc par s-additivité de la probabilité P, la série determe général P(Ai ) converge et

P(⋃i∈N

Ai ) =+∞∑i=0

P(Ai ).

Or, par définition d’un système complet d’événements,⋃

i∈NAi = V, d’où le résultat. ❑

Proposition 5

Pour tout système complet fini d’événements (A1, . . . , An) de l’espace probabilisé(V, T , P) et tout événement B, on a

P(B) =n∑

i=1

P(B ∩ Ai).

202

Page 210: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

Pour tout système complet d’événements dénombrable (Ai)i∈N de (V, T , P) et tout évé-nement B, la série de terme général P(B ∩ Ai) converge et sa somme vaut P(B).

Preuve• Soit (A1, . . . , An) un système complet d’événements. Comme les événements A1, . . . , An sont deux à deux

incompatibles, les événements B ∩ A1, . . . , B ∩ An sont aussi deux à deux incompatibles.

Par additivité finie, on obtient, P( n⋃

i=1(B ∩ Ai )

)=

n∑i=1

P(B ∩ Ai ).

Commen⋃

i=1(B ∩ Ai ) = B ∩ (

n⋃i=1

Ai ) = B ∩ V = B, on obtient

P(B) =n∑

i=1

P(B ∩ Ai ).

• Soit (Ai )i∈N un système complet d’événements. Le raisonnement est identique.Les événements B ∩ Ai sont deux à deux incompatibles, donc par s-additivité, la série de terme généralP(B ∩ Ai ) converge et

P( ⋃

i∈N(B ∩ Ai )

)=

+∞∑i=0

P(B ∩ Ai ).

Comme⋃

i∈N(B ∩ Ai ) = B, on a le résultat voulu. ❑

La propriété de la limite monotone qui fait l’objet de l’exercice suivant est une consé-quence très forte de la s-additivité.

Exercice 1. Propriété de la limite monotoneSoit (V, T , P) un espace probabilisé.

1. Montrer que, pour toute suite (An)n∈N croissante d’éléments de T , c’est-à-dire vérifiantAn ⊂ An+1 pour tout entier n de N, on a

P( +∞⋃

n=0

An

)= lim

n→+∞P(An).

2. Montrer que, pour toute suite (An)n∈N décroissante d’éléments de T , c’est-à-dire vérifiantAn+1 ⊂ An pour tout entier n de N, on a

P( +∞⋂

n=0

An

)= lim

n→+∞P(An).

3. En déduire que, pour toute suite (An)n∈N d’événements d’un espace probabilisé (V, T , P),on a

P( +∞⋃

n=0

An

)= lim

n→+∞P( n⋃

k=0

Ak

),

P( +∞⋂

n=0

An

)= lim

n→+∞P( n⋂

k=0

Ak

).

203

Page 211: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Solution.

1. Étant donnée une (An)n∈N croissante d’événements, on considère la suite (Bn) définie parB0 = A0 et, pour tout n ∈ N

∗, Bn = An \ An−1.

On note que, pour tout n ∈ N, on a Bn ⊂ An donc+∞⋃n=0

Bn ⊂+∞⋃n=0

An. Mais d’autre part si

v ∈+∞⋃n=0

An et si m est le plus petit entier k tel que v ∈ Ak, on a v ∈ Am \ Am−1 ⊂ Bm

donc v ∈+∞⋃n=0

Bn. On a donc+∞⋃n=0

An =+∞⋃n=0

Bn. On montre de même que, pour tout n ∈ N,

on a An =n⋃

k=0Bk. En effet, on a par définition

n⋃k=0

Bk ⊂n⋃

k=0

Ak ⊂ An

et réciproquement si v ∈ An et si m est le plus petit entier k tel que v ∈ Ak, on a m � n

et v ∈ Bm donc v ∈n⋃

k=0Bk.

Les événements Bn étant par définition incompatibles on a

P( +∞⋃

n=0

An

)= P

( +∞⋃n=0

Bn

)=

+∞∑n=0

P(Bn) = limn→+∞

n∑k=0

P(Bk),

par définition de la somme d’une série. Mais on a, toujours par incompatibilité des événe-ments Bn,

n∑k=0

P(Bk) = P( n⋃

k=0

Bk

)= P(An).

Finalement, on obtient

P( +∞⋃

n=0

An

)= lim

n→+∞P(An).

2. Si (An)n∈N est une suite décroissante d’événements, la suite (An)n∈N est une suite croissanted’événements. En appliquant les résultats de la première question, on trouve donc

P( +∞⋃

n=0

An

)= lim

n→+∞P(An).

On observe que+∞⋃n=0

An =+∞⋂n=0

An. On en déduit que

P( +∞⋂

n=0

An

)= 1 − P

( +∞⋃n=0

An

)= 1 − lim

n→+∞P(An) = lim

n→+∞

(1 − P(An)

)= lim

n→+∞P(An).

3. La suite (Bn)n∈N définie par Bn =n⋃

k=0Ak est croissante et

+∞⋃n=0

Bn =+∞⋃n=0

An. On a donc

P( +∞⋃

n=0

An

)= P

( +∞⋃n=0

Bn

)= lim

n→+∞P(Bn) = lim

n→+∞P( n⋃

k=0

Ak

).

204

Page 212: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

De même, la suite (Cn)n∈N définie par Cn =n⋂

k=0Ak est décroissante et

+∞⋂n=0

Cn =+∞⋂n=0

An.

On a donc

P( +∞⋂

n=0

An

)= P

( +∞⋂n=0

Cn

)= lim

n→+∞P(Cn) = lim

n→+∞P( n⋂

k=0

Ak

).

2.2 Probabilité sur un ensemble fini

Dans le cas où V est fini, l’ensemble des événements est fini. Une suite d’événementsincompatibles ne comporte qu’un nombre fini d’événements différents de ∅. La s-additivité est équivalente à l’additivité finie. Celle-ci peut se démontrer à partir del’additivité pour deux événements par récurrence sur n. On en déduit le théorèmesuivant.

Théorème 2

Soit (V,P(V)) un espace probabilisé fini. Toute application P de P(V) dans R+ vérifiant

• P(V) = 1 ;

• pour tous événements A et B incompatibles,

P(A ∪ B) = P(A) + P(B)

est une probabilité.

Ainsi une probabilité sur un espace probabilisé fini telle que nous l’avons définieen première année apparaît comme un cas particulier de la définition donnée pourun espace probabilisé quelconque. Comme nous l’avons vu en première année, uneprobabilité P sur un ensemble probabilisé fini (V,P(V)) est entièrement déterminépar la connaissance des probabilités des événements élémentaires. Nous avons en effetdémontré le théorème suivant.

Théorème 3

Soit n ∈ N∗ et V = {v1, v2, . . . , vn} un ensemble fini. On considère n nombres réelsp1, p2, . . . , pn.Alors il existe une probabilité P sur (V,P(V)) telle que P({vi}) = pi pour tout i ∈ [[1, n]]si, et seulement si,

∀i ∈ [[1, n]] pi � 0 etn∑

i=1

pi = 1.

Quand elle existe, la probabilité P est unique et, pour tout événement A, on a

P(A) =∑i∈[[1,n]]vi∈A

pi.

205

Page 213: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Équiprobabilité

Théorème 4

Sur tout espace probabilisable (V,P(V)) où V est un ensemble fini non vide de cardinaln, il existe une unique probabilité P prenant la même valeur sur tous les événementsélémentaires.

Pour tout élément v de V, P({v}) =1n

et, pour tout événement A,

P(A) =Card(A)

n=

Card(A)Card(V)

·

Définition 12

Pour tout univers V de cardinal fini, la probabilité définie sur (V,P(V)) par

P(A) =Card(A)Card(V)

pour tout événement A est appelée la probabilité uniforme sur V.

Cas d’un univers dénombrable

Dans un espace probabilisé(V,P(V)

)dont l’univers est dénombrable, une probabi-

lité est, comme dans un espace probabilisé fini, déterminée par la connaissance desprobabilités des événements élémentaires. Nous admettrons le théorème suivant quigénéralise le théorème 3.

Théorème 5

Soit V = {vn, n ∈ N} un ensemble dénombrable. On considère une suite de réels (pn).Alors il existe une probabilité P sur (V,P(V)) telle que P({vn}) = pn pour tout n ∈ N si,et seulement si,

∀n ∈ N pn � 0 et+∞∑n=0

pn = 1.

Quand elle existe, la probabilité P est unique et, pour tout événement A, on a

P(A) =∑n∈N

vn∈A

pn.

➤ RemarquePour tout événement A infini,

∑n∈N

vn∈A

pn est la somme d’une série à termes positifs convergente car ses sommes

partielles sont majorées par+∞∑n=0

pn = 1.

206

Page 214: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

ExemplePrenons V = N. On définit une probabilité sur

(N,P(N)

)en posant pour tout n ∈ N,

P({n}

)=

(12

)n+1

.

En effet, on a d’une part, pour tout n ∈ N,(

12

)n+1

> 0 ; d’autre part, la série de terme

général

(12

)n+1

est une série géométrique de raison12

donc convergente et

+∞∑n=0

(12

)n+1

=12

+∞∑n=0

(12

)n

=12

1

1 − 12

= 1.

Calculons la probabilité de l’événement A : « l’entier est pair ». On a A = {2n, n ∈ N} donc

P(A) =+∞∑n=0

P({2n}

)=

+∞∑n=0

(12

)2n+1

=12

+∞∑n=0

(14

)n

=12

1

1 − 14

=23·

2.3 Formule du crible

La formule du crible permet le calcul de la probabilité d’union de n événements.Démontrée dans le cas des espaces probabilisés finis en première année, elle reste vraiedans un espace probabilisé quelconque, avec la même démonstration.

Théorème 6 (Formule du crible ou de Poincaré)

Pour toute famille finie (A1, A2, . . . , An) d’événements de l’espace probabilisé (V, T , P),où n est un entier naturel non nul,

P( n⋃

i=1

Ai

)=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<i2<···<ik�n

P(Ai1 ∩ Ai2 ∩ · · · ∩ Aik )

⎞⎠ .

PreuveProcédons par récurrence sur n.

Pour n = 1, le résultat est trivial. Pour n = 2, la formule du crible s’écrit

P(A1 ∪ A2) = P(A1) + P(A2) − P(A1 ∩ A2),

formule qui a été démontrée dans la proposition 1.

Supposons l’égalité vérifiée au rang n � 2, et prouvons-la au rang n+1 en considérant une famille (A1, · · · , An+1)de n + 1 événements de V.

207

Page 215: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

D’après la formule du crible au rang 2 prouvée plus haut,

P

(n+1⋃i=1

Ai

)= P

((n⋃

i=1

Ai

)∪ An+1

)

= P

(n⋃

i=1

Ai

)+ P(An+1) − P

(( n⋃i=1

Ai)⋂

An+1

)

= P

(n⋃

i=1

Ai

)+ P(An+1) − P

(n⋃

i=1

(Ai ∩ An+1)

).

Par hypothèse de récurrence, on a

P

(n⋃

i=1

Ai

)=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<···<ik�n

P(Ai1 ∩ · · · ∩ Aik )

⎞⎠ , et

P

(n⋃

i=1

(Ai ∩ An+1)

)=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<···<ik�n

P((Ai1 ∩ An+1) · · · ∩ (Aik ∩ An+1)

)⎞⎠=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<···<ik�n

P(Ai1 ∩ · · · ∩ Aik ∩ An+1)

⎞⎠ .

On obtient donc

P

(n+1⋃i=1

Ai

)=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<···<ik�n

P(Ai1 ∩ · · · ∩ Aik )

⎞⎠ + P(An+1)

+n∑

k=1

⎛⎝(−1)k∑

1�i1<···<ik�n

P(Ai1 ∩ · · · ∩ Aik ∩ An+1)

⎞⎠=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<···<ik�n

P(Ai1 ∩ · · · ∩ Aik )

⎞⎠ + P(An+1)

+n+1∑j=2

⎛⎝(−1)j−1∑

1�i1<···<ij−1�n

P(Ai1 ∩ · · · ∩ Aij−1∩ An+1)

⎞⎠ ,

avec le changement d’indice j = k + 1 dans la seconde somme. Cela peut s’écrire

P

(n+1⋃i=1

Ai

)=

n+1∑k=1

(−1)k−1∑

1�i1<···<ik�n+1

P(Ai1 ∩ · · · ∩ Aik ).

En effet dans la première somme, on trouve toutes les intersections dans lesquelles ne figure pas An+1 et dansla seconde, trouve toutes les intersections de plus de deux événements dans lesquelles figure An+1.

Finalement on a montré

P

(n⋃

i=1

Ai

)=

n∑k=1

⎛⎝(−1)k−1∑

1�i1<i2<···<ik�n

P(Ai1 ∩ Ai2 ∩ · · · ∩ Aik )

⎞⎠par récurrence. ❑

208

Page 216: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

➤ Remarques• Pour n = 3, la formule est

P(A1 ∪ A2 ∪ A3) = P(A1) + P(A2) + P(A3) − P(A1 ∩ A2) − P(A1 ∩ A3) − P(A2 ∩ A3) + P(A1 ∩ A2 ∩ A3).

• Pour k fixé, la deuxième sommation se fait sur toutes les listes strictement croissantes de k entiers compris entre1 et n. Il y a donc

(nk

)termes dans cette somme. Puisque k varie de 1 à n, le nombre total de termes au second

membre de l’égalité est donc est donc den∑

k=1

(n

k

)= 2n − 1.

En particulier, si P(Ai1 ∩ · · · ∩ Aik ) ne dépend pas des entiers i1, . . ., ik, mais seulement de k, alors∑1�i1<i2···<ik�n

P(Ai1 ∩ · · · ∩ Aik ) =(n

k

)P(A1 ∩ · · · ∩ Ak). C’est le seul cas, pour une union de n ensembles, où

la formule du crible puisse être utilisée efficacement.

L’exercice qui suit illustre la dernière remarque.

Exercice 2.On place au hasard r boules numérotées dans n cases numérotées, chaque case pouvant recevoirun nombre quelconque de boules (r et n sont des entiers strictement positifs). Quelle est laprobabilité qu’aucune case ne soit vide ?

Solution. Soit E l’événement « aucune case n’est vide » et, pour 1 � i � n, Ai l’événement« la case i est vide ». On a E = A1 ∩ A2 ∩ . . . ∩ An et donc E = A1 ∪ A2 ∪ . . . ∪ An.

On calcule P(E) grâce à la formule de Poincaré. On obtient

P(E) =n∑

k=1

(−1)k−1∑

1�i1<i2<···<ik�n

P(Ai1 ∩ Ai2 ∩ · · · ∩ Aik

).

L’événement Ai1∩Ai2∩· · ·∩Aik est réalisé si aucune boule n’est placée dans les cases numérotéesi1, i2, . . . , ik, ce qui signifie qu’elles sont toutes placées dans l’une des n − k autres cases. La

probabilité de placer ainsi une des boules estn − k

n· Les choix pour les différentes boules étant

indépendants, on en déduit P(Ai1 ∩ Ai2 ∩ · · · ∩ Aik

)=

(n − k

n

)r

. Comme il y a(n

k

)choix

d’indices i1, i2, · · · , ik pour k fixé, on obtient

P(E) =n∑

k=1

(−1)k−1

(nk

)(n − k

n

)r

et donc

P(E) = 1 − P(E) = 1 +n∑

k=1

(−1)k(

nk

)(n − k

n

)r

=n∑

k=0

(−1)k(

nk

)(n − k

n

)r

.

Dans le livre de première année, le lecteur trouvera résolu grâce à la formule du crible leproblème des rencontres dont on trouve diverses formulations.

• Problème des danseurs de Chicago : n couples se présentent à un concours de danse ; chaquedanseur choisit une partenaire au hasard. Quelle est la probabilité que personne ne danseavec son conjoint ?

209

Page 217: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

• À l’opéra n mélomanes, numérotés suivant leur ordre d’arrivée au vestiaire, y déposentleur chapeau. En échange, un ticket leur est donné, mais le responsable a mélangé tousles tickets et tous les chapeaux qui sont donc rendus au hasard. Quelle est la probabilitéqu’aucun mélomane ne récupère son chapeau ?

• Un facteur possède n lettres adressées à n personnes distinctes. Il les distribue au hasard.Quelle est la probabilité qu’aucune n’arrive à destination ?

2.4 Le jeu de pile ou face

Cet exemple vise à montrer les difficultés qu’il y a à modéliser, c’est-à-dire à construireun espace probabilisé ad hoc, dans des situations en apparence simple. Un joueur lanceà plusieurs reprises une pièce équilibrée.Déterminer la probabilité de l’événement E : « on obtient face à tous les lancers ».

Cas finiNous considérons une suite de N lancers numérotés de 1 à N . Nous choisironscomme univers des possibles l’ensemble V = {0, 1}N . Il est fini et de cardinal 2N .Comme la pièce est parfaitement équilibrée, on munit l’espace probabilisé (V,P(V))de la probabilité uniforme.Pour 1 � n � N , l’événement An, l’événement « le n-ième lancer a donné face », estl’ensemble des N-listes dont le n-ième élément est 1. Il y en a 2N−1. Sa probabilité

est donc P(An) =2N−1

2N =12·

Le nombre12

est aussi la probabilité de l’événement contraire Bn = An : « le n-ième

lancer a donné pile ».L’événement E peut s’écrire sous la forme E = A1∩A2∩· · ·∩AN . C’est un événement

élémentaire qui s’écrit E = {(1, . . . , 1)}. On a donc P(E) =1

2N ·

Cas infiniSi le nombre de lancers est infini, la modélisation théorique de ce jeu de pile ou faceest très complexe. Les lancers successifs sont notés 1, 2, 3 . . . Nous choisirons commeunivers des possibles l’ensemble V de toutes les suites (an)n∈N∗ telles que, pour toutn ∈ N

∗, an = 0 (si le n-ième lancer amène pile) ou an = 1 (si le n-ième lancer amèneface). L’univers V n’est pas dénombrable ; on peut montrer qu’il peut être mis enbijection avec R.Nous ne préciserons pas quel est l’ensemble des événements. Il vérifie l’inclusionstricte T ⊂ P(V). Nous supposons qu’il contient pour tout n ∈ N∗, l’ensemble An,défini par « le n-ième lancer a donné face » (et donc toute intersection ou réunion detels ensembles ou de leur complémentaire). Nous admettrons que sur l’espace proba-bilisable ainsi obtenu on peut définir une probabilité vérifiant la propriété suivante :pour tout n ∈ N∗,

P(An) =12·

210

Page 218: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espaces probabilisés

Le nombre12

est aussi la probabilité de l’événement contraire Bn = An, défini par « le

n-ième lancer a donné pile ».L’événement E qui fait l’objet de la question posée, peut s’écrire

E =+∞⋂n=1

An.

Si l’on note, conformément au cas fini, EN = A1 ∩ A2 ∩ · · · ∩ AN , la relation entreE et les EN est simple ; on a

E =+∞⋂n=1

An =+∞⋂N=1

EN

et donc, pour tout N ∈ N∗, E ⊂ EN , ce qui implique 0 � P(E) � P(EN ).

Si l’on se donne le droit de considérer que les résultats du cas fini peuvent avoirencore un sens dans le cas infini quand ils ne concernent que les premiers lancers,

l’étude précédente donne P(EN ) =1

2N, d’où par passage à la limite dans les inégalités

précédentes,

0 � P(E) � limN→+∞

12N

et donc P(E) = 0. Ainsi, sous les hypothèses précédentes, est-il quasi impossible den’obtenir que des côtés face lorsqu’un joueur lance une pièce équilibrée une infinitéde fois.Cela ne signifie pas toutefois que cet événement est impossible (il serait alors l’événe-ment vide) ; il contient la suite constante égale à 1.

➤ RemarqueOn peut faire le même raisonnement avec une suite de lancers d’un dé équilibré. Montrons que si on lance le déune infinité de fois, l’événement B : « on obtient au moins un 6 » est quasi-certain.

Considérons l’événement contraire B : « on obtient une suite de numéros tous différents de 6 » et, pour toutN ∈ N∗, l’événement EN : « les N premiers lancers donnent des numéros tous différents de 6 ». Une suite deN lancers peut être représentée par l’univers V = [[1, 6]]N. On le munit de la probabilité uniforme. On a alors

Card(V) = 6N , Card(EN) = 5N et donc P(EN) =

(5

6

)N

.

De 0 � P(B) � P(EN) pour tout N ∈ N∗, on déduit, par passage à la limite, P(B) = 0, puis P(B) = 1. L’événementB est quasi-impossible bien qu’il contienne une infinité d’éléments : toutes les suites (an)n∈N∗ telles que, pour toutn ∈ N∗, an ∈ [[1, 5]].

211

Page 219: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

3. Les probabilités conditionnellesLes définitions qui suivent généralisent simplement les définitions vues en premièreannée dans le cas d’un univers fini.

3.1 Définition

Théorème 7

Pour tout événement A de l’espace probabilisé (V, T , P) vérifiant P(A) �= 0, l’application

T −→ R

PA : B −→ P(B ∩ A)P(A)

est une probabilité sur (V, T , P), appelée la probabilité conditionnelle relative à A.Pour tout événement B, PA(B) qui est encore noté P(B/A) est appelé la probabilité deB sachant A.

PreuveMontrons que PA est une probabilité sur V.

• On a PA(V) =P(V ∩ A)

P(A)= 1.

• Soit (Bi )i∈N une suite d’événements deux à deux incompatibles. La famille (Bi ∩ A)i∈N est aussi une suited’événements deux à deux incompatibles. La définition de la probabilité implique que

P((⋃

i∈NBi)∩ A)

= P(⋃

i∈N(Bi ∩ A)

)=

+∞∑i=0

P(

Bi ∩ A).

On a donc

PA

⎛⎝⋃i∈N

Bi

⎞⎠ =

P

((⋃i∈N

Bi

)∩ A

)P(A)

=

+∞∑i=0

P(Bi ∩ A)

P(A)=

+∞∑i=0

PA(Bi ).❑

➤ Remarques• La probabilité PA(B) de B sachant A est à bien distinguer de la probabilité de l’intersection de B et de A égale à

P(B ∩ A).En effet dans le calcul de la probabilité PA(B), nous supposons implicitement que l’événement A est réalisétandis que dans le calcul de la probabilité P(B ∩ A), nous cherchons la probabilité de l’événement (A et B) oùl’événement A n’est pas a priori réalisé.

• Puisque PA est une probabilité, elle possède toutes les propriétés d’une probabilité. En particulier, pour toutévénement B, on a PA(B) = 1 − PA(B).

3.2 Formules liées à la probabilité conditionnelle

La formule des probabilités composéesLe plus souvent dans les exercices, on ne calcule pas PA(B) à partir de P(A ∩ B) etP(A). Au contraire, c’est la connaissance de PA(B) et P(A) qui permet le calcul deP(A ∩ B).

212

Page 220: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les probabilités conditionnelles

Proposition 6

Pour tous événements A et B d’un espace probabilisé (V, T , P), on a

P(A ∩ B) = P(A)PA(B) si P(A) �= 0 ; P(A ∩ B) = P(B)PB(A) si P(B) �= 0.

Exercice 3.

1. Le tiers d’une population a été vacciné contre une maladie. Au cours d’une épidémie, onconstate que, sur quinze malades, il y a deux personne vaccinées. Le vaccin est-il efficace ?

2. On suppose de plus que sur cent personne vaccinées, huit sont malades. Quelle est laproportion de malades dans la population ?

Solution.

1. Pour le savoir, on compare la probabilité d’être malade P(M) avec celle d’être malade

sachant que l’on a été vacciné P(M/V ). On a P(V ) =13

et P(V/M) =215

· On en déduit

P(M/V ) =P(V ∩ M)

P(V )=

P(V/M)P(M)P(V )

=25

P(M).

On a donc P(M/V ) < P(M). Le vaccin possède donc une certaine efficacité.

2. On a donc P(M/V ) =8

100=

225

· Or P(M/V ) =25

P(M) d’où P(M) =15· Il y a donc

20% de malades.

La formule précédente se généralise à l’intersection de n événements.

Théorème 8 (Formule des probabilités composées)

Soit n un entier naturel supérieur ou égal à 2.Pour toute famille finie (A1, A2, · · · , An) d’événements de l’espace probabilisé (V, T , P)tels que P(A1 ∩ · · · ∩ An−1) �= 0, on a

P(A1 ∩ A2 ∩ · · · ∩ An−1 ∩ An) = P(A1)PA1 (A2)PA1∩A2 (A3) · · · PA1∩A2∩···∩An−1 (An).

PreuvePour tout entier k compris entre 1 et n − 1, (A1 ∩ · · · ∩ An−1) ⊂ (A1 ∩ · · · ∩ Ak), d’oùP(A1 ∩ · · · ∩ An−1) � P(A1 ∩ · · · ∩ Ak).

Comme P(A1 ∩· · ·∩An−1) = 0, on a a fortiori P(A1 ∩· · ·∩Ak) = 0. Donc toutes les probabilités conditionnellesfigurant dans la formule existent bien.Faisons une démonstration par récurrence sur n.

• Si n = 2, nous avons vu le résultat P(A1 ∩ A2) = P(A1)PA1 (A2) dans la proposition précédente.

• Supposons l’égalité acquise pour n événements et considérons n + 1 événements tels queP(A1 ∩ A2 ∩ · · · ∩ An) = 0. D’après la formule au rang 2,

P(A1 ∩ · · · ∩ An+1) = PA1∩···∩An (An+1)P(A1 ∩ · · · ∩ An).

213

Page 221: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

L’hypothèse de récurrence donne

P(A1 ∩ · · · ∩ An) = P(A1)PA1 (A2) . . . PA1∩···∩An−1(An).

Ainsi P(A1 ∩ A2 ∩ · · · ∩ An+1) = P(A1)PA1 (A2) . . . PA1∩···∩An (An+1), et le résultat est établi par récurrence. ❑

➤ RemarqueCette formule est très utile. On l’utilise en général quand les événements A1, A2, · · · , An sont dans un ordrechronologique.

Exercice 4.On effectue des tirages dans une urne contenant initialement a boules blanches et b boulesnoires. Après chaque tirage, la boule est remise dans l’urne avec c boules de la même couleur.

1. Pour tout n ∈ N∗, déterminer la probabilité pn que la première boule blanche soit obtenue

au n-ième tirage.

2. On pose, pour n ∈ N∗, an =n−1∏k=0

b + kca + b + kc

· Montrer que l’on a pn = an−1 − an, pour tout

n � 2. Calculer limn→+∞

an (considérer ln an). En déduire+∞∑n=1

pn. Interpréter.

Solution.

1. Notons, pour tout k ∈ N∗, Bk l’événement « le k-ième tirage donne une boule blanche ».

Il s’agit de calculer pn = P(B1 ∩ . . . ∩ Bn−1 ∩ Bn). On applique la formule des probabilités

composées. On a clairement P(B1) =b

a + b· Pour k � 2, si les tirages 1 à k− 1 amène une

boule noire, il y a dans l’urne au moment du k-ième tirage a boules blanches et b+(k−1)cboules noires. On en déduit

P(Bk/B1 ∩ . . .∩Bk−1) =b + (k − 1)c

a + b + (k − 1)cet P(Bn/B1 ∩ . . .∩Bn−1) =

aa + b + (n − 1)c

·

On obtient donc p1 =a

a + bet, pour n � 2,

pn = P(B1)P(B2/B1) . . . P(Bn−1/B1 ∩ . . . ∩ Bn−2)P(Bn/B1 ∩ . . . ∩ Bn−1)

=b

a + b· b + c

a + b + c· · · b + (n − 2)c

a + b + (n − 2)c· a

a + b + (n − 1)c

=

an−2∏k=0

(b + kc)

n−1∏k=0

(a + b + kc)

·

214

Page 222: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les probabilités conditionnelles

2. On a pour n � 2, an =b + (n − 1)c

a + b + (n − 1)can−1 et donc

an−1 − an = an−1 −b + (n − 1)c

a + b + (n − 1)can−1 =

aa + b + (n − 1)c

an−1 = pn.

Pour n ∈ N∗, on a

ln an =n−1∑k=0

ln

(b + kc

a + b + kc

)= −

n−1∑k=0

ln

(a + b + kc

b + kc

)= −

n−1∑k=0

ln(

1 +a

b + kc

).

Pour tout k ∈ N, ln(

1 +a

b + kc

)est positif et de plus

ln(

1 +a

b + kc

)∼

k→+∞

ab + kc

∼k→+∞

ab· 1

D’après le théorème de comparaison des séries à termes positifs, la série de terme général

ln(

1 +a

b + kc

)diverge comme la série harmonique. On en déduit que lim

n→+∞ln an = −∞

et donc par composition des limites que limn→+∞

an = 0.

De l’égalité pn = an−1 − an, on déduit, pour N � 2,N∑

n=1

pn = p1 +N∑

n=2

(an−1 − an) = p1 + a1 − aN =a

a + b+

ba + b

− aN = 1 − aN

et donc limN→+∞

N∑n=1

pn = 1 − limN→+∞

aN = 1. On a donc par définition+∞∑n=1

pn = 1.

Notons pour n ∈ N∗ Cn l’événement « il apparaît une boule blanche pour la première fois

au n-ième tirage » et C l’événement « il apparaît une boule blanche ». On a C =+∞⋃n=1

Cn.

En effet, une boule blanche apparaît si et seulement s’il existe un rang n � 1 où pourla première fois apparaît une boule blanche. Les événements Cn étant incompatibles, onobtient

P(C) =+∞∑n=1

P(Cn) =+∞∑n=1

pn = 1.

L’événement C est quasi-certain. Il est quasi-impossible qu’on n’obtienne que des boulesnoires tout au long de l’expérience.

La formule des probabilités totalesCommençons par un cas particulier important correspondant au cas où le systèmecomplet d’événements est (A, A).

Théorème 9

Pour tout événement A tel que 0 < P(A) < 1 et tout événement B de l’espace probabilisé(V, T , P),

P(B) = PA(B)P(A) + PA(B)P(A).

215

Page 223: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

PreuveComme (A, A) est un système complet d’événements, on a d’après la proposition 5 page 202

P(B) = P(B ∩ A) + P(B ∩ A).

Les événements A et A sont de probabilité non nulle, donc on peut écrire P(B ∩ A) = PA(B)P(A) etP(B ∩ A) = PA(B)P(A). On obtient donc

P(B) = PA(B)P(A) + PA(B)P(A). ❑

Cette formule est utilisée avec A = An dans le cas d’une suite (An) d’événementspour laquelle on connaît PAn−1 (An) et PAn−1

(An). On détermine ainsi une relation derécurrence entre P(An) et P(An−1).

Exercice 5.Un feu bicolore, lorsqu’il est rouge à un instant donné, passe au vert à l’instant suivant avec laprobabilité p et lorsqu’il est vert passe au rouge avec la probabilité q (0 < p < 1, 0 < q < 1).On note rn (resp. vn) la probabilité que ce feu soit au rouge (resp. au vert) à l’instant t = n. Onsuppose que r0 + v0 = 1.

1. Montrer l’existence d’une matrice A ∈ M2(R) telle que, pour tout n ∈ N,(rn+1

vn+1

)= A

(rnvn

).

2. Montrer que A est diagonalisable. Quelles sont ses valeurs propres ?

3. Calculer rn et vn en fonction de n. Calculer les limites des suites (rn) et (vn).

Solution.

1. On note Rn (resp. Vn) l’événement « le feu est au rouge (resp. au vert)à l’instant n ». Lesévénements Rn et Vn forment un système complet d’événements car Rn = Vn. On apar hypothèse P(Vn+1/Rn) = p et P(Rn+1/Vn) = q et donc P(Rn+1/Rn) = 1 − p etP(Vn+1/Vn) = 1 − q. On en déduit, par la formule des probabilités totales que, pour toutn ∈ N,

rn+1 = P(Rn+1) = P(Rn+1/Rn)P(Rn) + P(Rn+1/Vn)P(Vn) = (1 − p)rn + qvn

vn+1 = P(Vn+1) = P(Vn+1/Rn)P(Rn) + P(Vn+1/Vn)P(Vn) = prn + (1 − q)vn,

c’est-à-dire(

rn+1

vn+1

)= A

(rnvn,

), où A =

(1 − p q

p 1 − q

).

2. Pour tout l réel, on a

rg(A − lI2) = rg(

1 − p − l qp 1 − q − l

)= rg

(1 − p − l q

1 − l 1 − l

)= rg

(1 − p − q − l q

0 1 − l

).

Les valeurs propres de A sont donc 1 et 1 − p − q. Elles sont distinctes donc A est diago-nalisable.

216

Page 224: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les probabilités conditionnelles

On a A − I2 =(−p q

p −q

)donc (q, p) est un vecteur propre pour la valeur propre 1. De

même A − (1 − p − q)I2 =(

q qp p

)donc (1,−1) est un vecteur propre pour le valeur

propre 1− p− q. En posant P =(

q 1p −1

), matrice de passage de la base canonique de R2

à une base de vecteurs propres, on obtient A = PDP−1, où D =(

1 00 1 − p − q

). On

calcule P−1. On trouve P−1 =1

p + q

(1 1p −q

).

3. On obtient(rnvn

)= An

(r0v0

)= PDnP−1

(r0v0

)=

1p + q

P(

1 00 (1 − p − q)n

)(1

pr0 − qv0

)car r0 + v0 = 1,

=1

p + q

(q 1p −1

)(1

(pr0 − qv0)(1 − p − q)n

)=

1p + q

(q + (pr0 − qv0)(1 − p − q)n

p − (pr0 − qv0)(1 − p − q)n

).

Ainsi, on a

rn =q + (pr0 − qv0)(1 − p − q)n

p + qet vn =

p − (pr0 − qv0)(1 − p − q)n

p + q·

Par hypothèse p et q appartiennent à ]0, 1[, donc −1 < 1 − p − q < 1. On en déduit

limn→+∞

rn =q

p + qet lim

n→+∞vn =

pp + q

·

Théorème 10 (Formule des probabilités totales)

Soit (A1, A2, . . . , An) un système complet d’événements de l’espace probabilisé (V, T , P)tels que pour tout entier i de �1, n�, P(Ai) �= 0.Pour tout événement B, on a

P(B) =n∑

i=1

PAi (B)P(Ai).

Soit (Ai)i∈N un système complet d’événements de l’espace probabilisé (V, T , P) tel que,pour tout entier i, on ait P(Ai) �= 0.Pour tout événement B, on a

P(B) =+∞∑i=0

PAi (B)P(Ai).

217

Page 225: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

PreuveLes deux démonstrations sont semblables.

Si (A1, A2, . . . , An) un système complet d’événements, alors on a, d’après la proposition 5 page 202, pour toutévénement B

P(B) =n∑

i=1

P(B ∩ Ai ).

Or pour tout i de [[1, n]], P(B ∩ Ai ) = PAi (B)P(Ai ). On obtient donc

P(B) =

n∑i=1

PAi (B)P(Ai ).

Si (An)n∈N est un système complet d’événements, on obtient de même

P(B) =+∞∑i=0

P(B ∩ Ai ) =+∞∑i=0

PAi (B)P(Ai ). ❑

➤ Remarques• Cette formule est très utile quand l’expérience se déroule en plusieurs étapes et que la première aboutit à

plusieurs résultats incompatibles entre eux et donnant un système complet d’événements.

• On dit que (Ai )i∈N un système quasi-complet d’événements si les Ai sont des événements deux à deux incom-patibles dont la réunion est de probabilité égale à 1. La formule des probabilités totales reste vraie avec un

système quasi-complet. On note C =⋃i∈N

Ai , événement de probabilité nulle. On obtient un système complet

d’événements en adjoignant C au système précédent. On a donc, avec les notations du théorème,

P(B) = P(B ∩ C) ++∞∑i=0

P(B ∩ Ai ) =+∞∑i=0

P(B ∩ Ai ) =+∞∑i=0

PAi (B)P(Ai ),

car B ∩ C est aussi de probabilité nulle.

Exercice 6.Des boules en nombre infini numérotés 1, 2,. . . sont placées successivement, indépendammentles unes des autres, dans trois boîtes.

1. Pour k � 2, on note Ak l’événement « deux des trois boîtes sont non vides pour la

première fois lorsqu’on place la k-ième boule ». Calculer P(Ak) puis+∞∑k=2

P(Ak). Interpréter.

2. Pour � � 3, on note B� l’événement « les trois boîtes sont non vides pour la première foislorsqu’on place la �-ième boule ». Calculer P(B�/Ak) pour k � 2 et � � 3. En déduire

P(B�) puis+∞∑�=3

P(B�). Interpréter.

Solution.

1. L’événement Ak est réalisé si les k− 1 premières boules ont été placées dans la même boîteet la k-ième dans une autre boîte. On choisit la première boîte occupée ; il y a trois choix

possibles. La probabilité qu’une boule soit placée dans cette boîte est13

; la probabilité

qu’elle soit placée dans une autre boîte est23· On obtient donc

P(Ak) = 3

(13

)k−1 23

= 2

(13

)k−1

.

218

Page 226: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les probabilités conditionnelles

On obtient

+∞∑k=2

P(Ak) =+∞∑k=2

2

(13

)k−1

= 2+∞∑j=0

(13

)j+1

=23

11 − 1

3

= 1.

On a donc

P

⎛⎝⋃k�2

Ak

⎞⎠ =+∞∑k=2

P(Ak).

Posons A =⋃k�2

Ak. L’événement contraire A =⋂k�2

Ak est « on n’obtient jamais deux

boîtes non vides », c’est-à-dire « toutes les boules sont placées dans la même boîte ». Il estde probabilité nulle.On note que (Ak)k�2 est un système quasi-complet d’événements.

2. Si Ak est réalisé, il y au moins une boîte vide jusqu’au placement de la k-ième boule. Ona donc P(B�/Ak) = 0 si � � k.Supposons � > k. À l’issue du placement de la k-ième boule, deux des boîtes sont nonvides. Pour que B� soit réalisé, il faut que � − k − 1 boules supplémentaires soient placéesdans l’une des deux boîtes déjà occupées et que la (�−k)-ième soit placée dans la troisièmeboîte. On obtient

P(B�/Ak) =(

23

)�−k−1 13·

Appliquons la formule de probabilités totales avec le système quasi-complet d’événements(Ak)k�2. On obtient, pour � � 3,

P(B�) =+∞∑k=2

P(B�/Ak)P(Ak) =�−1∑k=2

(23

)�−k−1 13· 2

(13

)k−1

=�−1∑k=2

2�−k

3�−1 =1

3�−1

�−2∑j=1

2j =1

3�−1 · 2 (2�−2 − 1)

=(

23

)�−1

− 2(

13

)�−1

.

On en déduit que

+∞∑�=3

P(B�) =+∞∑�=3

(23

)�−1

− 2+∞∑�=3

(13

)�−1

=49

+∞∑j=0

(23

)j

− 29

+∞∑j=0

(13

)j

=49

11 − 2

3

− 29

11 − 1

3

=43− 1

3= 1.

L’interprétation est la même que dans la question précédente. Il est quasi-certain qu’aucunedes trois boîtes ne restera vide.

219

Page 227: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

La formule de Bayes

Théorème 11

Pour tout couple d’événements (A, B) de l’espace probabilisé (V, T , P) tel queP(A)P(B) �= 0,

PB(A) =P(A)PA(B)

P(B)·

PreuvePar définition de la probabilité conditionnelle

P(A)PA(B) = P(B ∩ A) = P(B)PB(A).❑

En général, pour exprimer P(A), on utilise la formule des probabilités totales. Onobtient le théorème suivant.

Théorème 12 (Formule de Bayes)

Pour tout système complet fini d’événements A1, . . . , An, et tout événement B de l’espaceprobabilisé (V, T , P), tels que les événements Ai (1 � i � n) et B aient une probabiliténon nulle, on a, pour tout i de [[1, n]],

PB(Ai) =PAi (B)P(Ai)

n∑j=1

PAj (B)P(Aj)·

En particulier, pour tout couple d’événements (A, B) tel que 0 < P(A) < 1 et P(B) �= 0,

PB(A) =PA(B)P(A)

PA(B)P(A) + PA(B)P(A)·

Pour tout système complet d’événements (An)n∈N, et tout événement B de l’espace pro-babilisé (V, T , P) tels que les événements An (n ∈ N) et B aient une probabilité non nulle,on a, pour tout i de N,

PB(Ai) =PAi (B)P(Ai)

+∞∑j=0

PAj (B)P(Aj)·

PreuveOn reconnaît P(B) dans le dénominateur du membre de droite des deux premières égalités, en vertu de la formule

des probabilités totales. Il s’agit donc de démontrer que PB(Ai ) =PAi (B)P(Ai )

P(B), ce qui résulte de la proposition

précédente. La dernière égalité est un cas particulier de la première, où le système complet d’événements est(A, A). ❑

220

Page 228: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les probabilités conditionnelles

ExempleUne maladie est présente dans la population, dans la proportion d’une personne malade sur10000. Un responsable d’un grand laboratoire pharmaceutique vante son nouveau test dedépistage : si une personne est malade, le test est positif à 99%. Si une personne n’est pasmalade, le test est positif à 0, 1%. Ces chiffres ont l’air excellents. Toutefois, ce qui importe,c’est la probabilité qu’une personne soit malade si le test est positif. On note M l’événement :« la personne est malade », et T l’événement « le test est positif ». La formule de Bayes donne

P(M/T ) =P(T/M)P(M)

P(T/M)P(M) + P(T/M)P(M)=

10−4 · 0, 9910−4 · 0, 99 + 0, 9999 · 10−3

� 0, 09.

C’est catastrophique. Il n’y a que 9% de chances qu’une personne positive au test soit effective-ment malade. C’est tout le problème des tests de dépistage pour des maladies rares : ils doiventêtre excessivement performants, sous peine de donner beaucoup trop de « faux-positifs ».

3.3 Arbres de probabilité

On illustre souvent les probabilités conditionnelles à l’aide d’arbres de probabilité(appelés aussi arbres pondérés).

V��������P(A)

A

��������P(A)

A

��������

��������

P(B/A)

P(B/A)

B

B

A∩B

A∩B

��������

��������

P(B/A)

P(B/A)

B

B

A∩B

A∩B

Figure 7.1 Arbre de probabilités

Sur un tel arbre, les embranchements correspondent à des événements ; la racine del’arbre correspond à l’événement certain, qu’on sous-entend en général. On parcourtun tel arbre de la racine vers l’extrémité des branches. Sur chaque branche figure laprobabilité de l’événement qui figure à son extrémité, conditionnelle à la conjonctiondes événements qui figurent entre la racine de l’arbre et son origine.Chaque chemin correspond à la conjonction des événements rencontrés. Par exemplesur l’arbre de la figure 1, les quatre chemin possibles correspondent aux événementsA ∩ B, A ∩ B, A ∩ B et A ∩ B. D’après la formule de probabilités composées, laprobabilité affectée à chaque chemin est le produit des probabilités rencontrées.La probabilité d’un événement est la somme des probabilités des chemins sur lequel ilfigure. Sur la figure 7.1, on obtient

P(A) = P(A ∩ B) + P(A ∩ B) = P(A)P(B/A) + P(A)P(B/A),

ce qui résulte de la formule des probabilités totales.

221

Page 229: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

On peut construire des arbres de probabilités où interviennent plus de deux événe-ments, mais l’utilisation des arbres est limitée par le nombre de branches qu’on peuteffectivement représenter.ExempleOn considère une urne contenant initialement quatre boules blanches et trois boules noires.On tire une à une trois boules de l’urne en remettant la boule dans l’urne si elle est noire et enne la remettant pas si elle est blanche. Construisons l’arbre correspondant à cette expériencealéatoire. Pour i ∈ [[1, 3]], on note Bi l’événement « la i-ème boule tirée est blanche » et Ni

l’événement contraire « la i-ème boule tirée est noire ». On obtient

��������4/7

B1

V ��������3/7

N1

������

������

1/2

1/2

B2

N2

������

������

4/7

3/7

B2

N2

�����

�����

B3

N3

2/5

3/5

B1∩B2∩B3

B1∩B2∩N3

�����

�����

B3

N3

1/2

1/2

B1∩N2∩B3

B1∩N2∩N3

�����

�����

B3

N3

1/2

1/2

N1∩B2∩B3

N1∩B2∩N3

�����

�����

B3

N3

4/7

3/7

N1∩N2∩B3

N1∩N2∩N3

Sur les branches après le deuxième embranchement figurent les probabilités conditionnelles àla conjonction des deux premiers événements.

On obtient par exemple P(B1 ∩ N2 ∩ B3) =47· 1

2· 1

2=

17

.

La probabilité de l’événement « on tire deux boules blanches » est

P(N1 ∩B2 ∩B3)+P(B1 ∩N2 ∩B3)+P(B1 ∩B2 ∩N3) =37· 47· 12

+47· 12· 12

+47· 12· 35

=107245

·

4. IndépendanceLes définitions ont déjà été données en première année.

4.1 Indépendance entre deux événements

Définition 13

Deux événements A et B de l’espace probabilisé (V, T , P) sont dits indépendants si

P(A ∩ B) = P(A) × P(B)

222

Page 230: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

➤ Remarques• Cette relation ne dépend pas de l’ordre des éléments. Si A et B sont indépendants, il en est de même de B et A.

• Si A est un événement de probabilité nulle, alors A et tout autre événement B sont indépendants. En effetA ∩ B ⊂ A donc P(A ∩ B) = 0 = P(A)P(B).

Proposition 7

Deux événements A et B de l’espace probabilisé (V, T , P) tels que A ait une probabiliténon nulle sont indépendants si, et seulement si, PA(B) = P(B).

Preuve Par définition de la probabilité conditionnelle, PA(B) =P(A ∩ B)

P(A)·

Or A et B sont indépendants si, et seulement si, P(A ∩ B) = P(A)P(B).

Par suite PA(B) = P(B) si, et seulement si, A et B sont indépendants. ❑

➤ Remarques• Ainsi, si P(A) = 0, A et B sont indépendants si la probabilité de B et sa probabilité conditionnelle à A sont

égales : la réalisation de A n’influe pas sur celle de B.

• On veillera à ne pas confondre l’indépendance de deux événements et le fait qu’ils sont incompatibles. Cesnotions s’excluent en général comme le montre la proposition suivante.

Proposition 8

Si A et B sont des événements incompatibles non négligeables, ils ne sont pas indépen-dants.

PreuveComme A et B sont incompatibles, A ∩ B = ∅, donc P(A ∩ B) = 0. Mais A et B sont des événements nonnégligeables, donc de probabilité non nulle et P(A ∩ B) = P(A)P(B). ❑

➤ RemarqueContrairement à l’incompatibilité qui est une notion ensembliste, l’indépendance est une notion probabiliste. Elledépend de la probabilité dont est munie V.

Proposition 9

Si A et B sont deux événements indépendants de l’espace probabilisé (V, T , P), les évé-nements A et B, les événements A et B et les événements A et B sont indépendants.

PreuveComme A et B sont indépendants, P(A ∩ B) = P(A)P(B).De l’égalité P(A ∩ B) = P(A) − P(A ∩ B), on déduit

P(A ∩ B) = P(A) − P(A)P(B) = P(A)(1 − P(B)

)= P(A)P(B),

ce qui montre que A et B sont indépendants.Comme B et A sont indépendants, le raisonnement précédent montre que B et A sont indépendants. Enfin,l’indépendance de A et B entraîne celle de A et B. ❑

223

Page 231: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

➤ RemarqueOn peut déduire de cette proposition que si A est un événement de probabilité 1, il est indépendant de toutévénement B. En effet A est de probabilité nulle donc A et B sont indépendants, comme nous l’avons déjà vu. Onen déduit que A et B sont indépendants.

4.2 Indépendance d’une famille d’événements

Définition 14

Des événements A1, A2, . . . , An de l’espace probabilisé (V, T , P) sont dits deux à deuxindépendants si, pour tout couple (i, j) d’éléments distincts de �1, n�,

P(Ai ∩ Aj) = P(Ai)P(Aj).

Des événements (A1, A2, . . . , An) de l’espace probabilisé (V, T , P) sont dits mutuelle-ment indépendants (ou simplement indépendants) si, pour tout sous-ensemble I de�1, n�,

P

(⋂i∈I

Ai

)=

∏i∈I

P(Ai).

➤ RemarqueSi les événements A1, . . ., An sont mutuellement indépendants, alors ils sont deux à deux indépendants, commeon le voit en prenant pour I un ensemble à deux éléments.

Par contre, la réciproque est fausse.

Proposition 10

Si les événements A1, . . . , An sont deux à deux indépendants, alors les événementsB1, . . . , Bn, où Bi est Ai ou Ai, sont deux à deux indépendants.Si les événements A1, . . . , An sont mutuellement indépendants, alors les événementsB1, . . . , Bn, où Bi est Ai ou Ai, sont mutuellement indépendants.

Preuve• On suppose que les événements A1, . . . , An sont deux à deux indépendants. Soient i et j deux entiers distincts

de �1, n�. Comme Ai et Aj sont indépendants, alors Bi et Bj sont indépendants, d’après la proposition 9.Donc les événements B1, B2,. . . , Bn sont deux à deux indépendants.

• On suppose que les événements A1, . . . , An sont mutuellement indépendants. On étudie d’abord le cas oùil existe k ∈ [[1, n]] tel que Bk = Ak et Bi = Ai si i = k. Soit I une partie de �1, n�.Si k /∈ I, alors P(

⋂i∈I

Bi ) = P(⋂i∈I

Ai ) =∏i∈I

P(Ai ) =∏i∈I

P(Bi ).

Si k ∈ I, on note que (⋂i∈I

Ai

)∪(⋂

i∈I

Bi

)=

⎛⎝ ⋂i∈I\{k}

Ai

⎞⎠ ∩ (Ak ∪ Bk) =⋂

i∈I\{k}Ai

et comme cette union est disjointe

P

(⋂i∈I

Bi

)= P

⎛⎝ ⋂i∈I\{k}

Ai

⎞⎠− P

(⋂i∈I

Ai

).

224

Page 232: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

Par la mutuelle indépendance des événements A1,. . . , An, on obtient

P

(⋂i∈I

Bi

)=∏

i∈I\{k}P(Ai ) −

∏i∈I

P(Ai )

=(1 − P(Ak)

) ∏i∈I\{k}

P(Ai )

= P(Ak)∏

i∈I\{k}P(Ai )

=∏i∈I

P(Bi ).

Ainsi les événements A1, . . . , Ak−1, Ak, Ak+1, . . . , An sont mutuellement indépendants.On passe au cas général. En utilisant ce premier résultat autant de fois qu’il y a de contraires dans les événe-ments B1, . . . , Bn, nous pouvons en déduire que les événements B1,. . . , Bn sont mutuellement indépendants.

➤ RemarqueOn peut démontrer que, pour tout n-uplet (A1, . . . , An) d’événements mutuellement indépendants, tout événe-ment pouvant s’écrire comme réunion ou intersection des événements A1, . . . , An−1 ou de leurs contraires estindépendant de An. Plus généralement, si p est un entier tel que 1 � p � n − 1, tout événement B pouvants’écrire comme réunion ou intersection des événements A1, . . . , Ap ou de leurs contraires est indépen-dant de tout événement C pouvant s’écrire comme réunion ou intersection des événements Ap+1, . . . ,An ou de leurs contraires.

Nous nous contenterons de montrer un résultat partiel.

Proposition 11

Si les événements A1, . . . , An sont mutuellement indépendants et si 1 � p � n − 1, lesévénements A1 ∩ . . . ∩ Ap, Ap+1, . . . , An sont mutuellement indépendants ainsi que lesévénements A1 ∪ . . . ∪ Ap, Ap+1, . . . , An .

PreuvePosons A0 = A1 ∩ . . . ∪ Ap. Soit I un sous-ensemble fini de {0, p + 1, . . . , n}.

Si 0 /∈ I, on a P(⋂i∈I

Ai ) =∏i∈I

P(Ai ) par indépendance des événements A1, . . . , An.

Si 0 ∈ I, on a, toujours par indépendance des événements A1, . . . , An,

P(A0 ∩

⋂i∈I\{0}

Ai)

= P( p⋂

i=1

Ai

⋂i∈I\{0}

Ai)

=

p∏i=1

P(Ai )∏

i∈I\{0}P(Ai ).

Comme les événements sont A1, . . . , An sont mutuellement indépendants, on en déduit

P(A0 ∩

⋂i∈I\{0}

Ai)

= P(A0)∏

i∈I\{0}P(Ai ) =

∏i∈I

P(Ai )

Les événements A0, Ap+1, . . . , An sont donc indépendants.

Comme les événements A1, . . . , An sont mutuellement indépendants, il résulte de la proposition 10 que lesévénements A1, . . . , An sont mutuellement indépendants. Du point précédent, on déduit que les événementA1 ∩ . . . ∩ Ap, Ap+1, . . . , An sont indépendants.

225

Page 233: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Comme A1 ∩ . . . ∩ Ap = A1 ∪ . . . ∪ Ap, on obtient en appliquant de nouveau la proposition 10 que lesévénements A1 ∪ . . . ∪ Ap, Ap+1, . . . , An sont indépendants. ❑

Définition 15

Soit (Ai)i∈N une suite d’événements de l’espace probabilisé (V, T , P). Si, pour toute partiefinie de N,

P

(⋂i∈I

Ai

)=

∏i∈I

P(Ai),

les événements Ai, où i décrit N, sont dits mutuellement indépendants.

4.3 Espace probabilisé produit

En fait, l’indépendance est souvent une conséquence de la modélisation choisie.Modéliser le lancer de deux dés par [[1, 6]]2 ou le lancers de n pièces par {0, 1}n,muni de la probabilité uniforme, c’est présupposer que les résultats des différents lan-cers sont indépendants.Considérons plus généralement deux épreuves aléatoires correspondant aux espacesprobabilisés (V1,P(V1), P1) et (V2,P(V2), P2). On les réalise successivement et onsuppose que le résultat de la première épreuve n’influe pas sur celui de la seconde. Onpeut représenter un résultat des deux épreuves comme un élément de V1 × V2.Nous avons démontré dans le livre de première année le théorème suivant .

Théorème 13

Étant donnés deux espaces probabilisés finis (V1,P(V1), P1) et (V2,P(V2), P2), il existeune unique probabilité P sur l’espace probabilisable fini (V1 ×V2,P(V1 ×V2)) vérifiant,pour tout (A1, A2) ∈ P(V1) × P(V2)

P(A1 × A2) = P1(A1) × P2(A2).

Cette probabilité est appelée probabilité produit de P1 et de P2.

Plus généralement, une succession de n épreuves aléatoires indépendantes représentéespar les espaces probabilisables (Vi,P(Vi), Pi) (1 � i � n) sera modélisée par l’espaceprobabilisable (V,P(V), P), où V = V1 × · · · × Vn et P est l’unique probabilité quivérifie pour tout (A1, . . . , An) ∈ V1 × · · · × Vn,

P(A1 × . . . × An) = P1(A1) × . . . × Pn(An),

appelée probabilité produit.

Exemple : Épreuves répétéesCela s’applique en particulier à une suite de n épreuves identiques et indépendantes (épreuvesrépétées). Si une épreuve est représentée par l’espace probabilisé (V,P(V), P), la suite des

226

Page 234: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

n épreuves sera représentée par l’espace probabilisé (Vn,P(Vn), Q), où Q vérifie, pour toutévénement (A1, . . . , An) ∈

(P(V)

)n,

Q(A1 × . . . × . . . An) = P(A1) × . . . × P(An).

En particulier, pour (v1, . . . , vn) ∈ Vn,

Q({(v1, . . . , vn)}) = P({v1}) . . . P({vn}).

C’est ainsi qu’on modélise le jeu de pile ou face. On dispose d’une pièce de monnaie qu’onlance n fois. On suppose que les résultats des différents lancers sont indépendants. Un lancersera représenté par l’univers {1, 0}, où 1 représente par exemple le résultat « pile » et 0 lerésultat « face ». Il existe p ∈ [0, 1] tel que la probabilité P sur {0, 1} est définie par P({1}) = pet P({0}) = 1− p. La suite de n lancers sera représentée par l’univers V = {0, 1}n, muni de laprobabilité produit Q.

Par exemple,

• la probabilité de l’événement « on obtient n piles » est pn ;

• la probabilité de l’événement « on obtient dans cet ordre k piles puis n − k faces »(0 � k � n) est pk(1 − p)n−k ;

• la probabilité de l’événement « on obtient k piles et n− k faces dans un ordre quelconque »(0 � k � n) est

(nk

)pk(1 − p)n−k car c’est la réunion de

(nk

)événements incompatibles de

même probabilité pk(n− p)k, correspondant aux différentes répartitions des k piles parmi lesn lancers.

Toute épreuve à deux issues, répétée, peut être modélisée de la même manière.

227

Page 235: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Voici le principe d’un nouveau jeu télévisé. Il y a trois portes identiques et opaquessur le plateau. Derrière deux d’entre il n’y a rien ; derrière la troisième se trouve une voiture.À la différence du présentateur, le candidat ne sait pas laquelle.Le candidat choisit une porte. Le présentateur ouvre alors une des deux portes restantes der-rière laquelle il n’y a pas de voiture. Il reste donc deux portes closes, celle choisie par lecandidat et une autre. Le présentateur autorise alors le candidat à éventuellement changer sonchoix et choisir l’autre porte. Une fois que son choix est fait, le présentateur ouvre la portechoisie par le candidat et si c’est celle qui cachait la voiture, le candidat la gagne.Le candidat a-t-il intérêt à changer son choix à la deuxième étape ?

2. On se donne un entier c � 1. On considère une urne U qui contient initialementun certain nombre de boules blanches et de boules noires et on tire les boules de U une à uneau hasard avec le protocole suivant : à l’issue de chaque tirage, la boule tirée est remise dansl’urne accompagnée de c boules de la même couleur.Pour a, b et i ∈ N

∗, on note pi(a, b) la probabilité d’obtenir une boule blanche au i-ième tirage,sachant que l’urne contenait initialement a boules blanches et b boules noires.

1. Montrer en considérant le résultat du premier tirage que, pour i � 2,

pi(a, b) =a

a + bpi−1(a + c, b) +

ba + b

pi−1(a, b + c).

2. En déduire la valeur de pi(a, b) pour tout i � 1.

3. Un livre contient quatre erreurs. À chaque relecture, une faute non corrigée est

corrigée avec une probabilité13· Les corrections des différentes fautes sont indépendantes les

unes des autres ; les relectures successives aussi.

1. Combien faut-il de relectures pour que la probabilité qu’il ne subsiste aucune erreur soitsupérieure à 0, 9 ?

2. Même question en supposant que le nombre d’erreurs est uniformément réparti sur [[0, 4]].

4. Un banquier se rend chaque jour de son domicile à sa banque, puis de sa banqueà son domicile. Il possède un unique parapluie et l’emporte de son bureau à son domicile etréciproquement quand il pleut.On suppose que la probabilité qu’il pleuve vaut constamment p ∈ ]0, 1[ (on pose q = 1 − p).On note pn la probabilité que le parapluie soit disponible là où se trouve le banquier (audomicile ou au bureau) au bout de n trajets et qn = 1 − pn.

1. Montrer qu’il existe S ∈ M2(R) tel que, pour tout n ∈ N, on ait(

pn+1qn+1

)= S

(pnqn

).

2. Montrer qu’il existe une matrice inversible P telle que, pour tout n ∈ N, on ait

Sn = P(

1 00 (−q)n

)P−1.

3. En déduire que la suite (pn)n∈N converge. Calculer p∞ = limn→+∞

pn.

228

Page 236: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

5. Un enfant saute d’un sommet à l’autre d’un triangle de sommets A, B, C tracé sur lesol de la manière suivante :

• s’il est au sommet A ou au sommet B, il sautera vers l’un des trois sommets du triangle avecla même probabilité ;

• s’il est au sommet C, il saute toujours vers le sommet A.

Avant le premier saut, l’enfant se trouve en A (resp. B, resp. C) avec une probabilité a0 (resp.b0, resp. c0). La probabilité que l’enfant soit A (rep. B, resp. C) après le n-ième saut est notée

an (resp. bn, resp. cn). On pose Xn =

(anbncn

).

1. Montrer qu’il existe une matrice A ∈ M3(R) telle que pour tout entier n on aitXn+1 = AXn.En déduire que, pour tout n ∈ N, on a Xn = AnX0.

2. Montrer que A est semblable à la matrice

⎛⎝0 0 00 − 1

3 00 0 1

⎞⎠.

Calculer An ; en déduire an, bn, cn pour tout n ∈ N.

6. On dispose d’un dé équilibré et d’une urne qui à l’origine contient une bouleblanche. On effectue une suite de lancers successifs avec le dé et à chaque fois que l’on obtientun résultat différent du six, on ajoute une boule rouge dans l’urne. Lorsque l’on obtient lepremier six, on tire une boule de l’urne, et l’expérience s’arrête.

1. Pour k entier naturel non nul, soit Ak l’événement « on a obtenu le premier six au k-ièmelancer du dé ».

a. Calculer P(Ak) et vérifier que+∞∑k=1

P(Ak) = 1.

b. Quelle est la probabilité d’avoir obtenu le premier six au plus tard au troisième lancer ?

c. Quelle est la probabilité d’avoir obtenu le premier six au plus tard au k-ième lancer ?

d. Quelle est la probabilité d’avoir obtenu le premier six après le k-ième lancer sachantqu’on l’a obtenu au plus tard au 2k-ième lancer ?

2. On appelle B l’événement : « on a obtenu la boule blanche ».a. Si les k − 1 premiers lancers n’ont pas donné de six, quelle est la composition de l’urne

juste avant qu’on ne lance le dé pour la k-ième fois ?

b. En déduire P(B ∩ Ak).

c. Montrer que, pour tout n ∈ N∗ et tout x ∈ [0, 1[, on a

n∑k=1

xk

k=

∫ x

0

1 − tn

1 − tdt.

En déduire que+∞∑k=1

xk

k= − ln(1 − x).

d. Calculer P(B).

229

Page 237: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

7. On lance deux dés jusqu’à ce qu’une somme de 5 ou 7 apparaisse.

1. Soit En l’événement « une somme de 5 apparaît au n-ième double lancer et sur les n − 1premiers doubles lancers ni la somme de 5 ni celle de 7 n’apparaît ».Calculer P(En)

2. Trouver la probabilité qu’on s’arrête sur une somme de 5.

3. Trouver la probabilité qu’on s’arrête sur une somme de 7.

4. Quelle est la probabilité que le jeu ne s’arrête jamais ?

8. Le tournoiDes joueurs notés A1, A2, . . . (il y a une infinité de joueurs) s’affrontent à pile ou face, avecune pièce honnête, de la façon suivante : A1 et A2 commencent , le perdant est éliminé etle gagnant rencontre A3, le perdant est éliminé et le gagnant rencontre A4, . . . Est déclarévainqueur le joueur qui gagne trois parties consécutives et le jeu s’arrête alors.Pour n � 1, on note pn la probabilité que An gagne le tournoi et qn la probabilité qu’il joue.

1. Montrer que pn =18

qn.

2. Calculer qn pour n � 4. Montrer que, pour n � 5, qn =12

qn−1 +14

qn−2.

3. Calculer qn, puis pn pour tout n.

9. On effectue une suite de lancers d’une pièce de monnaie. On suppose que les résul-tats des lancers sont indépendants et qu’à chaque lancer, la pièce donne pile avec la probabilitép (0 < p < 1) et face avec la probabilité q = 1 − p. On s’intéresse au nombre de lancersnécessaires pour obtenir deux piles de suite (c’est-à-dire lors de deux lancers consécutifs).Pour tout entier n � 1, on note Un l’événement « on obtient deux piles de suite, pour lapremière fois, aux lancers numéro n et n + 1 », An l’événement « les n premiers lancers nedonnent pas deux piles de suite et le n-ième lancer donne pile » et Bn l’événement « les npremiers lancers ne donnent pas deux piles de suite et le n-ième lancer donne face ».Enfin, et on pose un = P(Un), xn = P(An), yn = P(Bn).

1. a. Déterminer x1, y1, u1, x2, y2, u2, x3, y3, u3.

b. Trouver pour n � 1, une relation simple entre xn et un.

c. Pour tout n � 1, déterminer les probabilités conditionnelles

P(An+1/An), P(An+1/Bn), P(Bn+1/An), P(Bn+1/Bn).

d. En déduire, pour tout n � 1, les relations suivantes{xn+1 = pynyn+1 = q(xn + yn).

2. On suppose que p = 12 ·

a. Déterminer une relation de récurrence entre yn+1, yn et yn−1.

b. En déduire, pour tout n � 1, une expression de xn puis de un, en fonction de n.

c. Vérifier que∞∑

n=1un = 1, et en donner une interprétation.

230

Page 238: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

10. On lance une pièce équilibrée n fois (n � 2). Pour tout k ∈ [[1, n]], Ak désignel’événement « on obtient pile au k-ième lancer ». Soit An+1 l’événement « le nombre de pilesobtenus au cours des n lancers est pair ».

1. Déterminer les probabilités des événements Ak, k = 1, 2, . . . , n + 1.

2. a. Déterminer la probabilitéP(A1 ∩ . . . ∩ An ∩ An+1).

b. En déduire que les événements A1, . . . , An+1 ne sont pas mutuellement indépendants.

3. Montrer que toute sous-famille de n événements choisis parmi A1, . . . , An, An+1 est forméed’événements mutuellement indépendants.

11. Inégalités de BooleSoit (An)n∈N une suite d’événements d’un espace probabilisé. Montrer que :

1. pour tout entier n, P

(n⋃

i=1

Ai

)�

n∑i=1

P(Ai) et P

(n⋂

i=1

Ai

)� 1 −

n∑i=1

P(Ai) ;

2. si la série∑

P(An) converge, P

(⋃i∈N

Ai

)�

+∞∑i=0

P(Ai).

Pour cette question, on pourra utiliser les résultats de l’exercice 1 page 203.

12. Lemme de Borel-CantelliOn admettra dans cet exercice l’inégalité de Boole (résultat de la seconde question de l’exercice11.).Soit (V, T , P) un espace probabilisé et (An) une suite d’événements. Pour tout k ∈ N, on

pose Ck =+∞⋃p=k

Ap.

1. Montrer que l’événement B : « une infinité d’événements An se réalisent »

s’écrit B =+∞⋂k=0

Ck.

2. On suppose que la série∑

P(An) converge. Montrer que, pour tout k ∈ N, on a

P(B) � P(Ck) �+∞∑p=k

P(Ap).

En déduire que P(B) = 0.

3. On suppose que les événements An sont mutuellement indépendants et que la série∑P(An) diverge.

a. Soit k ∈ N. Montrer que, pour tout entier N � k, on a P(Ck) �N∏

p=k

P(Ap).

b. Montrer que limN→+∞

N∏p=k

P(Ap) = 0 (on utilisera la fonction logarithme).

231

Page 239: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

c. En déduire que P(Ck) = 0. Montrer que P(B) = 1.

4. Application. Une pièce de monnaie amène pile avec la probabilité p (0 < p < 1) et faceavec la probabilité q = 1 − p. On la lance une infinité de fois. Montrer que pile apparaîtune infinité de fois, de façon quasi-certaine. Pour tout m � 1, montrer qu’il apparaît uneinfinité de séquences de m piles consécutifs de façon quasi-certaine.

232

Page 240: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

8Variables aléatoiresréelles discrètes

La première partie de ce chapitre donne la définition d’une variable aléatoire et étudieles propriétés communes à toutes les variables aléatoires. Le programme prévoit l’étudede deux sortes de variables aléatoires : les variables discrètes qui font l’objet du restedu chapitre et les variables à densité qui seront étudiées dans le chapitre Variablesaléatoires à densité.

1. Une application liée à une expérience aléatoire :la variable aléatoire

Nous généralisons la définition d’une variable aléatoire donnée dans le cas fini au casd’un espace probabilisable quelconque. Il s’agit encore d’applications de V dans R,mais elles doivent vérifier des conditions plus contraignantes.

1.1 Variable aléatoire

Définition 1

Soit (V, T ) un espace probabilisable. Toute application X de V dans R telle que

∀x ∈ R, {v ∈ V, X(v) � x} ∈ T

est appelée variable aléatoire réelle sur (V, T ).

➤ Remarques• Remarquons qu’une variable aléatoire est une application définie sur V et non une variable et qu’elle n’est

pas aléatoire.

• Si T = P (V) (en particulier si V est fini), toute application de V dans R est une variable aléatoire.

Nous admettrons la proposition suivante.

Page 241: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Proposition 1

Si X est une variable aléatoire réelle sur (V, T ) alors, pour tout intervalle I de R, l’en-semble {v ∈ V, X(v) ∈ I} est un événement (i.e. appartient à T ).En particulier, pour tout réel x, l’ensemble {v ∈ V, X(v) = x} appartient à T .

Par définition d’une variable aléatoire réelle, la proposition est vérifiée pour toutintervalle de la forme ]−∞, x]. Elle reste vraie pour tout intervalle de R, car un telintervalle peut s’écrire à partir de réunions et intersections dénombrables d’intervallesde la forme ]−∞, x] ou de leur complémentaire. L’ensemble {v ∈ V, X(v) = x}correspond au cas où I est l’intervalle [x, x].Notations

Pour tout réel x, l’ensemble {v ∈ V, X(v) � x} est l’image réciproque de ]−∞, x]par l’application X ; il est noté habituellement X−1(]−∞, x]). Rappelons que cettenotation ne signifie nullement que X est bijective. Dans le langage des variables aléa-toires, on le note [X � x]. On écrit de même, pour tout réel x,

[X = x] = X−1({x}) = {v ∈ V, X(v) = x},

[X � x] = X−1([x, +∞[) = {v ∈ V, X(v) � x},

[X < x] = X−1(] −∞, x[) = {v ∈ V, X(v) < x},

[X > x] = X−1(]x, +∞[) = {v ∈ V, X(v) > x},

On remarque que[X � x] = [X < x] ∪ [X = x].

De même, on écrit, pour tous réels a et b,

[a � X � b] = X−1([a, b]) = {v ∈ V, a � X(v) � b}

et plus généralement, pour toute partie I de R,

[X ∈ I] = X−1(I) = {v ∈ V X(v) ∈ I}.

On rappelle que X(V) désigne l’ensemble des images par X des éléments de V, c’est-à-dire l’ensemble des valeurs prises par l’application X.

1.2 Fonction de répartition

Définition 2

Pour toute variable aléatoire réelle X de l’espace probabilisé (V, T , P), l’application

FX :

{R −→ R

x −→ P([X � x])

est appelée la fonction de répartition de X.

234

Page 242: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Une application liée à une expérience aléatoire : la variable aléatoire

➤ Remarques• Cette définition est justifiée car, pour tout réel x, [X � x] est un événement, donc on peut calculer sa probabi-

lité.

• La fonction de répartition est définie sur R et pas seulement sur l’ensemble X(V) des valeurs prises par l’appli-cation X. Elle est à valeurs dans [0, 1].

Proposition 2

La fonction de répartition FX d’une variable aléatoire réelle X est une fonction croissantesur R qui vérifie, de plus,

limx→−∞

FX (x) = 0 et limx→+∞

FX (x) = 1.

Preuve� Soient x et y deux réels tels que x � y. On a alors ]−∞, x] ⊂ ]−∞, y]. On en déduit[

X ∈ ]−∞, x]]

⊂[X ∈ ]−∞, y]

], i.e. [X � x] ⊂ [X � y]. Par croissance de P, on obtient

P([X � x]

)� P([X � y]

), c’est-à-dire FX (x) � FX (y).

� La fonction FX est croissante et minorée par 0, donc elle admet une limite finie en −∞ et

limx→−∞

FX (x) = limn→+∞

FX (−n) = limn→+∞

P([X � −n]).

On peut écrire [X � −n] =+∞⋃k=n

[−k − 1 < X � −k]. Ces événements étant incompatibles, on en déduit

que, pour tout n ∈ N,

P([X � −n]

)=

+∞∑k=n

P([−k − 1 < X � −k]

).

La série de terme général P([−k − 1 < X � −k]

)est donc convergente et l’égalité précédente montre que

P([−X � −n]

)est le reste d’ordre n − 1 de la série. Celui-ci a pour limite 0 quand n tend vers +∞. On a

donclim

n→+∞FX (−n) = 0 et lim

x→−∞FX (x) = 0.

� De même, la fonction FX , qui est croissante et majorée par 1, admet une limite finie en +∞ et

limx→+∞

FX (x) = limn→+∞

FX (n) = limn→+∞

P([X � n]).

On note que [X � n] = [X > n] et que [X > n] =+∞⋃k=n

[k < X � k + 1]. Comme ces événements sont

incompatibles, on a

P([X > n]

)=

+∞∑k=n

P([k < X � k + 1]

).

La série de terme général P([k < X � k + 1]

)est donc convergente et l’égalité précédente montre que

P([X > n]

)est le reste d’ordre n − 1 de la série. Celui-ci a pour limite 0 quand n tend vers +∞. Comme

FX (n) = P([X � n]

)= 1 − P

([X > n]

), on a donc

limn→+∞

FX (n) = 1 et limx→+∞

FX (x) = 1.❑

235

Page 243: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Théorème 1

Soit FX la fonction de répartition d’une variable aléatoire réelle X de l’espace probabilisé(V, T , P).Alors FX est continue à droite en tout point de R, c’est-à-dire que

∀x ∈ R, limt→xt>x

FX (t) = FX (x)

et d’autre part,

∀x ∈ R limt→xt<x

FX (t) = FX (x) − P([X = x]) = P([X < x]).

Preuve On peut admettre ces propriétés. Leur démonstration nécessite l’utilisation des résultats de l’exercice 1,page 203 du chapitre 7 (propriété de la limite monotone).

� Soit x un réel. La fonction FX est croissante sur ]x, +∞[ et minorée par FX (x). Elle admet donc une limite finieà droite en x et, par composition des limites,

limt→xt>x

FX (t) = limn→+∞

FX

(x +

1

n

)= lim

n→+∞P

([X � x +

1

n

]).

La suite

([X � x +

1

n

])n∈N∗

est une suite décroissante d’événements, car pour tout n ∈ N∗, on a[X � x +

1

n + 1

]⊂[

X � x +1

n

]donc, d’après l’exercice précité, on obtient

limn→+∞

P

([X � x +

1

n

])= P

(+∞⋂n=1

[X � x +

1

n

]).

On observe que+∞⋂n=1

[X � x +

1

n

]= [X � x]. En effet, on a clairement [X � x] ⊂

+∞⋂n=1

[X � x +

1

n

]et si

un élément v de V appartient à+∞⋂n=1

[X � x +

1

n

], on a pour tout n ∈ N∗, X(v) � x +

1

net par passage à

la limite X(v) � x, c’est-à-dire v ∈ [X � x].Il en résulte

limt→xt<x

FX (t) = P([X � x]) = FX (x)

et FX est continue à droite en tout point de R.

� La fonction FX est croissante sur ]−∞, x[ et majorée par FX (x). Elle admet donc une limite finie à gauche enx et, par composition des limites,

limt→xt<x

FX (t) = limn→+∞

FX

(x − 1

n

)= lim

n→+∞P

([X � x − 1

n

]).

La suite

([X � x − 1

n

])n∈N∗

est une suite croissante d’événements donc, en vertu du même exercice, on

obtient

limn→+∞

P

([X � x − 1

n

])= P

(+∞⋃n=1

[X � x − 1

n

]).

236

Page 244: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

On observe que+∞⋃n=1

[X � x − 1

n

]= [X < x]. En effet, on a clairement

+∞⋃n=1

[X � x − 1

n

]⊂ [X < x] et

d’autre part, si un élément v de V appartient à [X < x], on a X(v) < x, i.e. x − X(v) > 0 ; pour n assez

grand, on obtient alors1

n� x − X(v) et donc X(v) � x − 1

n, c’est-à-dire v ∈

[X � x − 1

n

]; ainsi v

appartient à+∞⋃n=1

[X � x − 1

n

].

Il en résulte quelimt→xt<x

FX (t) = P([X < x]).

Comme [X � x] = [X < x] ∩ [X = x] et que ces événements sont incompatibles, on a de plus,

P([X < x]

)= P([X � x]

)− P([X = x]

)= FX (x) − P([X = x]). ❑

Corollaire 1

Pour toute variable aléatoire réelle X de l’espace probabilisé (V, T , P), la fonction derépartition de X est continue en x si, et seulement si, P([X = x]) = 0.

PreuveD’après le théorème précédent FX est continue à droite en tout point de R. Par suite FX est continue en xsi, et seulement si, FX est continue à gauche en x, donc si, et seulement si, lim

t→xt<x

FX (t) = FX (x), c’est-à-dire

FX (x) − P([X = x]) = FX (x). Ainsi FX est continue en x si, et seulement si, P([X = x]) = 0. ❑

2. Variables aléatoires discrètes

2.1 Définition

Définition 3

Dans un espace probabilisable (V, T ), toute variable aléatoire réelle X dont l’image X(V)est au plus dénombrable, c’est-à-dire finie ou dénombrable, est appelée variable aléatoirediscrète.Plus précisément

• toute variable aléatoire réelle X dont l’image X(V) est finie, est une variable aléatoireréelle discrète finie ;

• toute variable aléatoire réelle X dont l’image X(V) est infinie dénombrable, est unevariable aléatoire réelle discrète infinie.

Dit autrement, toute variable aléatoire à valeurs dans une partie au plus dénombrable deR est une variable aléatoire discrète.

➤ Remarques• Si V est fini ou dénombrable, T = P (V), et toute application de V dans R est une variable aléatoire

dont l’image est au plus dénombrable ; c’est une variable aléatoire discrète.

• On rappelle qu’un ensemble E est dénombrable s’il peut être mis en bijection avec N : les éléments de E peuventdonc être indexés par N.

237

Page 245: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Les ensembles N, Z, Q, N2 sont dénombrables. Toute partie infinie d’un ensemble dénombrable est dénom-brable. Toute réunion dénombrable d’ensembles dénombrables est dénombrable.L’ensemble R des réels, l’ensemble P (N) des parties de N, ne sont pas dénombrables

• Tout ensemble E fini ou dénombrable peut s’écrire sous la forme E = {xi i ∈ I} où I est une partie de N etl’application i −→ xi une bijection de I sur E (on peut prendre I = N si E est dénombrable, I = �1, n� si E estfini de cardinal n).Dans la suite de ce chapitre, si X est une variable aléatoire discrète, nous noterons donc X(V) = {xi , i ∈ I} oùI est une partie de N.La plupart du temps on aura X(V) ⊂ N ou X(V) ⊂ Z.

Proposition 3

Soit (V, T ) un espace probabilisable et X une application de V dans R telle que X(V) soitfini ou dénombrable. On note X(V) = {xi, i ∈ I}, où I est une partie de N.Alors X est une variable aléatoire réelle discrète si, et seulement si,

∀i ∈ I, [X = xi] ∈ T .

PreuveComme X(V) est au plus dénombrable, si X est une variable aléatoire, c’est une variable aléatoire réelle discrète.Nous savons déjà, par la proposition 1, que si X est une variable aléatoire alors, pour tout i ∈ I, [X = xi ] est unévénement.Supposons réciproquement que cette condition est réalisée. Montrons alors que X est une variable aléatoireréelle, c’est-à-dire que, pour tout réel x, {v ∈ V, X(v) � x} est un élément de la tribu T .Comme X(V) = {xi , i ∈ I}, on a

{v ∈ V, X(v) � x} = {v ∈ V, ∃i ∈ I, X(v) = xi et xi � x}= {v ∈ V, ∃i ∈ I, v ∈ [X = xi ] et xi � x}

=⋃i∈I

xi�x

[X = xi ].

Comme [X = xi ] est un élément de T pour tout i de I et que {i ∈ I, xi � x} est fini ou dénombrable, alors{v ∈ V, X(v) � x} est une réunion au plus dénombrable d’éléments de T , donc un élément T (d’après lespropriétés de l’ensemble T des événements). ❑

ExempleDans une urne composée de boules rouges et de boules blanches, nous tirons une boule jusqu’àl’obtention d’une boule rouge. Les tirages se font avec remise après chaque tirage.

Soit X l’application de V dans N qui, à tout élément de l’univers des possibles V, associele nombre de tirages nécessaires pour obtenir une boule rouge pour la première fois et 0 sitous les tirages donnent une boule blanche. On admet qu’on peut modéliser l’expérience parun espace probabilisé (V, T , P) tel que, pour tout n, An : « tirer une boule rouge au n-ièmetirage » soit un événement. On a alors, pour tout n ∈ N∗,

[X = n] = A1 ∩ A2 ∩ . . . ∩ An−1 ∩ An,

238

Page 246: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

donc [X = n] est un événement. Il en est de même de

[X = 0] =+∞⋂k=1

Ak,

qui est une intersection dénombrable d’événements.

Ainsi X est une variable aléatoire sur(V, T

).

Comme nous le verrons par la suite (page 264), la probabilité de l’événement [X = 0] estnulle.

Proposition 4

Pour tout espace probabilisable (V, T ) et pour tout réel a, l’application

X :

{V −→ R

v −→ a

est une variable aléatoire discrète finie appelée variable aléatoire constante ou certaine.

PreuveL’ensemble X(V) = {a} est fini et {v ∈ V, X(v) = a} = V, donc X est une variable aléatoire finie d’après laproposition 3. ❑

Proposition 5

Pour tout espace probabilisable (V, T ) et tout événement A, l’application

X :

⎧⎪⎨⎪⎩V −→ R

v −→{

1 si v ∈ A0 si v /∈ A

est une variable aléatoire discrète finie appelée la variable aléatoire indicatrice del’événement A, notée généralement 1A.

PreuveEn effet X(V) = {0, 1} est fini et [X = 0] = A ∈ T et [X = 1] = A ∈ T . Donc X est une variable aléatoirediscrète d’après la proposition 3. ❑

Théorème 2

Soit X une variable aléatoire discrète de l’espace probabilisable (V, T ). On noteX(V) = {xi, i ∈ I}, où I est une partie de N. Alors la famille ([X = xi])i∈I est un systèmecomplet d’événements, appelé le système complet d’événements associé à X.

PreuvePar définition d’une variable aléatoire, [X = xi ] est un événement pour tout i ∈ I. Donc ([X = xi ])i∈I est unefamille finie ou dénombrable d’événements.

239

Page 247: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Si i et j sont deux éléments de I distincts, on a xi = xj , donc les événements [X = xi ] et [X = xj ] sontincompatibles. On a enfin, ⋃

i∈I

[X = xi ] = V

car, pour tout v ∈ V, il existe i ∈ I tel que X(v) = xi , et donc v appartient à [X = xi ]. ❑

Loi d’une variable aléatoire discrète

Définition 4

Si X une variable aléatoire discrète X de l’espace probabilisé (V, T , P), l’application

X(V) −→ R

x −→ P([X = x])

est appelée loi de probabilité ou distribution de X et est notée PX .

➤ RemarqueDéterminer la loi de X, c’est donc déterminer X(V) et calculer, pour tout x ∈ X(V), la probabilité P([X = x]). SiX(V) = {xi, i ∈ I}, où I est une partie de N, on détermine la famille (pi )i∈I, où pi = P([X = xi ]).

Proposition 6

Soit X une variable discrète de l’espace probabilisé (V, T , P).

• Si X est une variable finie telle que X(V) = {x1, x2, . . . , xn}, on a

n∑k=1

P([X = xk]) = 1.

• Si X est une variable aléatoire discrète infinie et X(V) = {xk, k ∈ N}, on a

∞∑k=0

P([X = xk]) = 1.

PreuveL’égalité est vérifiée car la famille

([X = xk]

)1�k�n

dans le premier cas,([X = xk]

)k∈N dans le second est un

système complet d’événements. ❑

Nous admettrons que la proposition 6 énonce des conditions suffisantes pour qu’uneapplication soit une loi de probabilité. Plus précisément, nous avons le théorèmesuivant :

Théorème 3

• Si m est un entier naturel non nul, (x1, x2, . . . , xm) un m-uplet de réels et

(p1, p2, . . . , pm) un m-uplet de réels positifs tel quem∑

i=1

pi = 1, alors il existe

240

Page 248: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

un espace probabilisé (V, T , P) et une variable aléatoire X sur V telle queX(V) ⊂ {x1, x2, . . . , xm} et

∀k ∈ �1, m�, P([X = xk]) = pk.

• Si (xn) est une suites de réels et (pn) une suite de réels positifs tels que+∞∑n=0

pn = 1, alors

il existe un espace probabilisé (V, T , P) et une variable aléatoire X sur V telle queX(V) ⊂ {xn, n ∈ N} et

∀k ∈ N, P([X = xk]) = pk.

➤ RemarqueLa condition ne porte que sur les pn. Ce théorème est à rapprocher des théorèmes 3 et 5 du chapitre 7 qui traitentde la façon de définir une probabilité sur un espace probabilisé dont l’univers est fini ou dénombrable.Les conditions sur les P([X = xk]) signifient qu’il existe une probabilité sur

(X(V),P (X(V))

)pour laquelle la proba-

bilité de l’événement élémentaire {xk} est P([X = xk]

).

Exemple

On pose, pour tout n ∈ N∗, pn =1

n(n + 1). On a, pour tout n ∈ N∗, pn > 0. On remarque

que, pour tout n ∈ N∗, pn =

1n− 1

n + 1. La série de terme général pn est une série télescopique

donc, pour tout N ∈ N∗,N∑

n=1

pn =N∑

n=1

(1n− 1

n + 1

)= 1 − 1

N + 1·

On en déduit que la série de terme général pn converge et+∞∑n=1

pn = limN→+∞

(1 − 1

N + 1

)= 1·

Il existe donc un espace probabilisé (V, T , P) et une variable aléatoire discrète sur cet espace

probabilisé telle que X(V) = N∗ et, pour tout n ∈ N∗, P([X = n]) =1

n(n + 1)·

➤ RemarqueSi deux variables aléatoires discrètes X et Y définies sur un même espace probabilisé ont même loi, celane signifie nullement que ces variables sont égales.En effet, les variables X et Y ont même loi si X(V) = Y (V) et si, pour tout x ∈ X(V), P([X = x]) = P([Y = x]).Mais l’égalité X = Y signifie que, pour tout v ∈ V, X(v) = Y (v) c’est-à-dire, pour tout x ∈ X(V), l’égalité[X = x] = [Y = x]. Que les ensembles [X = x] et [Y = x] aient même probabilité ne signifie pas qu’ils sont égaux.

ExempleOn lance une pièce équilibrée. On note X le nombre de pile, Y le nombre de face. On a

X(V) = Y (V) = {0, 1}, P([X = 0]) = P([X = 1]) =12

et P([Y = 0]) = P([Y = 1]) =12·

Les variables X et Y ont même loi, mais X n’est pas égal à Y . En effet, pour tout v ∈ V,

X(v) = 1 ⇐⇒ Y (v) = 0,

car si on obtient pile, on n’obtient pas face.

241

Page 249: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

2.2 Fonction de répartition

Les fonctions de répartition des variables aléatoires discrètes possèdent toutes les pro-priétés démontrées dans la partie 1.2 : elles sont croissantes, ont pour limite 0 en −∞et 1 en +∞, sont continues à droite en tout point.

D’après le théorème 1, la fonction de répartition FX d’une variable discrète X estcontinue en tout point x tel que P

([X = x]

)= 0 et en particulier en tout point x tel

que x /∈ X(V), car alors [X = x] = ∅.

Les propositions suivantes précisent les propriétés de la fonction de répartition pourune variable discrète.

Proposition 7

Soit X une variable aléatoire finie sur l’espace probabilisé (V, T , P). On poseX(V) = {x1, x2, . . . , xn} et l’on suppose que x1 < x2 < . . . < xn. Alors la fonction derépartition FX est une fonction en escalier croissante. On a, plus précisément

• FX (x) = 0 si x < x1 ;

• pour tout k ∈ �1, n − 1� et tout x ∈ [xk, xk+1[,

FX (x) = P([X = x1]) + P([X = x2]) + · · · + P([X = xk]) ;

• FX (x) = 1 si x � xn.

Preuve• Si x < x1, alors [X � x] = ∅ donc FX (x) = P([X � x]) = 0 ;

• si k ∈ �1, n − 1� et x ∈ [xk, xk+1[, [X � x] = [X = x1] ∪ [X = x2] ∪ · · · ∪ [X = xk] et

FX (x) = P([X � x]) = P([X = x1]) + P([X = x2]) + · · · + P([X = xk]) ;

• si x � xn, [X � x] = V et FX (x) = P([X � x]) = 1. ❑

➤ RemarqueDans le cas où X(V) est dénombrable, la fonction de répartition d’une telle variable aléatoire réelle discrète est unefonction « en escalier généralisé », possédant une infinité de discontinuités.

Examinons le cas d’une variable aléatoire à valeurs dans Z.

Proposition 8

Soit X une variable aléatoire réelle discrète dans un espace probabilisé (V, T , P) telle queX(V) ⊂ Z. Alors, pour tout entier n ∈ Z, la fonction FX est constante sur [n, n + 1[.

Preuve Soit n ∈ Z et x dans [n, n + 1[. On a alors

FX (x) = P([X � x]

)= P([X � n]

)+ P([n < X � x]

)= FX (n) + P

([n < X � x]

).

Mais P([n < X � x]

)= 0, puisque ]n, n + 1[∩X(V) = ∅. On obtient donc FX (x) = FX (n), et FX est constante

sur [n, n + 1[. ❑

242

Page 250: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

ExempleReprenons l’exemple d’une variable aléatoire discrète X telle que X(V) = N

∗ et, pour tout

n ∈ N∗, P([X = n]) =

1n(n + 1)

(cf page 241).

On a FX (x) = 0 si x < 1 et, pour tout n ∈ N∗ et tout x ∈ [n, n + 1[,

FX (x) = P([X � x]) =n∑

k=1

P([X = k]) =n∑

k=1

1k(k + 1)

=n∑

k=1

(1k− 1

k + 1

)= 1 − 1

n + 1=

nn + 1

·

Lien entre fonction de répartition et loiConnaissant la fonction de répartition d’une variable discrète X, on peut déterminersa loi. Nous nous plaçons dans le cas où X(V) ⊂ Z.

Proposition 9

Soit X une variable aléatoire réelle discrète X telle que X(V) ⊂ Z. On a, pour toutk ∈ X(V),

P([X = k]) = FX (k) − FX (k − 1).

PreuvePour tout entier relatif k, on a [X � k − 1] ⊂ [X � k] et

[X = k] = [X � k] \ [X � k − 1].

On en déduit queP([X = k]) = P([X � k]) − P([X � k − 1]) = FX (k) − FX (k − 1).

➤ Remarques• Cette formule est utile dans les cas où il est plus simple de déterminer la fonction de répartition que la loi de la

variable aléatoire.

• En supposant toujours que X est une variable aléatoire telle que X(V) ⊂ Z, on peut démontrer de même que,pour tout k ∈ X(V),

P([X = k]) = P([X � k]) − P([X � k + 1]

).

En effet, on a [X � k + 1] ⊂ [X � k] et [X = k] = [X � k] \ [X � k + 1].

Exercice 1.Un sauteur tente de franchir des hauteurs successives numérotées 1, 2,. . . , n,. . . Il n’essaie defranchir la hauteur n que s’il a réussi à passer les hauteurs précédentes. Si le sauteur a déjà réussiles n − 1 premiers sauts (n � 2), la probabilité qu’il franchisse avec succès la n-ième hauteur

est1n·

243

Page 251: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Soit X la variable aléatoire égale au numéro de la dernière hauteur franchie correctement.Déterminer la loi de X.

Solution. Pour n ∈ N∗, soit An l’événement « le sauteur a franchi la hauteur n ». Par hypothèse,

on a pour tout n � 2, P(An/A1 ∩ . . .∩An−1) =1n· Par la formule des probabilités composées,

on obtient donc, pour n � 1, P(An) =1n!·

On n’est pas sûr a priori qu’il y ait une dernière hauteur franchie, c’est-à-dire que le sauteurne franchisse pas toutes les hauteurs. On pose X(V) = N, où [X = 0] est l’événement « lesauteur franchit toutes les hauteurs». On a alors [X = 0] =

⋂n∈N∗

An. On a pour tout n ∈ N∗,

[X = 0] ⊂ An et donc 0 � P([X = 0]) � P(An) � 1n!· On en déduit, en faisant tendre n vers

+∞, que P([X = 0]) = 0.

L’événement [X = 0] est quasi-impossible. On peut considérer que la variable X est à valeursdans N∗.

Pour tout n ∈ N∗, on a [X � n] = An et donc P([X � n]) = P(An) =1n!· On en déduit que

P([X = n]) = P([X � n]) − P([X � n + 1]) =1n!

− 1(n + 1)!

·

Nous pouvons rapidement vérifier que+∞∑n=1

P([X = n]) = 1. En effet, pour N ∈ N∗,

N∑n=1

P([X = n]) =N∑

n=1

(1n!

− 1(n + 1)!

)= 1 − 1

(N + 1)!,

et donc

+∞∑n=1

P([X = n]) = limN→+∞

P([X = n]) = limN→+∞

(1 − 1

(N + 1)!

)= 1.

2.3 Variable aléatoire fonction d’une variable aléatoire discrète

Définition 5

Soit X une variable aléatoire discrète sur un espace probabilisé (V, T , P) et g une applica-tion de X(V) dans R. L’application

Y :{

V −→ R

v −→ g(X(v)

)est notée g(X).

244

Page 252: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

➤ RemarqueEn fait g(X) n’est rien d’autre que la composée g◦X. La notation s’accorde avec la terminologie qui appelle variablel’application X.

Théorème 4

Soit X une variable aléatoire réelle discrète d’un espace probabilisé (V, T , P) et g uneapplication de X(V) dans R. On note X(V) = {xi, i ∈ I}, où I est une partie de N.Alors l’application g(X) est une variable aléatoire réelle discrète d’image

g(X(V)) = {g(xi), i ∈ I}.On a, pour tout y ∈ g(X)(V),

P([g(X) = y]) =∑

xi∈X(V)g(xi)=y

P([X = xi]).

PreuveDe X(V) = {xi, i ∈ I}, on déduit

g(X)(V) = g(X(V)) = {g(xi ), i ∈ I}.Cet ensemble est au plus dénombrable.

Pour tout y ∈ g(X)(V) et v ∈ V, on a

v ∈ [g(X) = y] ⇐⇒ g(X(v)) = y

⇐⇒ ∃i ∈ I, X(v) = xi et g(xi ) = y

⇐⇒ ∃i ∈ I, g(xi ) = y et v ∈ [X = xi ].On a donc

[g(X) = y] =⋃

xi∈X(V)g(xi )=y

[X = xi ].

Comme {i ∈ I, g(xi ) = y} est au plus dénombrable, et que X est une variable aléatoire, [g(X) = y] est unévénement car réunion au plus dénombrable d’événements. Ainsi, g(X) est une variable aléatoire discrète.

La loi de la variable aléatoire g(X) est définie par

P([g(X) = y]) = P

⎛⎜⎝ ⋃i∈I

g(xi )=y

[X = xi ].

⎞⎟⎠ =∑

i∈Ig(xi )=y

P([X = xi ]),

par incompatibilité des événements. ❑

ExempleDans une urne, contenant une infinité de boules numérotées sur Z, un joueur prélève une

boule, de façon que la probabilité que la boule numéro i soit prélevée est1

2.3|i|·

La définition est raisonnable. En effet,1

2.3|i|� 0 pour tout i ∈ Z et comme d’autre part

12.3|−i| =

12.3|i|

, on obtient∑i∈Z

12.3|i|

= 2∑i∈N

12.3|i|

− 12 · 30

=+∞∑i=0

13i

− 12

=1

1 − 13

− 12

= 1.

245

Page 253: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Soit X la variable aléatoire discrète égale au numéro de la boule prélevée. On a donc X(V) = Z

et pour tout i ∈ Z, P([X = i]) =1

2.3|i|·

Posons Y = X2. On obtient Y (V) = {n2, n ∈ Z} = {n2, n ∈ N} et

∀n ∈ N∗, P([Y = n2]) = P([X = n]) + P([X = −n]) =

13n

P([Y = 0]) = P([X = 0]) =12·

Exercice 2.Soit X une variable aléatoire réelle discrète sur l’espace probabilisé (V, T , P) telle que

X(V) = N∗ et P([X = k]) =

a

k(k + 1)(k + 2)pour tout entier naturel non nul k.

1. On pose uk =12k

− 12(k + 1)

· Montrer que, pour tout k ∈ N∗, on a

1k(k + 1)(k + 2)

= uk − uk+1.

En déduire la valeur de a.

2. Montrer que Y = X + 1 est une variable aléatoire réelle discrète et déterminer sa loi.

3. Montrer que Z = X2 − 4X + 4 est une variable aléatoire réelle discrète et déterminer saloi.

Solution.

1. En effet, pour tout k ∈ N∗,

uk − uk+1 =12k

− 12(k + 1)

− 12(k + 1)

+1

2(k + 2)

=12k

− 1(k + 1)

+1

2(k + 2)

=(k + 1)(k + 2) − 2k(k + 2) + k(k + 1)

2k(k + 1)(k + 2)

=1

k(k + 1)(k + 2)·

La série de terme général1

k(k + 1)(k + 2)est donc une série télescopique. On obtient

n∑k=1

1k(k + 1)(k + 2)

=n∑

k=1

(uk − uk+1) = u1 − un+1 =14− un+1.

De limk→+∞

uk = 0, on déduit+∞∑k=1

1k(k + 1)(k + 2)

=14

et donc a = 4.

246

Page 254: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires discrètes

2. Comme X est une variable aléatoire réelle discrète, Y est une variable aléatoire réellediscrète et Y (V) = �2, +∞�.Pour tout entier k supérieur ou égal à 2,

P([Y = k]) = P([X = k − 1]) =4

(k − 1)k(k + 1)·

3. Remarquons que Z = (X − 2)2. Posons W = X − 2. Alors W est une variable aléatoirediscrète telle que W (V) = {k ∈ Z, k � −1} et pour tout entier k � −1,

P([W = k]) = P([X = k + 2]) =4

(k + 2)(k + 3)(k + 4)·

On en déduit que Z = W 2 est une variable aléatoire discrète et que

Z(V) = {k2, k ∈ W (V)} = {k2, k ∈ N}·Pour tout entier k � 2 et pour k = 0, on a [Z = k2] = [W = k] et

P([Z = k2] = P([W = k]) =4

(k + 2)(k + 3)(k + 4)·

Enfin [Z = 1] = [W = −1] ∪ [W = 1] et

P([Z = 1]) = P([W = −1]) + P([W = 1]) =46

+460

=1115

·

2.4 Opérations

Théorème 5

Si X et Y sont deux variables discrètes sur l’espace probabilisé (V, T , P) et l un réel, lesapplications de V dans R : X + Y , XY et lX définies, pour tout v de V, par

(X + Y )(v) = X(v) + Y (v), (XY )(v) = X(v)Y (v), (lX)(v) = lX(v)

sont des variables aléatoires discrètes.

Preuve On note X = {xi , i ∈ I} et Y = {yj, j ∈ J}, où I et J sont des parties de N. On alors

(X + Y )(V) = {xi + yj, (i, j) ∈ I × J}, (XY )(V) = {xiyj , (i, j) ∈ I × J}(lX)(V) = {lxi, i ∈ I}.

Comme I × J est une partie de N2 donc est au plus dénombrable, ces applications ont un ensemble au plusdénombrable de valeurs.

Pour tout z ∈ (X + Y )(V), on a

[X + Y = z] = {v, ∃(i, j) ∈ I × J, X(v) = xi, Y (v) = yj, xi + yj = z}= {v, ∃(i, j) ∈ I × J, v ∈ [X = xi ] ∩ [Y = yj ]}

=⋃

(i,j)∈I×Jxi +yj=z

[X = xi ] ∩ [Y = yj ].

Comme, pour tout (i, j) ∈ I× J, [X = xi ]∩ [Y = yj ] ∈ T comme intersection d’éléments de T et que l’ensemble{(i, j) ∈ I × J, xi + yj = z} est un sous-ensemble de I × J donc est dénombrable, [X + Y = z] est une réuniondénombrable d’éléments de T donc est un éléments de T .

Ainsi X + Y est une variable aléatoire discrète.

247

Page 255: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

On obtient le même résultat pour XY et lX en écrivant, pour z ∈ (XY )(V,

[XY = z] =⋃

(i,j)∈I×Jxi yj=z

[X = xi ] ∩ [Y = yj ]

et pour z ∈ lX(V),[lX = z] =

⋃i∈I

lxi=z

[X = xi ].❑

➤ RemarqueLes égalités précédentes permettent de déterminer les lois de X + Y , XY et lX, connaissant, pour tout (i, j) ∈ I × J,P([X = xi ] ∩ [Y = yj ]

).

3. Les moments d’une variable aléatoire

3.1 L’espérance

Définition 6

Pour toute variable aléatoire réelle discrète finie X sur l’espace probabilisé (V, T , P), telleque X(V) = {x1, . . . , xn}, l’espérance mathématique (ou encore espérance) de lavariable aléatoire X est le réel

E(X) =n∑

i=1

xiP([X = xi]

).

➤ Remarques• Toute variable aléatoire réelle discrète finie admet donc une espérance.

• L’espérance est la moyenne des valeurs prises par X pondérées par la probabilité que X prenne cette valeur.L’espérance mathématique est donc une généralisation de la notion de moyenne.

Proposition 10

Pour tout événement A de l’espace probabilisé (V, T , P), la variable aléatoire indicatrice1A de l’événement A admet une espérance égal à E(1A) = P(A).Pour tout réel a, la variable aléatoire réelle discrète X certaine égale à a admet a commeespérance.

Preuve� Rappelons que la variable aléatoire indicatrice de l’événement A est la variable aléatoire

1A :

⎧⎪⎨⎪⎩V −→ R

v −→{

1 si v ∈ A

0 si v /∈ A

1A admet une espérance et E(1A) = 0.P([1A = 0]

)+ 1.P

([1A = 1]

)= P(A).

� Soit X la variable aléatoire réelle discrète certaine égale à a. On a X(V) = {a} et P([X = a]

)= 1 donc X

admet une espérance etE(X) = a P

([X = a]

)= a. ❑

248

Page 256: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

Définition 7

Soit X une variable aléatoire réelle discrète infinie sur l’espace probabilisé (V, T , P),X(V) = {xi, i ∈ N}. Si la série de terme général xiP

([X = xi]

)converge absolu-

ment, on dit alors que X admet une espérance mathématique (ou espérance) égale aunombre réel

E(X) =+∞∑i=0

xiP([X = xi]).

➤ Remarques• La définition dans le cas fini apparaît comme un cas particulier de celle-ci, une somme finie pouvant être

considérée comme la somme d’une série absolument convergente dont une infinité de termes sont nuls.

• On impose la convergence absolue de la série, car dans le cas d’une série qui est convergente mais pas abso-lument convergente, la somme de la série varie si l’on fait subir aux indices i une permutation arbitraire de N.

Ainsi la valeur de+∞∑i=0

xiP([X = xi ]) dépendrait de la numérotation des éléments de X(v).

• Toute variable aléatoire réelle discrète X telle que X(V) = N admet une espérance si, et seulement si, la sériede terme général n P([X = n]) converge (en effet, elle est à termes positifs).En cas de convergence,

E(X) =+∞∑n=0

n P([X = n]) =+∞∑n=1

n P([X = n]).

• Toute variable aléatoire réelle discrète X telle que X(V) = Z admet une espérance si, et seulement si, les sériesde termes généraux nP([X = n]) et nP([X = −n]) convergent (ces séries sont à termes de signe constant doncla convergence absolue équivaut à la convergence). En cas de convergence de ces séries, on a

E(X) =+∞∑n=1

(−n)P([X = −n]) ++∞∑n=0

nP([X = n]),

ce que l’on note

E(X) =+∞∑

n=−∞n P([X = n]).

Exemples1. Reprenons l’exemple du sauteur en hauteur (page 243). On a X(V) = N

∗ et pour tout

n ∈ N∗, P([X = n]) =

1n!

− 1(n + 1)!

· On obtient, pour tout n ∈ N∗,

n∑k=1

kP([X = k]) =n∑

k=1

(kk!

− k(k + 1)!

)=

n∑k=1

kk!

−n+1∑j=2

j − 1j!

, en posant j = k + 1,

=n∑

k=1

1k!

− n(n + 1)!

·

La série de terme général1n!

converge et a pour somme e. On a d’autre part

0 � n(n + 1)!

� 1n!

et donc limn→+∞

n(n + 1)!

= 0. On en déduit

limn→+∞

n∑k=1

kP([X = k]) =+∞∑k=1

1k!

=+∞∑k=0

1k!

− 1 = e − 1.

La variable X possède une espérance et E(X) = e − 1.

249

Page 257: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

2. Reprenons la variable aléatoire X de l’exemple de la page 245. Ici X est la variable aléatoireégale au numéro de la boule prélevée dans une urne en contenant une infinité numérotéessur Z. La loi de X est définie par

∀k ∈ Z, P([X = k]) =1

2.3|k|·

La série de terme généralk

2.3kconverge donc X admet une espérance et

E(X) =+∞∑k=1

−k2.3k

++∞∑k=0

k2.3k

= 0.

➤ RemarqueIl existe des variables aléatoires réelles discrètes, infinies bien sûr, qui n’admettent pas d’espérance.

Nous avons montré qu’il existait une variable aléatoire X telle que X(V) = N∗ et P([X = n]) =1

n(n + 1), pour tout

n ∈ N∗. Cette variable n’admet pas d’espérance. En effet, la série de terme général nP([X = n]) =1

n + 1diverge.

Propriétés de l’espérance

Théorème 6 (Linéarité de l’espérance)

Soit X et Y sont deux variables discrètes sur le même espace probabilisé (V, T , P), admet-tant une espérance, et l un réel. Alors X + Y et lX sont des variables aléatoires réellesdiscrètes qui admettent une espérance et

E(X + Y ) = E(X) + E(Y ) et E(lX) = lE(X).

PreuveNous savons déjà que Z = X + Y et lX sont des variables aléatoires discrètes (cf théorème 5). Nous démontronsle théorème uniquement dans le cas fini.Soit X(V) = {x1, x2, . . . , xm} et Y (V) = {y1, y2, . . . , yn}.

On a alors Z(V) = {xi + yj, (i, j) ∈ [[1, m]] × [[1, n]]} et, pour tout z ∈ Z(V),

[Z = z] =⋃

(i,j)∈[[1,m]]×[[1,n]]xi +yj=z

[X = xi ] ∩ [Y = yj ].

On en déduit que

zP([Z = z]) = z∑

(i,j)∈[[1,m]]×[[1,n]]xi +yj=z

P([X = xi ] ∩ [Y = yj ]

)=

∑(i,j)∈[[1,m]]×[[1,n]]

xi +yj=z

zP([X = xi ] ∩ [Y = yj ]

)=

∑(i,j)∈[[1,m]]×[[1,n]],

xi +yj=z

(xi + yj )P([X = xi ] ∩ [Y = yj ]

),

250

Page 258: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

puis que

E(Z) =∑

z∈Z(V)

z P([Z = z])

=∑

z∈Z(V)

⎛⎜⎜⎝ ∑(i,j)∈[[1,m]]×[[1,n]]

xi +yj=z

(xi + yj ) P([X = xi ] ∩ [Y = yj ]

)⎞⎟⎟⎠=

∑(i,j)∈[[1,m]]×[[1,n]]

(xi + yj ) P([X = xi ] ∩ [Y = yj ]

),

car tout z ∈ Z(V) s’écrit xi + yj , où (i, j) ∈ [[1, m]] × [[1, n]].

Comme([X = xi

)1�i�m

et([Y = yj ]

)1�j�n

sont des systèmes complets d’événements, on obtient

∑(i,j)∈[[1,m]]×[[1,n]]

xiP([X = xi ∩ [Y = yj ]) =m∑

i=1

⎛⎝xi

n∑j=1

P([X = xi ] ∩ [Y = yj ])

⎞⎠=

m∑i=1

xiP([X = xi ]) = E(X),

∑(i,j)∈[[1,m]]×[[1,n]]

yjP([X = xi ∩ [Y = yj ]) =n∑

j=1

(yj

m∑i=1

P([X = xi ] ∩ [Y = yj ])

)

=n∑

j=1

yjP([Y = yj ]) = E(Y ).

On en déduit

E(Z) =∑

(i,j)∈[[1,m]]×[[1,n]]

xiP([X = xi ] ∩ [Y = yj ]

)+∑

(i,j)∈[[1,m]]×[[1,n]]

yjP([X = xi ] ∩ [Y = yj ]

)= E(X) + E(Y ),

c’est-à-direE(X + Y ) = E(X) + E(Y ).

Si l = 0 la variable lX est la variable nulle et son espérance est nulle. Sinon, on a(lX)(V) = {lx1, lx2, . . . , lxn} et, pour i ∈ �1, n�,

P([lX = lxi ]) = P([X = xi ]).

On en déduit

E(lX) =n∑

i=1

lxiP([X = xi ]) = l

n∑i=1

xiP([X = xi ]) = lE(X).❑

➤ RemarqueCe théorème signifie que l’ensemble des variables aléatoires sur (V,T , P) admettant une espérance forment unespace vectoriel et que l’application X −→ E(X) définie sur cet espace vectoriel est linéaire.

Corollaire 2

Soit X est une variable aléatoire réelle discrète admettant une espérance E(X). Pour toutcouple (a, b) de réels, aX + b est une variable aléatoire réelle discrète admettant a E(X) + bcomme espérance.

251

Page 259: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

PreuveLa variable aX admet un espérance égale à aE(X). La variable constante b admet une espérance b. Donc aX + badmet une espérance et

E(aX + b) = E(aX) + b = aE(X) + b. ❑

➤ RemarqueLe théorème 6 est utile pour calculer l’espérance d’une variable dont on ne connaît pas la loi, mais qu’on saitdécomposer en somme de variables aléatoires plus simples, par exemple en somme de variables indicatrices, donton sait calculer l’espérance.

ExempleOn considère un entier n � 2 et une urne contenant n jetons numérotés de 1 à n. Onprélève ces jetons successivement et sans remise. On note (u1, . . . , un) la liste des numérossuccessivement tirés. Pour 2 � i � n, on dit qu’il y a « montée » (resp. « descente » au i-ièmetirage si ui > ui−1 (resp. ui < ui−1). On note X (resp. Y ) la variable aléatoire égale au nombretotal de montées (resp. de descentes).

L’univers V est l’ensemble des permutations de [[1, n]]. On a donc Card(V) = n! et T = P(V).Les variables X et Y sont à valeurs dans [[0, n − 1]]. Pour i ∈ [[2, n]], on note Xi la variable quivaut 1 s’il y a montée au i-ième tirage et 0 sinon. On a alors

X = X2 + · · · + Xn.

Pour i ∈ �2, n�, l’événement [Xi = 1] est réalisé si ui−1 < ui. On choisit deux éléments de[[1, n]] au hasard, le plus petit est ui−1, le plus grand ui ; les n − 2 autres jetons peuvent êtretirées dans un ordre quelconque. On trouve

P([Xi = 1]) =

(n2

)(n − 2)!

n!=

12·

On en déduit que E(Xi) = P([Xi = 1]) =12

, puis

E(X) =n∑

i=2

12

=n − 1

On peut procéder de la même manière pour Y , mais on peut remarquer plus simplement queX + Y = n − 1, car s’il n’y a pas montée au i-ième tirage, il y a descente. On en déduit que

E(Y ) = n − 1 − E(X) =n − 1

Définition 8

Toute variable aléatoire réelle discrète admettant une espérance nulle est dite centrée.

Proposition 11

Pour toute variable aléatoire réelle discrète X admettant une espérance E(X), la variablealéatoire X − E(X) est une variable aléatoire réelle discrète centrée appelée la variablealéatoire centrée associée à X.

252

Page 260: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

PreuveNotons que E(X) est un réel qu’on considère comme la variable aléatoire constante v −→ E(X) ; celle-ci a pourespérance E(X). D’après le corollaire 2, la variable aléatoire X − E(X) est une variable aléatoire réelle discrèteadmettant une espérance et

E(X − E(X)

)= E(X) − E(X) = 0.

Proposition 12 (Positivité de l’espérance)

Soit X est une variable aléatoire réelle discrète admettant une espérance.

• Si X est positive, c’est-à-dire si X(v) � 0 pour tout élément v de V, alors E(X) estun réel positif.

• Si de plus E(X) = 0, la variable X est presque sûrement nulle, c’est-à-dire vérifiel’égalité P([X = 0]) = 1.

PreuveSoit X(V) = {xi, i ∈ I}.

• Comme X est une variable aléatoire positive, on a xi � 0 pour tout i ∈ I. L’espérance E(X) qui est la sommede la série de terme général xi P([X = xi ]), donc la somme d’une série à termes positifs, est positive.

• Supposons qu’il existe i ∈ I tel que xi > 0 et P([X = xi ]) > 0. On a alors, puisque tous les termes de la sériedéfinissant E(X) sont positifs, E(X) � xi P([X = xi ]) > 0.Par contraposée, si E(X) = 0 alors P([X = xi ]) = 0 pour tout i ∈ I tel que xi = 0. Donc P([X = 0]) = 1. ❑

Proposition 13 (Croissance de l’espérance)

Soit X et Y deux variables aléatoires réelles discrètes définies sur le même espace proba-bilisé (V, T , P), admettant une espérance.Si X � Y , c’est-à-dire si X(v) � Y (v) pour tout élément v de V, alors

E(X) � E(Y ).

PreuveComme X et Y admettent une espérance, Y − X est une variable aléatoire réelle discrète positive admettantune espérance et E(Y − X) = E(Y ) − E(X).D’après la proposition 12, E(Y − X) � 0, d’où E(X) � E(Y ). ❑

3.2 Le théorème de transfert

Théorème 7

Si X est une variable aléatoire réelle discrète finie vérifiant X(V) = {x1, x2, . . . , xn} et gune application de X(V) dans R, l’espérance de la variable aléatoire discrète finie g(X) estdonnée par

E(g(X)

)=

n∑i=1

g(xi)P([X = xi]

).

253

Page 261: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

PreuveL’image g(X)(V) = {g(xi ), i ∈ [[1, n]]} est finie ; on note

g(X)(V) = {y1, y2, . . . , ym}

et, pour tout j de �1, m�, on considère le sous-ensemble Ij de �1, n� des indices i tels que g(xi ) = yj . On a alors

[g(X) = yj ] =⋃i∈Ij

[X = xi ].

On en déduit que, pour tout j de �1, m�,

yjP([Y = yj ]) = yj

∑i∈Ij

P([X = xi ]) =∑i∈Ij

yjP([X = xi ])

=∑i∈Ij

g(xi )P([X = xi ]).

Par définition de l’espérance

E(g(X))

=m∑

j=1

yjP([g(X) = yj ]) =m∑

j=1

⎛⎝∑i∈Ij

g(xi )P([X = xi ])

⎞⎠=∑

i∈m⋃

j=1

Ij

g(xi )P([X = xi ]).

Commem⋃

j=1Ij = �1, n�, on a

E(g(X))

=n∑

i=1

g(xi )P([X = xi ]).❑

Nous admettrons le théorème suivant qui permet le calcul de l’espérance de la variableg(X) dans le cas où X est une variable discrète non finie.

Théorème 8

Soit X est une variable aléatoire réelle discrète telle que X(V) = {xn, n ∈ N} et g uneapplication de X(V) dans R, la variable aléatoire g(X) admet une espérance si, et seulementsi, la série de terme général g(xn)P([X = xn]) est absolument convergente, et l’on disposealors de l’égalité

E(g(X)

)=

+∞∑n=0

g(xn)P([X = xn]).

➤ Remarques• Dans le cas d’une variable aléatoire discrète finie, la variable aléatoire g(X) est encore finie donc g(X) existe

toujours, comme l’affirme le théorème 7. Si X(V) est dénombrable, le théorème 8 donne la condition pour queg(X) possède une espérance et l’expression de cette espérance dans le cas où elle est définie.

• Si X(V) = Z, il faut vérifier la convergence des séries de terme général g(n)P([X = n]) et g(−n)P([X = −n]) eten cas de convergence, on a

E(X) =∞∑

n=0

g(n)P([X = n]) ++∞∑n=1

g(−n)P([X = −n]).

254

Page 262: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

Exemples1. Considérons la variable aléatoire réelle discrète X, étudiée à la page 245, telle que

X(V) = Z et

∀k ∈ Z, P([X = k]) =1

2.3|k|·

• Posons Y = 2X : c’est une variable aléatoire réelle discrète.

Les séries de termes généraux2k

2.3k=

12

(23

)k

et2−k

2.3k=

12

(16

)k

convergent absolu-

ment, car23

et16

appartiennent à ] − 1, 1[. Ainsi Y admet une espérance et

E(Y ) =+∞∑k=1

12

(23

)k

++∞∑k=0

12

(16

)k

.

En faisant le changement d’indice j = k − 1 dans la première somme, on obtient

E(Y ) =13

+∞∑j=0

(23

)j

+12

+∞∑k=0

(16

)k

=13

11 − 2

3

+12

11 − 1

6

= 1 +35

=85·

• Posons Z = 4X : Z est une variable aléatoire réelle discrète.

La série de terme général4k

3k+1=

13

(43

)k

diverge car43

> 1. Donc Z n’admet pas

d’espérance.

2. Soit X une variable aléatoire réelle discrète telle que X(V) = N et

∀k ∈ N, P([X = k]) =e−1

k!.

On définit bien ainsi une variable aléatoire discrète car+∞∑k=0

1k!

= e et donc+∞∑k=0

e−1

k!= 1.

Posons Y =1

1 + X; c’est une variable aléatoire réelle discrète. La série de terme général

11 + k

e−1

k!=

e−1

(k + 1)!converge. Donc Y admet une espérance

E(Y ) =+∞∑k=0

e−1

(k + 1)!= e−1

+∞∑k=0

1(k + 1)!

= e−1+∞∑j=1

1j!

= e−1(e − 1) = 1 − e−1.

3.3 Moments d’une variable aléatoire discrète

Définition 9

Soit r un entier naturel. Pour toute variable aléatoire réelle discrète finie X sur l’espaceprobabilisé (V, T , P), telle que X(V) = {x1, . . . , xn}, le moment d’ordre r de la variable

255

Page 263: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

aléatoire X est le réel

mr(X) =n∑

i=1

xriP

([X = xi]

).

➤ RemarqueToute variable aléatoire réelle discrète finie admet un moment d’ordre r pour tout entier naturel r.

Définition 10

Soient r un entier naturel et X une variable aléatoire réelle discrète infinie sur l’espaceprobabilisé (V, T , P), telle que X(V) = {xi, i ∈ N}. Si la série de terme généralxr

i P([X = xi]

)converge absolument, on dit alors que X admet un moment d’ordre

r égal au nombre réel

mr(X) =+∞∑i=0

xriP([X = xi]).

➤ Remarques• La définition dans le cas fini apparaît comme un cas particulier de celle-ci, une somme finie pouvant être

considérée comme la somme d’une série absolument convergente dont une infinité de termes sont nuls.

• Si r est pair, la convergence absolue équivaut à la convergence, car la série de terme général xrnP([X = xn]) est

à termes positifs.

• Le moment d’ordre 0 est égal à 1, celui d’ordre 1 est l’espérance mathématique.

Proposition 14

Soit X une variable aléatoire réelle discrète et r entier naturel. La variable X admet unmoment d’ordre r si, et seulement si, la variable aléatoire réelle discrète Xr admet uneespérance et, dans ce cas, mr(X) = E(Xr).

PreuveCela résulte du théorème 8 (théorème de transfert) appliqué à la fonction g : x −→ xr et dans le cas d’unevariable finie, où mr (X) et E(Xr ) sont toujours définis, du théorème 7. ❑

Proposition 15

Si une variable aléatoire réelle discrète X admet un moment d’ordre r alors, pour toutentier naturel k � r, elle admet un moment d’ordre k.

PreuveSi X est une variable aléatoire réelle discrète finie, elle admet un moment à tout ordre. Considérons donc unevariable aléatoire réelle discrète infinie X, et posons X(V) = {xn, n ∈ N}. Supposons que X admette unmoment d’ordre r et considérons un entier naturel k inférieur ou égal à r.

Pour tout entier n de N, si |xn| � 1, alors |xn|k � 1, et si |xn| > 1, alors |xn|k � |xn|r . Ainsi pour tout entier nde N, |xn|k � 1 + |xn|r , d’où

|xn|k P([X = xn]

)� (1 + |xn|r )P

([X = xn]

).

256

Page 264: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

Les séries∑

P([X = xn]) et∑

|xn|r P([X = xn]) convergent. En effet, la première a pour somme 1 et la

convergence de la seconde équivaut à l’existence de mr (X).

On en déduit la convergence de la série∑

(1 + |xn|r )P([X = xn]) et, par le théorème de comparaison des séries

à termes positifs, celle de la série de terme général |xn|k P([X = xn]

)converge : X admet un moment d’ordre k.

3.4 La variance

Définition 11

Si la variable aléatoire X admet un espérance et si la variable(X − E(X)

)admet une

moment d’ordre 2, on appelle variance de X le réel V (X) définie par

V (X) = m2(X − E(X)) = E((

X − E(X))2

).

➤ Remarques• Toute variable aléatoire réelle discrète finie admet une variance.

• La variance est la moyenne du carré de la distance entre les valeurs de X et la moyenne de X. La variance estdonc une mesure de la dispersion de X par rapport à E(X).

• Comme la variable X − E(X) est centrée, la variance est aussi appelée moment centré d’ordre 2.

Proposition 16 (Formule de Koenig-Huygens)

Soit X une variable aléatoire réelle discrète. La variable X admet une variance si, et seule-ment si, X admet un moment d’ordre 2 et en cas d’existence, on a

V (X) = E(X2) −(E(X)

)2.

Preuve• Si X possède un moment d’ordre 2, elle possède un moment d’ordre 1, c’est-à-dire une espérance, d’après

le théorème 15. Comme(X − E(X))2 = X2 − 2E(X) X + ((E(X))2,

on en déduit par linéarité que (X − E(X))2 possède une espérance. Ainsi V (X) existe et

V (X) = E(X2) − 2E(X)E(X) + E((E(X))2)

= E(X2) − 2(E(X))2 + (E(X))2

= E(X2) − (E(X))2,

puisque E(X) est une variable aléatoire constante dont l’espérance est E(X).

• Réciproquement si V (X) existe, X et (X − E(X))2 ont des espérances. Il en est de même de X2, carX2 = (X − E(X))2 + 2E(X) X − ((E(X))2. La variable X possède donc un moment d’ordre 2. ❑

➤ RemarqueDans la quasi-totalité des cas, on utilise la formule de Kœnig-Huyghens pour calculer une variance et non ladéfinition qui entraîne des calculs compliqués.

257

Page 265: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Exemples

1. Soit X une variable aléatoire telle que X(V) = Z et, P([X = k]) =1

2.3|k|, pour tout

k ∈ Z. Nous avons déjà démontré (page 250) que son espérance est nulle.

La série de terme généralk2

2.3k=

k2

2

(13

)k

converge, car son terme général est équivalent

à12

k(k−1)

(13

)k

=118

k(k−1)

(13

)k−2

qui est dérivée seconde d’une série géométrique

de raison13

. On en déduit que X possède une moment d’ordre 2

E(X2) = 2+∞∑k=1

k2

2

(13

)k

=+∞∑k=1

k2

(13

)k

.

Comme la série de terme général k(k − 1)(

13

)k

converge, on peut écrire (la troisième

série étant convergente car différence des deux premières),

E(X2) =+∞∑k=1

k(k − 1)(

13

)k

++∞∑k=1

k(

13

)k

=19

+∞∑k=1

k(k − 1)

(13

)k−2

+13

+∞∑k=1

k(

13

)k−1

.

On reconnaît dans ces deux séries la dérivée seconde et la dérivée de la série géométrique

de raison13

. On en déduit

E(X2) =19

2(1 − 1

3

)3 +13

1(1 − 1

3

)2 =19

2.278

+13

94

=32·

Comme E(X) = 0, on obtient, d’après la formule de Kœnig-Huyghens,

V (X) = E(X2) =32·

2. Soit X une variable aléatoire réelle discrète telle que X(V) = N∗ et

P([X = k]) =4

k(k + 1)(k + 2)

pour tout entier k strictement positif (une telle variable aléatoire a été étudiée page 246).

La série de terme général kP([X = k]) =4

(k + 1)(k + 2)converge car

4(k + 1)(k + 2)

∼k→+∞

4k2 , terme d’une série convergente, donc X possède une

espérance, mais la série de terme général k2P([X = k]) =4k

(k + 1)(k + 2)diverge car

258

Page 266: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les moments d’une variable aléatoire

4k(k + 1)(k + 2)

∼k→+∞

4k

, terme d’une série divergente, donc X n’admet pas de moment

d’ordre 2 et donc pas de variance.

3. Soit X une variable aléatoire réelle discrète telle que X(V) = N∗ et, pour tout k ∈ N

∗,

P([X = k]) =caka

, où ca est le réel tel que+∞∑k=1

P([X = k]) = 1, c’est-à-dire1ca

=+∞∑k=1

1ka

.

La série de terme généralcakka

converge si, et seulement si, a > 2, condition nécessaire et

suffisante pour que X admette une espérance qui vaut alors

E(X) =+∞∑k=1

caka−1

=ca

ca−1·

Comme la série de terme généralcak2

kaconverge si, et seulement si, a > 3, il en résulte

que X admet un moment d’ordre 2 et donc une variance si, et seulement si, a > 3. Alorson peut écrire

E(X2) =+∞∑k=1

caka−2

=ca

ca−2

et la formule de Kœnig-Huyghens permet de conclure

V (X) = E(X2) −(E(X)

)2 = cac2a−1 − ca−2ca

ca−2c2a−1·

Propriétés de la variance

Proposition 17

Pour toute variable aléatoire réelle discrète X admettant un moment d’ordre 2, ona V (X) � 0.De plus V (X) = 0 si, et seulement si, X est presque sûrement constante, c’est-à-dire si etseulement s’il existe m ∈ R tel que P

([X = m]

)= 1.

PreuveLa variance est positive, car c’est l’espérance de la variable positive (X − E(X))2.

Si V (X) = 0, alors(X − E(X)

)2 est une variable aléatoire réelle discrète positive qui admet une espérancenulle. D’après la proposition 12, on en déduit que (X − E(X))2 est nulle presque sûrement, c’est-à-dire queP([(X − E(X)

)2= 0]) = 1. Comme

[(X − E(X)

)2= 0] = [X − E(X) = 0] = [X = E(X)],

on en déduit P([X = E(X)]) = 1 et donc que X est égale à E(X) presque sûrement.Si réciproquement X = m presque sûrement, alors E(X) = m, la variable

(X − E(X)

)2 est presque sûrement

nulle, donc V (X) = E((

X − E(X))2)

= 0. ❑

259

Page 267: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Proposition 18

Si (a, b) est un couple de réels et X une variable aléatoire réelle discrète admettant unmoment d’ordre 2, alors aX + b admet un moment d’ordre 2 et

V (aX + b) = a2V (X).

PreuveLa variable X admet un moment d’ordre 2 donc une espérance. On en déduit que aX + b admet un espéranceet E(aX + b) = aE(X) + b. On obtient(

aX + b − E(aX + b))2

= a2(X − E(X)

)2.

Comme X admet une variance(X − E(X)

)2 admet une espérance. Par linéarité, il en est de même de(aX + b − E(aX + b)

)2. Ainsi aX + b admet une variance et

V (aX + b) = E(a2(X − E(X))2

)= a2E

((X − E(X))2

)= a2V (X). ❑

3.5 L’écart-type

Définition 12

Si X est variable aléatoire réelle discrète admettant un moment d’ordre deux, l’écart-typede la variable aléatoire réelle discrète X est le réel s(X) =

√V (X).

Définition 13

Soit X variable aléatoire réelle discrète admettant un moment d’ordre 2. Si E(X) = 0 ets(X) = 1, la variable aléatoire X est dite centrée réduite.

Proposition 19

Si X est une variable aléatoire réelle discrète X admettant une variance non nulle, la

variable aléatoire réelle discrète X∗ =X − E(X)

s(X)est une variable aléatoire réelle discrète

centrée réduite, appelée la variable aléatoire réelle centrée réduite associée à X.

PreuveOn écrit X∗ =

1

s(X)X − E(X)

s(X), fonction affine de X.

D’après le corollaire 2 , X∗ possède une espérance et

E(X∗) =E(X)

s(X)− E(X)

s(X)= 0.

D’après la proposition 18, X∗ admet une variance et

V (X∗) =1

s(X)2V (X) = 1.

Par suite X∗ est une variable aléatoire centrée réduite. ❑

260

Page 268: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

4. Les lois usuelles

4.1 Lois finies

Rappelons les lois finies étudiées en première année. Leurs propriétés seront énoncéessans démonstration

Loi uniforme

Définition 14

On dit qu’une variable aléatoire réelle X suit la loi uniforme sur �1, n�, où n est unentier non nul, si X(V) = �1, n� et

∀k ∈ �1, n�, P([X = k]) =1n·

Plus généralement, on dit que la variable aléatoire réelle discrète X suit la loi uniformesur �a, b�, où a et b sont deux entiers tels que a < b, si X(V) = �a, b� et

∀k ∈ �a, b�, P([X = k]) =1

b − a + 1·

La proposition « X suit la loi uniforme sur �a, b� » se note X ↪→ U (�a, b�).

Exemples1. Un dé parfaitement équilibré est lancé. La variable aléatoire X égale au numéro de la face

supérieure suit la loi uniforme sur �1, 6�.

2. Une urne contient n boules numérotée. On en tire une au hasard. La variable X égale aunuméro de la boule tirée suit une loi uniforme sur �1, n�.

Proposition 20

Toute variable aléatoire X qui suit la loi uniforme sur �1, n� admet une espérance et unevariance

E(X) =n + 1

2, V (X) =

n2 − 112

·

Toute variable aléatoire X qui suit la loi uniforme sur �a, b� admet une espérance et unevariance

E(X) =a + b

2, V (X) =

(b − a)(b − a + 2)12

·

Loi de Bernoulli

Définition 15

Soit p ∈ ]0, 1[. On dit qu’une variable aléatoire réelle discrète X suit la loi de Bernoullide paramètre p si X(V) = {0, 1} et P([X = 1]) = p.La proposition « X suit la loi de Bernoulli de paramètre p » se note X ↪→ B(1, p).

261

Page 269: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Exemples1. Toute épreuve à deux issues peut être représentée par une variable de Bernoulli, en notant

1 et 0 les deux résultats possibles (appelés succès et échec).Par exemple la variable aléatoire réelle qui vaut 0 si la pièce tombe sur pile et 1 si la piècetombe sur face, suit la loi de Bernoulli de paramètre p.

2. La variable indicatrice d’un événement A tel que 0 < P(A) < 1 est une variable deBernoulli. Réciproquement, toute variable de Bernoulli est la variable indicatrice de l’évé-nement P([X = 1]).

3. Si X et Y sont deux variables aléatoires de Bernoulli, alors leur produit XY est une variablealéatoire de Bernoulli si XY �= 0.

4. En particulier, si X suit la loi de Bernoulli de paramètre p, il en est de même de X2 carX2 = X.

Proposition 21

Si la variable aléatoire X suit la loi de Bernoulli de paramètre p, X admet une espéranceet une variance, respectivement égales à

E(X) = p et V (X) = p(1 − p).

Loi binomiale

Définition 16

On dit que la variable aléatoire réelle discrète X définie sur l’espace probabilisé (V, T , P)suit la loi binomiale de paramètre (n, p), où n ∈ N∗ et p ∈ ]0, 1[ si X(V) = �0, n� et, pourtout k ∈ �0, n�,

P([X = k]) =(

nk

)pkqn−k,

où q = 1 − p.La proposition « X suit la loi binomiale de paramètre (n, p) » se note X ↪→ B(n, p).

➤ RemarqueUne variable aléatoire qui suit la loi binomiale de paramètre (1, p) est une variable aléatoire de Bernoulli de para-mètre p. Cela justifie la notation B(1, p) pour une variable de Bernoulli.

Exemples1. On considère une succession de n épreuves dont les résultats sont indépendants, chacune

ayant deux issues appelées succès (de probabilité p) et échec (de probabilité q = 1 − p).Alors la variable aléatoire égale au nombre total de succès dans ces n épreuves suit la loibinomiale de paramètre (n, p).

2. Une urne contient des boules blanches en proportion p et des boules noires en proportion1 − p. On fait n tirages avec remise dans l’urne. La variable égale au nombre de boulesblanches obtenues suit une loi binomiale de paramètre (n, p).

262

Page 270: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

3. On lance indépendamment n pièces équilibrées et on considère la variable aléatoire Xégale au nombre de piles apparus.

Dans l’hypothèse d’équiprobabilité, la variable X suit la loi binomiale de paramètre(

n,12

).

Proposition 22

Toute variable aléatoire X de loi binomiale de paramètre (n, p) admet une espérance etune variance,

E(X) = np, V (X) = npq.

Proposition 23

Si la variable aléatoire X suit la loi binomiale de paramètre (n, p), la variable aléatoire n−Xsuit la loi binomiale de paramètres (n, q), où q = 1 − p.

➤ RemarqueSi X représente un nombre de succès parmi n expériences, alors Y = n − X mesure le nombre d’échecs, ce quirend ce résultat évident.

Loi hypergéométrique

Définition 17

Soit n et N des entiers tels que 1 � n � N , p ∈ ]0, 1[ tel que Np soit entier, q = 1 − p.On dit qu’une variable aléatoire réelle discrète X suit la loi hypergéométrique de para-mètre (N, n, p) si X(V) = �max

(0, n − Nq

), min(n, Np)� et

∀k ∈ �max(0, n − Nq

), min(n, Np)�, P

([X = k]

)=

(Npk

)( Nqn−k

)(Nn

)La proposition « X suit la loi hypergéométrique de paramètre (N, n, p) » se noteX ↪→ H(N, n, p)

ExempleUne urne contient a boules blanches et b boules noires. On suppose que n � a + b.

On tire simultanément n boules dans l’urne. Soit X la variable aléatoire égale au nombrede boules blanches obtenues. La variable X suit donc la loi hypergéométrique de paramètre(

a + b, n,a

a + b

Si on tire successivement sans remise n boules dans l’urne, et qu’on note X la variable aléatoireégale au nombre de boules blanches obtenues, la variable X suit encore la loi hypergéométrique

de paramètre(

a + b, n,a

a + b

On retiendra que les tirages simultanés et les tirages successifs sans remise aboutissentà la même loi hypergéométrique.

263

Page 271: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Proposition 24

Toute variable aléatoire X qui suit la loi hypergéométrique de paramètre (N, n, p) admetune espérance et une variance

E(X) = np, V (X) = npqN − nN − 1

·

4.2 Loi géométrique

Situation typeOn considère une urne contenant un nombre fini de boules blanches et de boulesnoires supposées indiscernables au toucher, la proportion des boules blanches dansl’urne étant p et la proportion de boules noires q = 1 − p. On effectue une infinitéde tirages d’une boule dans l’urne, la boule tirée étant remise après chaque tirage. Lestirages sont numérotés dans N

∗.

Soit X l’application qui, à tout élément de l’univers des possibles V, associe le nombrede tirages nécessaires pour obtenir une boule blanche pour la première fois et 0 sitous les tirages donnent une boule noire. On admet que l’univers V peut être munid’une tribu T qui contient pour tout n ∈ N l’événement An : « le n-ième tiragedonne une boule blanche ». On suppose que les résultats des différents tirages sontindépendants et donc que (An) est une suite d’événements indépendants. On a parhypothèse P(An) = p et donc P(An) = 1 − p = q.Pour tout entier k non nul, [X = k] = A1 ∩ A2 ∩ · · · ∩ Ak−1 ∩ Ak ∈ T et

P([X = k)] = P(A1)P(A2) · · · ∩ P(Ak−1)P(Ak) = p qk−1.

On en déduit+∞∑k=1

P([X = k]) = p+∞∑i=0

qi =p

1 − q= 1,

car on reconnaît la somme d’une série géométrique.

Cette somme représente la probabilité de+∞⋃k=1

[X = k] = [X = 0]. Ainsi [X = 0] est

un événement de probabilité nulle. En négligeant cet événement, on peut considérerque X est une variable aléatoire discrète à valeurs dans N∗. La variable X est appeléele temps d’attente de la première boule blanche.On remarque que la variable Y = X − 1 représente le nombre de boules noires tiréesavant d’obtenir la première boule blanche.

Si on appelle succès le tirage d’une boule blanche, X est le temps d’attente dupremier succès et Y le nombre d’échecs avant le premier succès.

Les variables X et Y seront dites suivre une loi géométrique.

264

Page 272: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

Définition 18

Soit p ∈ ]0, 1[.On dit qu’une variable aléatoire réelle discrète X suit la loi géométrique de paramètre p àvaleurs dans N∗ (temps d’attente du premier succès) si X(V) = N∗ et

∀k ∈ N∗, P([X = k]) = p qk−1,

où q = 1 − p.On dit qu’une variable aléatoire réelle discrète Y suit la loi géométrique de paramètre p àvaleurs dans N (nombre d’échecs avant le premier succès) si Y (V) = N et

∀k ∈ N, P([Y = k]) = p qk,

où q = 1 − p.La proposition « X (ou Y ) suit la loi géométrique de paramètre p » se note X ↪→ G(p) (ouY ↪→ G(p)).

Exemples

1. On effectue une infinité de lancers d’une pièce de monnaie pour laquelle la probabilitéd’obtenir pile est p et la probabilité d’obtenir face est q = 1−p. On note X le rang d’appa-rition du premier pile et Y = X − 1. On montre comme précédemment que l’événement« on n’obtient que des faces » est de probabilité nulle et que X suit la loi géométrique deparamètre p à valeurs dans N

∗, Y la loi géométrique à valeurs dans N.

2. Le même raisonnement vaut pour toute répétition d’une épreuve à deux issues (succèset échec) pour laquelle la probabilité de succès est p, les résultats des différentes épreuvesétant indépendants. Le temps d’attente du premier succès et le nombre d’échecs avant lepremier succès suivent des lois géométrique de paramètre p.

Proposition 25

Toute variable aléatoire X (resp. Y ) qui suit la loi géométrique de paramètre p ∈ ]0, 1[ àvaleurs dans N

∗ (resp. N) admet une espérance et une variance, respectivement égales à

E(X) =1p

, V (X) =qp2

et E(Y ) =qp

, V (Y ) =qp2

,

où q = 1 − p.

PreuveLa série de terme général k P([X = k]) = pkqk−1 est une série géométrique dérivée convergente car q ∈ ]0, 1[.Donc X admet une espérance

E(X) = p+∞∑k=0

kqk−1 = p1

(1 − q)2=

1

p,

puisque 1 − q = p.Pour calculer la variance, il est plus simple de déterminer d’abord E

(X(X − 1)

).

265

Page 273: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

La série de terme général k(k − 1)P([X = k]) = k(k − 1)qk−1 = pqk(k − 1)qk−2 est une série dérivée seconded’une série géométrique convergente car q ∈ ]0, 1[. On en déduit que X(X − 1) admet une espérance

E(X(X − 1)

)=

+∞∑k=0

k(k − 1)pqk−1 = pq+∞∑k=2

k(k − 1)qk−2

= pq2

(1 − q)3=

2q

p2·

Comme X2 = X(X − 1) + X, on en déduit que X possède un moment d’ordre 2,

E(X2) = E(X(X − 1)

)+ E(X) =

2q

p2+

1

p

et donc une variance

V (X) = E(X2) −(E(X))2

=2q

p2+

1

p− 1

p2=

2q + p − 1

p2=

q

p2·

Les résultats pour Y résultent de l’égalité Y = X − 1 qui entraîne

E(Y ) = E(X) − 1 =1

p− 1 =

q

pet V (Y ) = V (X).

Proposition 26

Si la variable aléatoire X suit la loi géométrique de paramètre p ∈ ]0, 1[ à valeurs dans N∗,

on a, pour tout entier naturel k,

P([X > k]) = qk.

PreuvePour tout k ∈ N,

P([X > k]) =+∞∑

n=k+1

P([X = n]) =+∞∑n=k

pqn−1.

En posant j = n − k − 1, on obtient

P([X > k]) =+∞∑j=0

pqj+k = pqk+∞∑j=0

qj =pqk

1 − q= qk.

➤ RemarqueCe résultat est tout à fait évident si on se rappelle que X est le temps d’attente du premier succès. L’événement[X > k] est « les k premières épreuves ont été des échecs », de probabilité qk.

Corollaire 3

Si la variable aléatoire X suit la loi géométrique de paramètre p ∈ ]0, 1[ à valeurs dans N∗,

on a, pour tout couple d’entiers naturels (k, �),

P([X > k + �]

)= P

([X > k]

)P([X > �]

).

266

Page 274: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

PreuveCe résultat découle de la proposition précédente. Il s’écrit qk+� = qk q�. ❑

➤ Remarque

Comme [X > k + �] ⊂ [X > k], on a P[X>k]([X > k + �]

)=

P([X > k + �]

)P([X > k]

) · La propriété démontrée dans le

corollaire équivaut donc àP[X>k]([X > k + �]) = P([X > �]).

La probabilité que X prenne une valeur supérieure à k+� sachant qu’elle est supérieure à k, donc qu’elle s’accroisseau moins de � est égale à la probabilité qu’elle prenne une valeur supérieure à �. Si on pense à X comme à unedurée, on peut dire que X ne tient pas compte du passé. On dit que le processus est sans mémoire.

Proposition 27

La fonction de répartition d’une variable X qui suit la loi géométrique de paramètre p àvaleurs dans N

∗ est la fonction

FX :

⎧⎨⎩R −→ [0, 1]

x −→{

0 si x < 11 − qk si k � x < k + 1, k ∈ N∗.

PreuveCela résulte directement de la proposition 7. Pour tout k ∈ N∗ et x ∈ [k, k + 1[,

FX (x) = P([X � k]

)= 1 − P

([X > k]

)= 1 − qk. ❑

0 1 2 3 4 5 6 7 8 9 100

0.2

0.4

0.6

0.8

1.0

x

FX (x)

Figure 8.1 Graphe de FX

Exercice 3. Temps d’attente – Nombre d’échecsSoit r un entier naturel non nul. Une urne contient des boules indiscernables au toucher

blanches et noires, la proportion de boules blanches étant p ∈ ]0, 1[ et celle de boules noiresq = 1 − p. On effectue une infinité de tirages d’une boule dans l’urne, la boule tirée étantremise après chaque tirage. Les tirages sont numérotés dans N

∗.

267

Page 275: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

On définit la variable aléatoire réelle Xr égale au nombre de tirages nécessaires pour obtenir rboules blanches pour la première fois et à 0 si les tirages ne donnent jamais r boules blanches.De même, on définit la variable aléatoire réelle Zr , égale au nombre de boules noires tiréesavant l’obtention des r boules blanches et à −1 si on n’obtient jamais r boules blanches.

1. a. Déterminer la loi de Xr (on dit que Xr suit une loi de Pascal de paramètre (r, p)). Endéduire que

∀r ∈ N∗,

+∞∑k=r−1

(k − 1r − 1

)qk−r =

1pr ·

b. Montrer que Xr admet une espérance et calculer E(Xr).

c. Montrer que Xr admet une variance et calculer V (Xr).

2. a. Trouver une relation liant les variables aléatoires Xr et Zr (on dit que Zr suit une loibinomiale négative de paramètre (r, p)).

b. En déduire la loi de Zr , puis montrer que Zr admet une espérance et une variance quel’on déterminera.

Solution.

1. a. Montrons d’abord que l’événement [Xr = 0] est négligeable. Il est inclus dans l’événe-ment H : « il existe un rang à partir duquel tous les tirages donnent des boules noires ».L’événement H est la réunion lorsque n décrit N

∗ des événements Hn : « tous les tiragesà partir du n-ième donnent des boules noires et le (n−1)-ième tirage donne une bouleblanche si n � 2 ».Pour tout n ∈ N∗ et tout k ∈ N, Hn est inclus dans l’événement Hn,k : « tous les tiragesdu n-ième au (n + k)-ième donnent des boules noires » donc 0 � P(Hn) � P(Hn,k).Comme les résultats des différents tirages sont indépendants, on obtient P(Hn,k) = qk+1

et limk→+∞

P(Hn,k) = limk→+∞

qk = 0. Par passage à la limite dans les inégalités précédentes,

on en déduit P(Hn) = 0.Les événements Hn étant incompatibles, on obtient

P(H) =+∞∑n=1

P(Hn,k) = 0.

On a donc P([Xr = 0]) = 0 : l’événement [Xr = 0] est négligeable. On peut doncconsidérer que Xr(V) = �r, +∞�.Soit k ∈ Xr(V). L’événement [Xr = k] est l’intersection des événements A : « le k-ièmetirage a donné une boule blanche » et B : « r − 1 boules blanches ont été tirées lors desk − 1 tirages précédents. ».On a P(A) = p et P(B) =

(k−1r−1

)pr−1q(k−1)−(r−1), car il s’agit de la possibilité d’obtenir

(r −1) succès en (k−1) essais indépendants et le nombre de succès suit la loi binomialede paramètre (k − 1, p). Comme les tirages se font avec remise, les événements A et Bsont indépendants. On obtient donc

P([Xr = k]) = P(A)P(B) = p(

k − 1r − 1

)pr−1qk−r =

(k − 1r − 1

)prqk−r .

268

Page 276: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

Comme ([Xr = k])k�r est le système complet d’événements associé à la variable aléa-toire Xr , on a

+∞∑k=r

(k − 1r − 1

)prqk−r =

+∞∑k=r

P([Xr = k]) = 1.

On en déduit que, pour tout r ∈ N∗,

+∞∑k=r

(k − 1r − 1

)qk−r =

1pr·

b. On a, pour k � r l’égalité k(

k − 1r − 1

)= r

(kr

)et donc

k P([Xr = k]) = rpr

(kr

)qk−r .

L’égalité démontrée dans la question précédente donne, si on remplace r par r + 1,

+∞∑k=r+1

(k − 1

r

)qk−r−1 =

1pr+1

et avec le changement d’indice j = k − 1,

+∞∑j=r

(jr

)qj−r =

1pr+1

·

Ainsi, la série de terme général

(jr

)qj−r (j � r) converge. Il en est de même de la série

de terme général j P([Xr = j]), car rpr est une constante. Donc Xr admet une espéranceet

E(Xr) = rpr+∞∑j=r

(jr

)qj−r = rpr 1

pr+1 =rp·

c. On a, pour k � r, l’égalité (k + 1)k(

k − 1r − 1

)= r(r + 1)

(k + 1r + 1

)et donc

(k + 1)k P([Xr = k]) = (r + 1)rpr

(k + 1r + 1

)qk−r .

L’égalité démontrée dans la première question appliquée à r + 2 donne, avec le chan-gement de variable j = k − 2,

+∞∑k=r+2

(k − 1

r

)qk−r−2 =

+∞∑j=r

(j + 1

r

)qj−r =

1pr+2

·

269

Page 277: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

La série de terme général(

j + 1r

)qj−r (j � r) converge, donc il en est de même de

la série de terme général (j + 1)jP([Xr = j]). Ainsi, d’après le théorème de transfert, lavariable (Xr + 1)Xr possède une espérance et

E(Xr(Xr + 1)

)= (r + 1)rpr

+∞∑j=r

(j + 1r + 1

)qj−r

= (r + 1)rpr 1pr+2 =

(r + 1)rp2 ·

On en déduit que X2r = (Xr + 1)Xr − Xr possède une espérance. Ainsi Xr possède un

moment d’ordre 2 donc une variance et

V (Xr) = E(X2r ) − E(Xr)2 = E

(Xr(Xr + 1)

)− E(Xr) − E(Xr)2

=(r + 1)r

p2− r

p− r2

p2=

rqp2·

➤ RemarquePour r = 1, Xr représente le temps d’attente du premier succès et suit donc une loi géométrique à valeurs dansN∗. On retrouve alors l’espérance et la variance d’une variable aléatoire suivant une loi géométrique.

2. a. On a Xr = Zr + r.

b. L’événement [Zr = −1] qui est égal à [Xr = 0] est négligeable. On en déduit l’on peutconsidérer que Zr(V) = N. Pour tout k ∈ N,

P([Zr = k]) = P([Xr = k + r]) =(

k + r − 1r − 1

)prqk.

Comme Xr admet une espérance et une variance, il en est de même de Zr et

E(Zr) = E(Xr) − r =rqp

, V (Zr) = V (Xr) =rqp2 ·

➤ RemarquePour r = 1, Zr le nombre d’échecs avant le premier succès et suit donc une loi géométrique à valeurs dans N. Onretrouve alors l’espérance et la variance d’une variable aléatoire suivant une loi géométrique.

4.3 Loi de Poisson

Situation typeIl n’est pas possible de donner un modèle simple pour la loi de Poisson. Celle-ciapparaît comme une loi limite. Nous verrons dans le chapitre 12 (Convergences etapproximations) page 401 que si la variable aléatoire X suit un loi binomiale avec ngrand et p proche de 0, elle suit approximativement une loi de Poisson de paramètrel = np. On dit encore que la loi de Poisson est la loi des événements « rares ».

Dans la pratique, on peut décrire par une loi de Poisson le nombre d’événements d’uncertain type se produisant dans une période de temps donnée, par exemple

270

Page 278: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

• le nombre de clients se présentant dans un magasin pendant une période T ;

• le nombre de véhicules franchissant un poste de péage pendant une période T ;

• le nombre d’appels reçus par un standard téléphonique pendant une période T .

Définition 19

On dit qu’une variable aléatoire réelle discrète X suit la loi de Poisson de paramètrel, où l > 0, si X(V) = N et

∀k ∈ N, P([X = k]) =lk

k!e−l.

La proposition « X suit la loi de Poisson de paramètre l » se note X ↪→ P(l).

➤ RemarqueOn définit bien ainsi la loi d’une variable aléatoire discrète car

+∞∑k=0

lk

k!e−l = e−l

+∞∑k=0

lk

k!= e−lel = 1.

Proposition 28

Toute variable aléatoire X qui suit la loi de Poisson de paramètre l admet une espéranceet une variance, respectivement égales à

E(X) = l, V (X) = l.

PreuveLa série de terme général kP([X = k]) = le−l

lk−1

(k − 1)!(k � 1) est une série exponentielle. Elle est donc

convergente. Ainsi X admet une espérance

E(X) =+∞∑k=1

kP([X = k]) = le−l+∞∑k=1

lk−1

(k − 1)!= le−l

+∞∑j=0

lj

j!= le−lel = l.

Comme pour k � 2, k(k − 1)P([X = k]) = l2e−llk−2

(k − 2)!, terme général d’une série exponentielle, la série

de terme général k(k − 1)P([X = k]) converge donc, d’après le théorème de transfert, X(X − 1) admet uneespérance

E(X(X − 1)

)=

+∞∑k=2

k(k − 1)P([X = k]) = l2e−l+∞∑k=2

lk−2

(k − 2)!

= l2e−l+∞∑j=0

lj

j!= l2e−lel = l2.

On en déduit que X2 = X(X − 1) + X admet une espérance et donc que X admet une variance. On obtient

V (X) = E(X(X − 1)) + E(X) −(E(X))2

= l2 + l − l2 = l.❑

271

Page 279: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

Proposition 29

La fonction de répartition d’une variable X qui suit la loi de Poisson de paramètre l est lafonction

FX :

⎧⎪⎪⎪⎨⎪⎪⎪⎩R −→ [0, 1]

x −→

⎧⎪⎨⎪⎩0 si x < 0

k∑i=0

li

i!e−l si k � x < k + 1, k ∈ N.

PreuveCela résulte directement de la proposition 7. ❑

0 1 2 3 4 5 6 7 8 9 10 11 120

0.2

0.4

0.6

0.8

1.0

x

FX (x)

Figure 8.2 Graphe de FX avec l = 3, 5

0 1 2 3 4 5 6 7 8 9 10 11 120

0.2

0.4

0.6

0.8

1.0

x

FX (x)

Figure 8.3 Graphe de FX avec l = 8

272

Page 280: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

4.4 Tableau récapitulatif des lois discrètes classiques

NomEnsemble

des valeursLoi Espérance Variance

loi uniforme

X ↪→ U (�1, n�)�1, n� P

([X = k]

)=

1n

n + 12

n2 − 112

loi de Bernoulli

X ↪→ B(1, p){0, 1} P

([X = 1]

)= p

P([X = 0]

)= q

p pq

loi binomiale

X ↪→ B(n, p)�0, n� P

([X = k]

)=

(nk

)pkqn−k np npq

loi géométrique

X ↪→ G(p)N∗ P

([X = k]

)= pqk−1 1

pqp2

loi hypergéométrique

X ↪→ H(N, n, p)

inclus dans

�0, n�P([X = k]

)=

(Npk

)( Nqn−k

)(Nn

) np npqN − nN − 1

loi de Poisson

X ↪→ P(l)N P

([X = k]

)= e−l lk

k!l l

273

Page 281: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Soit n un entier supérieur ou égal à 2. Une urne contient une boule noire et (n − 1)boules blanches. On vide l’urne en effectuant des tirages d’une boule de la manière suivante :les tirages d’ordre impair s’effectuent sans remise et les tirages d’ordre pair s’effectuent avecremise de la boule tirée.

1. Quel est le nombre total N de tirages effectués lors de cette épreuve ?

2. On désigne par Xk la variable aléatoire qui vaut 1 si la boule noire est obtenue au k-ièmetirage et 0 sinon et par X la variable aléatoire égale au nombre d’apparitions de la boulenoire lors de cette épreuve.a. Déterminer la loi de Xk pour tout k ∈ [[1, 2n − 1]] (distinguer selon la parité de k).

b. En déduire l’espérance de X.

3. On note Y la variable aléatoire égale au rang où la boule noire est tirée pour la premièrefois.a. Déterminer la loi de Y et son espérance.

b. Exprimer l’événement [X = 1] en fonction des événements [Y = 2j − 1] (j ∈ [[1, n]]).En déduire la valeur de P([X = 1]).

4. Calculer P([X = n]).

2. Soit N un entier naturel non nul. On dispose d’un sac contenant N jetons numérotésde 1 à N dans lequel on peut effectuer une succession de tirages avec remise d’un jeton ennotant, à chaque fois, le numéro obtenu.

Pour tout entier naturel n non nul, on note Tn le nombre de numéros distincts obtenus aucours des n premiers tirages.

1. Soit n un entier naturel non nul.a. Quelles sont les valeurs prises par Tn ?

b. Calculer P([Tn = 1]) et P([Tn = n]).

c. Déterminer P([Tn = 2]).

2. Soit (k, n) un couple d’entiers naturels non nuls avec 1 � k � N .Déterminer une relation entre P([Tn+1 = k]), P([Tn = k]) et P([Tn = k − 1]).

3. Pour tout entier naturel n non nul, on considère le polynôme

Gn =N∑

k=1

P([Tn = k])Xk.

a. Prouver l’égalité

Gn+1 =1N

(X − X2)G′n + XGn.

b. Pour tout entier naturel n non nul, en reliant l’espérance E(Tn) à Gn, exprimer E(Tn+1)à l’aide de E(Tn), N et n, puis déterminer E(Tn) en fonction de N et n.

c. Déterminer limN→∞

E(TN )N

·

3. Soit X une variable aléatoire telle que X(V) ⊂ N.

1. Montrer que pour tout n ∈ N∗,n∑

k=1

kP([X = k]) =n−1∑k=0

P([X > k]) − nP([X > n]).

274

Page 282: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

2. a. On suppose que X admet une espérance, prouver que l’on a

limn→+∞

nP([X > n]) = 0.

En déduire la formule

E(X) =+∞∑k=0

P([X > k]).

b. Réciproquement, montrer que si la série de terme général P([X > k]) est convergente,alors X admet une espérance donnée par la formule précédente.

3. Retrouver ainsi l’espérance d’une variable aléatoire suivant la loi géométrique de para-mètre p.

4. Soit X une variable aléatoire définie sur (V, T , P) telle que X(V) ⊂ N et Y lavariable aléatoire définie sur (V, T , P) par

Y (v) = 0 si X(v) est impair ; Y (v) =X(v)

2si X(v) est pair.

Trouver la loi de Y et son espérance lorsque X suit une loi géométrique, puis lorsque X suitune loi de Poisson.

5. Le nombre de visiteurs quotidiens d’un parc d’attractions suit une loi de Poisson deparamètre 10000.Ce parc a dix portes d’entrées E1, E2, · · · , E10 qui sont choisies par les visiteurs de manièreéquiprobable.

1. Déterminer le nombre moyen de visiteurs en une journée.

2. Quelle est la probabilité qu’un visiteur donné se présente à l’entrée E1 ?

3. On désigne par X1 le nombre de visiteurs entrant par E1 en une journée donnée.Trouver la loi de X1, calculer son espérance et sa variance.

4. Sachant qu’un visiteur sur dix se débrouille pour entrer sans payer, calculer le nombremoyen de visiteurs payant et entrant par E1.

6. Soit f la fonction définie sur R+ par

f (0) = 0 et f (x) = −x ln x si x > 0.

Soit (V, T , P) un espace probabilisé et X une variable aléatoire sur V à valeurs dans unensemble fini E. On note N le nombre d’éléments de E. On appelle entropie de X le réelnoté H(X) défini par

H(X) =∑x∈E

f (P([X = x])).

1. a. Quelle est le signe de H(X) ?

b. Calculer H(X) lorsque X est constante.

275

Page 283: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

c. Calculer H(X) lorsque X suit une loi uniforme, c’est-à-dire lorsque, pour tout x ∈ E,

P([X = x]) =1N

.

2. a. Montrer que, pour x � 0, on a f (x) � 1 − x. Dans quel cas a-t-on égalité ?

b. En déduire que∑x∈E

f (NP([X = x])) � 0.

c. En déduire une majoration de H(X).

3. a. Pour quelles variables aléatoires X l’entropie H(X) est-elle minimale ?

b. Pour quelles variables aléatoires X l’entropie H(X) est-elle maximale ?

7. Soit A et B deux boîtes contenant respectivement deux jetons marqués 0 et deuxjetons marqués 1. On extrait au hasard un jeton de A et un jeton de B et on les échange. Onrépète cette opération. Pour n ∈ N∗, on note Xn la somme des numéros contenus dans Aaprès n échanges.

1. Déterminer la loi de X1.

2. Pour n ∈ N∗, déterminer Xn+1(V) et calculer, pour k ∈ Xn+1(V), P([Xn+1 = k]) en fonction

de P([Xn = 1]).

3. Calculer, pour tout n ∈ N∗, P([Xn = 1]). En déduire la loi de Xn.

4. Montrer que, pour tout n ∈ N∗, E(Xn) = 1.

8. Une urne contient n jetons numérotées de 1 à n. On effectue une suite de tirages,en tirant à chaque fois un jeton que l’on remet avant le tirage suivant. Tous les tirages sontsupposés équiprobables et indépendants.On note Bj,m l’événement : « au bout de m tirages, le numéro j n’est pas encore apparu ».

1. Calculer P(Bj,m) et, plus généralement P(Bj1,m ∩ Bj2,m ∩ · · · ∩ Bjk,m), où j1, j2, . . . , jk sont kindices distincts compris entre 1 et n.

2. Soit X la variable aléatoire égale au nombre de tirages nécessaires pour obtenir tous lesnuméros au moins une fois.a. Montrer que [X > m] = B1,m ∪ B2,m ∪ · · · ∪ Bn,m.

b. En appliquant la formule du crible, montrer que

P([X > m]) =n∑

k=1

(−1)k−1

(nk

)(n − k

n

)m

.

Calculer limm→+∞

P([X > m]). Interpréter.

c. En utilisant le résultat de l’exercice 3., montrer que X admet une espérance et que

E(X) = nn∑

k=1

(−1)k−1

(nk

)k·

d. Montrer que E(X) = n(

1 +12

+ · · · +1n

). En déduire un équivalent de E(X) lorsque

n tend vers +∞.

276

Page 284: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

9. Soit X un variable aléatoire discrète définie sur un espace probabilisé (V, T , P). Onappelle mode de X toute valeur de X(V) tel que P([X = x]) soit maximal.Déterminer les modes d’une variable suivant1. une loi binomiale de paramètre (n, p),2. une loi de Poisson de paramètre l.

10. 1. Soit (un)n�0 une suite à valeurs dans l’intervalle [0, 1[. Pour tout n ∈ N, on pose

qn =n∏

k=0

(1 − uk) = (1 − u0)(1 − u1) · · · (1 − un).

On dira que le produit∏

(1 − uk) est convergent si la suite (qn) admet une limite � > 0.

On notera alors � =+∞∏k=0

(1 − uk).

a. Étudier la convergence et calculer éventuellement la limite des produits suivants

qn =n∏

k=0

(1 − 1

k + 2

), qn =

n∏k=0

(1 − 1

(k + 2)2)·

b. On revient maintenant au cas général. Montrer que le produit∏

(1− uk) converge si etseulement si la série

∑uk converge.

2. Soit X une variable aléatoire à valeurs dans N telle que pour tout n ∈ N, on aitP([X � n]) > 0.On appelle taux de panne associé, la suite réelle (xn) définie pour tout n ∈ N par

xn = P([X = n]/[X � n]).

a. Exprimer P([X � n]) puis pn = P([X = n]) en fonction des xk.

b. Déterminer les lois des variables aléatoires à valeurs dans N∗ ayant un taux de panneconstant sur N∗.

c. Montrer qu’une suite (xk)k�0 est un taux de panne si et seulement si 0 � xk < 1, pourtout k ∈ N et la série

∑xk diverge.

11. On considère une suite d’épreuves de Bernoulli indépendantes. À chaque épreuve,la probabilité de succès est p ∈ ]0, 1[ . On se donne un entier r strictement positif. Pourn ∈ N

∗, on note Pn la probabilité qu’au cours des n premières épreuves, on ait obtenu aumoins r succès consécutifs.

1. a. Calculer P0, P1, . . . , Pr .

b. Montrer que, pour n � r, on a Pn+1 = Pn + (1 − Pn−r)pr(1 − p).

c. Montrer que la suite (Pn)n∈N est convergente. Calculer sa limite

2. a. Déduire de la question 1 que l’on peut définir une variable aléatoire T égale au tempsd’attente de r succès consécutifs. On définira [T = k] comme l’événement « on a obtenudes succès aux épreuves de rang k − r + 1, k − r + 2, . . . , k sans jamais avoir obtenu rsuccès consécutifs auparavant ».

b. Montrer en utilisant le résultat de l’exercice 3. que E(T ) =1 − pr

(1 − p)pr·

277

Page 285: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires réelles discrètes

12. Fonction génératriceSoit X une variable aléatoire à valeurs dans N. On pose, pour tout n ∈ N, pn = P([X = n]).

On appelle fonction génératrice de X la fonction gX : t −→+∞∑n=0

pntn.

1. Montrer que l’ensemble de définition de gX contient toujours [−1, 1]. Calculer gX (1). SiX est une variable finie, quel est l’ensemble de définition de gX ?

2. On veut démontrer que

X possède une espérance ⇐⇒ g est dérivable à gauche en 1

et qu’alors E(X) = g′(1).

a. Montrer que, pour tout t ∈ [0, 1[, on agX (t) − gX (1)

t − 1=

+∞∑n=1

(1 + t + · · · + tn−1)pn. En

déduire que la fonction t −→ gX (t) − gX (1)t − 1

est croissante sur [0, 1[.

b. On suppose que X possède une espérance. Montrer que, pour tout t ∈ [0, 1[,gX (t) − gX (1)

t − 1� E(X).

En déduire que gX est dérivable à gauche en 1 et que g′X (1) � E(X).

c. Réciproquement, on suppose que gX est dérivable à gauche en 1. Montrer que,

pour n ∈ N∗,n∑

k=1

kpk � g′X (1). En déduire que X possède une espérance et que

E(X) � g′X (1). Conclure.

3. Déterminer gX dans les cas suivants : X ↪→ B(n, p) ; X ↪→ G(p) ; X ↪→ P(l). Retrouverainsi l’espérance de ces variables.

13. Question préliminaire. Soit X variable aléatoire discrète, positive, possédant uneespérance. Montrer que, pour l > 0,

P([X � l]) � E(X)l

·Soit Sn une variable aléatoire. qui suit une loi binomiale de paramètre (n, p) et x > 0.

1. Montrer que, pour l > 0, on a P([Sn − np � nx]) � E(el(Sn−np))enlx

·

2. Montrer que E(el(Sn−np)) = (pelq + qe−lp)n.

3. En utilisant l’inégalité et � t + et2 , pour tout réel t (à démontrer), montrer que

P([Sn − np � nx]) � en(l2−lx).

4. En prenant la valeur de l qui minimise le côté droit de l’inégalité, montrer que

P([Sn − np � nx]) � e−nx2

4 .

5. On peut démontrer de la même façon que P([Sn − np � −nx]) � e−nx2

4 . En déduirel’inégalité de Bernstein

P([∣∣∣∣Sn

n− p

∣∣∣∣ � x])

� 2e−nx2

4 ·

278

Page 286: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

9Couples de variablesaléatoires réelles discrètes

Dans ce chapitre, nous généralisons les définitions données en première année au casde variables aléatoires discrètes quelconques.

1. Lois associées à un couple de variables aléatoires discrètes

1.1 Définitions

Définition 1

Soit (V, T ) un espace probabilisable. On appelle couple de variables aléatoires dis-crètes toute application

Z :{

V −→ R2

v −→(X(v), Y (v)

),

où X et Y sont des variables aléatoires discrètes sur (V, T ).On note Z = (X, Y ) ce couple de variables.

➤ Remarques• Si V est fini, un couple de variables discrètes est tout simplement une application de V dans R2.

• L’image (X, Y )(V) est la partie du produit cartésien X(V) × Y (V) formée des couples(X(v), Y (v)

)où v décrit

V. En général (X, Y )(V) est inclus strictement dans X(V) × Y (V).

ExempleOn lance une infinité de fois une pièce de monnaie. On note X le rang d’apparition dupremier pile et Y le rang d’apparition du second pile. Alors (X, Y ) est un couple de variablesaléatoires discrètes.

Page 287: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Proposition 1

Soit (X, Y ) un couple de variables aléatoires réelles discrètes. On note X(V) = {xi, i ∈ I}et Y (V) = {yj, j ∈ J}, où I et J sont des parties de N. Alors la famille d’événements(

[X = xi] ∩ [Y = yj])

(i,j)∈I×J

est un système complet d’événements de (V, T ) appelé système complet d’événementsassocié au couple (X, Y ).

PreuveComme X et Y sont des variables aléatoires réelles, [X = xi ] et [X = yj ] sont des éléments de T , et leurintersection [X = xi ] ∩ [X = yj ] est un élément de T .

Si (i, j) et (i′, j′) sont des éléments distincts de I × J, on a soit i = i′, xi = x′i et [X = xi ] ∩ [X = x′i ] = ∅, soitj = j′, yj = y′j et [Y = yj ]∩ [Y = y′j ] = ∅. On en déduit que

([X = xi ]∩ [Y = yj ]

)∩([X = x′i ]∩ [Y = y′j ]

)= ∅.

Enfin ⋃(i,j)∈I×J

[X = xi ] ∩ [Y = yj ] = V

car, pour tout v ∈ V, si X(v) = xi et Y (v) = yj , v appartient à [X = xi ] ∩ [Y = yj ]. ❑

➤ RemarquePour l’événement [X = xi ] ∩ [Y = yj ], on trouve aussi les notations [X = xi , Y = yj ] ou [(X, Y ) = (xi, yj )]. Quelleque soit la notation adoptée, cet événement est

{v ∈ V, X(v) = xi et Y (v) = yj}.

1.2 Loi conjointe

Définition 2

Soit (X, Y ) un couple de variables aléatoires réelles discrètes dans l’espace probabilisé(V, T , P). L’application

P(X,Y ) :{

X(V) × Y (V) −→ [0, 1](x, y) −→ P([X = x] ∩ [Y = y])

est appelée loi du couple (X, Y ) ou loi conjointe des variables aléatoires X et Y .

➤ Remarques• Si X(V) = {xi, i ∈ I} et Y (V) = {yj , j ∈ J}, où I et J sont des parties de N, il s’agit donc de déterminer la

famille (pi,j )(i,j)∈I×J , où pi,j = P([X = xi ] ∩ [Y = yj ]

).

• Si les variables X et Y sont finies, il existe des entiers naturels non nuls n et m tels que X(V) = {x1, . . . , xn}et Y (V) = {y1, . . . , ym}. La loi peut être représentée par un tableau à double entrée, les lignes correspon-dant aux valeurs de X(V) et les colonnes à celles de Y (V) : sur la i-ième ligne et la j-ième colonne, on placeP([X = xi ] ∩ [Y = yj ]

).

ExempleDans une succession de pile ou face pour laquelle la probabilité d’obtenir pile est p ∈ ]0, 1[ et laprobabilité d’obtenir face q = 1−p, on note X le rang d’apparition du premier pile et Y le rangd’apparition du second pile. On a X(V) = N

∗ et Y (V) = [[2, +∞[[. Soit (n, k) ∈ X(V)×Y (V).

280

Page 288: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires discrètes

• Si n � k, on a par définition de X et Y , P([X = n] ∩ [Y = k]) = 0.

• Si n < k, l’événement [X = n]∩ [Y = k] est réalisé si on obtient pile aux n-ième et k-ièmelancers, les tirages entre le premier et le k-ième différents de ces deux-là donnant face. Lesrésultats des différents lancers étant indépendants, on obtient

P([X = n] ∩ [Y = k]) = p2qk−2.

Proposition 2

Soit (X, Y ) un couple de variables aléatoires réelles discrètes de l’espace probabilisé(V, T , P).

• Si X et Y sont finies, avec X(V) = {x1, . . . , xm} et Y (V) = {y1, . . . , yn}, on a alors

m∑i=1

⎛⎝ n∑j=1

P([X = xi] ∩ [Y = yj])

⎞⎠ =n∑

j=1

(m∑

i=1

P([X = xi] ∩ [Y = yj])

)= 1.

• De même si X(V) = {xi, i ∈ N} et Y (V) = {yj, j ∈ N}, on a

+∞∑i=0

⎛⎝+∞∑j=0

P([X = xi] ∩ [Y = yj])

⎞⎠ =+∞∑j=0

(+∞∑i=0

P([X = xi] ∩ [Y = yj])

)= 1.

PreuveCela résulte du fait que, si X(V) = {xi , i ∈ I} et Y (V) = {yj, j ∈ J}, où I et J sont des parties de N, alors([X = xi ] ∩ [Y = yj ]

)(i,j)∈I×J

est un système complet d’événements. ❑

Illustrons cette proposition avec l’exemple de loi conjointe étudiée page 280.

ExempleOn a

+∞∑n=1

+∞∑k=2

P([X = n] ∩ [Y = k]) =+∞∑n=1

+∞∑k=n+1

p2qk−2.

En faisant le changement de variable j = k − n − 1, on obtient, pour tout k ∈ N∗,

+∞∑k=n+1

p2qk−2 =+∞∑j=0

p2qj+n−1 = p2qn−1+∞∑j=0

qj = p2qn−1 11 − q

= pqn−1.

On en déduit

+∞∑n=1

+∞∑k=2

P([X = n] ∩ [Y = k]) = p+∞∑n=1

qn−1 =p

1 − q= 1.

281

Page 289: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

1.3 Lois marginales

Définition 3

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes de l’espace probabilisé(V, T , P), la loi de X est appelée première loi marginale du couple et celle de Y estappelée deuxième loi marginale du couple.

Le théorème suivant exprime le fait que l’on peut déduire les loi marginales de la loidu couple.

Théorème 1

Soit (X, Y ) un couple de variables aléatoires réelles discrètes. On pose X(V)={xi, i ∈ I} etY (V) = {yj, j ∈ J}, où I et J sont des parties de N. On dispose alors des égalités suivantes

∀i ∈ I, P([X = xi]) =∑j∈I

P([X = xi] ∩ [Y = yj]),

∀j ∈ J, P([Y = yj]) =∑i∈J

P([X = xi] ∩ [Y = yj]).

PreuveLa première propriété résulte de ce que ([Y = yj ])j∈J est un système complet d’événements et la seconde de ceque([X = xi

)i∈I

est un système complet d’événements (on applique la proposition 5 du chapitre 7). ❑

➤ Remarques• Les sommes considérées sont finies ou infinies.

Si Y est finie, on pose Y (V) = {y1, . . . , ym} et on obtient

∀i ∈ I, P([X = xi ]) =m∑

j=1

P([X = xi ] ∩ [Y = yj ]).

Si Y est discrète infinie, on prend I = N (ou N∗) et on obtient

∀i ∈ I, P([X = xi ]) =+∞∑j=0

P([X = xi ] ∩ [Y = yj ]).

On peut faire la même remarque pour la seconde loi marginale.

• Si la loi conjointe est représentée sous la forme d’un tableau, pour obtenir la probabilité P([X = xi ]) il suffitde faire la somme des termes de la i-ième ligne ; pour obtenir P([Y = yj ]), on fait la somme des termes d’unecolonne.

Déterminons les lois marginales du couple dont on a déterminé les lois conjointespage 280.ExempleSi X et Y représentent le rang d’apparition du premier et du deuxième pile dans une suiteinfinie de lancers d’une pièce, on a obtenu, pour n ∈ N∗ et k � 2,

P([X = n] ∩ [Y = k]

)=

{p2qk−2 si n < k0 si n � k.

282

Page 290: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires discrètes

On obtient, pour tout n ∈ N∗,

P([X = n]) =+∞∑

k=n+1

P([X = n] ∩ [Y = k]

)=

+∞∑k=n+1

p2qk−2

=+∞∑j=0

p2qn+j−1 = p2qn−1 11 − q

= pqn−1

et, pour tout entier k � 2,

P([Y = k]) =k−1∑n=1

P([X = n] ∩ [Y = k]

)=

k−1∑n=1

p2qk−2 = (k − 1)p2qk−2.

On constate sans surprise que la variable X suit une loi géométrique de paramètre p (tempsd’attente d’un premier succès). La variable Y , temps d’attente du deuxième succès suit la loide Pascal de paramètre (2, p) étudiée en exercice page 267.

Exercice 1.Soit (X, Y ) un couple de variables aléatoires réelles discrètes à valeurs dans N2 de loi conjointe

∀(i, j) ∈ N2, P

([X = i] ∩ [Y = j]

)=

(i + j)ai+j

e.i!j!·

1. Déterminer le réel a.

2. Déterminer les lois marginales.

Solution.

1. Comme une probabilité est une fonction positive, a est nécessairement positif. On doitavoir

+∞∑i=0

+∞∑j=0

P([X = i] ∩ [Y = j]

)= 1.

Le calcul donne+∞∑j=0

P([X = i] ∩ [Y = j]

)=

+∞∑j=0

(i + j)ai+j

e.i!j!=

1e

ai

i!

⎛⎝i+∞∑j=0

aj

j!+

+∞∑j=1

aj

(j − 1)!

⎞⎠=

1e

ai

i!

(iea +

+∞∑k=0

ak+1

k!

)=

1e

ai

i!(iea + a ea).

On en déduit que+∞∑i=0

+∞∑j=0

P([X = i] ∩ [Y = j]

)=

ea

e

+∞∑i=0

(iai

i!+

a ai

i!

)

= ea−1

(+∞∑i=1

ai

(i − 1)!+ a

+∞∑i=0

ai

i!

)

= ea−1

(+∞∑k=0

ak+1

k!+ aea

)= ea−1 · 2aea = 2ae2a−1.

283

Page 291: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

On cherche a tel que 2ae2a−1 = 1. La fonction f : x −→ 2xe2x−1 est dérivable sur R+

de dérivée x −→ 2(1 + 2x)e2x−1 strictement positive. Elle est donc strictement croissante.

Elle prend au plus une fois la valeur 1. Comme on remarque que f(

12

)= 1, il en résulte

l’égalité a =12·

2. Le calcul effectué dans la première question montre que, pour tout i ∈ N,

P([X = i]

)=

+∞∑j=0

P([X = i] ∩ [Y = j]

)=

1e

ai

i!(iea + a ea) =

2i + 12i+1i!

e−12 ,

puisque a =12· Par symétrie, la loi de Y est la même que celle de X.

➤ RemarqueLa connaissance des lois marginales ne suffit pas à reconstituer la loi conjointe d’un couple de variables aléatoires.

1.4 Lois conditionnelles

Définition 4

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes et tout y de Y (V) tel queP([Y = y]) �= 0, l’application⎧⎨⎩ X(V) −→ R

x −→ P([X = x] ∩ [Y = y])P([Y = y])

= P[Y=y]([X = x])

est appelée la loi conditionnelle à [Y = y] de X,et pour tout x de X(V) tel que P([X = x]) �= 0, l’application⎧⎨⎩ Y (V) −→ R

y −→ P([X = x] ∩ [Y = y])P([X = x])

= P[X=x]([Y = y])

est appelée la loi conditionnelle à [X = x] de Y .

➤ Remarques• La première loi conditionnelle est la loi de la variable X dans l’espace probabilisable (V,T , P[Y=y]), où P[Y=y] est

la probabilité conditionnelle à l’événement [Y = y]. Avec les notations du chapitre 8, on la noterait(P[Y=y]

)X.

De même la seconde est la loi de Y dans l’espace probabilisé (V,T , P[X=x]).

• Au lieu de loi conditionnelle à [Y = y], on dit aussi loi sachant [Y = y].

Reprenons l’exemple de la page 282.

284

Page 292: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires discrètes

ExempleSi X et Y représentent le rang d’apparition du premier et du deuxième pile dans une suiteinfinie de lancers d’une pièce, on a obtenu, pour n ∈ N∗ et k � 2,

P([X = n] ∩ [Y = k]) =

{p2qk−2 si n < k0 si n � k.

P([X = n]) = pqn−1 et P([Y = k]) = (k − 1)p2qk−2.

On en déduit que, pour tout k � 2,

P[Y=k]([X = n]) =

⎧⎨⎩p2qk−2

(k − 1)p2qk−2=

1k − 1

si n � k − 1

0 si n � k.

La loi de X conditionnelle à [Y = k] est la loi uniforme sur �1, k − 1�. Cela peut s’expliquerainsi : une fois [Y = k] réalisé, il y a dans les k−1 premiers lancers exactement un pile (puisqueY est le deuxième pile). La probabilité d’obtenir pile étant la même à tous les lancers, il estréparti de manière équiprobable sur �1, k − 1�.Pour tout n � 1, on a

P[X=n]([Y = k]) =

⎧⎨⎩p2qk−2

pqn−1= pqk−n−1 si k � n + 1

0 si k � n.On remarque que, pour j ∈ N

∗,

P[X=n]([Y − n = j]) = P[X=n]([Y = n + j]) = pqj−1.

La loi de Y − n conditionnelle à [X = n] est donc la loi géométrique de paramètre p. Une foisl’événement [X = n] réalisé, Y − n représente le temps d’attente du premier pile (à partir du(n + 1)-ième lancer).

Proposition 3

Soit (X, Y ) est un couple de variables aléatoires discrètes sur (V, T , P). On poseX(V) = {xi, i ∈ I} et Y (V) = {yj, j ∈ J}, où I et J sont des parties de N. On supposeque, pour tout (k, �) ∈ I × J , P

([X = xk]

)�= 0 et P

([Y = y�]

)�= 0. On a, pour tout

(i, j) ∈ I × J ,

P([X = xi] ∩ [Y = yj]) = P[Y=yj]([X = xi])P([Y = yj])

= P[X=xi]([Y = yj])P([X = xi]),

P([X = xi]) =∑k∈J

P[Y=yk]([X = xi])P([Y = yk]),

P([Y = yj]) =∑�∈I

P[X=x�]([Y = yj])P([X = x�]).

PreuveLes premières égalités résultent de la définition des probabilités conditionnelles, les deux dernières de la formuledes probabilités totales appliqués aux systèmes complets d’événements

([Y = yk]

)k∈J

et([X = x�]

)�∈I

associésaux variables aléatoires Y et X. ❑

285

Page 293: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

➤ RemarqueAinsi, connaissant une des lois marginales et la probabilité conditionnelle de l’autre variable par rapport à celle-ci,on obtient la loi conjointe et la loi marginale de la deuxième variable.

Exercice 2.Soient X et Y deux variables aléatoires à valeurs dans N. On suppose que Y suit la loi dePoisson de paramètre l, et qu’il existe p ∈ ]0, 1[ tel que, pour tout entier naturel m, la loiconditionnelle de X sachant [Y = m] soit la loi binomiale de paramètre (m, p).

1. Déterminer la loi conjointe de (X, Y ).

2. Déterminer la loi de X.

Solution.

1. Soit (m, k) ∈ N2. Par définition de la loi binomiale de paramètre (m, p)

P[Y=m]([X = k]) =

{(mk

)pk(1 − p)m−k si k ∈ �0, m�

0 si k > m,

donc, par définition de la loi conditionnelle,

P([X = k] ∩ [Y = m]) = P[Y=m]([X = k])P([Y = m])

=

⎧⎨⎩(m

k

)pk(1 − p)m−k lm

m!e−l si k ∈ �0, m�

0 si k > m.

2. On en déduit que, pour tout entier naturel k,

P([X = k]) =+∞∑m=0

P([X = k] ∩ [Y = m])

=+∞∑m=k

(mk

)pk(1 − p)m−k lm

m!e−l

=+∞∑m=k

1k! (m − k)!

pk(1 − p)m−klme−l

= (pl)k1k!

e−l

+∞∑m=k

((1 − p)l)m−k

(m − k)!

= (pl)k1k!

e−l

+∞∑j=0

((1 − p)l)j

j!

= (pl)k1k!

e−le(1−p)l

=(pl)k

k!e−pl.

Donc X suit la loi de Poisson de paramètre pl.

286

Page 294: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance de variables aléatoires discrètes

2. Indépendance de variables aléatoires discrètes

2.1 Indépendance de deux variables aléatoires discrètes

Définition 5

Deux variables aléatoires réelles discrètes X et Y de l’espace probabilisé (V, T , P) sontdites indépendantes si

∀(x, y) ∈ X(V) × Y (V), P([X = x] ∩ [Y = y]

)= P

([X = x]

)P([Y = y]

).

➤ RemarqueCela équivaut à l’indépendance des événements [X = x] et [Y = y] pour tout couple (x, y) ∈ X(V) × Y (V).

Proposition 4

Deux variables aléatoires X et Y , définies sur le même espace probabilisé, suivant des loisde Bernoulli, sont indépendantes si, et seulement si, les événements [X = 1] et [Y = 1]sont indépendants.

PreuveOn a par définition X(V) = Y (V) = {0, 1}.

• Si les variables X et Y sont indépendantes, il résulte de la définition qu’en particulier les événements [X = 1]et [Y = 1] sont indépendants.

• Supposons réciproquement que les événements [X = 1] et [Y = 1] sont indépendants. D’après la pro-position 9 du chapitre 7, les événements [X = 1] et [Y = 1], les événements [X = 1] et [Y = 1], et lesévénements [X = 1] et [Y = 1] sont indépendants. Mais [X = 1] = [X = 0] et [Y = 1] = [Y = 0], donc lesévénements [X = 0] et [Y = 1], les événements [X = 1] et [Y = 0] et les événements [X = 0] et [Y = 0]sont indépendants. Pour tout (x, y) ∈ X(V) × Y (V), les événements [X = x] et [Y = y] sont indépendants,donc les variables X et Y sont indépendantes. ❑

Proposition 5

Soient X et Y deux variables aléatoires réelles discrètes sur l’espace probabilisé (V, T , P).Si les variables aléatoires X et Y sont indépendantes, alors pour toute partie E de X(V) ettoute partie F de Y (V), les événements [X ∈ E] et [Y ∈ F] sont indépendants.

PreuveLes ensembles X(V) et Y (V) sont au plus dénombrables donc il en est de même de leurs sous-ensembles E etF. Nous nous contenterons de démontrer la propriété quand E et F sont finis. On pose E = {a1, . . . , am} et

F = {b1, . . . , bn}. On a donc [X ∈ E] =m⋃

i=1

[X = ai ] et [Y ∈ F] =n⋃

j=1

[Y = bj ]. Par distributivité de l’intersection

par rapport à la réunion, on obtient

[X ∈ E] ∩ [Y ∈ F] =m⋃

i=1

n⋃j=1

([X = ai ] ∩ [Y = bj ]

).

287

Page 295: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Par incompatibilité des événements, on en déduit

P([X ∈ E] ∩ [Y ∈ F]

)=

m∑i=1

n∑j=1

P([X = ai ] ∩ [Y = bj ]

)=

m∑i=1

n∑j=1

P([X = ai ]

)P([Y = bj ]

),

puisque les variables aléatoires X et Y sont indépendantes. On reconnaît dans cette somme double(m∑

i=1

P([X = ai ]

))⎛⎝ n∑j=1

P([Y = bj ]

)⎞⎠. Mais

P([X ∈ E]) =

m∑i=1

P([X = ai ]

)et P([Y ∈ F]) =

n∑j=1

P([Y = bj ]

).

On a doncP([X ∈ E] ∩ [Y ∈ F]

)= P([X ∈ E])P([Y ∈ F]). ❑

Exercice 3.Soient X et Y deux variables aléatoires réelles indépendantes sur le même espace probabilisé(V, T , P), suivant toutes deux une loi géométrique (temps d’attente du premier succès) de

paramètre12· Déterminer la probabilité des événements suivants :

1. [X = Y ] ;

2. [X � kY ], où k est un entier naturel non nul fixé.

Solution. Par définition de la loi géométrique, on a, pour tout k ∈ N∗,

P([X = k]

)= P

([Y = k]

)=

(12

)k

,

car p = q =12· On rappelle, d’autre part, que P

([X > k]

)=

(12

)k

.

1. L’événement [X = Y ] est la réunion des événements [X = i] ∩ [Y = i], i variant dans N∗.Comme X et Y sont indépendantes, on a

P([X = i] ∩ [Y = i]

)= P

([X = i]

)P([Y = i]

)=

(12

)2i

.

On en déduit puisque les événements [X = i] ∩ [Y = i], i variant dans N∗, sont incompa-

tibles,

P([X = Y ]

)=

+∞∑i=1

(12

)2i

=+∞∑i=1

(14

)i

=14

+∞∑i=1

(14

)i−1

=14

+∞∑j=0

(14

)j

=14

1 − 14

=13·

288

Page 296: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance de variables aléatoires discrètes

2. Comme([Y = i]

)i∈N∗ est un système complet d’événements, on a

P([X � kY ]

)=

+∞∑i=1

P([X � kY ] ∩ [Y = i]

)=

+∞∑i=1

P([X � ki] ∩ [Y = i]

).

Les variables X et Y étant indépendante, on a d’après la proposition 5,

P([X � ki] ∩ [Y = i]

)= P

([X � ki]

)P([Y = i]

)= P

([X > ki − 1]

)P([Y = i]

)=

(12

)ki−1 (12

)i

=(

12

)(k+1)i−1

= 2(

12

)(k+1)i

.

On en déduit que

P([X � kY ]

)= 2

+∞∑i=1

(12

)(k+1)i

= 2+∞∑i=1

((12

)k+1)i

.

On reconnaît une série géométrique de raison x =(

12

)k+1

∈ ]0, 1[. On obtient

P([X � kY ]

)= 2

+∞∑i=1

xi = 2x+∞∑i=1

xi−1 = 2x+∞∑j=0

xj =2x

1 − x

=2(

12

)k+1

1 −(

12

)k+1 =2

2k+1 − 1·

Proposition 6

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes de l’espace probabilisé(V, T , P), toute fonction f de X(V) à valeurs dans R et toute fonction g de Y (V) à valeursdans R, si les variables aléatoires réelles X et Y sont indépendantes, alors f (X) et g(Y ) sontdes variables aléatoires réelles discrètes indépendantes.

PreuvePour tout (x, y) de f (X)(V) × g(Y )(V),

P([f (X) = x] ∩ [g(Y ) = y]) = P([X ∈ f−1({x})] ∩ [Y ∈ g−1({y}]).

On obtient, d’après la proposition 5, comme X et Y sont indépendantes,

P([f (X) = x] ∩ [g(Y ) = y]) = P([X ∈ f−1({x}]) P([Y ∈ g−1({y}]),

289

Page 297: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

c’est-à-direP([f (X) = x] ∩ [g(Y ) = y]) = P([f (X) = x]) P([g(Y ) = y]).

Ainsi f (X) et g(Y ) sont indépendantes. ❑

ExempleSi X et Y sont deux variables aléatoires discrètes indépendantes, pour tous entiers naturels nonnuls m et n, les variables Xm et Yn sont indépendantes.

2.2 Indépendance de n variables aléatoires discrètes

Définition 6

Les variables aléatoires réelles discrètes X1, . . . , Xn de l’espace probabilisé (V, T , P) sontdites indépendantes deux à deux si, pour tous entiers i et j distincts de [[1, n]], lesvariables aléatoires Xi et Xj sont indépendantes.

Définition 7

Les variables aléatoires réelles discrètes X1, . . . , Xn de l’espace probabilisé (V, T , P) sontdites mutuellement indépendantes (ou simplement indépendantes) si pour tout(x1, . . . , xn) ∈ X(V) × . . . × Xn(V),

P([X = x1] ∩ · · · ∩ [Xn = xn]

)= P

([X1 = x1]

)· · · P

([Xn = xn]

).

Proposition 7

Si (X1, . . . , Xn) est une famille de variables aléatoires discrètes mutuellement indépen-dantes de l’espace probabilisé (V, T , P), alors toute sous-famille est formée de variablesmutuellement indépendantes.

PreuveComme la propriété d’indépendance ne dépend pas de l’ordre des variables aléatoires, il suffit de démontrerque, pour k ∈ [[1, n]], les variables X1,. . . ,Xk sont mutuellement indépendantes. Il suffit même de le démontrerpour X1, . . . , Xn−1 et de raisonner par récurrence descendante.Fixons (x1, . . . , xn−1) ∈ X1(V) × · · · × Xn−1(V). La famille

([Xn = xn]

)xn∈Xn (V)

est un système complet événe-

ments. On obtient donc, en utilisant l’indépendance mutuelle de X1,. . . , Xn,

P([X = x1] ∩ · · · ∩ [Xn−1 = xn−1]) =∑

xn∈Xn (V)

P([X = x1] ∩ · · · ∩ [Xn−1 = xn−1] ∩ [Xn = xn]

)=∑

xn∈Xn (V)

P([X1 = x1]

)· · · P

([Xn−1 = xn−1]

)P([Xn = xn]

)= P([X1 = x1]

)· · · P

([Xn−1 = xn−1]

) ∑xn∈Xn (V)

P([Xn = xn]

)= P([X1 = x1]

)· · · P

([Xn−1 = xn−1]

),

ce qui montre l’indépendance mutuelle de X1, . . . , Xn−1. ❑

290

Page 298: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance de variables aléatoires discrètes

Corollaire 1

Si les variables aléatoires réelles discrètes X1, . . . , Xn de l’espace probabilisé (V, T , P) sontmutuellement indépendantes, alors elles sont indépendantes deux à deux.

➤ RemarqueLa réciproque est fausse, comme le montre l’exemple de deux variables indépendantes X et Y suivant la loi de

Bernoulli de paramètre1

2et de la variable Z = |X − Y|.

La variable Z est encore de Bernoulli et

[Z = 1] = [X = 1] ∩ [Y = 0] ∪ [X = 0] ∩ [Y = 1]donc

P([Z = 1]

)= P([X = 1] ∩ [Y = 0]

)+ P([X = 0] ∩ [Y = 1]

)=

1

4+

1

4=

1

2,

par indépendance de X et Y . On a d’autre part

P([X = 1] ∩ [Z = 1]

)= P([X = 1] ∩ [Y = 0]

)=

1

4= P([X = 1]

)P([Z = 1]

),

donc les variables de Bernoulli X et Z sont indépendantes. Il en est de même de Y et Z. Comme

P([X = 1] ∩ [Y = 1] ∩ [Z = 1]) = 0 = 1

8, les variables X, Y , Z ne sont pas mutuellement indépendantes, bien

qu’elles soient deux à deux indépendantes.

Les résultats démontrés pour deux variables indépendantes se généralisent au cas de nvariables indépendantes. Nous admettrons les deux théorèmes qui suivent.

Théorème 2

Pour tout n-uplet (X1, X2, . . . , Xn) de variables aléatoires discrètes mutuellement indépen-dantes de l’espace probabilisé (V, T , P) et tout n-uplet de fonction (g1, g2, . . . , gn) tel quegk est définie sur Xk(V), (g1(X1), g2(X2), . . . gn(Xn)) est un n-uplet de variables aléatoiresdiscrètes mutuellement indépendantes.

Théorème 3 (Lemme des coalitions)

Soit (X1, X2, . . . , Xn) un n-uplet de variables aléatoires discrètes mutuellement indépen-dantes de l’espace probabilisé (V, T , P).Alors quel que soit l’entier p de �2, n − 1�, les fonctions w de R

p dans R et c de Rn−p

dans R, les variables aléatoires w(X1, . . . , Xp) et c(Xp+1, . . . , Xn) sont indépendantes.Plus généralement si n1, . . . , nk sont des entiers naturels non nuls tels que n1 + · · ·+nk = net si, pour tout i ∈ �1, k�, wi est une fonction de R

ni dans R, les variables aléatoiresw1(X1, . . . , Xn1 ), w2(Xn1+1, . . . , Xn1+n2 ), . . . , wk(Xn1+···+nk−1+1, . . . , Xn) sont mutuellementindépendantes.

ExempleSi X, Y , Z et T sont des variables mutuellement indépendantes, les variables XY et ZT sontindépendantes, les variables X, Y + Z et T ont mutuellement indépendantes.

291

Page 299: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Définition 8

Toute suite (Xn)n∈N de variables aléatoires réelles discrètes de l’espace probabilisé (V, T , P)telle que pour toute partie finie I de N, les variables aléatoires réelles discrètes Xi où i décritI sont mutuellement indépendantes est appelée suite de variables aléatoires mutuellementindépendantes (ou simplement indépendantes)

➤ Remarques• Il suffit de vérifier que, pour tout entier n, les variables X0, . . . , Xn les variables sont mutuellement indé-

pendantes. En effet, toute sous-famille finie de (Xn)n∈N est contenue dans une sous-famille de la forme(X0, . . . , Xn). D’après la proposition 17, elle est constituée de variables aléatoires mutuellement indépendantessi les variables X0, . . . , Xn les variables sont mutuellement indépendantes.

• Une suite de variables mutuellement indépendantes est un modèle pour décrire une succession d’épreuvesdont les résultats sont indépendants, en particulier la répétition d’une même épreuve. On obtient alors unesuite de variables indépendantes de même loi (on dit aussi équidistribuée).Une suite de lancers de pile ou face aux résultats indépendants sera décrite par une suite (Xn) de variables deBernoulli indépendantes, où Xn représente le résultat de la n-ième épreuve.

3. Variable aléatoire fonction de deux variables aléatoires

3.1 Loi d’une variable aléatoire fonction de deux variables aléatoires

Théorème 4

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes sur le même espace proba-bilisé (V, T , P) et toute fonction g définie sur X(V)×Y (V) à valeurs dans R, l’application

Z :{

V −→ R

v −→ g(X(v), Y (v)

)est une variable aléatoire réelle discrète.

PreuveLes ensembles X(V) et Y (v) sont au plus dénombrables donc le produit X(V)×Y (V) l’est également. L’ensembleZ(V) = g

(X(V)×Y (V)

)est au plus dénombrable car c’est une réunion au plus dénombrable d’ensembles finis :

les singletons {g(x, y)}, où (x, y) ∈ X(V) × Y (V).Pour tout z ∈ Z(V),

[Z = z] =⋃

(x,y)∈X(V)×Y (V)

g(x,y)=z

([X = x] ∩ [Y = y]

).

Chaque ensemble [X = x] ∩ [Y = y] est un événement et [Z = z] qui est une réunion au plus dénombrabled’événements est un événement. Ainsi Z est une variable aléatoire réelle discrète. ❑

Théorème 5

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes sur le même espace pro-babilisé (V, T , P) et toute fonction g définie sur X(V) × Y (V) à valeurs dans R, la loi

292

Page 300: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction de deux variables aléatoires

de probabilité de la variable aléatoire réelle discrète Z = g(X, Y ) est définie, pour toutz ∈ Z(V) par

P([Z = z]

)=

∑(x,y)∈X(V)×Y (V)

g(x,y)=z

P([X = x] ∩ [Y = y]

).

En particulier, si les variables X et Y sont indépendantes, on obtient, pour tout z ∈ Z(V),

P([Z = z]

)=

∑(x,y)∈X(V)×Y (V)

g(x,y)=z

P([X = x]

)P([Y = y]

).

PreuveD’après le théorème précédent, on a, pour tout z ∈ Z(V),

[Z = z] =⋃

(x,y)∈X(V)×Y (V)g(x,y)=z

([X = x] ∩ [Y = y]

).

Puisque c’est une réunion d’événements incompatibles,

P([Z = z]

)=

∑(x,y)∈X(V)×Y (V)

g(x,y)=z

P([X = x] ∩ [Y = y]

).

Dans le cas où les variables sont indépendantes, l’égalité résulte de

P([X = x] ∩ [Y = y]

)= P([X = x]

)P([Y = y]

).

Corollaire 2

Si X et Y sont deux variables discrètes sur (V, T , P), indépendantes, on a, pour toutz ∈ (X + Y )(V),

P([X + Y = z]) =∑

(x,y)∈X(V)×Y (V)x+y=z

P([X = x])P([Y = y]).

PreuveLe résultat s’obtient en appliquant le théorème 5 à g : (x, y) −→ x + y. ❑

➤ RemarqueSi de plus X(V) et Y (V) sont inclus dans N alors (X + Y )(V) est inclus dans N et pour tout k ∈ (X + Y )(V),

P([X + Y = k]) =∑

(i,j)∈N2

i+j=k

P([X = i])P([Y = j]) =k∑

i=0

P([X = i])P([Y = k − i]).

Exercice 4.Soit X et Y deux variables indépendantes, suivant la même loi géométrique (temps d’attentedu premier succès) de paramètre p. Déterminer les lois de S = X + Y et D = X − Y .

293

Page 301: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Solution. Comme X(V) = Y (V) = N∗, on a S(V) = [[2, +∞[[ et D(V) = Z.

Pour tout entier k � 2,

P([S = k]) =∑

(i,j)∈N∗i+j=k

P([X = i])P([Y = j]) =k−1∑i=1

P([X = i])P([Y = k − i])

=k−1∑i=1

pqi−1pqk−i−1 =k−1∑i=1

p2qk−2 = (k − 1)p2qk−2.

Pour tout k ∈ Z,P([D = k]) =

∑(i,j)∈(N∗ )2

i−j=k

P([X = i])P([Y = j]).

Si k � 0, on a i � j. On peut prendre j quelconque dans N∗ et i = j + k. On obtient

P([D = k]) =+∞∑j=1

P([X = j + k])P([Y = j]) =+∞∑j=1

pqj+k−1pqj−1

= p2qk+∞∑j=1

(q2)j−1 =p2qk

1 − q2 =pqk

1 + q,

car 1 − q = p.Si k < 0, on a j > i. On peut prendre i quelconque dans N

∗ et j = i − k. On obtient

P([D = k]) =+∞∑i=1

P([X = i])P([Y = i − k]) =+∞∑i=1

pqi−1pqi−k−1 = p2q−k+∞∑i=1

(q2)i−1

=p2q−k

1 − q2=

pq−k

1 + q·

Finalement on obtient

∀k ∈ Z, P([D = k]

)=

pq|k|

1 + q·

Cas de min(X, Y ) et max(X, Y )

Pour étudier le maximum et le minimum de deux variables aléatoires discrètes, on necherche pas directement la loi.

Proposition 8

Soit X et Y deux variables aléatoires discrètes sur le même espace probabilisé, à valeursdans Z. On a pour tout k ∈ Z,

[min(X, Y ) � k] = [X � k] ∩ [Y � k] et [max(X, Y ) � k] = [X � k] ∩ [Y � k].

On en déduit que si X et Y sont indépendantes,

P ([min(X, Y ) � k]) = P ([X � k]) ([Y � k])

et P ([max(X, Y ) � k]) = P ([X � k]) P ([Y � k]) .

294

Page 302: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction de deux variables aléatoires

Exercice 5.Soit X et Y deux variables indépendante sur le même espace probabilisé suivant des lois géo-métriques (temps d’attente du premier succès) de paramètre p et p′ respectivement. Montrerque Z = min(X, Y ) suit une loi géométrique.

Solution. On pose q = 1 − p et q′ = 1 − p′. La variable aléatoire Z est également à valeursdans N∗. Pour k ∈ N∗, on a

P([Z � k]

)= P

([X � k]

)P([Y � k]

).

Déterminons P([X � k]

). Une variable géométrique représente le rang du premier succès dans

une suite d’épreuves indépendantes. Ainsi [X � k] est réalisé si les k−1 premières épreuves ontété des échecs. La probabilité d’obtenir un échec étant q, on en déduit P

([X � k]

)= qk−1.

On obtient de même P([Y � k]

)= q′k−1 et donc

P([Z � k]

)= qk−1q′k−1 = (qq′)k−1.

On en déduit que, pour tout k ∈ N∗,

P([Z = k]

)= P

([Z � k]

)− P

([Z � k + 1]

)= (qq′)k−1 − (qq′)k = (1 − qq′)(qq′)k−1.

La variable Z suit la loi géométrique de paramètre 1 − qq′.

3.2 Somme de variables indépendantes suivant une loi binomiale ou une loide Poisson

Les propriétés énoncées dans les deux théorèmes suivants sont appelées stabilité des loisbinomiales et de Poisson pour la somme. La première a déjà été exposée dans le livrede première année. Nous ne la redémontrons pas.

Théorème 6

• Si X et Y sont des variables indépendantes de (V, T , P), suivant des lois binomialesde paramètres respectifs (m, p) et (n, p), la somme X + Y suit une loi binomiale deparamètre (m + n, p).

• Plus généralement, si X1, X2, . . . , Xk sont des variables mutuellement indépendantestelles que, pour tout i de [[1, k]], Xi suive une loi binomiale de paramètre (ni, p), la

variable X1 + · · · + Xk suit une loi binomiale de paramètre

(k∑

i=i

ni, p

).

Corollaire 3

Si X1, . . . , Xk sont des variables aléatoires indépendantes de (V, T , P) qui suivent une loide Bernoulli de paramètre p, alors X1 + · · · + Xk suit la loi binomiale de paramètre (p, k).

295

Page 303: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Théorème 7

• Si X et Y sont des variables indépendantes de (V, T , P) suivant des lois de Poisson deparamètres respectifs l et m, la somme X + Y suit une loi de Poisson de paramètrel + m.

• Plus généralement, si X1, X2, . . . , Xn sont des variables mutuellement indépendantestelles que Xk suive la loi de Poisson de paramètre lk pour tout entier k de �1, n�, la

variable aléatoire X1 + · · · + Xn suit la loi de Poisson de paramètren∑

k=1lk.

Preuve• Posons S = X + Y . On a S(V) = N et, pour tout entier k de N,

P([S = k]

)=∑i+j=k

P([X = i]

)P([Y = j]

)=

k∑i=0

P([X = i]

)P([Y = k − i]

)

=k∑

i=0

e−lli

i!

e−mmk−i

(k − i)!= e−(l+m) 1

k!

k∑i=0

(k

i

)limk−i

=e−l+m

k!(l + m)k,

d’après la formule du binôme. On en déduit que S suit la loi de Poisson de paramètre l + m.

• On procède par récurrence sur n, la propriété étant évidente pour n = 1 et résultant du premier pointpour n = 2.Supposons que la propriété est vraie au rang n et considérons n variables indépendantes X1, . . . , Xn+1 suivantdes lois de Poisson. Par hypothèse de récurrence, la variable X1 + · · · + Xn suit la loi de Poisson de para-

mètren∑

i=1

li . Les variables X1, . . . , Xn, Xn+1 étant mutuellement indépendantes, les variables X1 + · · ·+ Xn et

Xn+1 sont indépendantes. Elles suivent des lois de Poisson de paramètres respectifsn∑

i=1

li et ln+1. D’après le

cas de deux variables, leur somme X1+· · ·+Xn+Xn+1 suit la loi de Poisson de paramètren∑

i=1

li+ln+1 =n+1∑i=1

li .

Cela termine la démonstration par récurrence. ❑

3.3 Espérance d’une variable aléatoire fonction de deux variables aléatoires

Cas de deux variables finies

Théorème 8

Soient X et Y deux variables aléatoires réelles finies et g une fonction définie surX(V) × Y (V). On note X(V) = {x1, . . . , xm} et Y (V) = {y1, . . . , yn}, où m et n sontdeux entiers naturels non nuls. La variable aléatoire réelle discrète finie Z = g(X, Y )admet alors une espérance et

E(Z) =m∑

i=1

n∑j=1

g(xi, yj)P([X = xi] ∩ [Y = yj]

).

296

Page 304: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction de deux variables aléatoires

PreuveLa variable Z est finie ; on note Z(V) = {z1, . . . , zs}, où s est un entier naturel non nul. Nous avons vu (théo-rème 5 p. 292) que la loi de Z est définie par

P([Z = zk]

)=

∑(xj ,yj )∈X(V)×Y (V)

g(xi ,yj )=zk

P([X = xi ] ∩ [Y = yj ]

).

Comme Z est une variable aléatoire réelle discrète finie, elle admet une espérance, et

E(Z) =s∑

k=1

zkP([Z = zk]

)=

s∑k=1

zk

∑(xi ,yj )∈X(V)×Y (V)

g(xi ,yj )=zk

P([X = xi ] ∩ [Y = yj ]

)

=

s∑k=1

∑(xi ,yj )∈X(V)×Y (V)

g(xi ,yj )=zk

zkP([X = xi ] ∩ [Y = yj ]

)

=∑

(xi ,yj )∈X(V)×Y (V)

g(xi , yj )P(X = xi , Y = yj )

=m∑

i=1

n∑j=1

g(xi , yj )P([X = xi ] ∩ [Y = yj ]

).

Cas de variables discrètes infinies

Définition 9

Soit u une application de N2 dans R. On note ui,j l’image du couple (i, j). Si la série de

terme général ui,j, où i est fixé, est absolument convergente, et si la série de terme général+∞∑j=0

ui,j est absolument convergente, alors la série notée∑

i,j

ui,j est appelée série double

absolument convergente et sa somme est le réel+∞∑i=0

+∞∑j=0

ui,j.

Nous admettrons la proposition suivante. Quand une série est absolument conver-gente, la somme ne dépend pas de l’ordre des sommations.

Proposition 9

Si la série∑

i,j

ui,j est absolument convergente, on a

+∞∑i=0

+∞∑j=0

ui,j =+∞∑k=0

+∞∑j=0

ui,j.

297

Page 305: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Nous admettrons le théorème suivant qui généralise au cas de variables infinies lethéorème 8.

Théorème 9 (admis)

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes de l’espace probabilisé(V, T , P) telles que X(V) = {xn, n ∈ N} et Y (V) = {yn, n ∈ N} et pour toute fonctiong définie sur X(V) × Y (V), la variable aléatoire réelle discrète Z = g(X, Y ) admet uneespérance si, et seulement si, la série double

∑i,j

g(xi, yi)P([X = xi] ∩ [Y = yj]) converge

absolument. En cas de convergence absolue

E(Z) =+∞∑i=0

+∞∑j=0

g(xi, yj)P([X = xi] ∩ [Y = yj]

).

➤ RemarqueSi on a pour tout (i, j), g(xi, yj ) � 0, la convergence équivaut à la convergence absolue. Il suffit alors, pour i fixé demontrer la convergence de la série de terme général g(xi , yj )P

([X = xi ]∩ [Y = yj ]

)(la variable est j), puis de vérifier

la convergence de la série de terme général+∞∑j=0

g(xi , yj )P([X = xi ] ∩ [Y = yj ]

). En cas de convergence, E(g(X, Y ))

est égal à la somme de cette série.

ExempleConsidérons deux variables aléatoires X et Y à valeurs dans N dont la loi, conjointe est définiepar

∀(i, j) ∈ N2, P([X = i] ∩ [Y = j]) =

(i + j)e.2i+j i!j!

·

Calculons l’espérance de 2X+Y , c’est-à-dire de g(X, Y ), où g est l’application (x, y) −→ 2x+y.Pour tout (i, j) ∈ N2, on a

g(i, j)P([X = i, Y = j]) = 2i+j (i + j)e.2i+j i!j!

=(i + j)ei!j!

.

Pour i fixé, on reconnaît la série de l’exponentielle. On obtient

+∞∑j=0

(i + j)ei!j!

=1ei!

+∞∑j=0

(ij!

+jj!

)

=1ei!

⎛⎝i+∞∑j=0

1j!

++∞∑j=1

1(j − 1)!

⎞⎠=

1ei!

(ie + e) =ii!

+1i!.

On a de nouveau le terme général d’une série convergente. On en déduit que 2X+Y possèdeune espérance et

E(2X+Y) =

+∞∑i=1

1(i − 1)!

++∞∑i=1

1i!

= 2e.

298

Page 306: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance et coefficient de corrélation linéaire

4. Covariance et coefficient de corrélation linéaire

4.1 CovarianceNous admettrons le théorème suivant, évident si X et Y sont finies, car alors XY estune variable finie qui possède donc une espérance.

Proposition 10

Si les variables aléatoires réelles discrètes X et Y sur le même espace probabilisé (V, T , P)admettent un moment d’ordre deux, alors le produit XY admet une espérance.

➤ RemarqueL’expression de E(XY ) est alors donnée par les théorèmes 8 et 9.Si X et Y sont deux variables aléatoires réelles finies, telles que X(V) = {x1, . . . , xm} et Y (V) = {y1, . . . , yn}, oùm et n sont deux entiers naturels non nuls, on a

E(XY ) =m∑

i=1

n∑j=1

xiyjP([X = xi ] ∩ [Y = yj ]

).

Si X et Y sont des variables aléatoires discrètes infinies, telles que X(V) = {xn, n ∈ N} et Y (V) = {yn, n ∈ N},on a

E(XY ) =+∞∑i=0

+∞∑j=0

xiyjP([X = xi ] ∩ [Y = yj ]

).

Corollaire 4

Si les variables aléatoires réelles discrètes X et Y sur le même espace probabilisé (V, T , P)admettent un moment d’ordre deux, alors la variable X + Y admet également un momentd’ordre 2.

PreuveD’après la proposition 10, la variable aléatoire XY possède une espérance. Par linéarité de l’espérance, la variable

(X + Y )2 = X2 + Y2 + 2XY

possède une espérance, donc X + Y possède un moment d’ordre 2. ❑

Définition 10

Soit X et Y deux variables aléatoires réelles discrètes admettant une espérance. Si la variable(X − E(X)

)(Y − E(Y )

)admet une espérance, on appelle covariance de X et Y (ou du

couple (X, Y )) le réel noté Cov(X, Y ) défini par

Cov(X, Y ) = E((

X − E(X))(

Y − E(Y )))

.

➤ RemarqueLa covariance de X et Y est donc l’espérance du produit des variables centrées associées à X et Y .

299

Page 307: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Théorème 10 (Théorème de Koenig-Huygens)

Soit X et Y des variables aléatoires réelles discrètes X et Y sur le même espace probabilisé(V, T , P). Si les variables X, Y et XY admettent une espérance, alors le couple (X, Y )admet une covariance donnée par la formule

Cov(X, Y ) = E(XY ) − E(X)E(Y ).

PreuvePar linéarité de l’espérance,(

X − E(X))(

Y − E(Y ))

= XY − XE(Y ) − YE(X) + E(X)E(Y )

admet une espérance. Donc X et Y possèdent une covariance et

Cov(X, Y ) = E((

X − E(X))(

Y − E(Y )))

= E(XY ) − E(Y )E(X) − E(X)E(Y ) + E(X)E(Y )

= E(XY ) − E(Y )E(X). ❑

➤ RemarqueLe théorème 10 s’applique en particulier si les variables aléatoires X et Y ont un moment d’ordre 2, car alors X etY possèdent un espérance et il en est de même de XY d’après le théorème 10.

ExempleCalculons la covariance du couple (X, Y ) étudié page 280 :X et Y représentent le rang d’ap-parition du premier et du deuxième pile dans une suite infinie de lancers d’une pièce. On a,pour n ∈ N∗ et k � 2,

P([X = n] ∩ [Y = k]

)=

{p2qk−2 si n < k0 si n � k.

La série double∑

nkP([X = n] ∩ [Y = k]

)est à termes positifs. Pour tout k � 2, on a

P([X = n] ∩ [Y = k] = 0 si n � k, donc

+∞∑n=0

nkP([X = n] ∩ [Y = k]

)=

k−1∑n=0

nkp2qk−2 = kp2qk−2k−1∑n=0

n =12

p2k2(k − 1)qk−2.

On a12

p2k2(k − 1)qk−2 ∼k→+∞

12

p2qk(k − 1)(k − 2)qk−3. À une constante près, on trouve la

dérivée troisième d’une d’une série géométrique, qui converge car q ∈ ]0, 1[. Ainsi, d’après lethéorème 9, XY possède une espérance et

E(XY ) =12

p2+∞∑k=2

k2(k − 1)qk−2.

On écrit k2(k − 1) = k(k − 1)(k − 2) + 2k(k − 1) et donc

E(XY ) =12

p2q+∞∑k=2

k(k − 1)(k − 2)qk−3 + p2+∞∑k=2

k(k − 1)qk−2

=12

p2q · 6(1 − q)4

+ p2 2(1 − q)3

=3qp2

+2p·

300

Page 308: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance et coefficient de corrélation linéaire

Par ailleurs, nous avons démontré que X suit une loi géométrique de paramètre p (temps

d’attente d’un premier succès), donc E(X) =1p

et la variable Y , suit la loi de Pascal de

paramètre (2, p) étudiée en exercice page 267 donc l’espérance est2p· On obtient finalement

Cov(X, Y ) =3qp2

+2p− 2

p2=

qp2·

Théorème 11

Si X, X ′, Y et Y ′ sont des variables admettant des moments d’ordre 2 et l un réel, on a

• Cov(X, X) = V (X) ;

• Cov(X, Y ) = Cov(Y, X) ;

• Cov(X + X ′, Y ) = Cov(X, Y ) + Cov(X ′, Y ) Cov(lX, Y ) = lCov(X, Y ) ;

• Cov(X, Y + Y ′) = Cov(X, Y ) + Cov(X, Y ′) Cov(X, lY ) = lCov(X, Y ).

Autrement dit, les applications X −→ Cov(X, Y ) et Y −→ Cov(X, Y ) sont linéaires.

Preuve• On a Cov(X, X) = E(X2) −

(E(X))2

= V (X), d’après la formule de Kœnig-Huyghens.

• Par définition, nous avons

Cov(X, Y ) = E((

X − E(X))(

Y − E(Y )))

= E((

Y − E(Y ))(

X − E(X)))

= Cov(Y, X).

• D’après le corollaire 4, X + X′ possède un moment d’ordre 2. Ainsi le couple (X + X′, Y ) possède unecovariance. Par linéarité de l’espérance, on obtient

Cov(X + X′, Y ) = E((X + X′)Y

)− E(X + X′)E(Y )

= E(XY ) + E(X′Y ) −(E(X) + E(X′)

)E(Y )

= E(XY ) − E(X)E(Y ) + E(X′Y ) − E(X′)E(Y )

= Cov(X, Y ) + Cov(X′, Y ),

et de même,

Cov(lX, Y ) = E(lXY ) − E(lX)E(Y ) = lE(XY ) − lE(X)E(Y ) = lCov(X, Y ).

• On peut écrire, en utilisant les deux premiers points

Cov(X, Y + Y ′)) = Cov(Y + Y ′, X) = Cov(Y, X) + Cov(Y ′, X)

= Cov(X, Y ) + Cov(X, Y ′)

etCov(X, lY ) = Cov(lY, X) = lCov(Y, X) = lCov(X, Y ).

• Cov(X, X) = E((

X − E(X)))2

= V (X) � 0. ❑

➤ RemarqueL’utilisation de la linéarité peut éviter des calculs de covariance souvent pénibles.

301

Page 309: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

Théorème 12

• Pour tout couple discret (X, Y ) de variables aléatoires réelles admettant un momentd’ordre deux, la variable aléatoire réelle discrète X + Y admet une variance égale à

V (X + Y ) = V (X) + V (Y ) + 2 Cov(X, Y ).

• Plus généralement, pour toute famille finie (X1, . . . , Xn) de n variables aléatoiresréelles discrètes admettant un moment d’ordre 2, la variable aléatoire réelle discrèteX1 + X2 + · · · + Xn admet une variance

V (X + · · · + Xn) =n∑

k=1

V (Xk) + 2∑

1�i<j�n

Cov(Xi, Xj).

Preuve• Comme X et Y admettent un moment d’ordre 2, X + Y admet un moment d’ordre 2 donc une variance. On

obtientV (X + Y ) = Cov(X + Y, X + Y ) = Cov(X, X + Y ) + Cov(Y, X + Y )

par linéarité par rapport à la première variable puis, par linéarité par rapport à la deuxième variable,

V (X + Y ) = Cov(X, X) + Cov(X, Y ) + Cov(Y, X) + Cov(Y, Y ).

Enfin, par symétrie, V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).

• Procédons par récurrence sur n.Nous avons déjà démontré le résultat au rang n = 2. Supposons que la propriété est vraie au rang n etconsidérons des variables X1, . . . , Xn, Xn+1 admettant une variance. Par hypothèse de récurrence, la variable

Sn =n∑

i=1

Xi admet une variance et

V (Sn) =n∑

k=1

V (Xi ) + 2∑

1�i<j�n

Cov(Xi, Xj ).

La variable X1 + · · · + Xn + Xn+1 = Sn + Xn+1 est la somme de deux variables aléatoires réelles discrètesadmettant un moment d’ordre 2 ; elle admet donc une variance

V (X1 + · · · + Xn+1) = V (Sn) + V (Xn+1) + 2 Cov(Sn, Xn+1).

Par linéarité de la covariance par rapport à la première variable,

V (X + · · · + Xn+1) = V (Sn) + V (Xn+1) + 2n∑

k=1

Cov(Xk, Xn+1).

En remplaçant V (Sn) par sa valeur, on obtient

V (X + · · · + Xn+1) =n∑

k=1

V (Xk) + 2∑

1�i<j�n

Cov(Xi, Xj ) + V (Xn+1) + 2n∑

k=1

Cov(Xk, Xn+1)

=n+1∑k=1

V (Xk) + 2∑

1�i<j�n+1

Cov(Xi, Xj ).

Ceci termine la démonstration par récurrence. ❑

302

Page 310: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance et coefficient de corrélation linéaire

Théorème 13

Si X et Y sont deux variables aléatoires discrètes, possédant un moment d’ordre 2, on a

|Cov(X, Y )| � s(X)s(Y ).

Si s(X) �= 0, on obtient une égalité dans l’inégalité précédente c’est-à-direCov(X, Y ) = ±s(X)s(Y ) si et seulement s’il existe (a, b) ∈ R

2 tel que Y = aX + bpresque sûrement, c’est-à-dire tel que P

([Y = aX + b]

)= 1.

Preuve• Traitons pour commencer le cas où V (X) = 0. On sait qu’alors X est presque sûrement constante. On a donc

P([X = E(X)]

)= 1. On en déduit que E(XY ) = E(E(X)Y ) = E(X)E(Y ), donc Cov(X, Y ) = 0. On a donc, quelle

que soit la variable Y , Cov(X, Y ) = s(X)s(Y ) = 0.

• Supposons V (X) > 0. Soit f la fonction définie sur R par l −→ V (lX + Y ). D’après le théorème 12, f (l) estdéfini pour tout l et

f (l) = V (lX) + 2Cov(lX, Y ) + V (Y ) = l2V (X) + 2 l Cov(X, Y ) + V (Y ).

Pour tout réel l, on a f (l) � 0, car une variance est toujours positive. La fonction f est une fonction trinômequi garde un signe constant donc son discriminant est négatif. On obtient

D = 4((

Cov(X, Y ))2 − V (X)V (Y )

)� 0

et donc(Cov(X, Y )

)2 � V (X)V (Y ). Comme V (X) > 0 et V (Y ) � 0, on en déduit

|Cov(X, Y )| �√

V (X)V (Y ) � s(X)s(Y ).

L’égalité Cov(X, Y ) = ±s(X)s(Y ) équivaut à D = 0 et donc à l’existence de l0 ∈ R tel que

f (l0) = V (l0X + Y ) = 0.

On sait qu’une variable aléatoire réelle discrète admet une variance nulle si, et seulement si, elle est presquesûrement constante. Ainsi V (l0X + Y ) = 0 équivaut à l0X + Y est presque sûrement constante, c’est-à-direà l’existence de b ∈ R tel que P

([l0X + Y = b]

)= 1, c’est-à-dire tel que P(

([Y = −l0X + b]

)= 1, ce qui

est le résultat voulu avec a = −l0. ❑

4.2 Coefficient de corrélation linéaire

Définition 11

Si X et Y sont des variables aléatoires réelles discrètes admettant une variance non nulle,le nombre réel

r (X, Y ) =Cov(X, Y )s(X)s(Y )

est appelé coefficient de corrélation linéaire de X et Y .

➤ RemarqueLes variables X et Y admettent un moment d’ordre 2 donc le couple (X, Y ) admet une covariance.

303

Page 311: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

ExempleCalculons la covariance du couple (X, Y ) étudié page 280 : X et Y représentent le rangd’apparition du premier et du deuxième pile dans une suite infinie de lancers d’une pièce.Nous avons vu page 300 que Cov(X, Y ) =

qp2· Par ailleurs, nous avons démontré que X suit

une loi géométrique de paramètre p (temps d’attente d’un premier succès), donc V (X) =qp2

et la variable Y , suit la loi de Pascal de paramètre (2, p) étudiée en exercice page 267 dont la

variance est2qp2· On obtient finalement

r(X, Y ) =qp2√

qp2 ·

√2qp2

=1√2·

Théorème 14

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes admettant un coefficientde corrélation linéaire, on dispose des inégalités

−1 � r (X, Y ) � 1.

On obtient une égalité dans les inégalités précédentes, c’est-à-dire r(X, Y ) = ±1 si etseulement s’il existe (a, b) ∈ R2 tel que Y = aX + b presque sûrement, c’est-à-dire tel queP([Y = aX + b]

)= 1.

PreuveTout cela découle directement du théorème 13.En effet les inégalités −1 � r (X, Y ) � 1 sont équivalentes à |r(X, Y )| � 1 et donc à |Cov(X, Y )| = s(X)s(Y ).De même l’égalité r(X, Y ) = ±1 équivaut à Cov(X, Y ) = ±s(X)s(Y ) et donc, puisque V (X) > 0, à l’existencede (a, b) ∈ R2 tel que P

([Y = aX + b]

)= 1, toujours d’après le théorème P

([Y = aX + b]

)= 1. ❑

Proposition 11

Si X et Y sont deux variables aléatoires admettant une variance non nulle et si X∗ et Y∗

sont les variables centrées réduites associées, on a

r(X, Y ) = Cov(X∗, Y∗).

PreuveEn effet, par définition, X∗ =

X − E(X)

s(X)et Y∗ =

Y − E(Y )

s(Y ).

Comme E(X∗) = E(Y∗) = 0, on obtient

Cov(X∗, Y∗) = E(X∗Y∗) =E((X − E(X))(Y − E(Y ))

)s(X)s(Y )

=Cov(X, Y )

s(X)s(Y )= r(X, Y ).

304

Page 312: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance et coefficient de corrélation linéaire

4.3 Cas des variables indépendantes

Théorème 15

Soit X et Y deux variables aléatoires discrètes, admettant un moment d’ordre deux, sur lemême espace probabilisé (V, T , P). On a alors

• E(XY ) = E(X)E(Y ) ;

• Cov(X, Y ) = 0 ;

• V (X + Y ) = V (X) + V (Y ).

PreuveOn démontre la première égalité dans le cas où les variables X et Y sont finies. On note X(V) = {x1, . . . , xm} etY (V) = {y1, . . . , yn}. Comme X et Y sont des variables indépendantes, on a, pour tout (i, j) ∈ �1, m�× �1, n�,

P([X = xi ] ∩ [Y = yj ]

)= P([X = xi ]

)P([Y = yj ]

).

On obtient

E(XY ) =m∑

i=1

n∑j=1

xiyj P([X = xi ]

)P([Y = yj ]

)

=

(m∑

i=1

xi P([X = xi ]

))⎛⎝ n∑j=1

yj P([Y = yj ]

)⎞⎠= E(X)E(Y )

Les deux autres égalités découlent de la première. On a en effet

Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0, puis

V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ) = V (X) + V (Y ).❑

Corollaire 5

Pour toute famille finie (X1, . . . , Xn) de n variables aléatoires réelles discrètes admettantun moment d’ordre 2, deux à deux indépendantes, on a

V (X + · · · + Xn) =n∑

k=1

V (Xk).

PreuveOn sait que

V (X + · · · + Xn) =n∑

k=1

V (Xk) + 2∑

1�i<j�n

Cov(Xi, Xj ).

Pour i = j, le variables Xi et Xj sont indépendantes donc Cov(Xi, Xj ) = 0 et

V (X1 + · · · + Xn) =n∑

k=1

V (Xk). ❑

305

Page 313: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

➤ Remarques• La propriété est vérifiée en particulier si les variables sont mutuellement indépendantes.

• Cette formule montre l’intérêt de décomposer une variable aléatoire en somme de variables aléatoires indé-pendantes plus simples.

Exercice 6.On considère une suite de lancers d’une pièce de monnaie, la probabilité d’obtenir pile sur unlancer étant p ∈ ]0, 1[. Pour tout n ∈ N

∗, on note Xn le rang d’apparition du n-ième pile. Onpose ensuite Y1 = X1 et pour tout entier n � 2, Yn = Xn − Xn−1 (temps d’attente du n-ièmepile).

1. Montrer que les variables (Yn)n∈N∗ forment une suite de variables indépendantes de mêmeloi.

2. En déduire l’espérance et la variance de Xn.

Solution.

1. On note Bn l’événement « le n-ième lancer donne un pile ».Pour tout n ∈∗, Yn est à valeursdans N

∗. Soit n ∈ N∗, (i1, . . . , in) ∈ N

∗n. On a

P([Y1 = i1] ∩ [Y2 = i2] ∩ . . . ∩ [Yn = in])

= P([X1 = i1] ∩ [X2 = i1 + i2] ∩ . . . ∩ [Xn = i1 + i2 + · · · + in])

= Bi1 ∩ Bi1+i2 ∩ . . . Bi1+···+in ∩⋂k∈I

Bk,

où I = [[1, i1 + · · · + in]] \ {i1, i1 + i2, . . . , i1 + · · · + in}. Comme les résultats des différentslancers sont indépendants, on obtient

P([Y1 = i1] ∩ [Y2 = i2] ∩ . . . ∩ [Yn = in]) = pnqi1+···in−n,

ce qu’on peut encore écrire

P([Y1 = i1] ∩ [Y2 = i2] ∩ . . . ∩ [Yn = in]) =n∏

k=1

(pqik−1).

Comme ([Y1 = i1])i1∈N∗ est un système complet d’événements, on obtient en sommantsur i1

P([Y2 = i2] ∩ . . . ∩ [Yn = in]) =+∞∑i1=1

P([Y1 = i1] ∩ [Y2 = i2] ∩ . . . ∩ [Yn = in])

=

(+∞∑i1=1

pqi1−1

)n∏

k=2

(pqik−1) =n∏

k=2

(pqik−1),

car+∞∑i1=1

pqi1−1 =p

1 − q= 1. En sommant sur i2 on obtient de même

P([Y3 = i3] ∩ . . . ∩ [Yn = in]) =

(+∞∑i2=1

pqi2−1

)n∏

k=3

(pqik−1) =n∏

k=3

(pqik−1).

En sommant successivement sur i1, i2, . . . , in−1, on obtient finalement

P([Xn = in] = pqin−1.

306

Page 314: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance et coefficient de corrélation linéaire

La variable Xn suit la loi G(p) pour tout n. On a donc, pour (i1, . . . , in) ∈ N∗n,

n∏k=1

P([Yk = ik]) =n∏

k=1

(pqik−1) = P([Y1 = i1] ∩ [Y2 = i2] ∩ . . . ∩ [Yn = in]).

Les variables (Xn) sont donc indépendantes.

2. On a clairement Xn = Y1 + Y2 + · · · + Yn. Les variables Yk ont pour espérance1p

et

comme varianceqp2 · Comme les variables Yk sont indépendantes, on en déduit que Yn a

une espérance et une variance données par

E(Xn) = E(Y1) + E(Y2) + · · · + E(Yn) = n1p

etV (Xn) = V (Y1) + V (Y2) + · · · + V (Yn) = n

qp2·

Définition 12

Si deux variables aléatoires discrètes sur le même espace probabilisé vérifientCov(X, Y ) = 0, on dit qu’elles sont non corrélées.

Proposition 12

Deux variables aléatoires discrètes indépendantes sont non corrélées.

PreuveCela résulte de la définition et de la proposition 15. ❑

➤ RemarqueLa réciproque est fausse. Deux variables non corrélées ne sont pas nécessairement indépendantes.

307

Page 315: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Soit X une variable aléatoire qui suit la loi binomiale de paramètre (n, p). Les résultatsde X sont affichés sur un compteur détraqué :

• si X �= 0, le compteur affiche X ;

• si X = 0, le compteur affiche au hasard un nombre entre 1 et n.

1. Déterminer la loi de Y , variable aléatoire égale au numéro affiché sur le compteur.

2. Préciser E(Y ) et vérifier E(Y ) � E(X).

2. Soit X1, X2, . . . , Xn+m des variables aléatoires réelles discrètes, indépendantes, demême loi, ayant une espérance m et une variance s2. On pose

U = X1 + X2 + · · · + Xn et V = Xm+1 + Xm+2 + · · · + Xm+n.

Quel est le coefficient de corrélation entre U et V ?

3. Préliminaire

On pose, pour tout x ∈ ]−1, 1[, f (x) =∞∑

n=0

xn =1

1 − x· On admet que, pour tout entier p la

dérivée p-ième de f sur ] − 1, 1[ s’obtient en dérivant p fois terme à terme la série.

En déduire que, pour tout x ∈ ]−1, 1[, on a

+∞∑k=0

(k + p

p

)xk =

1(1 − x)p+1

·

Soit l > 0 et (X, Y ) un couple aléatoire à valeurs dans N2 dont la loi de probabilité est donnée

par la formule

∀(m, n) ∈ N2, P

([X = m] ∩ [Y = n]

)= c

(m + n

n

)(l

2l + 1

)m+n+1

.

1. Déterminer c.

2. Déterminer les lois de X et de Y . Démontrer que ce sont des lois géométriques à valeurs

dans N (nombre d’échecs avant le premier succès) de paramètre1

l + 1· En déduire l’espé-

rance et la variance de X et Y .

3. Démontrer que

+∞∑m=0

m(

m + nn

)(l

2l + 1

)m

= (n + 1)l

2l + 1

(2l + 1l + 1

)n+2

.

En déduire que E(XY ) = 2l2. Déterminer Cov(X, Y ).

4. Déterminer la loi de Z = X + Y . Pour tout k ∈ N, déterminer la loi de X conditionnelleà [Z = k].

308

Page 316: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

4. Soient X et Y deux variables aléatoires réelles indépendantes, à valeurs dans N, Xsuivant la loi géométrique à valeurs dans N de paramètre a (a ∈ ]0, 1[).

On considère la variable aléatoire réelle définie par Z ={

X − Y si X > Y0 sinon.

Déterminer la loi de Z en fonction de celle de Y et montrer qu’elle ne dépend que dea = E

((1 − a)Y

).

5. On considère une variable aléatoire discrète N telle que N (V) = N etP([N = n]) �= 0 pour tout n ∈ N. Si la variable N prend la valeur n, on décide de procéderà une succession de n épreuves de Bernoulli indépendantes de paramètre p (0 < p < 1).On note S et E les variables aléatoires représentant respectivement le nombre de succès etd’échecs dans ces n épreuves.

1. Montrer que si N suit une loi de Poisson de paramètre l > 0, les variables S et E suiventaussi des lois de Poisson dont on déterminera les paramètres. Montrer que les variables E etS sont indépendantes.

2. Montrer réciproquement que si S et E sont indépendantes, alors N suit une loi de Poisson.Pour cela, on montreraa. qu’il existe deux suites (un)n∈N et (vn)n∈N telles que, pour tout (m, n) ∈ N

2,

(m + n)!P(N = m + n) = umvn ;

b. que les suites (un)n∈N et (vn)n∈N sont géométriques.

6. 1. Soit X une variable discrète. On note X(V) = {xi, i ∈ N}. Pour tout événementA de probabilité non nulle, on appelle espérance conditionnelle de X sachant A, quand la sérieconverge absolument, le réel

E(X/A) =+∞∑j=0

xiP([X = xi]/A).

Soit N un entier strictement positif et T une variable aléatoire à valeurs dans {0, . . . , N}.a. On suppose que X possède une espérance. Monter que E(X/[T = k]) est défini pour

tout k ∈ N et que

E(X) =N∑

k=0

E(X/[T = k])P([T = k]). (∗)

b. On suppose réciproquement que E(X/[T = k]) est défini pour tout k ∈ {0, . . . , N}.Montrer que X possède une espérance donnée par (∗).

2. On considère N variables aléatoires discrètes X1, . . . , XN , de même loi, possédant uneespérance. On suppose que les variables X1, . . . , XN et T sont indépendantes.On note S la variable aléatoire définie par S = X1 + · · · + XT , c’est-à-dire⎧⎪⎨⎪⎩

S(v) = 0 si T (v) = 0

S(v) =T (v)∑i=1

Xi(v) si T (v) � 1.

Montrer que E(S) = E(T )E(X1).

309

Page 317: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

3. On considère une population dans laquelle chaque individu peut se reproduire et donnernaissance ainsi à de nouveaux individus, que l’on appellera ses descendants directs. Onsuppose que chaque individu peut produire au plus N descendants directs, que les individusse reproduisent de façon indépendante et avec la même loi.La génération initiale à l’instant n = 0 est constituée d’un seul individu. L’ensemble desdescendants directs de la n-ième génération est appelé la (n + 1)-ième génération. On noteUn le nombre d’individus de la n-ième génération.Montrer que, pour tout n ∈ N, E(Un) = (E(U1))n.

4. Soit (Xn)n∈N une suite de variables aléatoires indépendantes suivant toutes une loi de Ber-noulli de paramètre p et T une variable aléatoire qui suit une loi de Poisson de paramètre l,indépendante des variables Xn. On pose S = X1 + · · ·+XT (défini comme précédemment).Déterminer la loi de S. Vérifier que E(S) = E(X1)E(T ).

7. Soient X et Y deux variables aléatoires à valeurs dans N, indépendantes et de mêmeloi. On pose U = inf(X, Y ) et V = X − Y .

1. On suppose que pour tout n ∈ N, P([X = n]

)= p qn où 0 < p < 1 et q = 1− p. Montrer

que∀(i, j) ∈ N × Z, P

([U = i] ∩ [V = j]

)= p2q2i+|j|.

En déduire les lois de U et V . Montrer que les variables U et V sont indépendantes.

2. Inversement, on suppose que les variables U et V sont indépendantes et que pour tout

n ∈ N, P([X = n]

)�= 0. On pose r =

P([V = 1]

)P([V = 0]

) ·a. Montrer que, pour tout n ∈ N,

P([X = n + 1] ∩ [Y = n]

)P([X = n] ∩ [Y = n]

) =P([U = n] ∩ [V = 1]

)P([U = n] ∩ [V = 0]

) = r.

b. Déterminer les lois de X et Y en fonction de r. Conclure

8. Soit X et Y deux variables à valeurs dans N, possédant une espérance et vérifiantY � X. On suppose que, pour tout n ∈ N, la loi de Y conditionnelle à [X = n] est la loiuniforme sur [[0, n]].

1. Montrer que,

∀n ∈ N, P([X = n]) = (n+1)(P([Y = n])−P([Y = n+1])) et P([X−Y = n]) = P([Y = n]).

Calculer E(X) en fonction de E(Y ).

2. Montrer que les deux propriétés suivantes sont équivalentes :a. il existe p ∈ ]0, 1] tel que, pour tout n ∈ N, P([Y = n]) = qnp (où q = 1 − p) ;

b. les variables X − Y et Y sont indépendantes.

9. Soit (Xn)n∈N∗ une suite de variables de Bernoulli indépendantes de mêmeparamètre p ∈ ]0, 1[. On note Y la variable aléatoire égale au plus grand entier i telque X1 = X2 = · · · = Xi et Z la variable aléatoire égale au plus grand entier j tel queXL+1 = · · · = XL+j.

310

Page 318: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

1. Déterminer la loi du couple (Y, Z) et les lois des marginales. Montrer que Y et Z ont même

loi si et seulement si p =12

.

2. Montrer que E(Y ) � E(Z) = 2, V (Y ) � V (Z) � 2.

3. Montrer que Cov(Y, Z) = − (p − q)2

pq.

4. Montrer que Y et Z sont indépendantes si et seulement si p =12·

10. Marche aléatoire dans Z2

Une puce fait une suite de sauts de longueur 1 ; chaque saut est effectué au hasard dans l’unedes directions nord, sud, est, ouest. On note Mn sa position après n sauts et O = M0. Le planest muni d’un repère orthonormal d’origine O, dont les axes ont une direction est-ouest etnord-sud. On note (Xn, Yn) les coordonnées de Mn.

1. Pour n ∈ N, calculer E(Xn) et E(X2n ). On pourra introduire, pour n � 1 la variable aléatoire

Tn = Xn − Xn−1.

2. Déterminer E(Yn) et E(Y 2n ). En déduire E(OM2

n ). Montrer que E(OMn) � √n.

3. Les variables Xn et Yn sont-elles indépendantes ?

4. Calculer la probabilité an que la puce sont revenue à l’origine après n déplacements .

11. On considère des variables à valeurs dans Z. On dit qu’une variable aléatoire X estsymétrique si P([X = −m]) = P([X = m]) pour tout m ∈ Z.

1. Montrer que si X et Y sont deux variables aléatoires indépendantes et de même loi, alorsX − Y est symétrique.

2. Montrer que si X et Y sont deux variables aléatoires indépendantes et symétriques, alorsX + Y est symétrique.

3. En déduire, plus généralement que, si pour un entier n � 2, X1, . . . , Xn sont des variablesindépendantes et symétriques, alors leur somme est symétrique.

12. On admettra que, pour tout k ∈ N et tout x ∈ ]−1, 1[, on a

+∞∑n=k

(nk

)xn =

xk

(1 − x)k+1 .

Un individu joue avec une pièce non nécessairement symétrique (la probabilité d’obtenir pileest p ∈ ]0, 1[) de la façon suivante.Dans un premier temps, il lance la pièce jusqu’à obtenir pour la première fois pile. On note Nla nombre aléatoire de lancers nécessaires.Dans un deuxième temps, si le premier pile était apparu au n-ième lancer, il lance cette mêmepièce n fois et l’on note X le nombre aléatoire de piles obtenus au cours de cette seconde sériede lancers.

1. Déterminer la loi du couple (N, X).

311

Page 319: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires réelles discrètes

2. Démontrer que

∀k ∈ N∗, P

([X = k]

)=

qk−1

(1 + q)k+1et P

([X = 0]

)=

q1 + q

·

3. Montrer que X a la même loi qu’un produit de deux variables indépendantes, l’une étantune variable aléatoire de Bernoulli et l’autre une variable aléatoire géométrique de mêmeparamètre p′ que l’on précisera.

4. En déduire l’espérance et la variance de X.

312

Page 320: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

10Variables aléatoires réellesà densité

Les variables aléatoires réelles à densité forment, avec les variables discrètes, ledeuxième cas particulier très important de la notion générale de variable aléatoireréelle. Les résultats fondamentaux les concernant sont très proches du cas discret, àcondition de remplacer par exemple des sommes de séries par des intégrales, souventgénéralisées.

1. Notion de variable aléatoire réelle à densité

1.1 Définition

Définition 1

Soit X une variable aléatoire réelle définie sur un espace probabilisé (V, T , P), F sa fonc-tion de répartition. On dit que X est une variable aléatoire réelle à densité s’il existeune fonction f : R −→ R vérifiant :

1. f positive ou nulle ;

2. f continue sauf éventuellement en un nombre fini de points ;

3. l’intégrale∫ +∞

−∞f (t) dt converge et

∫ +∞

−∞f (t) dt = 1 ;

telle que, pour tout réel x,

F(x) =∫ x

−∞f (t) dt.

La fonction f est appelée une densité de X.

➤ Remarques

• Si la fonction f est discontinue en a1 < a2 < · · · < an la convergence de∫ +∞

−∞f (t) dt équivaut à la conver-

gence de chacune des intégrales∫ a1

−∞f (t) dt,

∫ a2

a1

f (t) dt,. . . ,∫ +∞

an

f (t) dt qui sont toutes généralisées.

La convergence de∫ +∞

−∞f (t) dt implique celle de

∫ x

−∞f (t) dt pour tout réel x.

Page 321: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

• S’il y a nécessité de préciser, on notera FX la fonction de répartition et fX une densité de X.

• En général, la fonction f n’est pas unique. C’est pourquoi on parle d’une densité de f . Ce point sera préciséplus loin.

Nous admettrons qu’à toute fonction f vérifiant les trois propriétés énoncées dans ladéfinition correspond une variable aléatoire.

Théorème 1

Soit f une fonction de R dans R positive ou nulle, continue sauf en un nombre fini de

points et telle que∫ +∞

−∞f (t) dt = 1. Alors il existe un espace probabilisé (V, T , P) et une

variable aléatoire X, définie sur cet espace probabilisé, dont f est une densité.

➤ RemarqueUne telle fonction f est appelée une densité ou densité de probabilité.

Exemples

1. Soit f la fonction définie sur R par f (t) =12

e−|t|. Montrons que f est une densité d’une

variable aléatoire X.La fonction f est positive et continue sur R. Pour tout x � 0, on a∫ x

0f (t) dt =

12

∫ x

0e−t dt =

12

[−e−t

]x

0=

12

(1 − e−x

).

On en déduit limx→+∞

∫ x

0f (t) dt =

12· Ainsi

∫ +∞

0f (t) dt converge et vaut

12· Comme f est

paire, on en déduit ∫ +∞

−∞f (t) dt = 1.

La fonction f est une densité d’une variable aléatoire réelle.

2. Soit f la fonction définie par

f (t) =

⎧⎨⎩ 0 si t /∈ ]1, 2]a√

t − 1si t ∈ ]1, 2].

Déterminons a pour que f soit une densité d’une variable aléatoire réelle.La fonction f est définie sur R continue sauf en 1 et 2, positive ou nulle si a � 0. La

fonction f étant nulle en dehors de ]1, 2], il faut calculer∫ 2

1f (t) dt =

∫ 2

1

a√t − 1

dt. Cette

intégrale est généralisée en 1. Pour x ∈ ]1, 2], on a∫ 2

xf (t) dt =

[2a√

t − 1]2

x= 2a(1 −

√x − 1).

314

Page 322: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notion de variable aléatoire réelle à densité

On en déduit limx→1

∫ 2

xf (t) dt = 2a. Ainsi

∫ 2

1f (t) dt converge et est égale à 2a, donc

∫ +∞

−∞f (t) dt = 2a.

La fonction f est une densité d’une variable aléatoire si, et seulement si, a =12·

1.2 Fonction de répartition d’une variable à densité

Rappelons les propriétés vérifiées par la fonction de répartition d’une variable aléatoirequelconque. Elles ont été énoncées dans le chapitre Variables aléatoires discrètes. Lafonction de répartition d’une variable aléatoire quelconque est croissante, a pour limite0 en −∞ et 1 en +∞ ; elle est continue à droite en tout point et, pour tout réel x,limx−

F = F(x) − P([X = x]).

Théorème 2

Soit F la fonction de répartition d’une variable aléatoire réelle à densité X, f une densitéde X. Alors

1. F est continue sur R ;

2. F est de classe C1 sauf en un nombre fini de points. Il existe des réelsa1 < · · · < an tels que F est de classe C1 et de dérivée f sur chaque intervalle] −∞, a1[, ]a1, a2[, . . . , ]an, +∞[.

PreuveConsidérons une densité f de X, a1 < · · · < an les points de discontinuité éventuels de f . On pose de plusa0 = −∞, an+1 = +∞.Soit i ∈ �0, n�. Montrons que F est de classe C1 sur ]ai, ai+1[. On considère a ∈ ]ai, ai+1[. D’après la relation deChasles, on peut écrire, pour tout x ∈ ]ai, ai+1[,

F(x) =

∫ x

−∞f (t) dt =

∫ a

−∞f (t) dt +

∫ x

af (t) dt,

toutes les intégrales étant convergentes puisque∫ +∞

−∞f (t) dt est une intégrale convergente.

Comme f est continue sur ]ai, ai+1[, la fonction x −→∫ x

af (t) dt est, par définition de l’intégrale, une primitive

de f sur ]ai, ai+1[ (c’est la primitive de f qui s’annule en a). Comme∫ a

−∞f (t) dt est une constante, on en déduit

que F est dérivable sur ]ai, ai+1[, de dérivée f . Cela démontre que F est dérivable en tout point de R\{a1, . . . , an}et que F′ = f sur chaque intervalle où F est dérivable. Le second point est établi.Ce qui précède montre que F est continue (car dérivable) en tout point de R\{a1, . . . , an}. Il suffit de démontrerla continuité de F en a1, . . . , an. On sait déjà qu’il y a continuité à droite : c’est une propriété générale desfonctions de répartition. Pour la continuité à gauche, reprenons l’égalité précédente pour i ∈ �0, n − 1� : pourtout x ∈ ]ai, ai+1[,

F(x) =

∫ a

−∞f (t) dt +

∫ x

af (t) dt.

315

Page 323: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

La fonction f est continue sur [a, ai+1[. Par définition de la convergence d’une intégrale généralisée, on a

limx→ai+1

∫ x

af (t) dt =

∫ ai+1

af (t) dt. On en déduit

limx→ai+1x<ai+1

F(x) =

∫ a

−∞f (t) dt +

∫ ai+1

af (t) dt =

∫ ai+1

−∞f (t) dt = F(ai+1),

d’après la relation de Chasles et la définition d’une variable à densité.On a montré ainsi la continuité en ai+1 pour i ∈ �0, n − 1�, c’est-à-dire en a1, . . . ,an. Finalement, la fonction Fest continue sur R. ❑

Vérifier ces propriétés de la fonction de répartition suffit à montrer qu’une variablealéatoire est à densité, comme le montre le théorème suivant.

Théorème 3

Soit X une variable aléatoire réelle de fonction de répartition F. Si F est continue sur R

et de classe C1 sauf en un nombre fini de points, alors X est une variable à densité. Si f estune fonction positive ou nulle telle que F′(x) = f (x) en tout point x où F est dérivable, fest une densité de X.

PreuveConsidérons une fonction f positive telle que F′(x) = f (x) en tout point x où F est dérivable. Puisque F′ est declasse C1 sauf en un nombre fini de points, f est continue sauf en un nombre finie de points. Soit x ∈ R. Onconsidère des points a1, . . . , an vérifiant a1 < a2 < · · · < an et an = x tels que F soit dérivable en tout point de] −∞, x] \ {a1, a2, . . . , an}. Soit i ∈ �1, n − 1�. Pour tout segment [u, v] inclus dans l’intervalle ouvert ]ai, ai+1[,on a ∫ v

uf (t) dt =

∫ v

uF′(t) dt = F(v) − F(u).

Comme F est continue en ai et ai+1, cette intégrale a une limite finie quand u tend vers ai et v vers ai+1. On en

déduit que l’intégrale généralisée∫ ai+1

ai

f (t) dt converge et

∫ ai+1

ai

f (t) dt = F(ai+1) − F(ai).

Si on prend [u, v] dans ] − ∞, a1[ et que l’on fait tendre u vers −∞ et v vers a1, on obtient, sachant quelim

x→−∞F(x) = 0, puisque F est une fonction de répartition,

∫ a1

−∞f (t) dt = F(a1).

On en déduit que∫ an

−∞f (t) dt =

∫ x

−∞f (t) dt converge et par la relation de Chasles,

∫ x

−∞f (t) dt =

∫ an

−∞f (t) dt =

∫ a1

−∞f (t) dt +

∫ a2

a1

f (t) dt + · · · +∫ an

an−1

f (t) dt

= F(a1) + F(a2) − F(a1) + · · · + F(an) − F(an−1) = F(an) = F(x).

Par définition, X est une variable à densité dont une densité est f . ❑

316

Page 324: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notion de variable aléatoire réelle à densité

➤ Remarques• Dans la pratique, pour démontrer qu’une variable aléatoire réelle est une variable à densité, il faut déterminer

sa fonction de répartition, vérifier que celle-ci est continue et dérivable sauf en un nombre fini de points. Ladérivée trouvée est une densité.Cette méthode sera mise en œuvre dans la deuxième partie du chapitre, pour chercher une densité d’unevariable aléatoire fonction d’une variable à densité X.

• La fonction f n’est pas unique. C’est pourquoi on parle d’une densité et non de la densité.Si f est une densité de X, toute fonction g positive, coïncidant avec f sauf en un nombre fini de points estencore une densité. En effet, g est encore continue sauf en un nombre fini de points et sur tout intervalle,l’intégrale de g est égale à celle de f . Réciproquement toute densité g est de ce type, car g comme f doit êtreégale à F′ sauf en un nombre fini de points.En général, on prend f (x) = F′(x), si F est dérivable en x. Si F n’est pas dérivable en x, on peut prendre f (x)quelconque. En général, si c’est possible, on prolonge en un tel point f par continuité à gauche ou à droite.

Le théorème suivant répond à la question : à quelle condition une fonctionF : R −→ R est-elle la fonction de répartition d’une variable à densité ? (On peutd’ailleurs se poser la même question pour une variable aléatoire quelconque). C’est lependant du théorème 1 (admis), pour les densités. Nous l’en déduisons.

Théorème 4

Soit F une fonction définie et croissante sur R, ayant pour limites 0 et 1 en −∞ et +∞respectivement, continue sur R, de classe C1 sur R sauf peut-être en un nombre fini depoints.Alors il existe un espace probabilisé (V, T , P) et une variable aléatoire X définie sur cetespace probabilisé dont F est la fonction de répartition.

PreuveOn définit f comme dans la démonstration du théorème 3 : f (x) = F′(x) en tout point où F est dérivable, fpositive quelconque ailleurs. Comme F est croissante, f est positive. La démonstration du théorème 3 s’applique :elle ne fait appel qu’aux propriétés de F qui figurent dans l’hypothèse. On obtient donc, pour tout réel x,

F(x) =

∫ x

−∞f (t) dt.

En faisant tendre x vers +∞, on a de plus∫ +∞

−∞f (t) dt = lim

x→+∞

∫ x

−∞f (t) dt = lim

x→+∞F(x) = 1.

Ainsi f a toutes les propriétés voulues pour être une densité. D’après le théorème 1, il existe une variable Xdéfinie sur un espace probabilisé (V,T , P) dont f est une densité. Par définition d’une variable à densité, la

fonction de répartition de X est la fonction x −→∫ x

−∞f (t) dt, c’est-à-dire F. ❑

ExempleOn pose

F(x) =

⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩

0 si x < −1,1 −

√−x

2si − 1 � x � 0

1 +√

x2

si 0 � x � 1

1 si x > 1.

317

Page 325: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

La fonction F est définie sur R. On vérifie la continuité aux seuls points où elle n’est pasévidente, −1, 0 et 1 : on a

limx→(−1)−

F(x) = limx→(−1)+

F(x) = 0 = F(−1), limx→0−

F(x) = limx→0+

F(x) =12

= F(0)

limx→1−

F(x) = limx→1+

F(x) = 1 = F(1).

La fonction F est dérivable sur R \ {−1, 0, 1} et

F′(x) =

⎧⎨⎩0 si x < −1 ou x > 1,1

4√|x|

si 0 < |x| < 1.

Comme F′ est positive ou nulle sur ] −∞,−1[, ] − 1, 0[, ]0, 1[ et ]1, +∞[, F est croissantesur ] −∞,−1], [−1, 0], [0, 1] et [1, +∞[, donc sur R.Enfin lim

x→−∞F(x) = 0 et lim

x→+∞F(x) = 1.

Ainsi F est la fonction de répartition d’une variable aléatoire X. Une densité associée à f est,par exemple, la fonction définie par

f (x) =

⎧⎨⎩1

4√|x|

si 0 < |x| � 1

0 sinon.

Cet exemple nous montre qu’une densité peut ne pas être bornée : la fonction f tend vers+∞ en 0.

➤ RemarqueCependant, on définit plutôt une variable aléatoire par la donnée d’une densité que par sa fonction de répartition.

1.3 Probabilité de [X ∈ I], où I est un intervalle

Théorème 5

Soit X une variable aléatoire réelle à densité X. Pour tout réel x, on dispose de l’égalité

P([X = x]) = 0.

PreuveCela résulte de la continuité de F et de l’égalité P([X = x]) = F(x) − lim

x−F. ❑

Comme le montre la proposition suivante, la probabilité de tout événement de laforme [X ∈ I] s’exprime simplement en fonction de la densité et le caractère ouvertou fermé de l’intervalle n’a pas d’importance.

318

Page 326: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Notion de variable aléatoire réelle à densité

Proposition 1

Soit f une densité et F la fonction de répartition d’une d’une variable aléatoire réelle X.Pour tout réel x, on dispose des égalités

P([X � x]) = P([X < x]) = F(x) =∫ x

−∞f (t) dt,

P([X � x]) = P([X > x]) = 1 − F(x) =∫ +∞

xf (t) dt.

Pour tous réels a et b tels que a < b, on dispose des égalités

P([a < X < b]) = P([a � X < b]) = P([a � X < b]) = P([a � X � b])

= F(b) − F(a) =∫ b

af (t) dt.

PreuveRappelons que, si X une variable aléatoire réelle quelconque de (V,T , P) et I un intervalle de R, l’ensemble[X ∈ I] = {v ∈ V, X(v) ∈ I} est un événement donc possède une probabilité.On note F la fonction de répartition de X. Soit x un réel. On a par définition d’une variable à densité,

P([X � x]) = F(x) =

∫ x

−∞f (t) dt et comme [X � x] est la réunion des événements incompatibles [X < x] et

[X = x], on obtientP([X < x)] = P([X � x]) − P([X = x]) = P([X < x])

car, d’après le théorème 5, P([X = x]

)= 0.

Comme [X � x] et [X > x] sont les événements contraires de [X < x] et [X � x] respectivement, on obtient

P([X � x]) = P([X > x]) = 1 −∫ x

−∞f (t) dt =

∫ +∞

−∞f (t) dt −

∫ x

−∞f (t) dt,

par définition d’une densité. En appliquant la relation de Chasles, on obtient

P([X � x]) = P([X > x]) =

∫ +∞

xf (t) dt.

On peut écrire [a < X < b] = [X < b] \ [X � a]. Comme l’événement [X � a] est inclus dans [X < b], on endéduit

P([a < X < b]) = P([X < b]) − P([X � a]) = F(b) − F(a)

=

∫ b

−∞f (t) dt −

∫ a

−∞f (t) dt

=

∫ b

af (t) dt,

d’après la relation de Chasles. Les autres égalités s’en déduisent comme précédemment en utilisantP([X = a]) = P([X = b]) = 0. ❑

Interprétation géométriqueConsidérons la courbe représentative Cf de la densité f . Pour a < b, La probabilité del’événement [a � X � b] apparaît comme l’aire de la partie du plan comprise entreCf , l’axe des abscisses et les droites d’équation x = a et x = b. Pour tout réel a, F(a)apparaît comme l’aire de la partie du plan limitée par Cf , l’axe des abscisses et la droited’équation x = a, située à gauche de cette droite.

319

Page 327: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

1 2

1

a b

Cf

Figure 10.1 Probabilité P(a � X � b)

➤ Remarques• Pour une variable aléatoire à densité X, tous les événements [X = x] sont quasi-impossibles. La situation est

radicalement différente de celle d’une variable discrète X. Pour une telle variable, on a P([X = x]) = 0 pourtout x ∈ X(V) et on appelle loi de X la donnée de P([X = x]) pour tout x ∈ X(V). Quand on parle de loi d’unevariable à densité il s’agit de la donnée de f ou de F.

• La remarque précédente montre qu’une variable discrète ne peut pas être une variable à densité. Il s’agit dedeux ensembles disjoints de variables aléatoires.

• On peut préciser la signification d’une densité. Soit a un point où f est continue et vérifie f (a) = 0. Comme

f (a) = F′(a) = limh→0

F(a + h) − F(a)

h= lim

h→0

P([a � X � a + h])

h,

la probabilité de l’événement [a � X � a + h] est approximativement pour un petit accroissement h > 0 de lavariable égal à hf (a).

• Nous avons vu dans le cas des variables discrètes qu’on pouvait parler de variable aléatoire X de loi PX en faisantabstraction de l’espace probabilisé (V,T , P) sur lequel X est défini. C’est encore plus vrai pour les variables àdensité. On les définit rarement comme application de V dans R. Le point de départ est en général la donnéed’une densité ou d’une fonction de répartition.

Définition 2

Soit X une variable à densité définie sur l’espace probabilisable (V, T , P), I un intervallede R. On dit que X est à valeurs dans I si P([X ∈ I]) = 1.

Proposition 2

Soit X une variable aléatoire réelle à densité, I un intervalle de R. La variable X est àvaleurs dans I si, et seulement si, elle possède une densité qui est nulle sur le complémen-taire de I .

320

Page 328: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction d’une variable aléatoire à densité

PreuveFaisons la démonstration pour un segment [a, b]. Elle est très légèrement différente dans les autres cas.

• Supposons que P([

X ∈ [a, b]])

= P([a � X � b]) = 1 et donc que

P(

[a � X � b])

= P([X < a]

)+ P([X > b]

)= 0.

Pour x < a, on a [X � x] ⊂[X < a

]. On en déduit

F(x) = P(X � x) � P([X < a]) � 0, soit F(x) = 0.

De même, pour x � b, on a [a � X � b] ⊂ [X � x]. On en déduit

F(x) = P[(X � x]) � P(a � X � b]

)) � 1, soit F(x) = 1.

Ainsi, F est constante sur ] − ∞, a[ et ]b, +∞[ donc, pour x < a et x > b, F′(x) = 0. On peut prendrecomme densité f de X sur les intervalles ] −∞, a[ et ]b, +∞[, où F est dérivable, la fonction F′ qui est nullesur ces intervalles. Alors f est nulle sur le complémentaire de [a, b].

• Supposons réciproquement que f possède une densité nulle sur le complémentaire de [a, b], i.e. ]−∞, a[ et]b, +∞[. On alors

1 =

∫ +∞

−∞f (t) dt =

∫ a

−∞f (t) dt +

∫ b

af (t) dt +

∫ +∞

bf (t) dt =

∫ b

af (t) dt,

car la première et la troisième intégrales sont nulles.On a donc

P([

X ∈ [a, b]])

= P([a � X � b]) =

∫ b

af (t) dt = 1.

La variable X est à valeurs dans [a, b]. ❑

➤ RemarqueLe théorème précédent montre que, si X est une variable à densité à valeurs dans [a, b], sa fonction de répartitionvaut 0 sur ] −∞, a] et 1 sur [b, +∞[.On montrerait de même que si X est à valeurs dans R+, elle possède une densité nulle sur ] −∞, 0] et sa fonctionde répartition est nulle sur ] −∞, 0].

2. Variable aléatoire fonction d’une variable aléatoire à densitéSoit X une variable aléatoire réelle de densité f et w une fonction dont l’ensemble dedéfinition contient X(V). On peut se demander quelles conditions il faut imposer à w

pour que Y = w(X) (i.e. w ◦ X) soit encore une variable à densité et alors exprimerune densité de Y en fonction d’une densité de X et de w. Contrairement au casdes variables aléatoires discrètes (pour lesquelles il n’y a pas de condition sur w) leproblème est compliqué. On peut trouver des variables X et des fonctions w assezraisonnables, par exemple continues, pour lesquelles w(X) n’est pas une variable àdensité.Commençons par traiter le cas particulier d’une application affine.

321

Page 329: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Proposition 3

Soit X une variable aléatoire réelle de densité f et (a, b) un couple de réels tel que a �= 0.Alors Y = a X + b est une variable aléatoire réelle admettant une densité g définie par

∀y ∈ R, g(y) =1|a| f

(y − ba

).

PreuveDistinguons deux cas.

• Cas a > 0.

Soit y ∈ R. Pour tout v ∈ V, Y (v) � y équivaut à X(v) � y − b

a. On a donc [Y � y] =

[X � y − b

a

].

Comme X est une variable aléatoire réelle,

[X � y − b

a

]est un événement donc [Y � y] aussi, ce qui

montre que Y est une variable aléatoire réelle. On obtient de plus

FY (y) = P([Y � y]) = P

([X � y − b

a

])= FX

(y − b

a

).

La fonction FX est continue sur R donc FY est continue sur R comme composée de fonctions continues.

La fonction FX est de classe C1 sur R \ {x1, . . . , xn}. Alors FY est dérivable en tout y tel quey − b

ane soit

pas un des xi , i.e. pour y ∈ R \ {y1, . . . , yn}, où yi = axi + b. On a alors

F′Y (y) =1

aF′X

(y − b

a

)=

1

af

(y − b

a

).

La fonction FY est donc de classe C1 sur R \ {y1, . . . , yn}. On conclut que Y est une variable à densité dontune densité g est définie sur R \ {y1, . . . , yn} par

g(y) =1

af

(y − b

a

).

Ailleurs, on peut prendre g quelconque positive et donc garder la même expression en fonction de f .

• Cas a < 0.On montre de la même façon que Y est une variable aléatoire. Comme a < 0, pour tout y ∈ R et tout

v ∈ V, Y (v) � y équivaut à X(v) � y − b

a, ce qui montre que [Y � y] =

[X � y − b

a

]. On obtient

FY (y) = P([Y � y]) = P

([X � y − b

a

])= 1 − FX

(y − b

a

).

On termine comme dans le premier cas. On trouve que Y possède une densité définie, pour tout y ∈ R par

g(y) = −1

af

(y − b

a

)=

1

|a|f

(y − b

a

).

➤ RemarqueSi a = 0, Y est la variable aléatoire certaine b, discrète. Ce n’est pas une variable à densité.

322

Page 330: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction d’une variable aléatoire à densité

Cas où w est bijective et de classe C1

Théorème 6

Soit X est une variable aléatoire de densité f , à valeurs dans un intervalle I , et w : I −→ R

une application de classe C1 dont la dérivée ne s’annule pas. Alors Y = w(X) est unevariable aléatoire admettant une densité g nulle en dehors de l’intervalle J = w(I) et telleque, pour tout y ∈ J ,

g(y) = f ◦ w−1(y)∣∣(w−1)′(y)

∣∣ =f ◦ w−1(y)|w′ ◦ w−1(y| ·

PreuvePuisque w′ ne s’annule pas et est continue, elle garde un signe constant, donc w est strictement monotone.De plus elle est continue, donc elle réalise une bijection de I sur J. Supposons que w est strictement croissante.Alors, on a, pour tout y ∈ J,

[Y � y] = [w(X) � y] = [X � w−1(y)].

Par ailleurs si y /∈ J, [Y � y] = ∅ ou V selon que y est inférieur à inf I ou supérieur à sup I. Ainsi, pour touty ∈ R, [Y � y] est un événement, donc Y est une variable aléatoire. De plus, pour tout y ∈ I,

FY (y) = P[(Y � y]) = FX (w−1(y))

et d’autre part FY (y) = 0 ou 1 selon que y est inférieur à inf I ou supérieur à sup I.

La fonction FY est continue sur J car FX est continue sur R et w−1 est continue sur J, et constante sur chaqueintervalle inclus dans le complémentaire de J. Les seuls problèmes de continuité sont aux bornes de J. Supposonspar exemple que la borne inférieure de I soit un réel a et celle de J a = w(a). On a lim

y→aw−1(y) = a et

limy→a+

FY (y) = limy→a

FX (w−1(y)) = FX (a) = 0,

car w est à valeurs dans I. Comme FY (y) = 0 si y < a, a aussi limy→a−

FY (y) = 0 et FY est continue en a. Il en est

de même à l’autre extrémité de J.

Comme w est de classe C1 et que w′ ne s’annule pas, w−1 est aussi de classe C1. La fonction FY étant de classeC1 sauf un nombre fini de points, il en est de même de FY . Ainsi Y est une variable à densité. On obtient unedensité g en dérivant FY , là où c’est possible. Pour y ∈ J, on a

g(y) = F′Y (y) = (f ◦ w−1)(w−1)′(y) =f ◦ w−1(y)

w′ ◦ w−1(y),

d’après la formule donnant la dérivée d’une fonction réciproque. La démonstration qui précède est valable, làoù F′Y = f . Pour les points (en nombre fini) de J où ce n’est pas vrai, on définit g arbitrairement par la mêmeformule. Par ailleurs on peut prendre g = 0 hors de J, car Y est à valeurs dans J.

La démonstration est la même dans le cas où w est décroissante. On obtient, pour y ∈ J,

[Y � y] = [X � w−1(y)] et donc FY (y) = 1 − FX (w−1(y)).❑

➤ RemarqueCe théorème n’est pas à retenir en tant que tel, mais il donne la démarche qu’il faut savoir mettre enœuvre dans les cas concrets.

323

Page 331: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Exemples

1. Soit X une variable à densité de densité f et Y = eX . Montrons que Y est une variable àdensité.La fonction exp réalise une bijection strictement croissante de R sur R∗

+ ; sa bijectionréciproque est ln. On a donc, pour tout réel y,

[Y � y] = [eX � y] =

{∅ si y � 0[X � ln(y)] si y > 0.

Ainsi [Y � y] est un événement pour tout réel y, donc Y est une variable aléatoire et

FY (y) =

{0 si y � 0FX

(ln(y)

)si y > 0.

La fonction FY est continue sur R∗+ et R∗

− et

limy→0+

FY (y) = limy→0+

FX (ln(y)) = limx→−∞

FX (x) = 0 = lim0−

FY = FY (0).

Donc FY est continue sur R. Elle est de classe C1 sur R∗. Ainsi Y est une variable aléatoire

réelle à densité dont une densité g est nulle sur R− et définie pour y > 0 par

g(y) = F′Y (y) = F′

X

(ln(y)

)ln′(y) =

f(

ln(y))

y,

si FY est dérivable en ln(y). En les points où FY n’est pas dérivable, on peut prendre gquelconque, donc égale encore à cette expression.

2. Soit X une variable à densité à valeurs dans R∗+, c’est-à-dire dont une densité f est nulle

sur R− et Y = ln X. Montrons que Y est une variable à densité.On peut remarquer que, pour tout v ∈ V, Y (v) = ln

(X(v)

)est défini si X(v) > 0. Or

la variable X est à valeurs dans R∗+, ce qui signifie que P([X > 0]) = 1. La fonction Y est

donc définie presque sûrement.La fonction ln réalise une bijection de R

∗+ sur R. Sa fonction réciproque est exp. On a

donc, pour tout réel y, [Y � y] = [ln(X) � y] = [X � ey]. Ainsi [Y � y] est unévénement pour tout réel y, donc Y est une variable aléatoire.On obtient, pour tout réel y, FY (y) = FX (ey). La fonction FX est continue sur R, donc ilen est de même de FY comme composée de fonctions continues. La fonction FX étant declasse C1 sauf en un nombre fini de points, il en est de même de FY qui est dérivable en ysi ey est dérivable en FX . Ainsi Y est une variable à densité dont une densité s’obtient endérivant FY . Une densité g de Y est donnée par

g(y) = f (ey) exp′(y) = f (ey)ey.

3. Soit X une variable aléatoire de densité f et Y = X3. Montrons que Y est une variable àdensité.La fonction w : x −→ x3 est une bijection strictement croissante de R sur R dont la fonc-

tion réciproque est w−1 : x −→ 3√

x, dérivable sur R∗, de fonction dérivée x −→ 1

3 3√

x2.

324

Page 332: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variable aléatoire fonction d’une variable aléatoire à densité

On a pour tout réel y, [Y � y] = [X3 � y] = [X � 3√

y]. On en déduit que Y est unevariable aléatoire et que, pour tout y ∈ R, FY (y) = FX ( 3

√y).

La fonction FY est continue sur R comme composée de fonctions continues sur R. Lafonction FX est de classe C1 sauf en un nombre fini de points et la fonction w est de classeC1 sauf 0 donc FY est de classe C1 sauf en un nombre fini de points. Ainsi Y est une variableà densité dont une densité g est donnée pour tout y �= 0 par

g(y) =f(

3√

y)

3 3√

y2·

4. On peut montrer plus généralement, par le même raisonnement, que si X est une variablealéatoire réelle à densité et n un entier impair, alors Xn est une variable aléatoire réelle àdensité.

Il y a bien des cas où w(X) est une variable à densité, sans que w soit bijective. Lesexemples suivants en témoignent.

Exemples

1. Soit X une variable aléatoire de densité f . Montrons que Y = |X| est une variable aléatoireà densité.Soit y un réel. On a

[Y � y] = [|X| � y] =

{∅ si y < 0[−y � X � y] si y � 0.

On en déduit que [Y � y] est un événement pour tout y, donc Y est une variable aléatoire

réelle et

Fy(y) =

{0 si y < 0FX (y) − FX (−y) si y � 0.

Comme FX est continue sur R, il en est de même de FY . Le seul problème est la continuité

en 0 et

limy→0+

FY (y) = FX (0) − FX (0) = 0 = FY (0) = limy→0−

FY (y).

La fonction FX étant dérivable sauf en un nombre fini de points, il en est de même de FY .

Donc Y est une variable aléatoire à densité. Pour y < 0, F′Y (y) = 0 et pour y > 0, en un

point où FY est dérivable,

F′Y (y) = F′

X (y) + F′X (−y) = f (y) + f (−y).

On peut prendre comme densité la fonction g définie par

g(y) =

{f (y) + f (−y) si y � 00 si y < 0.

325

Page 333: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

2. Soit X une variable aléatoire réelle de densité f . Montrons que Y = X2 est une variablealéatoire réelle admettant une densité.Soit y un réel. On a

[Y � y] = [X2 � y] =

{∅ si y < 0[−√

y � X � √y] si y � 0.

On en déduit que [Y � y] est un événement pour tout y, donc que Y est une variablealéatoire réelle, et

Fy(y) = P([Y � y]) =

{0 si y < 0FX (

√y) − FX (−√

y) si y � 0.

Comme FX est continue sur R, il en est de même de FY . Le seul problème est la continuitéen 0 et

limy→0+

FY (y) = FX (0) − FX (0) = 0 = FY (0) = limy→0−

FY (y).

La fonction FX étant dérivable sauf en un nombre fini de points, il en est de même de FY .Donc Y est une variable aléatoire à densité. Pour y < 0, F′

Y (y) = 0 et pour y > 0, en unpoint où FY est dérivable,

F′Y (y) =

12√

yF′

X (√

y) +1

2√

yF′

X (−√y) =

12√

y

(f (√

y) + f (−√y)).

On peut prendre comme densité la fonction g définie par

g(y) =

⎧⎨⎩1

2√

y

(f (√

y) + f (−√y))

si y > 0

0 si y � 0.

De ce qui précède, on peut déduire la proposition suivante.

Proposition 4

Si X est une variable aléatoire à densité et n un entier naturel non nul, Xn est une variablealéatoire à densité.

PreuveDans le cas où n est impair, on le montre comme pour n = 3 (cf. page 324).Dans le cas n = 2, cela a été démontré dans l’exemple page 325. On en déduit que c’est vrai pour tout entiern = 2p, p ∈ N, par récurrence sur p. En effet, c’est évident pour p = 0, car 20 = 1 et si X2p

est une variable à

densité, il en est de même de X2p+1=(X2p)2

.Un entier n quelconque peut s’écrire n = 2pm, où p ∈ N et m est un entier impair. On en déduit, d’après cequi précède, que

Xn = X2pm =(

X2p)m

est une variable à densité. ❑

326

Page 334: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espérance et variance d’une variable aléatoire à densité

➤ RemarqueIl ne faut pas croire pour autant que, pour une variable aléatoire à densité X et une fonction continue w quel-conques, w(X) est une variable à densité.

ExempleSoit X une variable aléatoire réelle à densité sur un espace probabilisé (V, T , P). Considéronsalors Y = X + |X|.Pour tout v ∈ V, on a Y (v) = 0 si X(v) � 0 et Y (v) = 2X(v) > 0 sinon. On en déduitque, si y < 0, [Y � y] = ∅, [Y = 0] = [X � 0] et, si y > 0,

[Y � y] = [Y � 0] ∪ [0 < Y � y] = [X � 0] ∪[0 < X � y

2

]=

[X � y

2

].

Cela montre que [Y � y] est un événement pour tout y ∈ R, donc que Y est une variablealéatoire réelle. On a, de plus,

FY (y) =

⎧⎪⎨⎪⎩0 si y < 0FX (0) si y = 0

FX

( y2

)si y > 0.

Comme limx→0−

FY (y) = 0, si FX (0) �= 0, c’est-à-dire si X n’est pas à valeur dans R+, FY n’est

pas continue en 0, donc Y n’est pas une variable à densité.Si X n’est pas une variable à valeurs dans R−, Y n’est pas davantage une variable discrète. Eneffet, le seul point de discontinuité de FY est 0. Si Y était une variable discrète, ce serait lavariable constante 0 ; on aurait FY (0) = 1 = FX (0) et X serait à valeur dans R−.Il existe donc des variables aléatoires réelles qui ne sont ni discrètes, ni à densité. On a montréprécédemment que |X| est une variable à densité. Ainsi la somme de deux variables à densitén’est pas toujours une variable à densité.

3. Espérance et variance d’une variable aléatoire à densitéLes concepts d’espérance et de variance, déjà rencontrés au niveau des variables aléa-toires réelles discrètes, possèdent leurs analogues pour les variables à densité.

3.1 Espérance mathématique

Définition 3

Soit X une variable aléatoire réelle de densité f . Si l’intégrale∫ +∞

−∞t f (t) dt est absolument

convergente, on dit alors que X admet une espérance mathématique (ou espérance)égale au nombre réel

E(X) =∫ +∞

−∞t f (t) dt.

327

Page 335: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

➤ Remarques• La fonction t → tf (t) étant positive sur R+ et négative sur R−, l’absolue convergence équivaut en fait à la

convergence ici.

• Même si f présente des discontinuités, le seul problème de convergence pour∫ +∞

−∞|t|f (t) dt est en ±∞, car

si f possède une discontinuité en a, on a, au voisinage de a, |t|f (t) ∼ |a|f (t) et∫ +∞

−∞|a|f (t) dt converge (et

vaut |a|).• On en déduit que si X est variable à densité bornée, c’est-à-dire à valeurs dans un segment [a, b], elle possède

une espérance. En effet une densité de X est nulle en dehors de [a, b].

• L’espérance n’existe pas toujours. Soit c > 0 et f la fonction définie sur R par

f (x) =c

1 + x2·

La fonction f est continue et positive sur R. Pour a < b,∫ b

af (x) dx = c(Arctan(b) − Arctan(a)). De

lima→−∞

Arctan(a) = −p

2et lim

b→+∞Arctan(b) =

p

2, on déduit que

∫ +∞

−∞f (x) dx = cp. Cette intégrale vaut 1

si c =1

p· Pour cette valeur de c, f est une densité d’une variable X.

Comme en ±∞, |x|f (x) ∼ c

|x|, l’intégrale

∫ +∞

−∞|x|f (x) dx diverge. Une variable aléatoire réelle X de densité f

n’admet pas d’espérance.

Exemples1. Soit f la fonction définie sur R par

f (x) = 6x(1 − x) si x ∈ [0, 1] et f (x) = 0 sinon.

Montrons que f est une densité d’une variable aléatoire réelle qui admet une espérance.La fonction f est positive, car x(1−x) � 0 pour x ∈ [0, 1], et continue, sauf éventuellementen 0 et 1. D’autre part, on a∫ +∞

−∞f (x) dx =

∫ 1

06x(1 − x) dx =

∫ 1

0(6x − 6x2) dx =

[3x2 − 2x3

]1

0= 3 − 2 = 1.

Ainsi f est une densité d’une variable aléatoire réelle.Comme f est nulle en dehors de [0, 1],∫ +∞

−∞xf (x) dx =

∫ 1

0xf (x) dx =

∫ 1

0(6x2 − 6x3) dx =

[2x3 − 3

2x4

]=

12·

Toute variable aléatoire réelle X de densité f possède une espérance et E(X) =12·

2. Soit f la fonction définie sur R par f (t) = 0 si t < 1 et f (t) =3t4

pour t � 1. Montrons

que f est une densité d’une variable aléatoire X qui possède une espérance.La fonction est positive ou nulle et continue sauf en 1. On en déduit, pour tout x > 1,∫ x

1f (t) dt =

[− 1

t3

]x

1

= − 1x3

+ 1.

328

Page 336: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espérance et variance d’une variable aléatoire à densité

En faisant tendre x vers +∞, on obtient∫ +∞

1f (t) dt = 1 et donc

∫ +∞

−∞f (t) = 1. Donc f

est une densité d’une variable aléatoire X.On obtient de même, pour x > 1,∫ x

−∞tf (t) dt =

∫ x

1

3t3

dt =[− 3

2t2

]x

1

= − 32x2

+32·

En faisant tendre x vers +∞, on obtient∫ +∞

−∞f (t) dt =

32

, c’est-à-dire E(X) =32·

Propriétés de l’espérance

Théorème 7

Soient X une variable aléatoire réelle admettant une densité f et une espérance E(X), et aun réel. Alors Y = aX + b admet une espérance vérifiant

E(Y ) = aE(X) + b.

PreuveSi a = 0, la variable Y est la variable constante égale à b, dont l’espérance est b. L’égalité est vérifiée.

Supposons a > 0. D’après la proposition 3, la variable Y admet comme densité g(y) =1

af( y − b

a

)d’où, par

le changement de variable t = a u + b, les égalités∫ +∞

−∞|t| g(t) dt =

1

a

∫ +∞

−∞|t| f( t − b

a

)dt =

∫ +∞

−∞|au + b| f (u) du.

Comme |au + b|f (u) � |a| |u|f (u) + f (u), la convergence de∫ +∞

−∞|t| g(t) dt résulte de celle des intégrales∫ +∞

−∞|u| f (u) du et

∫ +∞

−∞f (u) du. Ainsi Y admet une espérance et le même changement de variable donne

E(Y ) =

∫ +∞

−∞t g(t) dt =

1

a

∫ +∞

−∞t f( t − y

a

)dt =

∫ +∞

−∞(au + b) f (u) du

= a∫ +∞

−∞uf (u) du + b

∫ +∞

−∞f (u) du

= aE(X) + b.

Le cas a < 0 est très peu différent : simplement g(y) = −1

af( y − b

a

)et les limites de l’intégrale généralisée

sont changées en leurs opposées, ce qui donne le même résultat. ❑

Définition 4

Toute variable aléatoire réelle discrète admettant une espérance nulle est dite centrée.

329

Page 337: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Proposition 5

Pour toute variable aléatoire réelle discrète X admettant une espérance E(X), la variablealéatoire X − E(X) est une variable aléatoire réelle discrète centrée appelée la variablealéatoire centrée associée à X.

PreuveD’après le théorème 7, la variable X − E(X) admet une espérance, puisque E(X) est une constante et

E(X − E(X)

)= E(X) − E(X) = 0.

Comme sur l’ensemble des variables discrètes, l’espérance est linéaire. Mais, ainsiqu’on l’a déjà remarqué, on n’est pas sûr a priori que la somme de deux variablesquelconques à densité est une variable à densité. Nous admettons le théorème sui-vant :

Théorème 8

Soit X et Y deux variables aléatoires réelles à densité sur le même espace probabilisé(V, T , P), admettant chacune une espérance. Si la variable aléatoire réelle X + Y est unevariable à densité, elle admet une espérance et E(X + Y ) = E(X) + E(Y ).

➤ RemarqueL’espérance n’a pas été définie pour une variable aléatoire réelle quelconque. Cela oblige à supposer que X + Y estune variable à densité.

Théorème 9

Soit X une variable aléatoire réelle à densité, à valeurs dans R+, possédant une espérance.On a alors

E(X) � 0.

PreuveLa variable X possède une densité f nulle sur R∗

−. On a donc

E(X) =

∫ +∞

0tf (t) dt � 0,

puisqu’il s’agit de l’intégrale d’une fonction positive. ❑

Nous admettrons la propriété plus générale suivante démontrée pour des variablesdiscrètes :

Proposition 6

Soient X et Y deux variables aléatoires réelles à densité admettant des espérances mathé-matiques et telles que P([X � Y ]) = 1 (on dit que X � Y presque sûrement). On aalors E(X) � E(Y ).

330

Page 338: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espérance et variance d’une variable aléatoire à densité

3.2 Théorème de transfert

Le théorème suivant est l’équivalent, pour les variables à densité, du théorème affir-mant que, pour une variable aléatoire discrète telle que X(V) = {xn, n ∈ N},l’espérance de g(X) est donnée, sous réserve d’absolue convergence, par

+∞∑n=0

g(xn)P([X = xn]).

Théorème 10

Soient X une variable aléatoire réelle de densité f , à valeurs dans un intervalle I de R, etw une fonction de I dans R, continue sauf en un nombre fini de points.Si Y = w(X) = w ◦ X est une variable aléatoire réelle à densité, elle admet une espérancesi, et seulement si, l’intégrale ∫

Iw(t) f (t) dt

est absolument convergente. Cette espérance est alors donnée par

E(w(X)

)=

∫Iw(t) f (t) dt.

➤ Remarque

Si I est un intervalle d’extrémités a et b, finies ou infinies,∫

Iw(t) f (t) dt désigne

∫ b

aw(t) f (t) dt.

Exemples1. Soit X une variable aléatoire réelle de densité f et Y = eX . Le théorème de transfert affirme

que si Y admet une espérance, elle est donnée par

E(Y ) =∫ +∞

−∞etf (t) dt.

Par ailleurs nous avons démontré (page 324) qu’une densité de Y est donnée par

g(y) = 0 si y � 0 et g(y) =f (ln(y))

ysi y > 0.

Ainsi l’espérance de Y est donnée sous réserve d’absolue convergence de l’intégrale par

E(Y ) =∫ +∞

0yg(y) dy =

∫ +∞

−∞f (ln(y)) dy.

Mais le changement de variable t = ln(y), i.e. y = et, dans la seconde intégrale redonne lapremière car on remplace dy par et dt.

2. Si X est une variable à densité, |X| est encore une variable à densité. Le théorème detransfert affirme que si |X| admet une espérance, elle est donnée par

E(|X|) =∫ +∞

−∞|t|f (t) dt.

331

Page 339: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

On peut transformer cette intégrale, en utilisant la relation de Chasles et le changement devariable u = −t pour t � 0. On obtient

E(|X|) =∫ 0

−∞|t|f (t) dt +

∫ +∞

0|t|f (t) dt = −

∫ 0

−∞tf (t) dt +

∫ +∞

0tf (t) dt

=∫ +∞

0uf (−u) du +

∫ +∞

0tf (t) dt =

∫ +∞

0t(f (−t) + f (t)

)dt.

Ce résultat ne nous étonne pas nous avons démontré dans un exemple page 325 que |X|possède une densité g, nulle sur R− et vérifiant pour y > 0,

g(y) = f (−y) + f (y).

On retrouve la définition de l’espérance d’une variable à densité.

3.3 Moments d’une variable à densité

Définition 5

Soit X une variable aléatoire réelle de densité f et n entier naturel.

On dit que la variable X admet un moment d’ordre n si l’intégrale∫ +∞

−∞xnf (x) dx

converge absolument, et en cas de convergence, on appelle moment d’ordre n de X leréel

mn(X) =∫ +∞

−∞xnf (x) dx.

➤ RemarqueLe moment d’ordre 0 est égal à 1, celui d’ordre 1 est l’espérance mathématique.

Proposition 7

Soit X une variable aléatoire réelle à densité et n entier naturel.La variable X admet un moment d’ordre n si, et seulement si, la variable aléatoire discrèteXn admet une espérance. On a alors mn(X) = E(Xn).

PreuveCela résulte du théorème de transfert appliqué à la fonction de R dans R w : x −→ xn. La variable Xn = w(X)

est une variable à densité. Elle possède un espérance égale à∫ +∞

−∞xnf (x) dx en cas de convergence absolue de

cette intégrale. ❑

Exemple

On considère une variable aléatoire réelle X dont une densité est définie par f (t) =12

e−|t| (cf.

exemple 1 page 314). Montrons que X possède des moments de tout ordre et calculons-les.

Il s’agit de montrer la convergence et de calculer∫ +∞

−∞

12

tne−|t| dt. La fonction que l’on intègre

332

Page 340: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espérance et variance d’une variable aléatoire à densité

étant paire ou impaire, selon la parité de n, il suffit de considérer∫ +∞

0tne−|t| dt =

∫ +∞

0tne−t dt,

que l’on note In.On raisonne par récurrence. Pour n = 0, on obtient I0 =

[−e−t

]+∞0

= 1. Si In−1 (n � 1)converge, on a, pour x > 0, en intégrant par parties,∫ x

0tne−t dt =

[−tne−t

]x

0+

∫ x

0ntn−1e−t dt = −xne−x + n

∫ x

0tn−1e−t dt.

Quand x tend vers +∞, xne−x tend vers 0 et la deuxième intégrale à une limite finie car In−1

converge. On en déduit que In converge et In = nIn−1. Comme I0 = 1, une récurrencesimple montre que, pour tout n ∈ N, In = n!.On en déduit que X a un moment d’ordre n pour tout n. Pour n impair, la fonctiont −→ tne−|t| dt est impaire donc mn(X) = 0. Pour n pair, elle est paire, donc

mn(X) =12

2In = In = n!.

Proposition 8

Si une variable aléatoire réelle à densité X admet un moment d’ordre n alors, pour toutentier naturel k � n, elle admet un moment d’ordre k.

PreuveNotons f est une densité de X. Par hypothèse, l’intégrale

∫ +∞

−∞|x|nf (x) dx converge.

Pour tout réel x, si |x| � 1, alors |x|k � 1, et si |x| > 1, alors |x|k � |x|n. Ainsi dans tous les cas |x|k � 1 + |x|n,d’où

|x|k f (x) � f (x) + |x|n f (x).

Les intégrales∫ +∞

−∞f (x) dx et

∫ +∞

−∞|x|nf (x) dx convergent. Il en est de même de

∫ +∞

−∞

(f (x) + |x|nf (x)

)dx et

donc de∫ +∞

−∞|x|kf (x) dx, d’après le théorème de comparaison des intégrales des fonctions positives. La variable

X admet un moment d’ordre k. ❑

3.4 Variance et écart-type

Définition 6

Si la variable aléatoire X admet un espérance et si la variable(X − E(X)

)2admet une

espérance, on appelle variance de X le réel V (X) définie par

V (X) = E(X − E(X)2

).

➤ Remarques• Notons que X étant une variable à densité, il en est de même de X − E(X) d’après la proposition 3 et donc de(

X − E(X))2, d’après la proposition 4.

333

Page 341: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

• La variance est la moyenne du carré de la distance entre les valeurs de X et la moyenne de X. La variancemesure donc la dispersion de X par rapport à E(X).

• Comme la variable X − E(X) est centrée, la variance est aussi appelée moment centré d’ordre 2.

Proposition 9 (Formule de Koenig-Huyghens)

Soit X une variable aléatoire réelle à densité. La variable X admet une variance si, etseulement si, X admet un moment d’ordre 2 et en cas d’existence, on a

V (X) = E(X2) −(E(X)

)2.

Preuve• Si X possède un moment d’ordre 2, elle possède un moment d’ordre 1, c’est-à-dire une espérance, d’après

le théorème 8. On développe(X − E(X))2 = X2 − 2E(X) X +

(E(X))2

.

La variable X2 admet une espérance ; il en est de même de −2E(X) X + ((E(X))2 qui est une fonction affinede X (car E(X) est une constante). On en déduit par linéarité que (X − E(X))2 possède une espérance. AinsiV (X) existe et

V (X) = E(X2) + E(− 2E(X)X + (E(X))2

)= E(X2) − 2(E(X))2 + (E(X))2

= E(X2) − (E(X))2.

• Réciproquement si V (X) existe, X et (X − E(X))2 ont des espérances. Il en est de même de X2, carX2 = (X − E(X))2 + 2E(X) X − ((E(X))2. La variable X possède donc un moment d’ordre 2. ❑

Reprenons les exemples de la page 328.

Exemples1. Soit X une variable aléatoire dont une densité f est définie par

f (x) = 6x(1 − x) si x ∈ [0, 1] et f (x) = 0 sinon.

Nous avons montré que E(X) =12· Comme f est nulle en dehors de [0, 1],

∫ +∞

−∞x2f (x) dx =

∫ 1

0x2f (x) dx =

∫ 1

0(6x3 − 6x4) dx =

[32

x4 − 65

x5

]=

310

·

La variable aléatoire réelle X possède un moment d’ordre 2 donc une variance et

V (X) = E(X2) −(E(X)

)2 =310

− 14

=120

·

2. Soit X une variable aléatoire dont une densité f est définie par f (t) = 0 si t < 1 et f (t) =3t4

pour t � 1.

334

Page 342: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Espérance et variance d’une variable aléatoire à densité

Nous avons montré que E(X) =32· On a, pour tout x > 1,∫ x

−∞t2f (t) dt =

∫ x

1

3t2

dt =[−3

t

]x

1

= −3x

+ 3.

En faisant tendre x vers +∞, on obtient∫ +∞

−∞t2f (t) dt = 3, c’est-à-dire E(X2) = 3.

La variable aléatoire X possède un moment d’ordre 2 donc une variance et

V (X) = E(X2) −(E(X)

)2 = 3 − 94

=34·

Exercice 1.Soit X une variable aléatoire réelle admettant une densité f et une variance V (X). Calculer∫ +∞

−∞

[ ∫ +∞

−∞(x − y)2f (x) f (y) dx

]dy.

Solution. Pour y fixé, considérons l’intégrale∫ +∞

−∞(x − y)2f (x) f (y) dx. Pour tout réel x,

(x − y)2f (x) f (y) = x2f (x)f (y) − 2xf (x)yf (y) + f (x)y2f (y).

L’intégrale∫ +∞

−∞xkf (x) dx converge pour k = 0, 1 et 2. On a donc une combinaison

linéaire de fonctions dont les intégrales sur ] − ∞, +∞[ convergent. On en déduit que∫ +∞

−∞(x − y)2f (x) f (y) dx converge et

∫ +∞

−∞(x − y)2f (x) f (y) dx = f (y)

∫ +∞

−∞x2f (x) dx − 2yf (y)

∫ +∞

−∞xf (x) dx

+ y2f (y)∫ +∞

−∞f (x) dx

= f (y)E(X2

)− 2yf (y)E(X) + y2f (y).

De nouveau, cette fonction de y est une combinaison de fonctions dont les intégralessur ] −∞, +∞[ convergent. On obtient∫ +∞

−∞

[ ∫ +∞

−∞(x − y)2f (x) f (y) dx

]dy = E

(X2

) ∫ +∞

−∞f (y) dy

− 2E(X)∫ +∞

−∞yf (y) dy +

∫ +∞

−∞y2f (y) dy

= E(X2

)− 2

(E(X)

)2+ E

(X2

)= 2V (X).

335

Page 343: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Théorème 11

Si X est une variable aléatoire réelle à densité admettant une variance V (X), alors pourtout couple (a, b) de réels la variable aléatoire a X + b admet une variance donnée parl’égalité

V (a X + b) = a2V (X).

PreuveSi a = 0, le résultat est clair car a X + b est alors une variable certaine (mais il faut noter qu’elle n’est plus àdensité mais discrète).

Si a = 0, on sait que aX + b possède une espérance donnée par E(aX + b) = aE(X) + b. On a alors(aX + b − E(aX + b)

)2= (aX − aE(X)

)2= a2

(X − E(X)

)2.

Par hypothèse(X − E(X)

)2 possède une espérance. Il en est de même de a2(X − E(X)

)2. Donc aX + b possèdeune variance et

V (aX + b) = E((

aX + b − E(aX + b))2)

= E(

a2(X − E(X))2)

= a2E((

X − E(X))2)

= a2V (X).❑

Nous admettrons le théorème suivant.

Théorème 12

Toute variance de variable aléatoire réelle à densité est strictement positive.

➤ RemarqueIl est clair que la variance est positive, car c’est l’espérance de la variable positive (X − E(X)).

Définition 7

Si X est variable aléatoire réelle à densité admettant un moment d’ordre deux, l’écart-type de la variable aléatoire réelle X est le réel strictement positif s(X) =

√V (X).

Définition 8

Soit X une variable aléatoire réelle à densité, possédant un moment d’ordre 2. Si X vérifieE(X) = 0 et s(X) = 1, elle est dite centrée réduite.

Proposition 10

Si X est une variable aléatoire réelle à densité, admettant un moment d’ordre 2, la variable

aléatoire réelle discrète X∗ =X − E(X)

s(X)est une variable aléatoire réelle à densité, centrée

réduite, appelée la variable aléatoire réelle centrée réduite associée à X.

336

Page 344: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

PreuveD’après le théorème 7, X∗ possède une espérance et

E(X∗) =E(X) − E(X)

s(X)= 0.

D’après le théorème 11, X∗ admet une variance et

V (X∗) =1

(s(X))2V (X) = 1.

Par suite X∗ est une variable aléatoire centrée réduite. ❑

4. Les lois usuelles

4.1 Loi uniforme

La loi uniforme sur un segment est la plus simple de toutes les lois de variables aléa-toires réelles à densité. Elle exprime le fait qu’un élément est choisi au hasard sur lesegment.

Définition 9

Soit a et b deux réels tels que a < b. On dit qu’une variable réelle X suit la loi uniforme

sur [a, b] si elle admet pour densité la fonction f égale à1

b − asur [a, b] et nulle ailleurs.

On noteX ↪→ U

([a, b]

).

➤ Remarques• L’existence d’une telle loi est justifiée. En effet, la fonction f est positive et continue sauf en a et b et∫ +∞

−∞f (x) dx =

∫ b

a

1

b − adx = 1.

• La fonction f peut s’écrire f =1

b − a1[a,b], où 1[a,b] est la fonction indicatrice de [a, b] définie par 1[a,b](x) = 1

si x ∈ [a, b] et 1[a,b](x) = 0 sinon.

Proposition 11

Si f est la densité donnée dans la définition 9 ci-dessus d’une variable aléatoire réellesuivant la loi U

([a, b]

), son graphe est formé d’un segment et de deux demi-droites.

1 2 3 4−1

0.5

−0.5Figure 10.2 Densité de la loi U [1, 3]

337

Page 345: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Théorème 13

La fonction de répartition F d’une variable aléatoire réelle suivant la loi uniforme sur [a, b]vaut 0 sur ] −∞, a ], 1 sur [ b, +∞[ et vérifie, pour tout réel x ∈ [a, b], l’égalité

F(x) =x − ab − a

·

PreuveComme X est à valeurs dans [a, b], on a F(x) = 0 si x � a, F(x) = 1 si x � b et pour x ∈ [a, b],

F(x) =

∫ x

−∞f (t) dt =

∫ x

a

1

b − adt =

x − a

b − a·

1 2 3 4−1

0.5

1.0

−0.5Figure 10.3 Fonction de répartition de la loi U [1, 3]

➤ RemarquePlus généralement, on a, pour tout couple de réels (x, y) tel que a � x � y � b,

P([x � X � y]) =

∫ y

xf (t) dt =

∫ y

x

1

b − adt =

y − x

b − a.

La probabilité que X appartienne à l’intervalle [x, y] est proportionnelle à la longueur de l’intervalle.

Exercice 2.Soit X une variable aléatoire qui suit la loi uniforme sur [−1, 2]. Déterminer la fonction derépartition et une densité Y = X2.

Solution. On sait déjà que Y est une variable à densité. Comme X est à valeurs dans [−1, 2],Y est à valeurs dans [0, 4]. On en déduit que, pour tout réel y, FY (y) = 0 si y < 0 et FY (y) = 1si y > 4. Pour y ∈ [0, 4], on peut écrire

FY (y) = P([Y � y]) = P([|X| � √y]) = P([−√

y � X � √y]).

Une densité de X est nulle hors de [−1, 2] et vaut13

sur [−1, 2]. On en déduit, pour y ∈ [0, 1],

FY (y) =2√

y

3,

338

Page 346: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

car [−√y,√

y] ⊂ [−1, 2]. Pour y ∈ ]1, 4], on obtient

FY (y) = P([−1 � X � √y]) =

√y + 1

La fonction FY est continue sur R et dérivable sur R \ {0, 1, 4}. On obtient, en dérivant, unedensité g de Y définie par

g(y) =

⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩0 si x � 0 ou x > 4

13√

ysi x ∈ ]0, 1]

16√

ysi x ∈ ]1, 4].

Exercice 3.Soit X une variable aléatoire à densité admettant une fonction de répartition F strictementcroissante. Déterminer la loi de F(X).

Solution. Comme la fonction de répartition F est continue et strictement croissante, elle réaliseune bijection de R sur ] lim

x→−∞F(x), lim

x→+∞F(x)[ = ]0, 1[.

Ainsi, pour tout réel x, [F(X) � x] est l’événement impossible si x � 0, l’événement certainsi x � 1 et

[F(X) � x] = [X � F−1(x)] si x ∈ ]0, 1[ .

On en déduit que Y = F(X) est une variable aléatoire dont la fonction de répartition vaut 0sur R+, 1 sur [1, +∞[ et vérifie, pour x ∈ ]0, 1[,

FY (x) = P([X � F−1(x)]

)= F

(F−1(x)

)= x.

On reconnaît dans cette fonction de répartition, la fonction de répartition d’une variablesuivant une loi uniforme sur [0, 1]. Donc F(X) suit la loi uniforme sur [0, 1].

Théorème 14

Toute variable aléatoire réelle X suivant une loi uniforme sur [a, b] admet des momentsde tous ordres, donnés par les égalités

mn(X) =bn+1 − an+1

(n + 1) (b − a)·

PreuveEn effet

mn(X) =

∫ b

axn 1

b − adx =

bn+1 − an+1

(n + 1) (b − a)· ❑

Théorème 15

Toute variable aléatoire réelle X suivant une loi uniforme de paramètre [a, b] admet une

espérance mathématique égale àa + b

2et une variance égale à

(b − a)2

12·

339

Page 347: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

PreuveLa formule précédente donne

E(X) = m1(X) =b2 − a2

2(b − a)=

b + a

2et m2(X) =

b3 − a3

3(b − a)=

b2 + ba + a2

3,

d’où l’on déduit

V (X) = m2(X) −(E(X))2

=b2 + ba + a2

3− b2 + 2ab + a2

4

=b2 − 2ab + a2

12=

(b − a)2

12·

4.2 Loi exponentielle

Définition 10

Soit l un réel strictement positif. On dit qu’une variable aléatoire réelle X suit la loiexponentielle de paramètre l si elle admet pour densité la fonction f nulle sur R

∗− et

définie, pour tout réel x � 0, par l’égalité

f (x) = l e−lx.

On noteX ↪→ E(l).

➤ Remarques• L’existence d’une telle loi est justifiée. En effet, la fonction f est positive et continue sauf en 0 et∫ +∞

−∞f (t) dt =

∫ +∞

0l e−lt dt =

[− e−lt

]+∞

0= 1.

• La fonction f est définie pour tout réel x par f = l e−lx1R+(x), où 1R+

est la fonction indicatrice de R+ définiepar 1R+

(x) = 1 si x ∈ R+ et 1R+(x) = 0 sinon.

Proposition 12

La densité f donnée dans la définition 10 d’une variable aléatoire réelle suivant la loi E(l)est strictement décroissante sur R+ ; son graphe admet l’axe des abscisses comme asymp-tote.La fonction de répartition d’une variable aléatoire suivant la loi E(l) est strictement crois-sante sur R+ ; son graphe admet la droite d’équation y = 1 comme asymptote.

PreuveEn effet, la dérivée de f , qui est la fonction x −→ −l2 e−lx est strictement négative sur R+.La dérivée de F qui est f est strictement positive sur R+. On a enfin lim

x→+∞f (x) = 0 et lim

x→+∞F(x) = 1. ❑

340

Page 348: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

1 2 3 4−1

0.5

1.0

−0.5Figure 10.4 Densité de la loi E(1)

1 2 3 4−1

0.5

1.0

−0.5

Figure 10.5 Fonction de répartition de la loi E(1)

Théorème 16

La fonction de répartition d’une variable aléatoire réelle suivant la loi exponentielle deparamètre l est nulle sur R− et vérifie pour x � 0,

F(x) = 1 − e−lx.

PreuveLa densité est nulle sur R− donc F(x) = 0 sur R− et pour x � 0,

F(x) =

∫ x

0le−lt dt =

[−e−lt

]x0

= 1 − e−lx. ❑

Corollaire 1

Si X suit la loi exponentielle de paramètre l, on a pour tout x � 0,

P([X > x]) = e−lx.

341

Page 349: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Théorème 17

Toute variable aléatoire réelle X suivant une loi exponentielle de paramètre l admet desmoments de tous ordres, donnés pour tout n ∈ N, par

mn(X) =n!ln

·

Pour n ∈ N, l’existence de mn(X) équivaut à la convergence de∫ +∞

0tnle−lt dt. Il

suffit de vérifier la relation de comparaison

tn e−lt =t→+∞

o(

e−lt2

),

car alors la convergence de l’intégrale résultera de celle de∫ +∞

0e−

lt2 dt, d’après le

théorème de comparaison des intégrales des fonctions positives.

Comme limt→+∞

tn e−lt

e−lt2

= limt→+∞

tn e−lt2 = 0, par croissances comparées d’une puissance

et d’une exponentielle, le résultat est établi.

Pour le calcul, on détermine une relation entre mn(X) et mn−1(X), pour n � 1. Pourx > 0, on obtient, en intégrant par parties,∫ x

0tnle−lt dt =

[−tne−lt

]x0 +

∫ x

0ntn−1e−lt dt = −xne−lx +

nl

∫ x

0tn−1le−lt dt.

Comme limx→+∞

xne−lx = 0, on en déduit en faisant tendre x vers +∞,

mn(X) =nl

mn−1(X).

En utilisant n fois cette relation, on obtient

mn(X) =nl· n − 1

l· · · 1

lm0(X) =

n!ln m0(X) =

n!ln ,

car m0(X) = 1.

Théorème 18

Toute variable aléatoire réelle X suivant une loi exponentielle de paramètre l admet une

espérance égale à1l

et une variance égale à1l2

·

342

Page 350: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

PreuveD’après la formule précédente, E(X) = m1(X) =

1

let

V (X) = m2(X) −(E(X))2

=2

l2− 1

l2=

1

l2· ❑

Définition 11

On dit qu’une variable aléatoire réelle X d’un espace probabilisé (V, T , P) est sansmémoire si elle est positive ou nulle et si, pour tout couple (x, y) de réels positifs ounuls, on dispose de l’égalité

P([X > x + y]) = P([X > x]) P([X > y]).

➤ RemarqueCette définition équivaut, si P([X > x]) > 0, à l’égalité

P[X>x]([X > x + y]) = P([X > y]).

La probabilité que X prenne une valeur supérieure à x +y sachant qu’elle est supérieure à x, donc qu’elle s’accroisseau moins de y est égale à la probabilité qu’elle prenne une valeur supérieure à y. Si on pense à X comme à unedurée, on peut dire que X ne tient pas compte du passé.

Proposition 13

Toute variable aléatoire réelle suivant une loi exponentielle est sans mémoire.

PreuveEn effet, elle est positive ou nulle, et pour x � 0, P([X > x]) = e−lx . Elle vérifie les conditions de la définitionpuisque e−l(x+y) = e−lx e−ly . ❑

Nous allons démontrer réciproquement qu’une variable sans mémoire est une variablecertaine nulle ou bien suit une loi exponentielle.

Lemme

Soit p une fonction de R+ dans [0, 1], dont la restriction à R∗+ n’est pas la fonction nulle,

et vérifiant l’égalité p(x + y) = p(x) p(y) pour tout couple (x, y) de réels positifs ou nuls.Il existe alors un réel a ∈ ]0, 1] tel que, pour tout x � 0, on ait

p(x) = ax.

PreuveDe l’hypothèse, on déduit, pour tout n ∈ N∗ et tout réel x � 0 l’égalité p(nx) =

(p(x))n. On le montre par

récurrence sur n. C’est en effet évident pour n = 1 et si p(nx) =(p(x))n, on obtient

p((n + 1)x

)= p(nx + x) = p(nx)p(x) =

(p(x))n

p(x) =(p(x))n+1

.

343

Page 351: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Soit a = p(1) ∈ [0, 1]. On a p(n) = p(1)n = an pour tout n ∈ N∗. Si m et n sont deux entiers naturels non

nuls et r =n

m, il vient

p(r)m = p(mr) = p(n) = an = (ar )m

d’où p(r) = ar , puisque p(r) et ar sont deux réels positifs. On dispose donc de l’égalité p(r) = ar pour toutnombre rationnel strictement positif r.Comme p est à valeurs dans [0, 1], l’inégalité p(x + y) = p(x)p(y) � p(x) est vérifiée pour tous réels positifs xet y donc p décroît.Pour tout réel x > 0, on peut trouver deux suites de rationnels strictement positifs, l’une croissante (rn) et l’autredécroissante (sn), convergeant toutes deux vers x. Pour tout entier n, on déduit de rn � x � sn, par décroissancede p, p(sn) � p(x) � p(rn), c’est-à-dire

asn � p(x) � asn .

Le suites (rn) et (sn) convergent vers x, donc par composition des limites, (arn ) et (asn ) convergent vers ax et parpassage à la limite dans l’égalité précédente, on obtient ax � p(x) � ax et donc p(x) = ax .Si a est nul, la fonction p est nulle sur R∗

+ , ce qui est contraire à l’hypothèse. Ainsi on a a ∈ ]0, 1]. Puisque p

n’est pas nulle sur R∗+ , il existe un réel t > 0 tel que p(t) > 0. De l’égalité p(t) p(0) = p(t + 0) = p(t), on tire

p(0) = 1 = a0. Finalement, on obtient, pour tout x � 0,

p(x) = ax. ❑

Théorème 19

Soit X une variable aléatoire positive ou nulle qui n’est pas la variable certaine nulle. AlorsX est sans mémoire, si et seulement si, elle est une variable aléatoire à densité qui suit uneloi exponentielle.

PreuveNous avons plus haut qu’une variable à densité qui suit une loi exponentielle est sans mémoire.

Supposons réciproquement que, pour tout couple (x, y) de réels positifs ou nuls, soit vérifiée la condition

P([X > x + Y ]) = P([X > x])P([X > y]).

Posons, pour tout x � 0, p(x) = P([X > x]) ∈ [0, 1]. La fonction p est à valeurs dans [0, 1] et vérifie pour toutcouple (x, y) de réels positifs ou nuls,

p(x + y) = p(x)p(y).

Si p est nulle surR∗+ , on a F(x) = 1 surR∗

+ , et même surR+ par continuité à droite de F, et F(x) = P([X � x]) = 0sur R∗

− : X est la variable certaine nulle.

Écartons ce cas ; on est donc dans les hypothèses du lemme et p vérifie la relation p(x) = ax pour tout x � 0,où a = p(1) ∈ ]0, 1].

Si a était égale à 1, il en résulterait F(x) = 1 − p(x) = 0 pour tout x � 0, ce qui contredirait l’égalité lim+∞

F = 1.

Donc a ∈ ]0, 1[ et l’on peut poser a = e−l avec l = − ln(a) > 0. Comme X est à valeurs dans R+, on obtientF(x) = 0 pour x < 0 et F(x) = 1 − p(x) = 1 − ax = 1 − e−lx , pour x > 0, ce qui définit effectivement une loiexponentielle de paramètre l. ❑

➤ Remarques• Si l’on met à part la loi certaine nulle, la loi exponentielle est donc caractérisée par l’absence de mémoire.

• La loi exponentielle intervient dans des problèmes de fiabilité (durée de vie de matériel, durée de survie). Unexemple concret est le suivant. Soit T la durée de vie d’un appareil dont on peut supposer qu’il fonctionne à peuprès sans usure et qui ne tombe donc en panne que pour des raisons externes. Lorsqu’il a fonctionné jusqu’àl’instant t � 0, tout se passe comme s’il était neuf. On a donc, pour u � 0, P[T>t](T > t + u) = P(T > u) : lavariable T est sans mémoire.

344

Page 352: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

4.3 Loi normale de Laplace-Gauss

Le dernier exemple de loi à densité est le plus complexe, mais le plus important surle plan théorique à cause du théorème de la limite centrée qui sera exposé dans lechapitre sur les convergences en calcul des probabilités. C’est Laplace qui commençaà étudier cette loi, mais c’est Gauss qui en fit une étude rigoureuse et complète.

Loi normale centrée réduiteNous admettrons le résultat suivant :

Théorème 20 ∫ +∞

−∞exp

(− t2

2

)dt =

√2p.

Définition 12

On dit qu’une variable aléatoire réelle X suit la loi normale centrée réduite si elleadmet pour densité la fonction f définie pour tout réel x par l’égalité

f (x) =1√2p

exp(− x2

2

).

On noteX ↪→ N (0, 1).

➤ RemarqueL’existence d’une telle loi est justifiée. En effet, la fonction f est positive et continue sur R et∫ +∞

−∞f (t) dt =

1√2p

∫ +∞

−∞exp(− t2

2

)dt = 1, d’après le résultat admis.

Propriétés de la fonction f

La fonction f est paire, donc le graphe de f est symétrique par rapport à l’axe desordonnées ; celui des abscisses est une asymptote du graphe de f . Le maximum de

f vaut f (0) =1√2p

≈ 0, 3989. Les dérivées successives de exp(− x2

2

)étant

−x exp(− x2

2

)et (x2 − 1) exp

(− x2

2

), on voit que ce graphe admet deux points

d’inflexion aux points d’abscisse 1 et −1 et d’ordonnée1√2pe

≈ 0, 2420 (ce nombre

est aussi la valeur absolue des pentes des tangentes d’inflexion, qui coupent donc l’axedes abscisses aux points d’abscisse 2 et −2).

345

Page 353: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

1 2 3−1−2−3

0.5

Figure 10.6 Densité de la loi normale centrée réduite

On note F la fonction de répartition d’une variable aléatoire réelle suivant une loinormale centrée réduite.

Proposition 14

La fonction de répartition F de la variable normale centrée réduite vérifie les propriétéssuivantes :

• pour tout réel x, F(x) =1√2p

∫ x

−∞exp

(− t2

2

)dt ;

• pour tout réel x, F(−x) = 1 − F(x) ; F(0) =12

;

• pour tout x � 0, P(|X| � x) = 2F(x) − 1 et P(|X| � x) = 2(1 − F(x)

).

PreuveLa première propriété résulte de la définition d’une variable à densité, les autres de la parité de la densité. On a,pour tout réel x,

F(−x) =1√2p

∫ −x

−∞exp

(− t2

2

)dt.

En faisant le changement de variable t = −u, on obtient

F(−x) =1√2p

∫ x

+∞exp

(−u2

2

)(−du)

=1√2p

∫ +∞

xexp

(−u2

2

)du

= P([X � x]) = 1 − F(x).

En particulier F(0) = 1 − F(0), donc F(0) =1

Pour x � 0,P(|X| � x) = P([−x � X � x]) = F(x) − F(−x) = 2F(x) − 1,

d’après la relation précédente.

Enfin, P([|X| � x

])= 1 − P

([|X| � x

])= 1 − 2F(x) + 1 = 2

(1 − F(x)

). ❑

346

Page 354: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

La fonction F est strictement croissante sur R. Son graphe admet les droites d’équation

y = 0 et y = 1 comme asymptotes. Il est symétrique par rapport au point(

0,12

).

Cela résulte de l’égalité12

(F(x) + F(−x)) =12

.

1 2 3−1−2−3

0.5

1.0

Figure 10.7 Fonction de répartition de la loi normale centrée réduite

Théorème 21

Toute variable aléatoire réelle X suivant une loi normale centrée réduite admet desmoments de tout ordre, donnés pour tout entier naturel n par

m2n(X) = 0 et m2n+1(X) =(2n)!2n n!

·

Preuve

• Pour l’existence du moment d’ordre n, il suffit de démontrer la convergence de∫ +∞

0tn exp

(− t2

2

)dt,

puisque la densité est paire. On a, pour t�1, tn exp(−t2

2

)� tn exp

(− t

2

)et tn exp

(− t

2

)� exp

(− t

3

)pour t assez grand. En effet, lim

t→+∞

tn exp(− t

2

)exp(− t

3

) = limn→+∞

tn

exp(

t6

) = 0 par croissance comparée d’une

puissance et d’une exponentielle, donc cette fonction est inférieure ou égale à 1 pour t assez grand.

De la convergence de∫ +∞

0exp(− t

3

)dt, on déduit la convergence de

∫ +∞

0tn exp

(− t2

2

)dt, par le

théorème de comparaison des intégrales des fonctions positives.

• La densité f de la loi normale centrée réduite étant paire, la fonction t −→ t2n+1f (t) est impaire, pour toutentier naturel n, donc son intégrale sur R est nulle. On a donc m2n+1(X) = 0.Pour m2n, on raisonne par récurrence. Pour n � 1 La fonction t −→ t2nf (t) étant paire, on a

m2n(X) =2√2p

∫ +∞

0t2n exp

(− t2

2

)dt.

347

Page 355: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

On note que la fonction t −→ exp(− t2

2

)a pour dérivée t −→ −t exp

(− t2

2

). Pour x > 0, on obtient

donc en intégrant par parties,∫ x

0t2n exp

(− t2

2

)dt =

∫ x

0(−t2n−1)

d

dtexp(− t2

2

)dt

=

[−t2n−1 exp

(− t2

2

)]x

0

+∫ x

0(2n − 1)t2n−2 exp

(− t2

2

)dt

= −x2n−1 exp(− x2

2

)+ (2n − 1)

∫ x

0t2n−2 exp

(− t2

2

)dt.

Comme limx→+∞

x2n−1 exp(− x2

2

)= 0, on obtient, en faisant tendre x vers +∞,

∫ +∞

0t2n exp

(− t2

2

)dt = (2n − 1)

∫ +∞

0exp(− t2

2

)dt

et doncm2n(X) = (2n − 1)m2n−2(X) = (2n − 1)m2(n−1)(X).

En réitérant cette relation de récurrence, on obtient

m2n(X) = (2n − 1)(2n − 3) · · · 3 · 1m0(X).

Comme m0(X) = 1, on obtient, en rajoutant des termes pairs au numérateur et au dénominateur

m2n(X) =(2n)(2n − 1)(2n − 2) · · · 3 · 2 · 1

(2n)(2(n − 1))(2 · 2)(2)=

(2n)!

2n n!·

Théorème 22

Toute variable aléatoire réelle X suivant une loi normale centrée réduite admet une espé-rance nulle et une variance égale à 1.

PreuveD’après le théorème précédent, X admet une espérance et une variance et

E(X) = m1(X) = 0

V (X) = m2(X) −(E(X))2

= m2(X) =2!

2= 1. ❑

➤ RemarqueIl est assez rassurant de constater que E(X) = 0 et V (X) = 1 : la variable X est centrée et réduite.

Loi normale généraleRappelons (cf. théorème 3 page 322) que si Y est une variable aléatoire réelle admet-tant une densité g et X = sY + m, avec s > 0, alors X est une variable aléatoire

admettant pour densité la fonction f définie par f (x) =1s

g(x − m

s

).

Supposons que Y suit une loi normale centrée réduite. Alors X admet pour densité la

f définie par f (x) =1

s√

2pexp

(− (x − m)2

2s2

).

348

Page 356: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Les lois usuelles

Définition 13

Soit m un réel et s un réel strictement positif. On dit qu’une variable aléatoire réelle Xsuit la loi normale de paramètre (m, s2) si elle admet pour densité la fonction f définiepour tout réel x par l’égalité

f (x) =1

s√

2pexp

(− (x − m)2

2s2

).

On noteX ↪→ N (m, s2).

➤ RemarqueCertains auteurs utilisent (m, s) comme paramètre.

Proposition 15

La variable aléatoire réelle X suit la loi normale de paramètre (m, s2) si, et seulement si,

la variable Y =X − m

ssuit la loi normale centrée réduite.

PreuveSi Y suit la loi normale centrée réduite, la variable X = sY + m suit la loi normale de paramètre (m, s2). C’estainsi que nous avons introduit cette loi.

Réciproquement, si X suit la loi normale de paramètre (m, s2), la variable Y =X − m

sadmet pour densité,

d’après le théorème 3, la fonction g définie par

g(y) = sf (sy + m) =1√2p

exp(− x2

2

),

donc Y suit la loi normale centrée réduite. ❑

➤ RemarqueOn peut donc écrire

X ↪→ N (m, s2) ⇐⇒ 1

s(X − m) ↪→ N (0, 1),

Y ↪→ N (0, 1) ⇐⇒ m + sY ↪→ N (m, s2).

Théorème 23

Toute variable aléatoire réelle suivant la loi normale de paramètre (m, s2) admet uneespérance mathématique égale à m et une variance égale à s2.

PreuveCela résulte du fait que si X suit la loi normale de paramètre (m, s2), on peut écrire X = sY + m, où Y suit laloi normale centrée réduite. Comme Y possède une espérance et une variance, il en est de même de X et

E(X) = sE(Y ) + m = m et V (X) = s2V (Y ) = s2.❑

349

Page 357: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Corollaire 2

Si la variable X suit la loi normale de paramètre (m, s2), la variable centrée réduite associéeà X suit la loi normale centrée réduite.

PreuveOn a X∗ =

X − m

set cette variable suit la loi normale centrée réduite d’après la proposition 15. ❑

Théorème 24

La fonction de répartition d’une variable aléatoire réelle suivant une loi normale de para-mètre (m, s2) vérifie, pour tout réel x, l’égalité

F(x) = P([X � x]) =1

s√

2p

∫ x

−∞exp

(− (t − m)2

2s2

)dt.

PreuveCela traduit la relation entre densité et fonction de répartition. ❑

1

1

Cf

12

3√2p

Figure 10.8 Densité de la loinormale de paramètre

(12 , 1

9

)1

0.5

1.0

12

Figure 10.9 Fonction de répartitionde la loi normale de paramètre

(12 , 1

9

)

Théorème 25

Toute variable aléatoire réelle suivant une loi normale de paramètre (m, s2) admet desmoments de tous ordres.

350

Page 358: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

PreuveSi X suit la loi normale de paramètre (m, s2), on peut écrire X = sY + m, où Y suit la loi normale centréeréduite. Pour tout entier n, on a

Xn = (sY + m)n =n∑

k=0

(n

k

)skYkmn−k.

Comme Y possède de moments de tous ordre, les variables Yk admettent une espérance et Xn qui est unecombinaison linéaire de variables à densité possédant un espérance possède une espérance. Donc X possèdeun moment d’ordre n pour tout entier naturel n. ❑

5. IndépendanceLa notion de variables indépendantes qui a été donnée dans le cadre des variablesdiscrètes peut se généraliser à des variables à densité. On obtient des propriétés trèssemblables.

5.1 Définitions

Définition 14

Deux variables aléatoires à densité, définies sur le même espace probabilisé (V, T , P) sontindépendantes si, pour tout couple (I, J) d’intervalles de R, on a

P([X ∈ I] ∩ [Y ∈ J]) = P([X ∈ I])P([Y ∈ J]).

Définition 15

Des variables aléatoires réelles à densité X1, X2, . . . , Xn sur le même espace probabilisé(V, T , P) sont dites mutuellement indépendantes (ou simplement indépendantes) si, pourtous intervalles I1, I2, . . . , In,

P

(n⋂

k=1

[Xk ∈ Ik]

)=

n∏k=1

P([Xk ∈ Ik]).

Nous admettrons qu’il suffit que la propriété soit vérifiée pour les intervalles de laforme ] −∞, x]. C’est ce qu’énonce la propriété suivante.

Proposition 16

Deux variables aléatoires à densité, définies sur le même espace probabilisé (V, T , P) sontindépendantes si, pour tout couple de réels (x, y), on a

P([X � x] ∩ [Y � y]) = P([X � x])P([Y � y]) = FX (x)FY (y).

351

Page 359: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

Des variables aléatoires réelles à densité X1, X2, . . . , Xn sur le même espace probabilisé(V, T , P) sont indépendantes si, et seulement si, pour tous réels x1, x2, . . . , xn,

P

(n⋂

k=1

[Xk � xk]

)=

n∏k=1

P([Xk � xk]) =n∏

k=1

FXk (xk),

où FXk est la fonction de répartition de Xk.

Exercice 4.Soit (X1, X2, . . . , Xn) une famille finie de variables aléatoires réelles à densité sur le mêmeespace probabilisé (V, T , P), mutuellement indépendantes, suivant la loi uniforme sur [0, 1],et S = max

k∈�1,n�(Xk), I = min

k∈�1,n�(Xk). Montrer que S et I sont des variables à densité dont on

déterminera l’espérance et la variance.

Solution.

• On a, pour tout x ∈ R et v ∈ V, S(v) � x si, et seulement si, Xk(v) � x, pour toutk ∈ �1, n�. On a donc

[S � x] = [X1 � x] ∩ [X2 � x] ∩ · · · ∩ [Xn � x].

Ainsi [S � x] est une intersection d’événements donc un événement et S est une variablealéatoire. Par indépendance des variables X1, . . . , Xn, on obtient

FS(x) = P([S � x]) =n∏

k=1

P([Xk � x]) =n∏

k=1

FXk (x) =(FX1 (x)

)n,

car les variables Xk suivent toutes la loi uniforme sur [0, 1]. Comme FX1 est continue surR et de classe C1 sur R \ {0, 1}, il en est de même de FS : la variable S est à densité. Onobtient

FS(x) =

⎧⎪⎨⎪⎩0 si x < 0xn si x ∈ [0, 1]1 si x > 1.

Une densité fS est donnée par

fS(x) = nxn−1 si x ∈ [0, 1] et fS(x) = 0 sinon.

La fonction fS est nulle en dehors de [0, 1] et continue sur ce segment, donc S possède desmoments de tout ordre. On trouve

E(S) =∫ +∞

−∞xfS(x) dx =

∫ 1

0nxn dx = n

[xn+1

n + 1

]1

0

=n

n + 1,

E(S2) =∫ +∞

−∞x2fS(x) dx =

∫ 1

0nxn+1 dx = n

[xn+2

n + 2

]1

0

=n

n + 2·

On en déduit

V (S) =n

n + 2−

( nn + 1

)2=

n(n + 1)2(n + 2)

·

352

Page 360: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

• Les calculs sont très semblables pour I . On passe par l’événement contraire

[I > x] = [X1 > x] ∩ [X2 > x] ∩ · · · ∩ [Xn > x].

On obtient, par indépendance des variables

FI (x) = 1 − P([I > x]) = 1 −n∏

k=1

P([Xk > x]) = 1 −n∏

k=1

(1 − FXk (x)

)= 1 − (1 − F1(x))n .

Cela montre que S est une variable à densité. On obtient

FI (x) =

⎧⎪⎨⎪⎩0 si x < 01 − (1 − x)n si x ∈ [0, 1]1 si x > 1.

Une densité fI est donnée par

fI (x) = n(1 − x)n−1 si x ∈ [0, 1] et fS(x) = 0 sinon.

La variable I possède des moments de tout ordre et on trouve, grâce au changement devariable t = 1 − x,

E(I) =∫ 1

0n(1 − x)n−1x dx = n

∫ 1

0tn−1(1 − t) dt

= n[

tn

n− tn+1

n + 1

]1

0

=1

n + 1,

E(I2) =∫ 1

0n(1 − x)n−1x2 dx = n

∫ 1

0tn−1(1 − t)2 dt

= n∫ 1

0

(tn−1 − 2tn + tn+1

)dt = n

[tn

n− 2tn+1

n + 1+

tn+2

n + 2

]1

0

=2

(n + 1)(n + 2)·

On en déduit

V (S) =2

(n + 1)(n + 2)−

(1

n + 1

)2

=n

(n + 1)2(n + 2)·

Les propriétés des variables indépendantes vues dans le cas des variables discrètes segénéralisent au cas des variables à densité.

Proposition 17

Si (X1, . . . , Xn) est une famille de variables aléatoires à densité mutuellement indépen-dantes de l’espace probabilisé (V, T , P), alors toute sous-famille est formée de variablesmutuellement indépendantes.

353

Page 361: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

PreuveComme la propriété d’indépendance ne dépend pas de l’ordre des variables aléatoires, il suffit de démontrerque, pour k ∈ [[1, n]], les variables X1,. . . ,Xk sont mutuellement indépendantes. Il suffit même de le démontrerpour X1, . . . , Xn−1 et de raisonner par récurrence descendante.Soit I1, . . . , In−1 des intervalles de R. On pose In = R. Comme X1, . . . , Xn−1, Xn sont indépendantes, on a

P

(n⋂

k=1

[Xk ∈ Ik]

)=

n∏k=1

P([Xk ∈ Ik]).

Comme In = R , l’événement [Xn ∈ In] est égal à V etn⋂

k=1

[Xk ∈ Ik] =

n−1⋂k=1

[Xk ∈ Ik]. On a donc

P

(n−1⋂k=1

[Xk ∈ Ik]

)=

n−1∏k=1

P([Xk ∈ Ik]),

ce qui montre l’indépendance mutuelle de X1, . . . , Xn−1. ❑

Nous admettrons les théorèmes suivants.

Théorème 26

Pour tout n-uplet (X1, X2, . . . , Xn) de variables aléatoires à densité mutuellement indé-pendantes de l’espace probabilisé (V, T , P) et tout n-uplet de fonction (g1, g2, . . . , gn) telque gk(Xk) soit une variable aléatoire à densité pour tout k, (g1(X1), g2(X2), . . . gn(Xn)) estun n-uplet de variables aléatoires à densité mutuellement indépendantes.

Théorème 27

Soit (X1, X2, . . . , Xn) un n-uplet de variables aléatoires à densité mutuellement indépen-dantes de l’espace probabilisé (V, T , P).Alors quel que soit l’entier p de �2, n−1� et les fonctions w de R

p dans R et c de Rn−p dans

R telles que w(X1, . . . , Xp) et c(Xp+1, . . . , Xn) soient des variables à densité, ces variablesaléatoires sont indépendantes.Plus généralement si n1, . . . , nk sont des entiers naturels non nuls tels que n1 + · · ·+nk = net si, pour tout i ∈ �1, k�, wi est une fonction de R

ni dans R, telle w1(X1, . . . , Xn1 ),w2(Xn1+1, . . . , Xn1+n2 ), . . . , wk(Xn1+···+nk−1+1, . . . , Xn) soient des variables à densité, ellessont mutuellement indépendantes.

Définition 16

Une suite (Xn) de variables aléatoires réelles à densité définies sur le même espace proba-bilisé (V, T , P) est dite formée de variables aléatoires indépendantes si toute sous-famillefinie est formée de variables aléatoires réelles indépendantes.

354

Page 362: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Indépendance

Tableau récapitulatif des lois continues classiques

NomEnsemble

des valeursDensité Espérance Variance

loi uniforme

X ↪→ U (�a, b�)�a, b� f (x) =

⎧⎨⎩

1b − a

si x ∈ [a, b]

0 si x /∈ [a, b]

a + b2

(b − a)2

12

loi de exponentielle

X ↪→ E(l)R+ f (x) =

{le−lx si x � 0

0 si x < 0

1l

1l2

loi normale centrée réduite

X ↪→ N (0, 1)R f (x) =

1√2p

e−x22 0 1

loi normale

X ↪→ N (m, s2)R f (x) =

1

s√

2pe−

(x−m)2

2s2 m s2

355

Page 363: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Soit X une variable aléatoire suivant la loi exponentielle E(l).

1. a. Déterminer la loi de la variable aléatoire Y =√

X .

b. Calculer l’espérance mathématique et la variance de Y .

2. a. Déterminer une densité de X2.

b. Déterminer une densité de X3.

2. 1. On considère la fonction f définie par f (x) =1

x√

2pe−

12 (ln x−1)2 si x > 0 et 0

sinon.a. Montrer que f est une densité de probabilité. Soit X une variable aléatoire de densité f .

Exprimer la fonction de répartition de X à l’aide de la fonction de répartition F d’uneloi normale centrée réduite.

b. Calculer E(X) et V (X).

2. On considère une variable aléatoire Y qui suit une loi normale de paramètre (m, s2). Onpose Z = eY .a. Déterminer une densité de Z (on dit que Z suit la loi Log-normale de paramètre

(m, s2)).

b. Calculer E(Z) et V (Z).

3. Loi Bêta

1. a. Soit a et b deux réels.

Pour quelles valeurs de a et b l’intégrale B(a, b) =∫ 1

0ta−1(1−t)b−1 dt est-elle conver-

gente ?

b. On suppose a > 0 et b > 0.Montrer que bB(a + 1, b) = aB(a, b + 1) et que B(a, b + 1) + B(a + 1, b) = B(a, b).

En déduire que B(a + 1, b) =a

a + bB(a, b).

2. Soit f la fonction définie par f (x) =

⎧⎨⎩0 si x /∈]0, 1[1

B(a, b)xa−1(1 − x)b−1 si x ∈ ]0, 1[ .

a. Montrer que f est la densité de probabilité. Soit X une variable aléatoire de densité f .

b. Calculer E(X) et V (X) après avoir démontré leur existence.

4. 1. Soient a et a des nombres réels strictement positifs et f la fonction définie sur R

par

f (x) =

⎧⎨⎩0 si x < a

aaa

xa+1si x � a.

a. Vérifier que f est bien une densité de probabilité. Soit X une variable aléatoire réelle dedensité f . On dit une loi de Pareto de paramètre (a, a).

b. Déterminer la fonction de répartition F de X.

356

Page 364: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

c. Déterminer les valeurs de a pour lesquelles X admet une espérance et la calculer dansce cas.

d. Déterminer les valeurs de a pour lesquelles X admet une variance et la calculer dans cecas.

2. a. Soient une variable aléatoire Y qui suit une loi exponentielle de paramètre l > 0, b unréel strictement positif et g un réel strictement supérieur à 1.Déterminer la loi de la variable Z = bgY .

b. Étudier la réciproque de la propriété ainsi démontrée.

c. Soient Z une variable aléatoire qui suit une loi de Pareto de paramètre (a, a) et c un réelstrictement positif. Déterminer la loi de Zc .

5. La variable X suit une loi normale centrée réduite. On note F sa fonction de répar-tition et on pose, pour tout x ∈ R, Q(x) = 1 − F(x). La fonction Q s’appelle la queue de larépartition associée à X.

1. En utilisant deux intégrations par parties montrer que, pour tout x > 0,

(i) Q(x) � 1

x√

2pe−

x2

2 ;

(ii) Q(x) � 1

x√

2pe−

x2

2 − 1

x3√

2pe−

x2

2 .

2. En déduire un équivalent de Q(x) lorsque x tend vers +∞.

3. Soit (a, ´) ∈ ]0, +∞[2. On note p(a, ´) =QX (a + ´)

QX (a)· Déterminer lim

a→+∞p(a, ´) pour

´ > 0 fixé.

4. En déduire que, pour ´ > 0,

P([a < X < a + ´]) ∼a→+∞

P([a < X]).

6. Soient X et Y deux variables aléatoires de densité respective fX et fY , indépendantes.On pose Z = sup (X, Y ) et T = inf (X, Y ).

1. Exprimer les fonctions de répartition de Z et T en fonction des fonctions de répartitionFX et FY de X et Y .

2. Déterminer une densité fZ de Z et une densité fT de T en fonction de fX , fY , FX et FY .

3. On suppose que X et Y suivent la loi uniforme sur [0, 1]. Préciser fZ et fT .Déterminer l’espérance et la variance de Z et de T .

4. On suppose que X et Y suivent des lois exponentielles de paramètre l et m respectivement.Quelle est la loi (classique) suivie par T ? En déduire l’espérance et la variance de T .Préciser fZ . En déduire l’espérance et la variance de Z.

7. Des voyageurs arrivent de façon aléatoire dans la salle des pas perdus de la gare deLyon. On suppose que la variable aléatoire Nt égale au nombre de ces voyageurs arrivant entreles instants 0 et t (t > 0) suit une loi de Poisson de paramètre at (a > 0).

1. On note X1 l’instant d’arrivée du premier voyageur.Déterminer P([X1 > t]) pour tout réel t. En déduire la loi de X1, puis E(X1) et V (X1).

357

Page 365: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

2. On note Xn l’instant d’arrivée du n-ième voyageur (n � 1).

a. Montrer que, pour t > 0, FXn (t) = 1 − e−atn−1∑k=0

(at)k

k!. En déduire une densité de Xn.

b. Calculer E(Xn) et V (Xn).

8. Une machine tombe en panne à un instant aléatoire T , variable aléatoire positivede fonction de répartition F, possédant une densité f , nulle sur R−, continue et strictementpositive sur ]0, +∞[. Si à l’instant t > 0 la panne ne s’est pas produite, le risque de panne

immédiate se mesure par le taux de panne h(t) = limu→0+

P([t < T � t + u]/[T > t])u

. On dit

qu’il y a usure lorsque h croît et rodage lorsqu’elle décroît.

1. Déterminer h en fonction de F et f .

2. On pose L(t) =∫ t

0h(u) du. Montrer que pour tout t > 0,

P([T > t]) = e−L(t).Calculer E(L(T )).

3. Montrer que le taux de panne de T est constant si et seulement si T suit une loi exponen-tielle.

4. Pour deux composants montés en parallèle, on prend comme instant de panne sup(T1, T2),où T1 et T2 sont deux variables aléatoires indépendantes de loi exponentielle de paramètresl1 et l2. Montrer qu’il y a d’abord usure, puis rodage si l1 �= l2 et usure seulementpour l1 = l2.

5. On suppose qu’il y a usure sur ]0, +∞[. Montrer que, pour tout (s, t) ∈ (R∗+)2,

P([T > s + t]) � P([T > s])P([T > t]).

9. Soit X une variable aléatoire à densité, positive. On note f une densité de X, Fsa fonction de répartition. On suppose que f est nulle sur ] − ∞, 0], strictement positive etcontinue sur ]0, +∞].

1. Montrer que l’équation F(x) =12

admet une solution unique sur ]0, +∞[. Cet unique

réel, que l’on notera m, sera appelé médiane de X.

2. Dans cette question, on suppose que X suit une loi exponentielle de paramètre l.Montrer que X satisfait aux hypothèses du début de l’exercice et déterminer la médiane de X.

3. On suppose dans cette question que la densité de X est donnée sur ]0, +∞[ par f (t) = t e−t

et sur ] −∞, 0] par f (t) = 0.a. Vérifier que f satisfait aux hypothèses du début de l’exercice.

b. Déterminer la fonction de répartition F de X.

c. Montrer, sans chercher à la calculer, que la médiane m de X vérifie 1 � m � 2 (ondonne 6 < e2 < 9)).On se propose, dans la suite de cette question, de calculer une valeur approchée de m.On introduit pour cela la fonction g définie sur [1, 2] par g(x) = ln(2x + 2), fonction quiva permettre de construire une suite convergeant vers m.

d. Montrer que g(m) = m.

358

Page 366: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

e. Montrer que si x appartient à [1, 2] alors g(x) appartient à [1, 2] et

|g(x) − m| � 12|x − m|.

f. On considère la suite (un) définie par u0 = 1 et pour n > 0 par un = g(un−1).

Montrer que |un − m| �(

12

)n

.

g. Déterminer un entier n tel que un soit une valeur approchée de m à 10−2 près.

4. On revient maintenant au cas général et on suppose que la variable X admet une espéranceE(X) et une variance V (X). On note toujours m la médiane de X.a. Montrer qu’on a les inégalités

V (X) �m∫

0

(t − E(X))2 f (t) dt et V (X) �+∞∫m

(t − E(X))2 f (t) dt.

b. En distinguant les cas m � E(X) et m > E(X), montrer que

|m − E(X)| �√

2V (X).

10. Pour tout nombre réel x, on note �x� la partie entière de x, c’est-à-dire l’uniquenombre entier n vérifiant : n � x < n + 1.Soit X une variable aléatoire réelle, positive, de fonction de répartition F et de densité f . Onnote Y = [X] la partie entière de X et Z = X − Y .

1. a. Montrer que Y est une variable aléatoire discrète dont on déterminera la loi.

b. Montrer que E(X) existe ⇐⇒ E(Y ) existe.

2. On suppose que X suit la loi exponentielle de paramètre l (l > 0).a. Préciser la loi de Y . Donner l’espérance et la variance de Y .

b. Montrer que

∀x ∈ [0, 1[, P([Z � x]) =1 − e−lx

1 − e−l·

En déduire une densité f de Z.

c. Déterminer l’espérance E(Z) de Z. Ce résultat était-il prévisible ?

11. Soit n un entier naturel non nul et fn la fonction définie par

fn(x) =

⎧⎨⎩1

(n − 1)!2nxn−1 e−

x2 si x > 0

0 si x � 0.

1. On pose In =∫ +∞

0xn−1 e−

x2 dx.

a. Montrer la convergence de In pour tout n ∈ N∗.Montrer que, pour n � 2, In = 2(n − 1)In−1. En déduire In.

b. Montrer que fn est une densité d’une variable aléatoire.

2. On considère une variable aléatoire réelle Xn de densité fn. Déterminer l’espérance et lavariance de Xn.

359

Page 367: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires réelles à densité

3. a. Montrer que, pour tout l > 0 et tout entier n non nul, on a

el =n−1∑k=0

lk

k!+

∫ l

0el−t tn−1

(n − 1)!dt.

b. Soient Y une variable aléatoire suivant la loi de Poisson de paramètre l. Montrer queP([Xn > 2l]) = P([Y < n]).

12. Soit n ∈ N∗ et (Xk)k∈[[1,n]] une famille de n variables aléatoires à densité, mutuelle-ment indépendantes, de même loi. On note F leur fonction de répartition et f leur densité.Soit Y1, . . . , Yn les variables obtenues en réordonnant X1, . . . , Xn par ordre croissant (Y1 estle minimum des Xk et Yn le maximum des Xk).Pour tout réel x, on note Nx le nombre de variables Xk vérifiant Xk � x.

1. Donner la loi de Nx.

2. Comparer, pour k ∈ [[1, n]] et tout réel x, les événements [Nx � k] et [Yk � x].

3. Déterminer la fonction de répartition Fk de Yk (1 � k � n). Montrer que Yk possède unedensité fk définie par

fk(x) = n(

n − 1k − 1

)(F(x))k−1(1 − F(x))n−kf (x).

4. On suppose que les variables Xk suivent une loi uniforme sur [0, 1]. Déterminer, pour1 � k � n, l’espérance et la variance de Yk (on pourra utiliser les résultats de l’exercice 3.).

13. Dans cet exercice, on utilisera la table de la loi normale centrée réduite.Une machine fabrique des pièces cylindriques dont le diamètre exprimé en millimètres est unevariable aléatoire D suivant la loi normale N (m, s) où m est réglable et s = 0, 4.

1. On suppose m = 8. Calculer

P([D < 7, 5]), P([D > 9]), P([7, 5 < D < 8, 5]).

2. Toute pièce est vérifiée à l’aide de deux calibres, l’un de 7, 5 mm, l’autre de 8, 5 mm ; elleest acceptée si elle passe dans le grand et non dans le petit. Déterminer la probabilité pourqu’une pièce soit refusée sia. m = 7, 5 ;

b. m = 8 ;

c. m = 8, 5.

3. Dans le cas où m = 8, déterminer la probabilité pour qu’une pièce soit acceptée sachantqu’elle passe dans le grand calibre.

4. Lorsque la pièce est trop petite elle est rejetée ; la perte est alors de 10 euros. Si elle esttrop grande on peut la rectifier ; le coût de l’opération est égal à 3 euros et on admet que lapièce est acceptée après rectification.Soit Z la variable aléatoire égale à la perte subie : Z prend les valeurs 10, 3 ou 0 suivantque la pièce est trop petite, trop grande ou bonne.Calculer l’espérance mathématique de Z en fonction de m. Déterminer m pour que E(Z)soit minimale (réglage optimum de la machine).

360

Page 368: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

11Couples de variablesaléatoires admettant

une densité

1. Lois associées à un couple de variables aléatoires à densité

1.1 Notion de couple à densité

Définition 1

Soit (V, T ) un espace probabilisable. On appelle couple de variables aléatoires touteapplication

Z :{

V −→ R2

v −→(X(v), Y (v)

),

où X et Y sont des variables aléatoires sur (V, T ).On note Z = (X, Y ) ce couple de variables.

Définition 2

Si (X, Y ) est un couple de variables aléatoires, la fonction F : R2 −→ R définie par

F(x, y) = P ([X � x] ∩ [Y � y])

est appelée fonction de répartition du couple (X, Y ) ou fonction de répartition conjointede X et Y .

Définition 3

Soit (X, Y ) un couple de variables aléatoires réelles définies sur un espace probabilisé(V, T , P), de fonction de répartition F. On dit que (X, Y ) possède une densité s’il existeune fonction f : R

2 −→ R vérifiant :

1. f positive ou nulle ;

2. l’intégrale double∫∫

R2

f (t, u) dt du converge et∫∫

R2

f (t, u) dt du = 1 ;

Page 369: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

telle que, pour tout réel (x, y) ∈ R2,

F(x, y) =∫∫

]−∞,x]×]−∞,y]f (t, u) dt du.

La fonction f est appelée une densité du couple (X, Y ) ou densité conjointe de X et Y .

➤ RemarqueNous nous placerons dans le cadre tracé dans le chapitre intégration, paragraphe 2.3. La fonction f sera doncsupposée continue sur un ensemble élémentaire éventuellement non borné et nulle en dehors de et ensembleélémentaire. On peut remarquer que dans ces conditions, pour tout réel y, sauf éventuellement un nombre fini,la fonction x −→ f (x, y) est continue sauf en un nombre fini de points. Il en est de même pour la fonctiony −→ f (x, y) pour tout réel x. L’ensemble des points où f n’est pas continue est d’aire nulle (on dit qu’un telensemble est négligeable et que f est continue presque partout).

Comme dans le cas d’une variable aléatoire réelle à densité, il n’y a pas unicité de la fonction f . Deux densités d’uncouple (X, Y ) de variables aléatoires coïncident sauf sur un ensemble d’aire nulle.

Nous admettrons que les propriétés de f énoncées dans la définition caractérisent unedensité.

Théorème 1 (admis)

Soit f une fonction de R2 dans R positive ou nulle, telle que

∫∫R2

f (t, u) dt du = 1. Alors

il existe un espace probabilisé (V, T , P) et un couple de variables aléatoire (X, Y ), définisur cet espace probabilisé, dont f est une densité.

Exemples

1. Soit f la fonction est définie par f (x, y) =

{1 si (x, y) ∈ [0, 1]2

0 sinon.La fonction f est posi-

tive, nulle en dehors de [0, 1]2 et continue sur ce produit de segment. On en déduit la

convergence de∫∫

R2

f (t, u) dt du et

∫∫R2

f (t, u) dt du =∫∫

[0,1]2dt du =

∫ 1

0dt

∫ 1

0du = 1.

Donc f est la densité d’un couple (X, Y ) de variables aléatoires. On dit que (X, Y ) suit laloi uniforme sur [0, 1]2.

2. Soit f la fonction est définie par f (x, y) =

{c si x2 + y2 � 10 sinon.

Déterminons c pour que f

soit la densité d’un couple. Soit D = {(x, y) ∈ R2, x2 + y2 � 1}, le disque de centre (0, 0)

et de rayon 1. La fonction f est positive, nulle en dehors de D et continue sur D. Comme

D est un domaine élémentaire, on en déduit la convergence de∫∫

R2

f (t, u) dt du et

∫∫R2

f (t, u) dt du =∫∫

Dc dt du = cp,

362

Page 370: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires à densité

car∫∫

Ddt du est égal à l’aire de D. Donc f est la densité d’un couple (X, Y ) de variables

aléatoires si, et seulement si, c =1p· On dit alors que (X, Y ) suit la loi uniforme sur le

disque D.

3. Plus généralement si D est un domaine élémentaire borné d’aire A(D) non nulle, la fonc-

tion f définie par f (x, y) =

{1

A(D) si (x, y) ∈ D

0 sinonest la densité d’un couple. On dit qu’un

tel couple suit la loi uniforme sur D.

4. Soit f la fonction définie sur R2 par f (x, y) = c exp(−x2 − 2xy− 3y2). Déterminons c pour

que f soit la densité d’un couple de variables aléatoires. La fonction est continue et positivesur R2. Pour tout y ∈ R, la fonction fy : x −→ f (x, y) est intégrable sur R. En effet, on afy(x) = c exp(−(x + y)2 − 2y2) = c exp(−2y2) exp(−(x + y)2) et x −→ exp(−(x + y)2) estintégrable sur R. On obtient∫ +∞

−∞f (x, y) dx = c exp(−2y2)

∫ +∞

−∞exp(−(x + y)2) dx

= c exp(−2y2)∫ +∞

−∞exp(−t2) dt = c exp(−2y2)

√p,

grâce au changement de variable t = x+y. La fonction y −→ c√

p exp(−2y2) est intégrablesur R et∫ +∞

−∞c√

p exp(−2y2) dy = c√

p

∫ +∞

−∞

exp(−u2)√2

du = c√

p

√p√2

= cp√2

,

par le changement de variable t√

2 = u.On en déduit que∫∫

R2

f (x, y) dx dy =∫ +∞

−∞

(∫ +∞

−∞f (x, y) dx

)dy = c

p√2

et f est une densité si, et seulement, si c =√

2p

·

Nous admettrons le théorème suivant qui permet de calculer une densité à partir dela fonction de répartition.

Proposition 1

Soit (X, Y ) un couple de variables aléatoires, de fonction de répartition conjointe F etpossédant une densité f . Si f est continue au voisinage de (x, y) (c’est-à-dire sur un bouleouverte de centre (x, y)), on a

f (x, y) =∂2F∂x∂y

(x, y) =∂2F∂y∂x

(x, y).

363

Page 371: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

➤ RemarqueContrairement au cas des variables aléatoires à densité, on ne peut pas énoncer de condition simple sur la fonctionde répartition conjointe pour qu’un couple de variable aléatoires soit à densité. Il nous faudra admettre, dans lesexercices, qu’on se trouve dans un «bon cas »et que la densité est donnée, où c’est possible, en dérivant deux foisla fonction de répartition conjointe.

Examinons la fonction de répartition d’un couple suivant la loi uniforme sur le carré[0, 1]2, dont la densité a été introduite page 362.

ExempleLes variables aléatoires X et Y sont à valeurs dans [0, 1] donc F(x, y) = P([X � x]∩[Y � y]) = 0si x < 0 ou y < 0.

Si (x, y] ∈ [0, 1]2, on a

F(x, y) =∫∫

[0,1]×[0,1]f (u, v) du dv =

∫∫[0,x]×[0,y]

du dv =∫ x

0du

∫ y

0dv = xy.

Si x ∈ [0, 1] et y > 1, [Y � y] = V, F(x, y) = P([X � x]) = x ; le cas x > 1 et y ∈ [0, 1] estidentique.

Enfin si x > 1 et y > 1, alors F(x, y) = 1.

On vérifie que F est de classe C2 sur R2 privé des côtés du carré [0, 1]2 et que sur cet ensemble,

f =∂2F∂x∂y

·

1.2 Probabilité de [(X, Y) ∈ D], où D est un domaine de R2

Le résultats suivants sont analogues aux théorèmes démontrés pour les variables àdensité sur R dans le paragraphe 1.3 du chapitre 10. Nous les admettrons.

Théorème 2

Soit (X, Y ) un couple de variables aléatoires de fonction de répartition conjointe F, pos-sédant une densité f . Pour tous intervalles I et J de R, on a

P([X ∈ I] ∩ [Y ∈ J]) = P([(X, Y ) ∈ I × J]) =∫∫

I×Jf (x, y) dx dy.

On obtient en particulier, si I = [a, b] et J = [c, d], où a, b, c, d sont des réels tels que a < bet c < d,

P([a � X � b] ∩ [c � Y � d] =∫ b

a

(∫ d

cf (x, y) dy

)dx.

Plus généralement si D est un domaine élémentaire, éventuellement non borné, on obtient

P([(X, Y ) ∈ D]) =∫∫

Df (x, y) dx dy.

364

Page 372: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires à densité

ExempleSoit (X, Y ) un couple de variables aléatoires suivant la loi uniforme sur le carré [0, 1]2.

Calculer P([

12 � X + Y � 3

2

])et P([X2 + Y 2 � 1]).

Pour tout domaine élémentaire D inclus dans [0, 1]2, on a

P([(X, Y ) ∈ D]) =∫∫

Ddx dy = A(D),

aire de D car la densité du couple (X, Y ) sur D est égale à 1. Si D n’est pas inclus dans [0, 1],on écrit

P([(X, Y ) ∈ D]) = P([(X, Y ) ∈ D ∩ [0, 1]2]) = A(D ∩ [0, 1]2).

On obtient P([

12 � X + Y � 3

2

])= A(D1), où D1 =

{(x, y) ∈ [0, 1]2,

12

� x + y � 32

}est

le complémentaire dans [0, 1]2 de deux triangles rectangles dont les cotés de l’angle droit ont

pour longueur12· On en déduit

A(D1) = 1 − 2 · 18

=34·

1

1

On obtient de même, P([

X2 + Y 2 � 1])

= A([0, 1]2 \ D2), où D2 est le disque de centre(0, 0) et de rayon 1. De l’aire du carré, il faut donc soustraire l’aire d’un quart de disque. Onen déduit

P([

X2 + Y 2 � 1])

= 1 − p

1

1

365

Page 373: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

1.3 Densités marginales et conditionnelles

Densités marginales

Théorème 3

Si (X, Y ) est un couple de variables aléatoires possédant une densité f , les variables X et Ysont des variables aléatoires à densité, dont une densité est définie respectivement par

∀x ∈ R, fX (x) =∫ +∞

−∞f (x, y) dy et ∀y ∈ R, fY (y) =

∫ +∞

−∞f (x, y) dx.

Preuve On a, pour tout réel x,

FX (x) = P([X � x] ∩ [Y ∈ R]) =

∫∫Dx

f (t, y) dt dy,

où Dx = {(t, y) ∈ R2, t � x}. On en déduit

FX (x) =

∫ x

−∞

(∫ +∞

−∞f (t, y) dy

)dt.

Nous admettrons que les hypothèses faites sur f implique que la fonction fX : t −→∫ +∞

−∞f (t, y) dy est continue

sauf en un nombre fini de points. Par ailleurs, fX est positive, comme intégrale d’une fonction positive. Pardéfinition d’une variable à densité, la fonction fX est une densité de X.

On démontre de la même façon que Y est une variable à densité. ❑

Définition 4

Si (X, Y ) est un couple de variables aléatoires possédant une densité, les densités desvariables X et Y sont appelées les densités marginales du couple.

➤ Remarques• Il résulte des propriétés des variables à densité que pour tout couple (x, y) de réels, on a

P([X = x]) = P([Y = y]) = 0. Il en résulte que si I est un intervalle quelconque de R, on a

P([X = x] ∩ [Y ∈ I]) = P([X ∈ I] ∩ [Y = y]) = 0.

• En général, la connaissance des densités de X et Y est insuffisante pour déterminer la densité du couple (X, Y ).

Déterminons les densités marginales des couples des exemples 1, 2 et 4 de la page 362.Exemples

1. Soit f définie par f (x, y) =

{1 si (x, y) ∈ [0, 1]2

0 sinon..

Si x /∈ [0, 1], on a f (x, y) = 0 pour tout réel y et donc fX (x) = 0. Si x ∈ [0, 1], on obtientf (x, y) = 1 si y ∈ [0, 1] et f (x, y) = 0 sinon. On en déduit que fX (x) =

∫ 10 dy = 1. On

reconnaît la densité de la loi uniforme sur [0, 1]. Ainsi X ↪→ U ([0, 1]). On démontre qu’ilen est de même de Y .

366

Page 374: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires à densité

2. Soit f la fonction est définie par f (x, y) =

⎧⎨⎩1p

si x2 + y2 � 1

0 sinon.

Si |x| > 1, on a x2 + y2 > 1 et donc f (x, y) = 0 pour tout réel y. On en déduit fX (x) = 0.

Si |x| � 1, on a f (x, y) =1p

si x2 + y2 � 1, i.e. −√

1 − x2 � y �√

1 − x2 et f (x, y) = 0

sinon. On en déduit que

fX (x) =∫ √

1−x2

−√

1−x2

1p

dy =2p

√1 − x2.

3. Soit f la fonction définie sur R2 par f (x, y) =

√2

pexp(−x2 − 2xy − 3y2).

Pour tout réel x, on a

fX (x) =√

2p

∫ +∞

−∞exp(−x2 − 2xy − 3y2) dy

=√

2p

∫ +∞

−∞exp

(−3

(y +

13

x)2

− 23

x2

)dy

=√

2p

exp

(−2

3x2

)∫ ∞

−∞exp(−u2)

1√3

du,

avec le changement de variable u =√

3(

y +13

x)

. On en déduit

fX (x) =√

2p

exp

(−2

3x2

)1√3

√p =

√2

3pexp

(−2

3x2

)=

1√3p2

exp

(−x2

32

).

La variable X suit la loi normale de paramètre(

0,34

).

On procède de même pour Y . On trouve, pour tout réel y,

fY (x) =√

2p

∫ +∞

−∞exp(−x2 − 2xy − 3y2) dx =

√2

p

∫ +∞

−∞exp

(−(x + y)2) − 2y2

)dx

=√

2p

exp(−2y2)∫ ∞

−∞exp(−u2) du,

avec le changement de variable u = x + y. On en déduit

fY (x) =√

2p

exp(−2y2)√

p =

√2p

exp(−2y2) =1√

p2

exp(−y2

12

).

La variable Y suit la loi normale de paramètre(

0,14

).

367

Page 375: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

Densités conditionnellesPour définir les lois conditionnelles à [X = x] ou [Y = y], il n’est pas questionde diviser par P([X = x]) ou P([Y = y]), car ces probabilités sont nulles pour desvariables à densité.

Théorème 4

Soit (X, Y ) un couple de variables aléatoires définies sur un espace probabilisé (V, T , P),possédant une densité f , fX et fY les densités marginales. Pour tout réel x tel que fX (x) > 0,la fonction fY/[X=x] définie par

fY/[X=x](y) =f (x, y)fY (x)

est la densité d’une variable aléatoire, appelée densité de Y conditionnelle à [X = x]. Ondit aussi que c’est la densité de la loi de Y conditionnelle à [X = x].De même, pour tout réel y tel que fY (y) > 0, la fonction fX/[Y=y] définie par

fX/[Y=y](x) =f (x, y)fY (y)

est la densité d’une variable aléatoire, appelée densité de Y conditionnelle à [Y = y]. Ondit aussi que c’est la densité de la loi de X conditionnelle à [Y = y].

PreuveIl résulte de propriétés imposées à f que la fonction y −→ f (x, y) est continue sauf en un nombre fini de points.Il en est donc de même pour fY/[X=x]. Il est clair que fY/[X=x] est positive. Enfin, on a d’après le théorème 4,

∫ +∞

−∞fY/[X=x](y) dy =

1

fX (x)

∫ +∞

−∞f (x, y) dy =

fX (x)

fX (x)= 1.

Ainsi, fY/[X=x] est une densité de probabilité. La démonstration est la même pour fX/[Y=y]. ❑

Reprenons les couples des exemples 1, 2 et 4 de la page 362.

Exemples

1. Soit f définie par f (x, y) =

{1 si (x, y) ∈ [0, 1]2

0 sinon..

On a fX (x) = 1 si x ∈ [0, 1] et fX (x) = 0 sinon. On obtient, pour x ∈ [0, 1],

fY/[X=x] =f (x, y)fX (x)

=

{1 si x ∈ [0, 1]0 sinon.

La loi de Y conditionnelle à [X = x] est pour tout x ∈ [0, 1], la loi uniforme sur [0, 1].On obtient le même résultat pour la loi de X conditionnelle à [Y = y].

368

Page 376: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Lois associées à un couple de variables aléatoires à densité

2. Soit f la fonction est définie par f (x, y) =

⎧⎨⎩1p

si x2 + y2 � 1

0 sinon.

On a fX (x) = 0 si |x| > 1 et fX (x) =2p

√1 − x2 si |x| � 1. Soit x ∈ [−1, 1]. On a pour

tout réel y,

fY/[X=x](y) =f (x, yfX (x)

=

{1

2√

1−x2 si |y| �√

1 − x2

0 sinon.

La loi de Y conditionnelle à [X = x] est la loi uniforme sur [−√

1 − x2,√

1 − x2]. Onobtient le même résultat pour la loi de X conditionnelle à [Y = y].

3. Soit f la fonction définie sur R2 par f (x, y) =

√2

pexp(−x2 − 2xy − 3y2).

Pour tout réel x, fX (x) =√

23p

exp(−2

3x2

). On en déduit que, pour tout (x, y) ∈ R

2,

fY/[X=x](y) =f (x, y)fX (x)

=

√3p

exp(−1

3x2 − 2xy − 3y2

)=

√3p

exp

(−3

(y +

13

x)2

).

La loi de Y conditionnelle à [X = x] est la loi normale de paramètre(−x

3,

16

).

On a de même, pour tout réel y, fY (x) =√

2p

exp(−2y2), d’où l’on déduit, pour tout

(x, y) ∈ R2,

fX/[Y=y](x) =f (x, y)fY (y)

=1√p

exp(−x2 − 2xy − y2) =1√p

exp(−(x + y)2).

La loi de X conditionnelle à [Y = y] est la loi normale de paramètre(−y,

12

).

1.4 Densité d’un couple de variables indépendantes

Nous avons défini l’indépendance d’un couple de variables à densité dans le chapitre10.Nous admettrons le théorème suivant :

Théorème 5

Soit X et Y deux variables aléatoires à densité définies sur le même espace probabilisé, defonction de répartition conjointe F. Il y a équivalence entre :

(i) les variables X et Y sont indépendantes ;

(ii) pour tout (x, y) ∈ R2, F(x, y) = FX (x)FY (y) ;

(iii) la fonction (x, y) −→ fX (x)fY (y) est une densité du couple (X, Y ).

369

Page 377: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

➤ Remarques• L’équivalence entre (i) et (ii) a déjà été énoncée dans le cas de n variables indépendantes (cf page 351).

Si (ii) est réalisé, la fonction (x, y) −→ fX (x)fY (y) est continue sauf sur un ensemble d’aire nulle, positive et∫∫R2

fX (x)fY (y) dx dy =

∫ +∞

−∞fX (x) dx

∫ +∞

−∞fY (y) dy = 1 · 1 = 1.

De plus, on a pour tout (x, y) ∈ R2,

F(x, y) =

∫ x

−∞fX (t) dt

∫ y

−∞fY (u) du =

∫∫]−∞,x]×]−∞,y]

f (X (t)fY (u) dt du.

Donc la fonction (x, y) −→ fX (x)fY (y) est une densité du couple (X, Y ).

• L’équivalence entre (i) et (iii) affirme deux choses :1. Si X et Y sont deux variable aléatoires réelles à densité, indépendantes, le couple (X, Y ) est à densité, unedensité possible étant la fonction (x, y) −→ fX (x)fY (y).2. Si (X, Y ) est un couple à densité, de densité conjointe f , de densités marginales fX et fy , les variables X etY sont indépendantes si (x, y) −→ fX (x)fY (y) est aussi une densité de f , c’est-à-dire si f (x, y) = fX (x)fY (y) pourtout réel (x, y) sauf peut-être sur un ensemble d’aire nulle.Pour démontrer que les variables X et Y ne sont pas indépendantes, il faut démontrer donc que l’on af (x, y) = fX (x)fY (y) pour tout (x, y) dans un ensemble d’aire non nulle.

Examinons l’indépendance des couples des exemples 1, 2 et 4 de la page 362.

Exemples

1. Si (X, Y ) suit une loi uniforme sur [0, 1]2, X et Y suivent des lois uniformes sur [0, 1]. Ona, pour (x, y) ∈ [0, 1]2, f (x, y) = fx(x) = fy(y) = 1 et donc f (x, y) = fx(x)fy(y). Cela restevrai si (x, y) /∈ [0, 1]2, car alors f (x, y) = 0 et soit fX (x) = 0, soit fY (y) = 0. Les variables Xet Y ont donc indépendantes.

2. Si (X, Y ) suit une loi uniforme sur le disque D de centre (0, 0) et de rayon 1, on a, pour

tout (x, y) ∈ R2 tel que x2 + y2 � 1, f (x, y) =

1p· Si x2 + y2 � 1 alors |x| � 1 et

|y| � 1 donc fX (x) =2p

√1 − x2 et fY (y) =

2p

√1 − y2 et fX (x)fY (y) �= f (x, y) sauf sur un

ensemble d’aire nulle. Il faut en effet (1− x2)(1− y2) =p2

16, ce qui donne une réunion de

deux courbes incluses dans D. Les variables X et Y ne sont pas indépendantes.

3. Si la densité du couple (X, Y ) est définie par f (x, y) =√

2p

exp(−x2 + 2xy − 3y2) pour

tout (x, y) ∈ R2, alors on obtient fX (x) =

√2

3pexp

(−2

3x2

), fY (x) =

√2p

exp(−2y2) et

donc

fX (x)fY (y) =2

p√

3exp

(−2

3x2 − 2y2

).

Ainsi fX (x)fY (y) = f (x, y) si et seulement si exp(− 1

3 x2 + 2xy − y2)

=√

23

c’est-à-dire sur un ensemble d’aire nulle (il s’agit d’une courbe de R2 d’équation

−13

x2 + 2xy − y2 =12

ln23

). Les variables X et Y ne sont pas indépendantes.

370

Page 378: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

2. Variables aléatoires fonctions d’un couple de variablesà densité

Il s’agit d’étudier les variables aléatoires de la forme g(X, Y ), où (X, Y ) est un couplede variables aléatoires et g une fonction de deux variables. Nous commençons par lecas où g(X, Y ) = X + Y et les variables X et Y sont indépendantes.

2.1 Somme de variables indépendantes

Définition 5

Soit f et g deux densités de probabilité sur R. On appelle produit de convolution des fonctionsf et g la fonction h définie par

∀z ∈ R, h(z) =∫ ∞

−∞f (x)g(z − x) dx.

Nous admettrons le théorème suivant.

Théorème 6

Si X et Y sont deux variables aléatoires indépendantes de densité fX et fY , la sommeZ = X + Y est une variable à densité dont une densité est donnée par le produit deconvolution de fX et fY . On a donc, pour tout z ∈ R,

fZ(z) =∫ ∞

−∞fX (x)fY (z − x) dx.

Corollaire 1

Si X et Y sont deux variables aléatoires indépendantes à densité, positives ou nulles, alorsune densité de Z = X + Y est donnée sur R+ par

fZ(z) =∫ z

0fX (x)fY (z − x) dx

et est nulle sur R∗−.

PreuveLa variable Z est positive, donc on peut prendre fZ (x) = 0 si z < 0. Pour z � 0, on considère le produit deconvolution de fX et fY . Comme fX (x)fY (z− x) = 0 si x < 0 ou z− x < 0, c’est-à-dire x < 0 ou x > z l’intégraledonnant fZ (x) se réduit à

fz(x) =

∫ z

0fX (x)fY (z − x) dx. ❑

➤ RemarqueSi X1, X2, . . . , Xn sont des variables à densité mutuellement indépendantes, alors X1 + · · · + Xn est une variable àdensité. Pour le montrer, il suffit de raisonner par récurrence sur n et d’appliquer le théorème 6. En effet c’est clairpour n = 1. Si on suppose que la propriété est vraie au rang n et si X1, . . . , Xn, Xn+1 sont des variables à densitémutuellement indépendantes, la variable aléatoire X1 + · · ·+ Xn possède une densité par hypothèse de récurrence ;elle est indépendante de Xn+1 d’après le lemme des coalitions, donc X1 + · · · + Xn + Xn+1 est une variable à densitéd’après le théorème 6.

371

Page 379: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

Exemples1. Soit X et Y deux variables indépendantes, suivant la loi uniforme [0, 1]. Déterminer une

densité de Z = X + Y .Comme X et Y sont à valeurs dans [0, 1], la variable Z est à valeurs dans [0, 2] et fZ(z) = 0

si z /∈ [0, 2]. Si z ∈ [0, 2], on obtient fz(x) =∫ z

0fX (x)fY (z − x) dx, d’après le corollaire

précédent.

Si z � 1, on a fz(x) =∫ z

0fY (z − x) dx =

∫ z

0dx = z.

Si 1 < z � 2, on a fZ(x) =∫ 1

0fY (z − x) dx =

∫ 1

z−1dx = 2 − z, car fY (z − x) = 0 si

z − x > 1, i.e. x < z − 1.

2. Soit X et Y deux variables indépendantes, suivant des lois exponentielles de paramètresrespectifs l et m. Déterminer une densité de Z = X + Y .Comme X et Y sont à valeurs dans R+, la variable Z est à valeurs dans R+ et fZ(z) = 0 siz < 0. Si z � 0, on obtient, d’après le corollaire précédent,

fz(x) =∫ z

0fX (x)fY (z − x) dx = lm

∫ z

0e−lxe−m(z−x) dx

= lme−mz∫ z

0e(−l+m)x dx.

Si l = m, on obtient

fZ(z) = l2e−lz∫ z

0dx = l2ze−lz.

Si l �= m, il vient

fZ(z) = lme−mz e(−l+m)z − 1m − l

=lm

m − l(e−lz − e−mz).

Stabilité de la loi normale

Théorème 7

Soit X et Y deux variables aléatoires définies sur le même espace probabilisé, indé-pendantes, suivant des lois normales de paramètres respectifs (m, s2) et (m′, s′2). AlorsZ = X + Y suit la loi normale de paramètre (m + m′, s2 + s′2).

Preuve La densité fZ de Z est définie pour tout z ∈ R par

fZ (z) =

∫ +∞

−∞fX (x)fY (z − x) dx =

1

2pss′

∫ +∞

−∞exp

(− (x − m)2

2s2− (z − x − m′)2

2s′2

)dx.

En développant et en regroupant les termes, on obtient fZ (z) =1

2pss′

∫ +∞

−∞exp(−ax2 − 2bx − c) dx, où

a =s2 + s′2

2s2s′2 , b =−ms′2 − (z − m′)s2

2s2s′2 et c =m2s′2 + (z − m′)2s2

2s2s′2 . On met le trinôme sous forme

372

Page 380: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

canonique : ax2 + 2bx + c = a

(x2 + 2

b

ax

)+ c = a

(x +

b

a

)2

+ac − b2

a· En faisant le changement de variable

t =√

a

(x +

b

a

)dans l’intégrale, on obtient

fZ (z) =1

2pss′√aexp

(b2 − ac

a

)∫ +∞

−∞e−t2

dt =1

2√

pss′√aexp

(b2 − ac

a

),

car∫ +∞

−∞e−t2

dt =√

p (intégrale de Gauss).

On simplifie

b2 − ac =(ms′2 + (z − m′)s2)2 − (s2 + s′2)(m2s′2 + (z − m′)2s2)

4s4s′4

=s2s′2(2m(z − m′) − m2 − (z − m′)2)

4s4s′4 = − (z − m − m′)2

4s2s′2

et doncb2 − ac

a=

−(z − m − m′)2

2(s2 + s′2).

On obtient enfin

fZ (z) =1√

2p(s2 + s′2)exp

(−(z − m − m′)2

2(s2 + s′2)

).

On reconnaît la densité de la loi N (m + m′, s2s′2). ❑

Corollaire 2

Soit X1, X2, . . . , Xn des variables aléatoires indépendantes telles que, pour tout k ∈ [[1, n]]

Xk suive la loi normale de paramètres (mk, s2k). Alors la variable

n∑k=1

Xk suit la loi normale

de paramètre

(n∑

k=1

mk,n∑

k+1

s2k

).

PreuveOn le montre par récurrence sur n ∈ N∗. Le cas n = 1 est évident et le cas n = 2 résulte du théorème.

Supposons la propriété démontrée au rang n et considérons n + 1 variables aléatoires indépendantesX1, X2, . . . , Xn+1 telles que, pour tout k ∈ [[1, n + 1]], Xk suive la loi normale de paramètres (mk, s2

k ). Alors les

variables X1, X2, . . . , Xn sont encore indépendantes et par hypothèse de récurrence, la variable aléatoiren∑

k=1

Xk

suit la loi normale de paramètre

(n∑

k=1

mk,n∑

k+1

s2k

). D’après le lemme des coalitions, les variables

n∑k=1

Xk et

Xn+1 sont indépendantes. On en déduit, en appliquant le théorème que leur sommen+1∑k=1

Xk suit la loi normale

de paramètre

(n∑

k=1

mk + mn+1,n∑

k=1

s2k + s2

n+1

)=

(n+1∑k=1

mk,n+1∑k=1

s2k

). ❑

En utilisant le théorème 6 ou le lemme 1, on peut déterminer la densité de g(X, Y ),où les variables X et Y sont indépendantes, dans des cas simples, par exempleg(X, Y ) = X − Y ou g(X, Y ) = XY .

373

Page 381: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

Exercice 1.Soit X et Y deux variables aléatoires indépendantes, suivant toutes deux la loi exponentiellede paramètre l. On pose Z = |X − Y |.1. Déterminer une densité de −Y .

2. Déterminer une densité de X − Y .

3. Vérifier que Z suit une loi exponentielle.

Solution.

1. On a, pour tout réel y,

F−Y (y) = P([−Y � y]) = P([Y � −y]) = 1 − P([Y < −y]) = 1 − FY (−y).

Si y � 0, alors −y � 0, donc FY (−y) = 0 et F−Y (y) = 1.Si y < 0, alors −y > 0 donc F−Y (y) = P([Y � −y]) = ely.La fonction F−Y est continue sur R et de classe C1 sur R

∗ donc −Y possède une densitéobtenue en dérivant FY . On obtient

f−Y (y) =

{lelx si y < 00 si y � 0.

2. Les variables X et Y sont indépendantes. Il en est de même de X et −Y . On obtient doncune densité de U = X −Y = X + (−Y ) en utilisant le théorème 6. On obtient, pour toutu ∈ R,

fU (u) =∫ +∞

−∞fX (x)f−Y (u − x) dx =

∫ +∞

0le−lxf−Y (u − x) dx,

car fX est nulle sur R−. La fonction f−Y est nulle sur R+. Ainsi f−Y (u − x) �= 0 équivaut àu − x < 0, i.e. x > u.Si u < 0, cette condition est réalisée pour tout x � 0 et on trouve

fU (u) =∫ +∞

0le−lxlel(u−x) dx = elu

∫ +∞

0l2e−2lx dx = elu

[−l

2e−2lx

]+∞

0

=l

2elu.

Si u � 0, on obtient

fU (u) = elu∫ +∞

ul2e−2lx dx = elu

[−l

2e−2lx

]+∞

u

=l

2e−lu.

3. La variable aléatoire Z est à valeurs dans R+ donc FZ(z) = 0 si z ∈ R∗−. Si z � 0, on a

Fz(z) = P([Z � z]) = P([−z � U � z]) =∫ z

−zfU (u) du

=∫ 0

−z

l

2elu du +

∫ z

0

l

2e−lu du =

12

[elu

]0

−z+

12

[−e−lu

]z

0

=12

(1 − e−lz − e−lz + 1

)= 1 − e−lz.

La variable Z suit donc la loi exponentielle de paramètre l.

374

Page 382: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

Exercice 2.Soit (Xn) une suite de variables indépendantes, suivant toutes la loi uniforme sur [0, 1]. Onsouhaite déterminer, pour tout n ∈ N∗, la loi de Yn = X1X2, . . . , Xn. On pose Zn = ln Yn.

1. Déterminer une densité de Z1 = ln X1.

2. Soit fn une densité de Zn.a. Démontrer que fn est nulle sur R

∗+ et que, pour n � 2 et z � 0, on a

fn(z) =∫ 0

zfn−1(x)ez−x dx.

b. En déduire fn(z) pour z � 0 (on remarquera que z −→ −e−zfn(z) est une primitivez −→ e−zfn−1(z).

3. Déterminer une densité de Yn.

Solution.

1. On a P([X1 > 0]) = 1 − P([X1 = 0]) = 1, puisque X1 est une variable à densité. Ainsi Z1

est définie presque sûrement. La variable X1 étant à valeurs dans [0, 1], la variable Z1 estnégative. On obtient donc FZ1 (z) = 1 − P([Z1 > z]) = 1 si z > 0 et pour z � 0,

FZ1 (z) = P([ln X1 � z]) = P([X1 � ez]) = ez

car ez ∈ [0, 1]. La fonction FZ1 est continue sur R (il suffit de le vérifier en 0) et de classeC1 sur R∗ donc Z1 possède une densité f qui s’obtient en dérivant FZ1 . On obtient

f (z) =

{ez si z � 00 si z > 0.

2. a. On note que Zn = ln X1 + ln X2 + · · · + ln Xn. Pour tout k, la variable ln Xk suit lamême loi que ln X1. On en déduit que ln Xk est à valeurs dans R−. La variable aléatoireZn est négative, car c’est une somme de variables aléatoires négatives. Les variables Xk

étant indépendantes, il en est de même des ln Xk. On en déduit que Zn est une variableà densité (cf la remarque qui suit le corollaire 1). D’après ce qui précède, une densitéfn de Zn est nulle sur R∗

+.Pour n � 2, on a Zn = Zn−1 + ln Xn. Les variables aléatoires Zn−1 et ln Xn sontindépendantes, d’après le lemme des coalitions, donc fn est obtenu par un produit de

convolution de fn−1 et f . On obtient, pour z � 0, fn(z) =∫ +∞

−∞fn−1(x)f (z − x) dx.

Comme fn−1(x) = 0 si x > 0 et f (z − x) = 0 si z − x > 0, i.e. x < z, on obtient

fn(z) =∫ 0

zfn−1(x)f (z − x) dx =

∫ 0

zfn−1(x)ez−x dx.

b. On peut écrire, pour tout z � 0,

fn(z)e−z =∫ 0

ze−zfn−1(x)ez−x dx =

∫ 0

zfn−1(x)e−x dx = −

∫ z

0fn−1(x)e−x dx.

375

Page 383: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

En notant gn la fonction z −→ fn(z)e−z, on voit que gn est l’opposé de la primitive quis’annule en 0 de gn−1. Comme Z1 = ln X1, on a f1(z) = ez et donc g1(z) = 1 pour tout

z � 0. On en déduit que g2(z) = −z, g3(z) =z2

2et par une récurrence immédiate

gn(z) =(−1)n−1zn−1

(n − 1)!pour n ∈ N∗ et z � 0. En effet, si c’est vrai au rang n − 1, on a

pour z � 0,

gn(z) = −∫ z

0gn−1(x) dx = −

∫ z

0

(−1)n−2xn−2

(n − 2)!=

(−1)n−1zn−1

(n − 1)!·

On en déduit que, pour tout z � 0,

fn(z) = ezgn(z) =(−1)n−1zn−1ez

(n − 1)!=

(−z)n−1ez

(n − 1)!·

3. La variable Yn = exp(Zn) est encore une variable à densité (cf exemple 1 page 324, chapitreVariables à densité). Notons hn une densité de Yn. La variable Zn est à valeurs dans R−donc Yn est à valeurs dans ]0, 1]. On a donc FYn (y) = 0 si y � 0 et FYn (y) = 1 si x > 1.Enfin si y ∈ ]0, 1], on obtient

FYn (y) = P([Yn � y]) = P([Zn � ln y]) =∫ ln y

−∞fn(z) dz.

On obtient hn en dérivant la fonction de répartition. On a donc hn(y) = 0 si y � 0 ouy > 1 et pour y ∈ ]0, 1],

hn(y) =1y

fn(ln y) =1y· (− ln y)n−1y

(n − 1)!=

(− ln y)n−1

(n − 1)!·

2.2 Cas général

Soit (X, Y ) un couple de variables aléatoires possédant une densité f . Si Z = g(X, Y )et si on n’est pas dans le cas de la somme de deux variables aléatoires indépendantes, onpeut chercher la fonction de répartition de Z en essayant de trouver pour tout z ∈ R,un ensemble élémentaire Dz tel que [Z � z] = [g(X, Y ) � z] = [(X, Y ) ∈ Dz]. Cecipermettra de calculer FZ(z) = P([Z � z]) pour tout z ∈ R à l’aide de f . Si FZ est declasse C1 sauf en un nombre fini de points, on en déduira une densité de Z.

Exemples

1. Reprenons pour commencer le couple (X, Y ) dont une densité est définie par

f (x, y) =√

2p

exp(−x2 − 2xy − 3y2)

et déterminons la loi de Z = X + Y . On ne peut pas utiliser le produit de convolution,car on a démontré que les variables X et Y ne sont pas indépendantes.

376

Page 384: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

Pour tout z ∈ R, on pose Dz = {(x, y) ∈ R2, x + y � z} = {(x, y) ∈ R

2, x � z − y}.On a alors

P([Z � z]) = P([(X, Y ) ∈ Dz]) =∫∫

Dz

f (x, y) dx dy

=∫ +∞

−∞

(∫ z−y

−∞

√2

pexp(−x2 − 2xy − 3y2) dx

)dy

=√

2p

∫ +∞

−∞

(∫ z−y

−∞exp(−(x + y)2 − 2y2) dx

)dy.

En faisant le changement de variable t = x + y, on obtient∫ z−y

−∞exp(−(x + y)2 − 2y2) dx = e−2y2

∫ z

−∞e−t2 dt

puis

P([Z � z]) =√

2p

∫ +∞

−∞e−2y2

dy∫ z

−∞e−t2 dt =

√1p

∫ z

−∞e−t2 dt,

car∫ +∞

−∞e−2y2

dy =1√2

∫ +∞

−∞e−u2

du =√

p

2· On en déduit que Z suit la loi normale

de paramètre(

0,12

).

2. Soit a > 0, X et Y deux variables indépendantes, suivant une loi uniforme sur [0, a]. On

pose U = inf(X, Y ) et V = sup(X, Y ). Déterminer la loi de T =UV·

On a P([V = 0]) = 0 donc il y a un sens à parler deUV· Le couple (X, Y ) suit la loi

uniforme sur [0, a]2. Sa densité f vaut donc1a2

sur [0, a]2 et 0 ailleurs.

La variable aléatoire T est à valeur dans [0, 1] (car 0 � U � V ), donc FT (t) = 0 si t < 0et FT (t) = 1 si t > 1. Soit t ∈ [0, 1]. On a

P([T � t] ∩ [Y � X]) = P([

YX

� t])

= P([Y � tX]),

car[

YX

� t]⊂ [Y � X]. On en déduit que

P([T � t] ∩ [Y � X]) = P([(X, Y ) ∈ Dt]) =A(Dt)

a2,

où Dt = {(x, y) ∈ [0, a]2, y � tx} est l’intérieur d’un triangle.

a

Dt

377

Page 385: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

On trouve A(Dt) =12

a · (at) et

P([T � t] ∩ [Y � X]) =t2·

On trouve de même P([T � t] ∩ [Y � X]) =A(D′

t )a2

, où D′t = {(x, y) ∈ [0, a]2, x � ty}

est de même aire que Dt.

a

D′t

Comme P([X = Y ]) = 0, on obtient

FT (t) = P([T � t]) = P([T � t] ∩ [Y � X]) + P([T � t] ∩ [X � Y ]) = t

et T suit la loi uniforme sur [0, 1].

3. Soit (X, Y ) un couple de variables aléatoires suivant la loi uniforme sur le disque de centre

(0, 0) et de rayon 1. Une densité du couple est définie par f (x, y) =

⎧⎨⎩1p

si x2 + y2 � 1

0 sinon.

Déterminer la loi de Z =√

X2 + Y 2.La variable Z est à valeur dans [0, 1], donc FZ(z) = 0 si z < 0 et FZ(z) = 1 si z > 1. Soitz ∈ [0, 1]. On a

FZ(z) = P([Z � z]) = P([X2 + Y 2 � z2]) =∫∫

Dz

1p

dx dy,

où Dz = {(x, y) ∈ R2, x2 + y2 � z2} est le disque de centre (0, 0) et de rayon z. Onobtient

FZ(z) =A(Dz)

p=

pz2

p= z2.

La fonction FZ est continue et de classe C1 sur R \ {0, 1}. Elle possède une densité définiepar

fZ(z) =

{2z si z ∈ [0, 1]0 sinon.

On peut noter que Z2 suit la loi uniforme sur [0, 1]. En effet Z2 est à valeurs dans [0, 1],et pour t ∈ [0, 1],

P([Z2 � t]) = P([Z �√

t]) = t.

On peut utiliser la même méthode pour déterminer la loi d’un couple de variablesaléatoires, toutes deux fonctions de X et Y .

378

Page 386: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

Exercice 3.Soit X et Y deux variables indépendantes, toutes deux de loi normale centrée réduite. On

pose R =√

X2 + Y 2 et Q = ArctanYX·

1. Déterminer la fonction de répartition de R.

2. Déterminer la fonction de répartition de Q.

3. Les variables R et Q sont-elles indépendantes ?

On utilisera les coordonnées polaires.

Solution. Puisque les variables X et Y sont indépendantes, une densité du couple (X, Y ) est

donnée par f (x, y) =1

2pe−

x2+y2

2 (produit d’une densité de X par une densité de Y ).

1. La variable R est à valeurs dans R+ donc si r < 0 on a FR(r) = 0.

Si r � 0, on obtient FR(r) =∫∫

Dr

f (x, y) dx dy, où Dr = {(x, y) ∈ R2, x2 + y2 � r2}. On

passe en coordonnées polaires. On les note (r, a) avec r � 0 et a ∈[−p

2,

3p

2

](on fait

ce choix en liaison avec la fonction Arctan). On obtient f (x, y) =1

2pe−

r2

2 et Dr est défini

par r � r et a quelconque. On en déduit

FR(r) =1

2p

∫∫[− p

2 , 3p2 ]×[0,r]

e−r2

2 r dr da =1

2p

∫ 3 p2

− p2

da

∫ r

0e−

r2

2 r dr

=1

2p2p

[−e−

r2

2

]r

0

= 1 − e−r2

2 .

2. L’événement [X = 0] est de probabilité nulle donc Q est définie presque sûrement. La

variable Q est à valeurs dans]−p

2,

p

2

[. On a donc FQ(u) = 0 si u � −p

2et FQ(u) = 1

si u � p

2.

Soit u ∈]−p

2,

p

2

[. On obtient

FQ(u) =∫∫

Du

f (x, y) dx dy, où Du = {(x, y) ∈ R2, Arctan

yx

� u}.

De nouveau, on passe en coordonnées polaires. On trouve Arctanyx

= Arctan tan a. Si

a ∈[−p

2,

p

2

[, on a Arctan tan a = a et il faut a � u, c’est-à-dire a ∈

[−p

2, u

].

Si a ∈[

p

2,

3p

2

], on a Arctan tan a = a − p et il faut a − p � u, c’est-à-dire

a ∈[p

2, p + u

]. Finalement, Du est défini en coordonnées polaires par

a ∈ Iu =[−p

2, u

]∪

[p

2, p + u

]et r quelconque.

379

Page 387: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

On en déduit

FQ(u) =1

2p

∫∫Iu×R+

e−r2

2 r dr da =1

2p

∫Iu

da

∫ +∞

0e−

r2

2 r dr

=1

2p· 2

(u +

p

2

)[−e−

r2

2

]+∞

0

=1p

(u +

p

2

).

La variable Q suit la loi uniforme sur[−p

2,

p

2

].

3. Soit F la fonction de répartition du couple (R, Q).

Si r < 0 ou u � −p

2, on a F(r, u) = P([R � r] ∩ [Q � u]) = 0.

Si r � 0 et u � p

2, on a F(r, u) = P([R � r] ∩ [Q � u]) = P([R � r]) = FR(r).

Enfin si r � 0 et u ∈[−p

2,

p

2

], on a

F(r, u) =∫∫

Cr,u

f (x, y) dx dy, où Cr,u = {(x, y) ∈ R2, x2 + y2 � r2 et Arctan

yx

� u}.

En utilisant les résultats et les notations précédents, on voit que C(r,u) est défini en coor-données polaires par r ∈ [0, r] et a ∈ Iu. On obtient

F(r, u) =1

2p

∫∫[0,r]×Iu

e−r2

2 r dr da =1

2p

∫Iu

da

∫ r

0e−

r2

2 r dr

=1

2p· 2

(u +

p

2

)[−e−

r2

2

]r

0

=1p

(u +

p

2

)1 − e−

r2

2 = FR(r)FQ(u).

Dans tous les cas, on a F(r, u) = FR(r)FQ(u), donc les variables aléatoires R et Q sontindépendantes.

On peut aussi à partir de la fonction de répartition conjointe, déterminer la densitéconjointe du couple obtenu.

Exercice 4.Un couple de variables aléatoires (X, Y ) admet une densité conjointe f telle que

f (x, y) =

{xe−x−y si x � 0 et y � 00 sinon.

On pose U = min(X, Y ) et V = max(X, Y )

1. Montrer que (U, V ) est à valeurs dans A = {(u, v) ∈ (R+)2, u � v}.

2. Déterminer la fonction de répartition conjointe F de U et V . En déduire que (U, V )admet une densité g telle que

g(u, v) =

{(u + v)eu+v si (u, v) ∈ A0 si (u, v) /∈ A.

On admettra que g s’obtient en dérivant F par rapport à u et à v.

3. En déduire des densités de U et V .

380

Page 388: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Variables aléatoires fonctions d’un couple de variables à densité

Solution. La fonction f est bien une densité : elle est positive et continue saufsur R+ × {0} ∪ {0} × R+, ensemble d’aire nulle et on vérifie facilement que∫∫

R2

f (x, y) dx dy = 1. En effet cette intégrale est égale à∫ +∞

0xe−x dx

∫ +∞

0e−y dy et∫ +∞

0xe−x dx =

∫ +∞

0e−y dy = 1,

car les fonctions x −→ xe−x et y −→ e−y ont pour primitive x −→ −(x+1)e−x et y −→ −e−y,fonctions qui toutes deux ont pour limite 0 en +∞ et −1 en 0.

1. Les variables X et Y sont à valeurs dans R+. En effet, si x < 0, on a, pour tout réel y,f (x, y) = 0 et donc

FX (x) =∫ +∞

−∞f (x, y) dy = 0,

donc X possède une densité nulle sur R∗−. Il en est de même pour Y .

On en déduit que U et V sont positives. D’autre part, il est clair que U � V , donc (U, V )est à valeurs dans A.

2. Si u < 0 ou v < 0, on a F(u, v) = P([U � u] ∩ [V � v]) = 0.Soit (u, v) ∈ (R+)2. Si v < u, on a, puisque U � V ,

[U � u] ∩ [V � v] = [V � v] = [X � v] ∩ [Y � v]

et

F(u, v) =∫ v

0xe−x dx

∫ v

0e−y dy =

[−(x + 1)e−x

]v

0

[−e−y

]v

0= (1 − (v + 1)e−v)(1 − e−v).

Si enfin (u, v) ∈ A, on écrit

[U � u] ∩ [V � v] = [V � v] \ [U > u] ∩ [V � v]

et on remarque que

[V � v] ∩ [U > u] = [u < X � v] ∩ [u < Y � v].

On en déduitF(u, v) = P([V � v]) − P([u < X � v] ∩ [u < Y � v]).

Le premier terme a été calculé précédemment. Le second vaut∫ v

uxe−x dx

∫ v

ue−y dy =

[−(x + 1)e−v]v

u

[−e−y]v

u= ((u + 1)e−u − (v + 1)e−v)(e−u − e−v).

On a finalement

F(u, v) = (1 − (v + 1)e−v)(1 − e−v) − ((u + 1)e−u − (v + 1)e−v)(e−u − e−v)

= 1 − (v + 2)e−v − (u + 1)e−2u + (u + v + 2)e−u−v.

On remarque que la fonction F est de classe C2 sur R2 privé de

B = {(u, v) ∈ (R+)2, u = 0 ou v = 0 ou u = v},

réunion de trois demi-droites donc d’aire nulle.

381

Page 389: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

On obtient en dérivant par rapport à v, puis par rapport à u, g(u, v) = 0 si u < 0 ou v < 0et de même g(u, v) = 0 si u > 0, v > 0 et u > v car alors F(u, v) ne dépend que de v, doncon trouve 0 quand on dérive par rapport à v.Enfin, si u > 0, v > 0 et u < v, on obtient

∂F∂v

(u, v) = (v + 1)e−v − (u + v + 1)e−u−v

puis

g(u, v) =∂2F∂u∂v

(u, v) = (u + v)e−u−v.

Sur B ensemble d’aire nulle on peut fixer g arbitrairement, ce qui conduit à l’expressionde g donnée dans l’énoncé.

3. On sait qu’on alors, pour tout u ∈ R, fU (u) =∫ +∞

−∞g(u, v) dv. On obtient fU (u) = 0 si

u < 0 et si u � 0,

fU (u) =∫ +∞

u(u + v)e−u−v dv = e−u

[−(u + v + 1)e−v

]+∞u

= e−2u(2u + 1),

car limv→+∞

(u + v + 1)e−v = 0.

On a de même fV (v) = 0 si v < 0 et si v � 0,

fV (v) =∫ v

0(u + v)e−u−v du = e−v

[−(u + v + 1)e−u

]v

0= e−v(−(2v + 1)e−v + (v + 1))

= −(2v + 1)e−2v + (v + 1)e−v.

3. Covariance - Coefficient de corrélation

3.1 Espérance d’une variable aléatoire fonction d’un couple de variablesaléatoires à densité

Nous admettrons le théorème suivant (qui est pour les variables à densité l’équivalentdu théorème 9 du chapitre 9).

Théorème 8

Soit (X, Y ) un couple de variables aléatoires possédant une densité f et g une applicationdéfinie sur un ensemble D contenant (X, Y )(V). La variable aléatoire g(X, Y ) admet une

espérance si et seulement si l’intégrale∫∫

R2

g(x, y)f (x, y) dx dy converge. Cette espérance

est alors donnée par

E(g(X, Y )) =∫∫

R2

g(x, y)f (x, y) dx dy.

382

Page 390: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance - Coefficient de corrélation

➤ RemarqueNous avions déjà remarqué que si X est une variable à densité et w une application continue, on n’est pas sûr quew(X) est une variable à densité. C’est vrai ici a fortiori. Même si g est continue, on ne peut pas assurer que g(X, Y )est une variable à densité. Nous supposerons quand on demandera d’appliquer ce théorème que nous sommesdans un « bon cas ».

Exemple

Soit X et Y deux variables aléatoires indépendantes, suivant une loi exponentielle de paramètrel. Nous avons vu page 374 que Z = |X − Y | suit aussi une loi exponentielle de paramètre l.

On a donc E(Z) =1l· Retrouvons ce résultat en utilisant le théorème 8. La densité du couple

est le produit des densités de X et Y . On obtient donc, sous réserve de convergence

E(Z) =∫∫

R2

|x − y|fX (x)fY (y) dx dy =∫∫

R2+

|x − y|l2e−lxe−ly dx dy

=∫ +∞

0

(e−ly

∫ +∞

0|x − y|l2e−lx dx

)dy.

Pour tout y � 0 et A > y, on a, en intégrant par parties,∫ A

0|x − y|l2e−lx dx =

∫ y

0(y − x)l2e−lx dx +

∫ A

y(x − y)l2e−lx dx

= [(x − y)le−lx]y0 −∫ y

0le−lx dx + [(y − x)le−lx]Ay +

∫ A

yle−lx dx

= ly +[e−lx

]y

0+ (y − A)le−lA −

[e−lx

]A

y

= ly + e−ly − 1 + (y − A)le−lA − e−lA + e−ly.

Comme limA→+∞

e−lA = limA→+∞

Ae−lA = 0,∫ +∞

0|x − y|l2e−lx dx converge et vaut

ly − 1 + 2e−ly. Sous réserve de convergence

E(Z) =∫ +∞

0(lye−ly − e−ly + 2e−2ly) dy.

On sait que∫ +∞

0le−ly dy =

∫ +∞

02le−2ly dy = 1, car on reconnaît l’intégrale de

la densité d’une variable suivant une loi exponentielle de paramètre l ou 2l. D’autre∫ +∞

0lye−ly dy =

1l

, car c’est l’espérance d’une variable suivant une loi exponentielle de

paramètre l. On en déduit que∫ +∞

0(lye−ly − e−ly + 2e−2ly) dy converge et

E(Z) =1l− 1

l+

1l

=1l·

383

Page 391: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

3.2 Covariance

Nous admettrons le résultat suivant.

Théorème 9

Soit (X, Y ) un couple de variables aléatoires possédant une densité f . Si les variables X etY possèdent un moment d’ordre 2, alors la variable XY possède une espérance donnéepar

E(XY ) =∫∫

R2

xyf (x, y) dx dy.

➤ RemarqueLa formule donnant l’espérance de XY résulte du théorème 8 appliqué à la fonction g : (x, y) −→ xy.

Définition 6

Soit X et Y deux variables aléatoires à densité admettant une espérance. Si la variable(X − E(X)

)(Y − E(Y )

)admet une espérance, on appelle covariance du couple (X, Y )

le réel noté Cov(X, Y ) défini par

Cov(X, Y ) = E((

X − E(X))(

Y − E(Y )))

.

Théorème 10 (Formule de Koenig-Huyghens)

Soit (X, Y ) un couple de variables aléatoires possédant une densité f . Si les variables X etY possèdent un moment d’ordre 2, alors le couple (X, Y ) admet une covariance donnéepar la formule

Cov(X, Y ) = E(XY ) − E(X)E(Y ).

Preuve Les variables X et Y possèdent un moment d’ordre 2, donc elles possèdent une espérance. D’après lethéorème 9, XY possède une espérance. Par linéarité de l’espérance,(

X − E(X))(

Y − E(Y ))

= XY − XE(Y ) − YE(X) + E(X)E(Y )

admet une espérance. Donc le couple (X, Y ) possède une covariance et

Cov(X, Y ) = E((

X − E(X))(

Y − E(Y )))

= E(XY ) − E(Y )E(X) − E(X)E(Y ) + E(X)E(Y )

= E(XY ) − E(Y )E(X). ❑

Reprenons les exemples 2 et 4 de la page 362.

Exemples1. Si (X, Y ) suit la loi uniforme sur le disque de centre (0, 0) et de rayon 1, on a vu que X et

Y suivent la même loi, de densité définie par fX (x) =

⎧⎨⎩2p

√1 − x2 si |x| � 1

0 si |x| > 1.Comme

la fonction fX est continue sur [−1, 1] et nulle en dehors, X (et Y ) possède des moments

384

Page 392: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance - Coefficient de corrélation

de tout ordre et en particulier un moment d’ordre 2. On en déduit que (X, Y ) possèdeune covariance. La fonction fX est paire, donc E(X) = E(Y ) = 0 et

Cov(X, Y ) = E(XY ) =∫

R2

xyf (x, y) dx dy =∫

D

1p

xydx dy

=∫ 1

−1

(∫ √1−y2

−√

1−y2

xy dx

)dy = 0,

car pour tout y ∈ [−1, 1], la fonction x −→ xy est impaire donc son intégrale sur[−

√1 − y2,

√1 − y2] est nulle.

2. Soit (X, Y ) un couple de variables aléatoires dont une densité est définie par

f (x, y) =√

2p

exp(−x2 + 2xy − 3y2).

Nous avons vu que X suit la loi normale de paramètre(

0,34

)et que Y suit la loi normale

de paramètre(

0,14

). Ces deux variables ont un moment d’ordre 2, donc (X, Y ) possède

une covariance. On a E(X) = E(Y ) = 0 et

Cov(X, Y ) = E(XY ) =∫∫

R2

xyf (x, y) dx dy =√

2p

∫R2

xy exp(−x2 + 2xy − 3y2) dx dy

=√

2p

∫ +∞

−∞

(∫ +∞

−∞xy exp(−x2 + 2xy − 3y2) dx

)dy

=√

2p

∫ +∞

−∞

(∫ +∞

−∞xy exp(−(x − y)2 − 2y2) dx

)dy

=√

2p

∫ +∞

−∞

(ye−2y2

∫ +∞

−∞x exp(−(x − y)2) dx

)dy.

Avec le changement de variable t = x − y, on obtient∫ +∞

−∞x exp(−(x − y)2) dx =

∫ +∞

−∞(t + y) exp(−t2) dt

=∫ +∞

−∞t exp(−t2) dx + y

∫ +∞

−∞exp(−t2) dx.

La première intégrale est nulle, car la fonction t −→ t exp(−t2) est impaire. La seconde estl’intégrale de Gauss et vaut

√p. On en déduit

Cov(X, Y ) =√

2p

∫ +∞

−∞

(ye−2y2

) (y√

p)

dy

=

√2p

∫ +∞

−∞y2e−2y2

dy =1

2√

p

∫ +∞

−∞u2e−u2

du,

385

Page 393: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

grâce au changement de variable u = y√

2. En intégrant par parties, on obtient

Cov(X, Y ) =1

2√

p

[−1

2ue−u2

]+∞

−∞+

14√

p

∫ +∞

−∞e−u2

du = 0 +1

4√

p

√p =

14·

Les propriétés de la covariance sont les mêmes que dans le cas discret. Nous pouvonsdonc reprendre le contenu des théorèmes 11 et 12 du chapitre 9.

Théorème 11

Si X, X ′, Y et Y ′ sont des variables aléatoires à densité admettant des moments d’ordre 2et l un réel, on a :

• Cov(X, X) = V (X) ;

• Cov(X, Y ) = Cov(Y, X) ;

• Cov(X + X ′, Y ) = Cov(X, Y ) + Cov(X ′, Y ) Cov(lX, Y ) = lCov(X, Y ) ;

• Cov(X, Y + Y ′) = Cov(X, Y ) + Cov(X, Y ′) Cov(X, lY ) = lCov(X, Y ).

Autrement dit, les applications X −→ Cov(X, Y ) et Y −→ Cov(X, Y ) sont linéaires.On a, de plus, |Cov(X, Y )| � s(X)s(Y ).

Théorème 12

• Pour tout couple (X, Y ) de variables aléatoires réelles à densité admettant un momentd’ordre deux, la variable aléatoire réelle X + Y admet une variance égale à

V (X + Y ) = V (X) + V (Y ) + 2 Cov(X, Y ).

• Plus généralement, pour toute famille finie (X1, . . . , Xn) de n variables aléatoires réellesà densité admettant un moment d’ordre 2, la variable aléatoire réelle X1 +X2 + · · ·+Xn

admet une variance

V (X + · · · + Xn) =n∑

k=1

V (Xk) + 2∑

1�i<j�n

Cov(Xi, Xj).

Preuve Les démonstrations sont les mêmes que dans le cas discret. En effet, celles-ci reposent unique-ment sur la linéarité de l’espérance et pour la dernière affirmation du théorème 11 sur le fait que l’applicationl −→ V (lX + Y ) est une fonction trinôme qui garde toujours un signe positif et donc a un discriminant négatif.❑

➤ RemarqueNous ne sommes pas assurés pourtant que la somme X + X′ de deux variables aléatoires à densité est une variableà densité. Les calculs effectués dans les théorèmes précédents ont encore un sens à condition de se placer dans lecadre général des variables aléatoires réelles, tracé dans la première partie du chapitre 8.

386

Page 394: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Covariance - Coefficient de corrélation

3.3 Coefficient de corrélation linéaire

Définition 7

Soit (X, Y ) un couple de variables aléatoires à densité. Si le couple (X, Y ) possède unecovariance, on appelle coefficient de corrélation linéaire de (X, Y ) le réel rX,Y défini par

rX,Y =Cov(X, Y )

sXsY·

➤ RemarqueCette définition est justifiée car l’écart-type d’une variable à densité est strictement positif.

Reprenons les exemples de la page 384.

Exemples1. Dans le premier cas on a rX,Y = 0 car Cov(X, Y ) = 0.

2. Dans le second cas, on a trouvé Cov(X, Y ) =14· Les variables X et Y suivent des lois

normales de paramètre(

0,34

)et

(0,

14

)respectivement. On a donc sX =

√3

2et

sY =12· On en déduit rX,Y =

1√3·

Théorème 13

Pour tout couple (X, Y ) de variables aléatoires réelles discrètes admettant un coefficientde corrélation linéaire, on dispose des inégalités

−1 � r (X, Y ) � 1.

Preuve Cela résulte directement de la dernière affirmation du théorème 11. ❑

3.4 Cas des variables indépendantes

Théorème 14

Soit X et Y deux variables aléatoires à densité sur le même espace probabilisé (V, T , P),admettant un moment d’ordre deux. Si X et Y sont indépendantes, on a

• E(XY ) = E(X)E(Y ) ;

• Cov(X, Y ) = 0 ;

• V (X + Y ) = V (X) + V (Y ).

387

Page 395: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

PreuveSoit fX et fY une densité de X et Y respectivement. Comme X et Y sont indépendantes, la fonction(x, y) −→ fX (x)fY (y) est une densité du couple (X, Y ). Il résulte alors du théorème 9 que XY possède uneespérance donnée par

E(XY ) =

∫∫R2

xyfX (x)fY (y) dx dy =

∫ ∞

−∞xfX (x) dx

∫ ∞

−∞yfY (y) dy = E(X)E(Y ).

Les deux autres égalités découlent de la première. On a en effet

Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0, puis

V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ) = V (X) + V (Y ). ❑

Définition 8

Si deux variables aléatoires à densité sur le même espace probabilisé vérifientCov(X, Y ) = 0, on dit qu’elles sont non corrélées.

Proposition 2

Deux variables aléatoires réelles à densité, indépendantes, sont non corrélées.

PreuveCela résulte de la définition et de la proposition 14. ❑

➤ RemarqueLa réciproque est fausse. Nous avons vu que si le couple (X, Y ) suit la loi uniforme sur le disque de centre (0, 0) etde rayon 1, les variables X et Y sont non corrélées, mais ne sont pas indépendantes.

388

Page 396: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. Soit X, Y , Z trois variables aléatoires indépendantes, de même loi uniforme sur

[−1, 1]. Calculer une densité de X + Y ,12

(X + Y ) et X + Y + Z.

2. Soit a ∈ ]0, 1[ et (X, Y ) un couple de variables aléatoires de densité f définie par

f (x, y) ={

((1 + ax)(1 + ay) − a) exp(−x − y − axy) si x � 0 et y � 00 sinon.

1. Vérifier que f est une densité de probabilité.

2. Déterminer les lois marginales du couple (X, Y ).

3. Les variables X et Y sont-elles indépendantes ?

3. Soit (X, Y ) un couple de variables aléatoires de densité f définie par

f (x, y) =

⎧⎨⎩k

x2ysi x � 1 et

1x

� y � x

0 sinon.

1. Déterminer k.

2. Déterminer les densités marginales et conditionnelles du couple (X, Y ).

4. 1. Les variables aléatoires A et B sont indépendantes et suivent une loi uniformesur [0, 1]. Quelle est la probabilité que l’équation x2 + 2Ax + B = 0 aita. deux solutions réelles ;

b. deux solutions complexes non réelles ;

c. une seule solution ?

2. Mêmes questions si A et B suivent une loi exponentielle de paramètre 1.On exprimera le résultat à l’aide de la fonction de répartition F de la loi normale centréeréduite.

5. Deux personnes A et B se donnent rendez-vous entre 15 et 16 heures. Chacund’eux a promis de ne pas attendre l’autre plus de 10 minutes. On suppose qu’ils arriventindépendamment à des instants uniformément distribués sur entre 15 heures et 16 heures.

1. Quelle est la probabilité qu’ils se rencontrent ?

2. À présent, A fixe son heure d’arrivée x. Quelle est la probabilité qu’il rencontre B ?

3. Arrivant à l’heure x, A ne trouve personne. Quelle est la probabilité qu’il rencontre B ?

6. Trois personnes, notées A, B, C entrent simultanément à la poste pour téléphoner.Il n’y a que deux cabines téléphoniques que A et B occupent immédiatement. C attend etremplace le premier sorti. On suppose que les durées de communication de A, B, C sontdes variables aléatoires mutuellement indépendantes, suivant la même loi uniforme sur [0, 1],notées respectivement X, Y et Z.

389

Page 397: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

1. On pose : U = sup(X, Y ) et V = inf(X, Y ). Définir des densités des variables aléatoiresU et V . Calculer l’espérance et la variance de U et V , la covariance et le coefficient decorrélation de (U, V ).

2. On pose W = |X − Y |. Définir une densité de W .

3. Les variables W et Z sont-elles indépendantes ? Définir par sa densité le couple (W, Z).

4. Montrer que la probabilité de l’événement « C termine sa communication en dernier » estP([W < Z]). Calculer cette probabilité.

5. Soit T le temps total passé par C dans le bureau de poste. Définir par sa densité la loi ducouple (V, Z). En déduire une densité de T .

6. Calculer l’espérance et la variance de T .

7. On casse une baguette de bois de longueur � en deux endroits choisis au hasard.

On note X et Y les variables aléatoires abscisses des points où l’on brise la baguette. On supposeque X et Y suivent la loi uniforme sur [0, 1].Calculer la probabilité qu’avec les trois morceaux, on puisse former un triangle.Indication. On montrera que cela équivaut à

inf(X, Y ) <�

2, sup(X, Y ) >

2et sup(X, Y ) − inf(X, Y ) <

8. On prend un point M au hasard sur le cercle C de centre 0 et de rayon 1.

1. Soit X et Y les coordonnées de M dans un repère orthonormé de centre 0. CalculerCov(X, Y ) ; montrer que X et Y ne sont pas indépendantes.

2. Soit A le point de coordonnées (1, 0) et L la variable aléatoire égale à la longueur AM .Déterminer la loi, l’espérance et la variance de L.

9. Soit X et Y deux variables aléatoires de même loi exponentielle de paramètre l. On

pose U = X + Y et V =X

X + Y·

1. Déterminer les fonction de répartition de U et V .

2. Déterminer la fonction de répartition du couple (U, V ). Les variables U et V sont-elleindépendantes ?

10. Pour a > 0, on dit qu’une variable aléatoire suit une loi de Cauchy de paramètre asi elle admet comme densité la fonction fa définie sur R par

fa(x) =a

p(a2 + x2)·

On note C(a) une telle loi.

1. a. Justifier que fa est une densité de probabilité.Soit X une variable aléatoire de loi C(a). Déterminer sa fonction de répartition. Possède-t-elle une espérance ?

390

Page 398: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

b. Soit (X, Y ) un couple aléatoire possédant comme densité la fonction g définie sur R2

par g(x, y) =

⎧⎨⎩1p

si x2 + y2 � 1

0 sinon. Montrer que Z =

YX

suit une loi C(1).

c. Soit X et Y deux variables aléatoires indépendantes, suivant chacune une loi normale

centrée réduite. Montrer que Z =YX

suit une loi C(1).

2. a. Soit a > 0, l > 0 et X une variable qui suit la loi C(a). Déterminer la loi de la variablelX.

b. Soit (x, t, b) ∈ R3 et c = [x2 + (b + 1)2][x2 + (b − 1)2]. Vérifier que

c[(t − x)2 + 1][t2 + b2]

= x ·[

2tt2 + b2

− 2(t − x)[(t − x)2 + 1)

]+

(x2 + b2 − 1)(t − x)2 + 1

+x2 − b2 + 1

t2 + b2·

c. Soit X et Y deux variables aléatoires indépendantes, X suivant une loi C(a) et Y une loiC(b). Montrer que S = X + Y suit une loi C(a + b). On commencera par supposer quea = 1 et on utilisera ce qui précède.

11. Pour a > 0, on pose G(a) =∫ +∞

0e−xxa−1 dx. On appelle loi gamma de paramètre

(a, l) (a > 0, l > 0), notée G(a, l), la loi sur R de densité ga,l, où

ga,l(x) =la

G(a)e−lxxa−1 si x > 0 et ga,l(x) = 0 si x � 0.

1. a. Vérifier que G(a) est défini pour tout a > 0 et que G(a + 1) = aG(a).Montrer que ga,l est une densité de probabilité.

b. Soit X une variable aléatoire de loi G(a, l). Calculer E(X) et V (X).

2. a. Soient X et Y deux variables aléatoires indépendantes de lois respectives G(a, l) etG(b, l) (a > 0, b > 0). Montrer que X + Y suit la loi G(a + b, l).En déduire que ∫ 1

0ta−1(1 − t)b−1 dt =

G(a)G(b)G(a + b)

·

b. Montrer qu’une loi exponentielle est une loi gamma.Si X1, . . . , Xn sont des variables aléatoires indépendantes suivant une loi exponentiellede paramètre l, donner la loi de S = X1 + · · · + Xn.

3. a. Soit Y une variable qui suit la loi normale centrée réduite. Montrer que Y 2 suit la loi

G(

12

,12

). En déduire la valeur de G

(12

).

b. Si Y1, . . . , Yn sont n variables indépendantes suivant la loi normale centrée réduite,déterminer la loi de Z = Y 2

1 + · · · + Y 2n (on dit que Z suit la loi du x2 à n degrés de

liberté). Calculer l’espérance et la variance de Z.

391

Page 399: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables aléatoires admettant une densité

12. Soit (X, Y ) un couple de variables aléatoires réelles de densité conjointe définie,pour tout couple (x, y) de réels par

f (x, y) = k exp(− 1

2(1 − r2)(x2 − 2rxy + y2)

),

où r est un élément de ] − 1, 1[. On dira que (X, Y ) est un couple normal standard.

1. Déterminer k en fonction de r. On pourra pour cela remarquer l’identité

x2 − 2rxy + y2 = (x − ry)2 + (1 − r2)y2.

2. a. Déterminer et reconnaître les lois marginales de X et de Y .

b. Calculer la covariance de X et Y . Montrer que X et Y sont indépendantes si, et seule-ment si, elles sont non corrélées.

3. Déterminer les lois conditionnelles du couple (X, Y ).

13. 1. Soit f la fonction définie par

f (x) =

⎧⎨⎩1x2

si x � 1

0 si x < 1.

Montrer que f est une densité de probabilité.

2. Soit X et Y deux variables aléatoires indépendantes de densité f . On pose U = XY et

V =XY

. On note F la fonction de répartition conjointe de U et V .

a. Montrer que le couple (U, V ) est à valeurs dans

A = {(u, v) ∈ [1, +∞[×R∗+, uv � 1, u � v} .

b. Soit (u, v) ∈ A. Montrer que F(u, v) =∫∫

Df (x)f (y) dx dy,

D = {(x, y) ∈ R2, 1 � x �

√uv,

xv

� y � ux

, y � 1}.

En déduire F(u, v). On distinguera les cas v � 1 et v > 1.

c. On admet qu’une fonction g telle que g(u, v) =∂2F∂u∂v

(u, v) en tout point où F est de

classe C2 est une densité de (U, V ). Montrer que,

g(u, v) =

⎧⎨⎩1

2u2vsi (u, v) ∈ A

0 si (u, v) /∈ A.

d. En déduire les lois marginales du couple (U, V ). Les variables U et V sont-elles indé-pendantes ?

392

Page 400: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

12Convergenceset approximations

Dans ce chapitre, nous considérons des variables aléatoires Xn définies sur un mêmeespace probabilisé (V, T , P), dépendant d’un entier naturel n et étudions le compor-tement de Xn lorsque n tend vers l’infini.

Quand nous parlerons de variable aléatoire réelle, il s’agira soit de variable discrète,soit de variable à densité.

1. Loi faible des grand nombres

1.1 L’inégalité de Bienaymé-Tchebychev

Lemme (Inégalité de Markov)

Toute variable aléatoire réelle positive X admettant une espérance, vérifie l’inégalité

∀a > 0, P([X � a]

)� E(X)

Preuve• Si la variable X est discrète et X(V) = {xi, i ∈ I}, où I est une partie de N, on pose J = {i ∈ J, xi � a}.

On a alors [X � a] =⋃i∈J

[X = xi ] et

P([X � a]

)=∑i∈J

P([X = xi ]

).

Comme X est positive, on a, pour tout i ∈ I, xi � 0. On en déduit

E(X) =∑i∈I

xiP([X = xi ]

)�∑i∈J

xiP([X = xi ]

)�∑j∈J

aP([X = xi ]

)� aP

([X � a]

).

Page 401: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

• Si X est une variable aléatoire à densité, de densité f , la fonction f est nulle sur R− car X est à valeurs

positives. D’autre part, on a P([X � a]

)=

∫ +∞

af (t) dt. On en déduit, puisque f est positive,

E(X) =

∫ +∞

0tf (t) dt �

∫ +∞

atf (t) dt �

∫ +∞

aaf (t) dt � aP

([X � a]

).

Théorème 1 (Inégalité de Bienaymé-Tchebychev)

Toute variable aléatoire réelle X admettant un moment d’ordre deux vérifie l’inégalité

∀´ > 0, P([

|X − E(X)| � ´])

� V (X)´2

·

PreuveLa variable

(X − E(X)

)2 est positive et possède une espérance égale à V (X). D’après l’inégalité de Markov, on apour tout ´ > 0

P( [(

X − E(X))2 � ´2

] )� V (X)

´2·

Comme les événements[|X − E(X)| � ´

]et[(X − E(X))2 � ´2

]sont égaux, on en déduit

P([

|X − E(X)| � ´])� V (X)

´2·

1.2 Loi faible des grands nombres

Théorème 2 (Loi faible des grands nombres)

Soit (Xn)n∈N∗ une suite de variables aléatoires réelles discrètes définies sur l’espace proba-bilisé (V, T , P). On suppose que ces variables admettent toutes la même espérance m et lamême variance s2, et sont deux à deux non corrélées. On pose

Yn =X1 + X2 + · · · + Xn

Alors, pour tout ´ > 0, on a

limn→+∞

P([

|Yn − m| � ´])

= 0.

PreuveÉtant somme de variables deux à deux non-corrélées admettant une espérance et une variance,Sn = Y1 + Y2 + · · · + Yn admet une espérance et une variance telles que

E(Sn) =n∑

k=1

E(Xk) = nm et V (Sn) =n∑

k=1

V (Xk) = ns2.

On en déduit

E(Yn) =1

nE(Sn) = m et V (Yn) =

1

n2V (Sn) =

1

ns2.

394

Page 402: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Loi faible des grand nombres

Par l’inégalité de Bienaymé-Tchebychev, on obtient

∀´ > 0, P([

|Yn − m| � ´])� s2

n´2·

On en déduit que, pour tout ´ > 0,

limn→+∞

P([

|Yn − m| � ´])

= 0. ❑

➤ Remarques• Les hypothèses du théorème précédent sont remplies en particulier lorsque les variables aléatoires Xn sont

mutuellement indépendantes, de même loi et admettent un espérance et une variance. C’est dans ce cadrequ’on l’utilise en général.

• L’appellation « loi faible des grands nombres » suggère qu’il y a des résultats plus forts. Pour une suite (Xn) devariables aléatoires mutuellement indépendantes, de même loi et admettent un espérance et une variance, onpeut démontrer que la suite (Xn) converge presque sûrement vers m, c’est-à-dire que l’ensemble A des élémentsv ∈ V pour lesquels la suite de réels (Xn(v)) converge vers m est de probabilité 1.

• La propriété : pour tout ´ > 0, limn→+∞

P([

|Yn − m| � ´])

= 0 signifie qu’en un certain sens la suite (Yn)

converge vers m. On dit que (Yn) converge en probabilité vers m ; cette notion n’est pas au programme.

Théorème 3 (Théorème de Bernoulli)

Soit (Xn)n∈N une suite de variables de Bernoulli indépendantes, de même paramètre p, surl’espace probabilisé (V, T , P). On pose

Yn =X1 + X2 + · · · + Xn

Alors, pour tout ´ > 0, on a

limn→+∞

P([

|Yn − p| � ´])

= 0.

PreuveIl s’agit d’un cas particulier du théorème précédent, où m = p et s2 = p(1 − p). On obtient, pour tout ´ > 0,

∀´ > 0, P([

|Yn − p| � ´])� s2

n´2· ❑

ExempleSoit A un événement d’un espace probabilisé (V, T , P). On considère une suite d’épreuvesindépendantes. Pour n ∈ N

∗, on note Xn la variable de Bernoulli qui vaut 1 si l’événementA est réalisé lors de la n-ième épreuve ; elle est de paramètre p = P(A). Alors Yn est égal à lafréquence de réalisation de l’événement A. Cette fréquence a pour limite p = P(A) quand ntend vers +∞.La loi faible des grands nombres s’accorde avec l’intuition qui, dans le cas d’un espace proba-bilisé fini, voit la probabilité d’un événement comme une fréquence.

395

Page 403: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

2. Convergence en loi

2.1 Définition

Considérons une suite (Xn)n∈N de variables aléatoires réelles, et X une variable aléa-toire réelle. Une façon d’aborder le problème de la convergence de la suite (Xn)n∈Nvers la variable aléatoire X est de considérer qu’une variable aléatoire réelle est définiepar la donnée de sa fonction de répartition FXn et d’envisager la convergence pourtout réel x de la suite FXn(x) vers FX (x).

Définition 1

Soit (Xn)n∈N une suite de variables aléatoires réelles. On note FXn la fonction de répartitionde Xn.On dit que la suite (Xn)n∈N converge en loi vers la variable aléatoire réelle X de fonctionde répartition FX si la suite

(FXn (x)

)converge vers FX (x) en tout x où FX est continue.

➤ RemarqueEn réalité, la notion de convergence en loi n’est pas relative aux variables aléatoires elles-mêmes, mais concerneles lois des variables aléatoires. Elle n’indique aucune proximité entre la fonction Xn et la fonction X.

Proposition 1

Soit (Xn) une suite de variables aléatoires réelles convergeant en loi vers la variable aléatoireréelle X. Soit a et b deux points de continuité de FX , a < b. On a alors

limn→+∞

P([a < Xn � b]

)= P

([a < X � b]

).

PreuvePour tout entier n, P

([a < Xn � b]

)= FXn (b) − FXn (a). On en déduit, puisque FX est continue en a et b,

limn→+∞

P([a < Xn � b]

)= lim

n→+∞FXn (b) − lim

n→+∞FXn (a) = FX (b) − FX (a)

= P([a < X � b]

). ❑

2.2 Convergence en loi des variables à valeurs entières

Théorème 4

Soit (Xn)n∈N une suite de variables aléatoires réelles discrètes et X une variable aléatoireréelle discrète telles que, pour tout entier n, Xn(V) ⊂ N et X(V) ⊂ N.Dans ces conditions, (Xn)n∈N converge en loi vers X si, et seulement si, pour tout entiernaturel k, lim

n→+∞P([Xn = k]

)) = P

([X = k]

).

Preuve� Supposons que (Xn)n∈N converge en loi vers X. Alors, pour tout entier naturel k, les réels a = k − 1

2et

b = k +1

2sont des points de continuité de FX , puisque les points de discontinuité de la fonction FX sont les

éléments de X(V). On a donc, d’après la proposition 1, limn→+∞

P([a < Xn � b]

)= P([a < X � b]

), ce qui

est le résultat annoncé puisque P([a < Xn � b]

)= P([Xn = k]

)et P([a < X � b]

)= P([X = k]

).

396

Page 404: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Convergence en loi

� Réciproquement, supposons que pour tout entier naturel k,

limn→+∞

P([Xn = k]

)= P([X = k]

).

Soit x un réel quelconque. Si x < 0, on a, pour tout n ∈ N, FXn (x) = 0 et donc limn→+∞

FXn (x) = 0 = FX (x). Si

x � 0, on obtient, pour tout n ∈ N,

FXn (x) =

�x∑k=0

P([Xn = k]

),

où �x� représente la partie entière de x.On a, par hypothèse , pour tout k ∈ N, lim

n→+∞P([Xn = k]

)= P([X = k]

). Comme x est fixé, il en est de

même de �x� et la limite d’une somme de suites étant la somme des limites, on obtient,

limn→+∞

FXn (x) =

�x∑k=0

P([X = k]

)= FX (x).

Cela prouve que (Xn)n∈N converge en loi vers X. ❑

Approximation d’une loi hypergéométrique par une loi binomiale

Proposition 2

Soit (XN )N∈N une suite de variables aléatoires réelles discrètes telles que XN suit la loihypergéométrique de paramètre (N, n, p), où n et p sont fixés et N appartient à l’ensembleI des entiers tels que Np soit entier. Alors, pour tout entier k de �0, n�, on a

limN→+∞

N∈I

P([XN = k]

)=

(nk

)pk(1 − p)n−k.

La suite (XN )N∈I converge en loi vers une variable aléatoire X qui suit la loi binomiale deparamètre (n, p).

PreuveRappelons que

P([XN = k]

)=

(Npk

)( Nqn−k

)(Nn

) ·

Alors

P([XN = k]

)=

(Np)! (Nq)! n! (N − n)!

k! (Np − k)! (n − k)! (Np − n + k)!

=n!

k!(n − k)!

(Np) · · · (Np − k + 1)(Nq) · · · (Nq − n + k + 1)

N(N − 1) · · · (N − n + 1)·

Or les produits (Np)(Np−1) · · · (Np− k + 1)(Nq)(Nq−1) · · · (Nq−n + k + 1) et N(N−1) · · · (N−n + 1) possèdentn facteurs, n étant indépendant de N. Ce sont des fonctions polynomiales de N, équivalentes quand N tend vers+∞ à leur terme de plus haut degré, c’est à dire pkqn−kNn et Nn respectivement. On obtient donc

limN→+∞

(Np)(Np − 1) · · · (Np − k + 1)(Nq) · · · (Nq − n + k + 1)

N(N − 1) · · · (N − n + 1)= pkqn−k.

etlim

N→+∞P([XN = k]

)=(n

k

)pk(1 − p)n−k. ❑

397

Page 405: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

➤ Remarques• Dans une urne contenant N boules blanches ou rouges, la proportion de boules blanches étant p, on tire

simultanément n boules. Si N devient très grand, on obtient à peu près le même résultat que si les tirages sonteffectués avec remise.

• Dans la pratique, dès que N � 10 n, on considère qu’on peut approcher la loi hypergéométrique deparamètre (N, n, p) par la loi binomiale de paramètre (n, p).

• En faisant cette approximation, on remplace une loi dépendant de deux réels N, n et p par une loi qui nedépend que de deux réels n et p.

ExempleSoit X une variable aléatoire suivant la loi hypergéométrique de paramètre (100; 4; 0, 05).Intéressons nous à P

([X � 1]

).

• Calcul exact :

P([X � 1]

)= 1 − P(X = 0) = 1 −

(50

)(954

)(

1004

)= 1 − 95 × 94 × 93 × 92

4 × 3 × 2 × 1× 4 × 3 × 2 × 1

100 × 99 × 98 × 97≈ 0, 188.

• Calcul approché :Approchons la loi H(100; 4; 0, 05) par la loi B(4; 0, 05). On a alors

P([X � 1]

)= 1 − P

([X = 0]

)≈ 1 −

(40

)× (0, 05)0(0, 95)4 ≈ 0, 185.

Approximation d’une loi binomiale par une loi de Poisson

Proposition 3

Soit l un réel strictement positif et (Xn)n∈N une suite de variables aléatoires réelles discrètes

telles que Xn suit la loi binomiale de paramètre(

n,l

n

). Alors, pour tout entier k de N,

on a

limn→+∞

P([Xn = k]

)=

lk

k!e−l.

La suite (Xn)n∈N converge en loi vers une variable aléatoire X qui suit la loi de Poisson deparamètre l.

PreuvePour tout entier k (fixé) et pour tout entier n � k,

P([Xn = k]

)=(n

k

)(l

n

)k (1 − l

n

)n−k

=lk

k!· n(n − 1) · · · (n − k + 1)

nke(n−k) ln

(1− l

n

).

398

Page 406: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Théorème de la limite centrée

Nous avons, quand n tend vers +∞, n(n − 1) · · · (n − k + 1) ∼ nk donc limn→+∞

n(n − 1) · · · (n − k + 1)

nk= 1.

D’autre part, puisquel

ntend vers 0, on a ln

(1 − l

n

)∼ −l

net donc

limn→+∞

(n − k) ln

(1 − l

n

)= lim

n→+∞(n − k)

(−l

n

)= −l.

On obtient limn→+∞

P([Xn = k]

)=

lk

k!e−l. ❑

➤ Remarques• Dans une urne contenant des boules blanches ou rouges, la proportion de boules blanches étant p, on tire

n boules avec remise. Si p est proche de 0 et n assez grand, la variable aléatoire égale au nombre de boulesblanches tirées suivra approximativement une loi de Poisson. On dit que la loi de Poisson est la loi des « événe-ments rares ».

• Dans la pratique, dès que n � 30 et p � 0, 1, on considère qu’on peut approcher la loi binomiale deparamètre (n, p) par la loi de Poisson de paramètre l = np. Notons cependant que les tables de la loi dePoisson usuelles n’existent que pour l � 15. Cela introduit la contrainte supplémentaire np � 15.

• En faisant cette approximation, on remplace une loi dépendant de deux réels n et p par une loi qui ne dépendque d’un réel l.

ExempleOn considère une variable aléatoire X suivant la loi binomiale B(100; 0, 05), et l’on s’intéresseà la probabilité pour que X prenne la valeur 2.

• Calcul exact

P([X = 2]) =(

1002

)(0, 05)2(0, 95)98 = 4950 × 0, 0025 × (0, 95)98 ≈ 0, 0812.

• Calcul approché :Nous sommes dans les conditions de l’approximation de la loi binomiale par la loi de Pois-son. On approche donc la loi B(100; 0, 05) par la loi P(100 × 0, 05) = P(5). On obtient

P([X = 2]) ≈ e−5 × 52

2!≈ 0, 0843.

3. Théorème de la limite centrée

3.1 Théorème de la limite centrée

Nous admettrons le théorème suivant.

Théorème 5

Soit (Xn)n∈N∗ une suite de variables aléatoires réelles définies sur un même espace proba-bilisé (V, T , P), mutuellement indépendantes, de même loi, admettant une variance nonnulle. On note

m = E(X1) s =√

V (X1)

et pour tout n ∈ N∗,

Yn =1n

n∑k=1

Xk, Y∗n =

(Yn − m)s√

n

·

399

Page 407: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

Alors la suite (Y∗n )n∈N∗ converge en loi vers une variable aléatoire de loi N (0, 1), c’est-à-

dire que, pour tout (a, b) ∈ R2 tel que a < b, on a

limn→+∞

P([a < Y∗n � b]) = lim

n→+∞P

⎛⎜⎝⎡⎢⎣a <

X1 + · · · + Xn

n− m

s√n

� b

⎤⎥⎦⎞⎟⎠ =

∫ b

a

1√2p

e−t2

2 dt.

➤ Remarques• La variable Y∗

n est la variable centrée réduite associée à Yn. On a en effet, puisque les variables Xk sont indé-

pendantes, E(Yn) =1

nnm = m et V (Yn) =

1

n2ns2 =

s2

n.

Si on pose Sn =n∑

k=1

Xk, on a Sn = nYn donc S∗n = Y∗n . Dans l’énoncé du théorème, on peut remplacer Y∗

n par

S∗n =X1 + · · · + Xn − nm

s√

n

• Comme Sn = s√

nY∗n +nm, la variable aléatoire Sn suit approximativement la loi N (nm, ns2), c’est-à-dire la loi

normale qui a même espérance et même variance que Sn. On ne peut évidemment pas dire que (Sn) convergeen loi vers une variable aléatoire de loi N (nm, ns2), puisque celle-ci dépend de n.

• Ce théorème est encore appelé « théorème central limite ».

• Ce théorème est remarquable en ce que, avec peu d’hypothèses, on obtient un résultat très fort. Il met enévidence le rôle central joué par la loi de Laplace-Gauss en probabilités et en statistiques.

Exercice 1.Une montre fait une erreur d’au plus une demi-minute par jour. Déterminer la probabilitéque l’erreur commise au bout d’une année soit inférieure ou égale à un quart d’heure.

Solution. On choisit comme unité de temps la minute. En l’absence d’autre indication, on

peut supposer que l’erreur commise un jour donnée suit une loi uniforme sur[−1

2,

12

]. On

note Xk la variable aléatoire égale à l’erreur commise le k-ième jour de l’année. On suppose

que les variables Xk sont indépendantes. On a donc Xk ↪→ U[−1

2,

12

]et, si l’année n’est pas

bissextile, l’erreur commise au bout d’un an est S =365∑k=1

Xk.

On obtient E(X1) = 0 et V (X1) =112

et donc E(S) = 0, V (S) =36512

, puis S∗ =S√

12√365

. La

variable S∗ suit approximativement une loi normale centrée réduite. On en déduit

P(|S| � 15) = P

(|S∗| � 15

√12√

365

)≈ 2F

(15√

12√365

)− 1 ≈ 2F(2, 72) − 1 ≈ 0, 993.

400

Page 408: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

Théorème de la limite centrée

3.2 Approximation d’une loi binomiale par une loi normale

Théorème 6 (Théorème de Moivre-Laplace)

Soit p ∈ ]0, 1[, q = 1 − p et (Sn)n∈N∗ une suite de variables aléatoires telle que Sn suit la

loi binomiale B(n, p). Alors la suite de variables aléatoires de terme général S∗n =

Sn − np√

npqconverge en loi vers une variable aléatoire de loi N (0, 1).

PreuveToute variable binomiale de paramètre (n, p) peut être considérée comme la somme de n variables de Bernoulli

mutuellement indépendantes de même paramètre p. On a donc Sn =n∑

k=0

Xk où Xk désigne une variable

aléatoire de Bernoulli de paramètre p, et où les Xk sont mutuellement indépendantes. Comme les variables deBernoulli admettent une variance pq, on est dans le cadre de l’application du théorème de la limite centrée, et

l’on en déduit que la variable centrée réduite S∗n =Sn − np√

np qconverge en loi vers une variable aléatoire suivant

la loi normale centrée réduite. ❑

➤ Remarques• Pour n assez grand, la loi de Sn peut être approchée par la loi normale de paramètre (np, np q). La convergence

est d’autant plus rapide que p est proche de1

2. Dans la pratique, dès que n � 30, np � 5 et nq � 5, on

considère qu’on peut approcher B(n, p) par N (np, npq).

• On aura noté que l’on approche ici une loi discrète par une loi continue. On doit alors souvent utiliser lacorrection de continuité, et ainsi approcher P

([Sn = k]

)par P

([k − 0, 5 < N < k + 0, 5]

), où Sn suit une loi

binomiale et N la loi normale appropriée ; si on prenait P([N = k]

), on trouverait 0, ce qui ne donnerait pas du

tout une approximation correcte.

ExempleSoit X une variable binomiale de paramètre (900 ;0,5). On cherche à calculer

P([405 � X � 495]

).

Le calcul avec les formules exactes nécessiterait l’utilisation d’un ordinateur, et ne donneraitde toutes façons qu’un résultat approché.

Mais nous sommes dans les conditions d’approximation de la loi binomiale par la loi nor-male. On approche la loi B(900; 0, 5) par la loi N (450, 225), et l’on considère que la variableX − 450

15suit approximativement la loi normale centrée réduite. On obtient alors

P([405 � X � 495]

)= P

([−3 � X − 450

15� 3

])≈ 2F(3) − 1 ≈ 0, 9973.

3.3 Approximation d’une loi de Poisson par une loi normale

Proposition 4

Soit a un réel strictement positif et (Sn) une suite de variables aléatoires réelles discrètestelle que Sn suit la loi de Poisson de paramètre na. Alors la suite de variables aléatoires de

terme général S∗n =

Sn − na√na

converge en loi vers une variable aléatoire de loi N (0, 1).

401

Page 409: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

PreuveToute variable de Poisson de paramètre (na) peut être considérée comme la somme de n variables de Poisson

mutuellement indépendantes de même paramètre a. On a donc Sn =n∑

k=1

Xk où Xk désigne une variable

aléatoire de Poisson de paramètre a, et où les Xk sont mutuellement indépendantes. Comme les variables dePoisson admettent une espérance a et une variance a, on est dans le cadre de l’application du théorème de la

limite centrée, et l’on en déduit que la variable centrée réduite S∗n =Sn − na√

naconverge en loi vers une variable

aléatoire suivant la loi normale centrée réduite. ❑

➤ Remarques• Pour n assez grand, la loi de Sn peut être approchée par la loi normale N (na, na). Comme a est quelconque,

cela signifie qu’une loi de Poisson de paramètre l peut être approchée par une loi N (l, l), dès que l est assezgrand.Dans la pratique, dès que l � 18, on approche la loi P (l) par la loi normale N (l, l).

• On aura remarqué que l’on approche ici une loi discrète par une loi continue. Ici aussi, on doit souvent utiliserune correction de continuité.

ExempleDans la table de la loi de Poisson de paramètre l = 16, on lit P

([X � 21]

)≈ 0, 9107.

En approchant X par une variable normale de paramètre (16,16), on est conduit à considérer

que la variableX − 16

4suit une loi normale centrée réduite.

On obtient alors P([X � 21]

)= P

([X − 16

4� 1, 25

])≈ F(1, 25) ≈ 0, 8944.

L’approximation obtenue n’est pas catastrophique, bien que la valeur de l soit faible.

402

Page 410: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

1. En utilisant l’inégalité de Bienaymé-Tchebychev, montrer que, pour tout x > 0,∫ x

−∞e−

t2

2 dt �√

2p

(1 − 1

2x2

2. Soit (Xn)n�1 une suite de variables aléatoires réelles, indépendantes de même loi,de fonction de répartition F, définies sur un même espace probabilisé. Pour tous x ∈ R etn ∈ N

∗, on note Zn,x le nombre de variables Xi, pour i ∈ [[1, n]], qui prennent une valeur

inférieure ou égale à x. On pose Tn,x =1n

Zn,x.

1. Déterminer la loi de Zn,x, son espérance et sa variance. Déterminer un majorant de V (Zn,x),indépendant x.

2. Montrer que, pour tout ´ > 0, on a

limn→+∞

P([|Tn,x − F(x)| � ´]

)= 0.

3. Soit (Xn)n�1 une suite de v.a.r. définies sur un même espace probabilisé, indépen-dantes, suivant une loi uniforme sur [0, 1]. Pour n � 1, on définit

Mn = max(X1, X2, . . . , Xn) et Yn = n(1 − Mn).

1. Déterminer la fonction de répartition de Mn, puis celle de Yn.

2. Montrer que la suite (Yn) converge en loi vers une variable remarquable.

4. On réalise une suite de lancers indépendants d’une pièce de monnaie équilibrée. Onassocie à cette expérience une suite (Xn)n�1 de variables aléatoires indépendantes, définies surun espace probabilisé et suivant toutes la loi de Bernoulli de paramètre 1

2 ·Pour tout entier n supérieur ou égal à 1, on pose Sn = X1 + · · · + Xn.

1. a. Déterminer la loi de probabilité de la variable Sn.

b. Quelles sont l’espérance et la variance de Sn ?

2. a. Montrer que pour tout réel ´ strictement positif, on peut trouver une constante K´ telleque, pour tout entier n supérieur ou égal à 1, on ait l’inégalité

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � ´

])� K´

b. Déduire de la majoration obtenue que, pour tout réel r vérifiant 0 < r < 12 , on a

limn→+∞

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1nr

])= 0.

3. Montrer, à l’aide du théorème de la limite centrée, que P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1√n

])admet

une limite non nulle quand n tend vers +∞.

403

Page 411: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergences et approximations

5. Un étudiant fait en moyenne une faute d’orthographe tous les 500 mots. Quelle estla probabilité qu’il ne fasse pas plus de 5 fautes dans un devoir contenant 200 mots ?On utilisera l’approximation d’une loi binomiale par un loi de Poisson.

6. 5 000 personnes sont rassemblées dans une salle de concert. La probabilité qu’unepersonne quelconque achète un T-Shirt à l’effigie du chanteur est 0, 4. De combien de T-Shirts doit-on disposer pour que la probabilité que l’on vienne à en manquer soit inférieureà 0, 1 ?

7. Un dé régulier est lancé 9 000 fois. Déterminer la probabilité d’obtenir le résultat 6entre 1 400 et 1 600 fois (on comparera les résultats obtenus par approximation de loi et parl’inégalité de Bienaymé-Tchebychev)

8. Un commando de soldats doit traverser une rivière, malheureusement infestée de

crocodiles. La probabilité qu’un soldat soit dévoré au cours de la traversée est de110

· Combien

faut-il envoyer de soldats pour que la probabilité d’avoir au moins 300 personnes sur l’autrerive soit supérieure à 95 % ?

9. Une entreprise compte 300 employés. Chacun d’eux téléphone en moyenne 6minutes par heures. Quel est le nombre de lignes que l’entreprise doit installer pour que laprobabilité que toutes les lignes soient utilisées au même instant soit au plus égale à 0, 025 ?

10. On considère une suite (Xn)n∈N∗ de variables de Poisson indépendantes de para-mètre 1. On pose Sn = X1 + X2 + · · · + Xn.

1. Quelle est la loi de Sn ?

2. Déterminer P([Sn � n]).

3. En utilisant le théorème central limite, montrer que

limn→+∞

e−nn∑

k=0

nk

k!=

12·

11. Dans un élevage de poules pondeuses, aux heures de ponte maximale, le nombreX d’œufs pondus dans un enclos en 15 minutes suit une loi de Poisson de paramètre 10.

1. Quelles sont les valeurs de X ayant la probabilité maximale ?

2. Quelle est la probabilité pour que, au cours de 15 minutes, il y ait entre 7 et 12 œufs pondus(au sens large) ?

3. Certains œufs sont déclassés (cassés ou de poids insuffisant). La probabilité pour qu’un œufpondu soit déclassé est 0, 03. Sur un lot de N œufs pondus, quelle est la loi de probabilitésuivie par le nombre YN d’œufs déclassés ?

404

Page 412: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

EXERCICES

4. On suppose à présent N = 4 000.a. Par quelle loi peut-on approcher la loi de YN ? Soient f la densité continue et F la

fonction de répartition associées à cette approximation. Donner, pour tout x réel, lesexpressions de f (x) et F(x).

b. On définit, pour h réel strictement positif fixé, une fonction w de la variable réelle x enposant

w(x) = F(x + h) − F(x − h).

Étudier les variations de la fonction w. Où faut-il placer le milieu du segment [a, b] pourque, l’amplitude (b − a) étant fixée, P([a � YN � b]) soit maximale ?

c. Trouver un intervalle [a, b] centré en 120, de longueur minimale, tel que l’on aitP([a � YN � b]) � 0, 95.

405

Page 413: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année
Page 414: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Solutiondes

exercices

Page 415: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1

1. 1. a. Comme (i + 2,−5) = (i + 2)(1, i − 2), on a A = Vect((1, i − 2)). Par ailleurscomme (1, i − 2) �= 0, la famille ((1, i − 2)) est une base de A.

b. Nous savons que C2 est un C-espace vectoriel de dimension 2 ; la famille(

(i, 2), (3, 4i), (i, 7))

est une famille nécessairement liée. Déterminons le rang de cettefamille. Soient a, b, c trois réels, on a

a(i, 2) + b(3, 4i) + c(i, 7) = 0 ⇔{

ai + 3b + ci = 02a + 4bi + 7c = 0

⇔{

ai + 3b + ci = 0−10b + 5ci = 0 L2 ← iL2 − 2L1

⎧⎪⎨⎪⎩a =

−5c2

b =ci2·

Par exemple (i, 7) =52

(i, 2) +−i2

(3, 4i). On en déduit que B = Vect((i, 2), (3, 4i)).

Ces deux vecteurs sont non-colinéaires la famille ((1, 2), (3, 4)) est une base de B. B estun sous-espace de dimension 2 de C, lui-même espace de dimension 2, ils sont doncégaux.

2. Nous savons que R3 est un R-espace de dimension 3 ; au maximum, nous pouvons avoir3 vecteurs dans une famille de vecteurs libres et dans ce cas là il forment nécessairementune famille génératrice de R3.a. Soient a, b, c trois réels tels que a(1, 3,−3) + b(4, 2,−3) + c(−1, 7, 6) = 0. On résout le

système équivalent{a + 4b − c = 0

3a + 2b + 7c = 0−3a − 3b + 6c = 0

⇔{

a + 4b − c = 0−10b + 10c = 0

9b + 3c = 0L2 ← L2 − 3L1L3 ← L3 + 3L1{

a + 4b − c = 0−b + c = 03b + c = 0

⇔{

a + 4b − c = 0−b + c = 0

4c = 0 L3 ← L3 + 3L2

⇔ a = b = c = 0

La famille ((1, 3,−3), (4, 2,−3), (−1, 7, 6)) est donc libre ; elle est aussi génératrice deA par définition de Vect. C’est une base de A et A = R3.

b. Soient a, b, c, d quatre réels tels que

a(4,−5, 3) + b(2, 3,−2) + c(4,−16, 10) + d(8, 1,−1) = 0.

On résout le système équivalent{4a + 2b + 4c + 8d = 0

−5a + 3b − 16c + d = 03a − 2b + 10c − d = 0

⇔{

4a + 2b + 4c + 8d = 022b − 44c + 44d = 0

−14b + 28c − 28d = 0L2 ← 4L2 + 5L1L3 ← 4L3 − 3L1

⇔{

4a + 2b + 4c + 8d = 0b − 2c + 2d = 0 ⇔

{4a = −2b − 4c − 8db = 2c − 2d ⇔

{a = −4c − 2db = 2c − 2d

Il existe donc une solution telle que c = 1 et d = 0. Ceci implique que (4,−16, 10)est combinaison linéaire de ((4,−5, 3), (2, 3,−2)). De même il existe une solutiontelle que c = 0 et d = 1, et donc (8,−1, 1) est aussi combinaison linéaire de((4,−5, 3), (2, 3,−2)).

Page 416: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On en déduit que B = Vect((4,−5, 3), (2, 3,−2)). Ces deux vecteurs n’étant pas coli-néaires, ils forment également une famille libre. La famille ((4,−5, 3), (2, 3,−2)) estdonc une base de B.

c. Soient a, b, c trois réels tels que a(1, 1,−2) + b(2, 1,−3) + c(0, 1,−1) = 0. On résout lesystème équivalent{

a + 2b = 0a + b + c = 0

−2a − 3b − c = 0⇔

{a + 2b = 0−b + c = 0

b − c = 0⇔

{a = −2cb = c

On a donc par exemple (0,−1, 1) = 2(1, 1, 2) − (2, 1,−3).On en déduit que C = Vect((1, 1, 3), (2, 1,−3)). Les deux vecteurs n’étant pas coli-néaires il forment une famille libre. La famille ((1, 1, 3), (2, 1,−3)) étant à la fois libreet génératrice de C, c’est une base de C.

d. On remarque que (−2,−8, 6) = −2(1, 4,−3). Donc D = Vect((1, 4,−3)). Le vecteur(1, 4,−3) n’étant pas nul, la famille ((1, 4,−3)) est une base de D.

2. 1. Soit (x, y, z, t) un élément quelconque de K4. Nous avons les équivalences sui-vantes.

(x, y, z, t) ∈ E ⇐⇒{

2x + y − z + 2t = 0x + y + z = 0

⇐⇒{

x = 2z − 2ty = 2t − 3z

L2 ← L1 − L2L1 ← 2L2 − L1

⇐⇒ (x, y, z, t) = z(2,−3, 1, 0) + t(−2, 2, 0, 1)

⇐⇒ (x, y, z, t) ∈ Vect((2,−3, 1, 0), (−2, 2, 0, 1)

)Le sous-ensemble E est égal à Vect

((2,−3, 1, 0), (−2, 2, 0, 1)

)dont nous savons qu’il s’agit

d’un sous-espace vectoriel de K4. Les vecteurs (2,−3, 1, 0) et (−2, 2, 0, 1) engendrent E,

ils ne sont pas colinéaires, ils forment une famille libre qui est donc une base de E ; E estde dimension 2.Remarquons que le cours (voir page 5) nous permet d’affirmer avant tout calcul que E estun sous-espace vectoriel de K

4.

2. Soit (x, y, z, t) un élément quelconque de K4. Nous avons les équivalences suivantes.

(x, y, z, t) ∈ Vect((−1, 2, 1,−1), (3, 1, 0,−1)

)⇐⇒ ∃(a, b) ∈ K2 (x, y, z, t) = a(−1, 2, 1,−1) + b(3, 1, 0,−1)

⇐⇒ ∃(a, b) ∈ K2

⎧⎪⎨⎪⎩x = −a + 3by = 2a + bz = at = −a − b

⇐⇒ ∃(a, b) ∈ K2

⎧⎪⎨⎪⎩0 = x + 4z + 3t0 = y − z + ta = zb = −z − t

L1 ← L1 + 4L3 + 3L4L2 ← L2 − L3 + L4L3L4 ← L4 + L3

⇐⇒{

0 = x + 4z + 3t0 = y − z + t

409

Page 417: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

Nous avons donc

Vect((−1, 2, 1,−1), (3, 1, 0,−1)

)=

{(x, y, z, t) ∈ K

4 |x + 4z + 3t = 0, y − z + t = 0}

.

Les deux équations trouvées ne sont pas uniques, répondre à la question posée revient àdonner un système de deux équations linéaires indépendantes équivalent au système dedeux équations que nous proposons.

3. 1. Soit V =

⎛⎜⎝ xyzt

⎞⎟⎠ ,un élément quelconque de l’espace vectoriel M4,1(R).

Nous avons les équivalences suivantes.

V ∈ F ⇐⇒ ∃(a, b, c) ∈ R3 V = av1 + bv2 + cv3

⇐⇒ ∃(a, b, c) ∈ R3

⎧⎪⎨⎪⎩−a + b + c = xa + 3b + c = ya − b − c = z

−3a − b + c = t

⇐⇒ ∃(a, b, c) ∈ R3

⎧⎪⎨⎪⎩−a + b + c = x

4b + 2c = x + y0 = x + z

4b + 2c = 3x − t

L2 ← L1 + L2L3 ← L1 + L3L4 ← 3L1 − L4

⇐⇒{

0 = x + z0 = 2x − y − t L4 ← L4 − L2

⇐⇒ V =

⎛⎜⎝ xyzt

⎞⎟⎠ = x

⎛⎜⎝ 10

−12

⎞⎟⎠ + y

⎛⎜⎝ 010

−1

⎞⎟⎠

⇐⇒ V ∈ Vect

⎛⎜⎝⎛⎜⎝ 1

0−1

2

⎞⎟⎠ ,

⎛⎜⎝ 010

−1

⎞⎟⎠⎞⎟⎠

V ∈ G ⇐⇒ ∃(a, b) ∈ R2 V = av4 + bv5

⇐⇒ ∃(a, b) ∈ R2

⎧⎪⎨⎪⎩2a + 3b = xa + 3b = y2a + b = za + b = t

⇐⇒ ∃(a, b) ∈ R2

⎧⎪⎨⎪⎩2a + 3b = x

a = x − y0 = −5x + 4y + 3z0 = −x − z + 4t

L2 ← L1 − L2L3 ← 3L3 + 4L2 − 5L1L4 ← 4L4 − L1 − L3

⇐⇒{

0 = −5x + 4y + 3z0 = −x − z + 4t

410

Page 418: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

⇐⇒ V =

⎛⎜⎝ xyzt

⎞⎟⎠ =x4

⎛⎜⎝ 4501

⎞⎟⎠ +z4

⎛⎜⎝ 0−3

41

⎞⎟⎠

⇐⇒ V ∈ Vect

⎛⎜⎝⎛⎜⎝ 4

501

⎞⎟⎠ ,

⎛⎜⎝ 0−3

41

⎞⎟⎠⎞⎟⎠

Et finalement nous avons

V ∈ F ∩ G ⇐⇒

⎧⎪⎨⎪⎩0 = x + z0 = 2x − y − t0 = −5x + 4y + 3z0 = −x − z + 4t

⇐⇒

⎧⎪⎨⎪⎩0 = x + z0 = 8x − 4y0 = 00 = 4t

L2 ← 4L2 + L4 + L1L3 ← L3 + 4L2 + L4 − 2L1L4 ← L4 + L1

⇐⇒

⎧⎪⎨⎪⎩x = xy = 2xz = −xt = 0

⇐⇒ V ∈ Vect

⎛⎜⎝⎛⎜⎝ 1

2−1

0

⎞⎟⎠⎞⎟⎠

Nous pouvons conclure que dim(F ∩ G) = 1 et que

⎛⎜⎝⎛⎜⎝ 1

2−1

0

⎞⎟⎠⎞⎟⎠ en est une base.

2. Posons uI =

⎛⎜⎝ 12

−10

⎞⎟⎠, uF =

⎛⎜⎝ 010

−1

⎞⎟⎠ et uG =

⎛⎜⎝ 0−3

41

⎞⎟⎠ .

Le premier calcul nous permet de conclure que F est de dimension 2 ; la famille libre(uI , uF ) en est une base.De même le deuxième calcul nous permet de conclure que G est de dimension 2 ; lafamille libre (uI , uG) en est une base.Il est immédiat de vérifier que les vecteurs (uI , uF, uG) de F + G forment une famille libre ;de plus ils engendrent les vecteurs de F et ceux de G, elle engendre donc F + G. F + Gest donc de dimension 3.

3. Nous avons effectivement dim(F + G) = dim(F) + dim(G) − dim(F ∩ G).

4. a. Le sous-espace F ∩ G est de dimension r finie parce qu’il est inclus par exemple dansF qui est lui-même de dimension finie. Si r �= 0, il existe donc une base de F ∩ G quenous notons BI = (l1, l2, . . . , lr). avec r ∈ N ∗ .

411

Page 419: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

b. Puisque F ∩G ⊂ F et F ∩G ⊂ G, nous avons pour les dimensions de ces sous-espacesr � p et r � q.Nous pouvons compléter éventuellement la base BI avec p − r vecteurs pour obtenirla base BF = (l1, . . . , lr , m1, . . . , mp−r) de F et aussi avec q − r vecteurs pour obtenir labase BF = (l1, . . . , lr , n1, . . . , nq−r) de G

c. Remarquons que la famille F = (l1, . . . , lr , m1, . . . , mp−r , n1, . . . , nq−r) de p + q − rvecteurs de F + G engendre tous les vecteurs de F et tout ceux de G, elle est doncgénératrice de F + G qui de ce fait est de dimension finie.Montrons que la famille F est aussi libre.Considérons une combinaison linéaire nulle de ses p + q − r vecteurs

a1l1 + · · · + ar lr + b1m1 + · · · + bp−rmp−r + g1n1 + · · · + gq−rnq−r = 0.

Soit V = a1l1 + · · · + ar lr + b1m1 + · · · + bp−rmp−r = −g1n1 − · · · − gq−rnq−r .Le vecteur V est dans F ∩ G, il se décompose donc sur la base BI , par exempleV = d1l1 + · · · + dr lr . A cause de l’unicité de la décomposition de V sur la baseBG on a g1 = g2 = · · · = gq−r = 0 et donc V = 0 ; comme BF est une famille libre,on a a1 = a2 = + · · · = ar = b1 = b2 = · · · + bp−r = 0. La famille F est libre, c’estune base de F ∩ G qui est de dimension p + q − r.Nous avons donc pour tout sous-espaces F et G de dimension finie

dim(F + G) = dim(F) + dim(G) − dim(F ∩ G).

4. 1. Nous avons fk(x) = ex+k = ekex et donc

Ef = Vect(x :→ ex, x :→ eex, x :→ e2ex, x :→ e3ex,

)= Vect

(x :→ ex

).

Dans ce cas, Ef est de dimension 1.

2. Nous avons fk(x) = sin(x + k) = cos(k) sin(x) + sin(k) cos(x) et donc

Ef = Vect(f0, f1, f2, f3

)⊂ Vect

(sin, cos

).

Nous pouvons remarquer que les fonctions f1 : x → cos(1) sin(x) + sin(1) cos(x) etf0 : x → sin(x) ne sont pas colinéaires ; Ef est donc un sous-espace de dimensionau moins 2 inclus dans un sous-espace de dimension 2 ; nous avons donc l’égalitéEf = Vect

(sin, cos

)et Ef est de dimension 2.

3. Nous avons fk(x) = (x + k)2 = k2 + 2kx + x2 et donc

Ef = Vect(f0, f1, f2, f3

)⊂ Vect

(x :→ 1, x :→ x, x :→ x2

).

Comme précédemment, on montre facilement que (f0, f1, f2) est une famille libre de troisvecteurs, l’inclusion est donc une égalité et Ef est de dimension 3.

4. Nous avons fk : x → (x + k)ex+k = kekex + ekxex et donc

Ef = Vect(f0, f1, f2, f3

)⊂ Vect

(x :→ ex, x :→ xex

).

Les fonctions f0 et f1 ne sont pas colinéaires, la famille (f0, f1) est une famille libre de deuxvecteurs, l’inclusion est donc une égalité et Ef est de dimension 2.

412

Page 420: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

5. Nous avons fk : x �→ e(x+k)2 = ek2e2kxex2

.Montrons que la famille (f0, f1, f2, f3) est une famille libre. Remarquons que si k < l alors

fk =+∞

o(fl), en effet nous avons limn→+∞

fk(x)fl(x)

= limn→+∞

e2kx

e2lx= lim

n→+∞e(k−l)x = 0.

Considérons une combinaison linéaire nulle l0f0 + l1f1 + l2f2 + l3f3 = 0. Si les li ne sontpas tous nuls, notons i0 le plus grand indice i dans �1, 4� tel que li �= 0; nous avons alorsl0f0 + l1f1 + l2f2 + l3f3 ∼

+∞li0 fi0 .

La seule fonction équivalente à la fonction nulle est la fonction nulle, nous avons doncli0 fi0 = 0 et li0 = 0 ce qui contredit le choix de li0 . Les li sont donc tous nuls, la famille(f0, f1, f2, f3) est une famille libre et Ef est de dimension 4.

5. 1. Écrivons une combinaison linéaire nulle des trois suites proposées. Soient a, b, ctrois réels tels que pour tout n ∈ N, on ait

aun + bvn + cwn = 0

Alors en écrivant cette égalité pour n = 0, 1 et 2, nous voyons que a, b, c sont solutionsd’un système linéaire homogène que nous résolvons{

a + b = 02a − 3b + 2c = 04a + 9b + 8c = 0

⇔{

a + b = 04a − 21b = 04a + 9b + 8c = 0

L2 ← 4L2 − L3

⇔{

25a = 04a − 21b = 04a + 9b + 8c = 0

L1 ← 21L1 + L2⇔ a = b = c = 0

La famille ((un), (vn), (wn)) est donc bien une famille libre.

2. a. L’ensemble E n’est pas vide, il contient par exemple la suite constante nulle.Soit (tn) et (sn) deux suites éléments de E et deux réels a et b. Il est alors immédiatde vérifier que la suite (atn + bsn) vérifie la relation de récurrence R qui caractériseles suites éléments de E. Le sous-ensemble E étant non vide et stable par combinaisonlinéaire est un sous-espace vectoriel de RN.

b. Soit (tn) un suite élément de E et considérons la suite (t′n) définie par∀n ∈ N, t′n = t0an + t1bn + t2cn. La suite (t′n) est élément de E comme combinaisonlinéaire des éléments (an), (bn) et (cn) de E et l’on a ti = t′i pour i = 0, 1 et 2 ; les suites(tn) et (t′n) sont donc égales, la famille

((an), (bn), (cn)

)est donc une famille génératrice

de E.

c. Il est immédiat de vérifier que les suites (un), (vn) et (wn) vérifient la relation R. Lafamille

((un) , (vn) , (wn)

)est une famille libre de trois vecteurs de E et la famille(

(an) , (bn) , (cn))

est une famille de trois vecteurs génératrice de E ; L’espace vecto-riel E est donc de dimension 3,

((un) , (vn) , (wn)

)est une base de E et toute suite (tn)

vérifiant la relation de récurrence R est de la forme tn = a2n + b(−3)n + gn2n avec(a, b, g) ∈ R

3.

Le lecteur relira avec profit dans le livre de première année ce qui concerne les suites récur-rentes linéaires et remarquera que −3 est une racine simple du polynôme caractéristique dessuites étudiées ici et que 2 en est une racine double.

413

Page 421: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

6. 1. Les ensembles F et G contiennent tous les deux le polynôme nul, ils ne sontpas vides. Il est immédiat de voir que chacun de ces ensembles est stable par combinaisonlinéaire.Les ensembles F et G sont donc des sous-espaces vectoriels de E = K3[X].• Soit un polynôme P ∈ F ∪ G, P est de degré inférieur ou égal à 3 et il admet 4 racines

1, 2, 3 et 4 ; P est donc le polynôme nul.Nous avons donc F ∩ G = {0}.

• Soit un polynôme P ∈ F. Puisque P a pour racine 1 et 2, P se factorise par (X−1)(X−2),il existe donc des réels a et b tels que P = (aX + b)(X − 1)(X − 2) ; et nous avons doncP = aR1 + bR2 en posant R1 = X(X − 1)(X − 2) et R2 = (X − 1)(X − 2).De même nous montrons que pour tout polynôme Q ∈ G il existe donc des réels c etd tels que Q = (cX + d)(X − 3)(X − 4) ; et nous avons donc Q = cR3 + dR4 en posantR3 = X(X − 3)(X − 4) et R4 = (X − 3)(X − 4).

• Montrons que la famille (R1, R2, R3, R4) est une famille libre de K3[X]. Soit quatreréels a, b, g, d tels que pour tout x réel aR1(x) + bR2(x) + gR3(x) + dR4(x) = 0. Enprenant successivement x = 0, 1, 3, 5 nous obtenons le système suivant⎧⎪⎨⎪⎩

2b +12d = 06g + 6d = 0

6a + 2b = 060a + 12b +10g + 2d = 0

⇐⇒

⎧⎪⎨⎪⎩2b +12d = 0

6g + 6d = 06a + 2b = 0

−40g = 0 L4 − 10L3 + 4L1 − (50/6)L2

⇐⇒ a = b = g = d = 0

La famille de polynômes (R1, R2, R3, R4) est donc une famille libre de qui est de dimen-sion 4, c’est donc une base de E = K3[X]. La sous-famille (R1, R2) est aussi libre et elleengendre F, c’est donc une base de F et de même (R3, R4) est une base de G.Nous avons donc bien E = F ⊕ G.

On peut facilement généraliser cet exercice.

2. Cet exercice est à rapprocher de l’exemple du cours sur les fonctions impaires et paires.Si A et B sont des matrices et l un réel, nous savons que la transposée de A + B est lasomme tA + tB et que la transposée de lA est ltA.Si A est une matrice de Mn(K), nous avons les équivalences

A ∈ S ⇐⇒ tA = A et A ∈ A ⇐⇒ tA = −A

• L’ensemble S est non vide, il contient la matrice nulle. Soit A et B deux matricessymétriques éléments de S, l et m deux réels. Nous avons alors

t(lA + mB) = t(lA) + t(mB) = l(tA) + m(tB) = lA + mB.

L’ensemble S est non vide et stable par combinaison linéaire, c’est donc un sous-espacevectoriel de Mn(K).

• De même, l’ensemble A est non vide, il contient la matrice nulle. Soit A et B deuxmatrices antisymétriques éléments de A, l et m deux réels. Nous avons

t(lA + mB) = t(lA) + t(mB) = l(tA) + m(tB) = l(−A) + m(−B) = −(lA + mB).

414

Page 422: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

L’ensemble A est non vide et stable par combinaison linéaire, c’est donc un sous-espacevectoriel de Mn(K).

• Soit A = (ai,j) 1�i�n1�j�n

une matrice de S ∩ A. Nous avons alors, pour tout (i, j) ∈ �1, n�2,

ai,j = aj,i = −aj,i ce qui impose ai,j = 0.Nous avons donc S ∩ A = {0}.

• Soit M une matrice de Mn(K). Posons

S =12

(M + tM

)et A =

12

(M − tM

).

Nous avons clairement S ∈ S, A ∈ A et M = S + A.Nous pouvons donc conclure que Mn(K) = S ⊕A.

3. • L’ensemble F est non vide, il contient la fonction nulle. Soit f et g deux fonctionséléments de C1(R, R), l et m deux réels. Nous avons alors

(lf + mg)(0) = lf (0) + mg(0) = 0 et (lf + mg)′(0) = lf ′(0) + mg′(0) = 0.

L’ensemble F est non vide et stable par combinaison linéaire, c’est donc un sous-espacevectoriel de C1(R, R).

• L’ensemble G est en fait égal à l’espace vectoriel R1[X], c’est donc un sous espace deC1(R, R).

• La seule fonction de F ∩ G est clairement la fonction nulle. Nous avons doncF ∩ G = {0}.

• Soit f une fonction de C1(R, R). Définissons les fonctions g et h par

g : x �→ f (x) −(xf ′(0) + f (0)

)et h : x �→

(xf ′(0) + f (0)

).

Nous avons clairement g ∈ F, h ∈ G et f = g + h.Nous pouvons donc conclure que E = F ⊕ G.

4. • Les ensembles F et G ne sont pas vides, ils contiennent tous les deux la suite constantenulle.Nous savons que si u et v sont deux suites réelles convergentes, alors toute combinaisonlinéaire de u et v est une suite convergente et que la limite de la combinaison linéaire estla combinaison linéaire des limites ; ceci confirme que E est bien un espace vectoriel etque F en est un sous-espace. De même, il est clair que l’ensemble des suites constantesest stable par combinaison linéaire, c’est un sous-espace de E.

• La seule suite constante convergeant vers 0 est la suite constante nulle. Nous avons doncF ∩ G = {0}.

• Soit u une suite convergeant vers le réel �. Soit w la suite constante égale à � et v la suitedéfinie par v = u − w. Nous avons clairement v ∈ F, w ∈ G et u = v + w.Nous pouvons donc conclure que E = F ⊕ G.

7. 1. Soit i0 ∈ �0, n� un entier fixé. Le polynôme Pi0 admet n racines distinctes et estde degré inférieur ou égal à n ; il est nécessairement de la forme

Pi0 (X) = ki0

n∏i=0i �=i0

(X − xi)

415

Page 423: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

où ki0 est un scalaire déterminé par la condition Pi0 (xi0 ) = 1. Posons donc

Pi0 =

⎛⎜⎝ n∏i=0i �=i0

(xi0 − xi)

⎞⎟⎠−1 ⎛⎜⎝ n∏

i=0i �=i0

(X − xi).

⎞⎟⎠ . Le polynôme Pi0 satisfait les conditions

demandées, il est le seul à avoir ces propriétés.

∀i ∈ �0, n�, i �= i0 =⇒ Pi0 (xi) = 0 et Pi0 (xi0 ) = 1

2. Soit Q un polynôme de Kn[X] Considérons alors le polynôme Q1 =n∑

i=0

Q(xi)Pi.

Pour chaque i0 ∈ �0, n�, nous avons

Q1(xi0 ) =n∑

i=0

Q(xi0 )Pi(xi0 ) = Q(xi0 ).

Le polynôme Q − Q1 de degré inférieur ou égal à n a n + 1 racines distinctes qui sontx0, x1, . . . , xn, c’est donc le polynôme nul et Q = Q1. Le polynôme Q est donc engendrépar la famille (Pi)i∈�0,n�. Cette famille de n + 1 vecteurs est génératrice de l’espace Kn[X]qui est de dimension n + 1 ; c’est donc une famille libre et une base de Kn[X].

3. Soit maintenant (yi)i∈�0,n� une suite de n + 1 scalaires.Montrons tout d’abord l’unicité du polynôme Q ; Supposons qu’il existe deux polynômesQ et Q1 tels que pour tout i ∈ �0, n� on ait Q(xi) = Q1(xi) = yi. Comme précédemment,le polynôme Q − Q1 de degré inférieur ou égal à n a n + 1 racines, c’est le polynôme nul,Q = Q1, le polynôme Q, s’il existe, est unique.

Il est facile de voir que le polynôme Q =n∑

i=0

yiPi est de degré inférieur ou égal à n tel que

pour tout i ∈ �0, n� on ait Q(xi) = yi.En terme plus géométrique, nous avons montré que par exemple 3 points d’abscisses dif-férentes définissent une unique parabole (représentant un unique polynôme du deuxièmedegré) sauf s’ils sont alignés, dans ce dernier cas ils définissent une unique droite (représen-tant un unique polynôme du degré 1 ou 0).

8. 1. ⇒ Sens direct Soit F et G deux sous-espaces vectoriels d’un K-espace vecto-riel E tels que F ∪ G soit une sous-espace vectoriel de E.Supposons qu’il existe dans F∪G un couple de vecteurs (u, v) avec u ∈ F \G et v ∈ G\F.Puisque l’addition est une loi de composition interne pour un sous-espace vectoriel, nousavons u + v ∈ F ∪G ; si u + v ∈ F, alors v = (u + v) + (−u) ∈ F ce qui contredit v ∈ G \F ;si u + v ∈ G, alors u = (u + v) + (−v) ∈ G ce qui contredit u ∈ F \ G.Dans les deux cas, nous avons une contradiction, ce qui prouve qu’il n’existe pas dansF ∪G un couple de vecteurs (u, v) avec u ∈ F \G et v ∈ G \F. Nous avons donc ou bienF ⊂ G ou G ⊂ F.

⇐ Réciproque Soit F et G deux sous-espaces vectoriels d’un K-espace vectoriel E telsque F ⊂ G ou F ⊂ G Dans cette situation, soit F ∩G = G soit F ∩G = F, dans les deuxcas F ∩ G est un sous-espace vectoriel de E.Ceci démontre donc que F ∪ G est un sous-espace de E ⇐⇒ (F ⊂ G ou G ⊂ F).

2. Soit F G et H trois sous-espaces vectoriels d’un espace vectoriel E, tel que G ⊂ F.

416

Page 424: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

• Soit v ∈ F ∩ (G + H), alors il existe g ∈ G et h ∈ H tels que v = g + h ; remarquons queh = v− g ∈ F puisque v et g sont dans F et donc h ∈ F ∩H et v = g + h ∈ G + (F ∩H)

• Inversement, soit v ∈ G+(F∩H), alors il existe g ∈ G et h ∈ (F∩H) tels que v = g+h.D’une part v ∈ G + H puisque g ∈ G et h ∈ H ; d’autre part v ∈ F puisque g et h sontdans F. Nous avons donc v ∈ F ∩ (G + H).

Ceci démontre l’égalité F ∩ (G + H) = G + (F ∩ H).

9. 1. Nous avons A2 =

(3 1 11 1 11 1 1

), et A3 =

(5 3 33 1 13 1 1

). La relation annon-

cée en découle.

2. Soient a, b deux réels,

aA + bA2 = 0 ⇔(

a + 3b a + b a + ba + b b ba + b b b

)= 0 ⇔

{a + 3b = 0a + b = 0b = 0

⇔ a = b = 0.

La famille (A, A2) est bien libre.

3. L’unicité découle de la liberté de (A, A2).Prouvons l’existence par récurrence sur n.Pour n = 1, A = 1 × A + 0 × A2, d’où la relation voulue en posant a1 = 1 et b1 = 0.Si An = anA + bnA2, alors

An+1 = A×An = anA2+bnA3 = anA2+bn(A2+2A) = 2bnA+(an+bn)A2 = an+1A+bn+1A2

où l’on a posé an+1 = 2bn et bn+1 = an + bn.On a donc pour tout n � 1, An = anA + bnA2 où (an), (bn) sont les suites définies par larécurrence suivante

a1 = 1, b1 = 0 et{

an+1 = 2bnbn+1 = an + bn

4. a. Pour n � 1,

an+2 = 2bn+1 = 2(an + bn) = 2an + 2bn = an+1 + 2an.

b. La suite (an) est récurrente linéaire d’ordre 2. On résout l’équation caractéristiquex2 − x − 2 = 0 dont −1 est racine évidente, et 2 l’autre racine.On sait alors qu’il existe deux réels a, b tels que an = a(−1)n + b2n pour n � 1. Enégalant les deux premiers termes, on résout un système pour déterminer a et b{

−a + 2b = 1a + 4b = 0 ⇔

{−a + 2b = 1

6b = 1 ⇔ a = −23

et b =16·

D’où an = − 23 (−1)n + 1

6 2n. Il s’ensuit que

bn =12

an+1 = −13

(−1)n+1 +112

2n+1 =13

(−1)n +16

2n·

c. De tout ce qui précède, on obtient

An =(−2

3(−1)n +

16

2n

)A +

(13

(−1)n +16

2n

)A2.

417

Page 425: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 1 – Espaces vectoriels

10. Nous allons démontrer que la famille de n + 1 vecteurs((X − 1)k(X + 1)n−k

)0�k�n

est une base de Kn[X] par récurrence sur n.

Initialisation. La famille (1) est une famille libre de un vecteur dans l’espace vectoriel K0[X]des polynômes constants qui est de dimension 1, c’est donc une base de cet espace.Hérédité. Supposons que la famille de n vecteurs

((X − 1)k(X + 1)n−k−1

)0�k�n−1

soit unebase de Kn−1[X] pour une entier n non nul.Considérons dans l’espace vectoriel Kn[X] une combinaison linéaire nulle Q des vecteurs dela famille de n + 1 vecteurs

((X − 1)k(X + 1)n−k

)0�k�n

:

Q =n∑

k=0

ak(X − 1)k(X + 1)n−k = 0.

En 1, l’égalité ci-dessus nous donne Q(1) = a0 = 0.Par ailleurs, le polynôme Q nul a une dérivée qui est aussi le polynôme nul.

Q′ =n∑

k=0

akk(X − 1)k−1(X + 1)n−k +n∑

k=0

ak(n − k)(X − 1)k(X + 1)n−k−1

=n−1∑k=0

ak+1(k + 1)(X − 1)k(X + 1)n−k−1 +n−1∑k=0

ak(n − k)(X − 1)k(X + 1)n−k−1

=n−1∑k=0

((n − k)ak + (k + 1)ak+1

)(X − 1)k(X + 1)n−k−1 = 0.

Comme la famille((X − 1)k(X + 1)n−k−1

)0�k�n−1

est libre, tous les coefficients de la dernièreligne ci-dessus sont nuls. Les coefficients ak sont donc solutions du système étagé suivant.⎧⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩

a0 = 0na0 +a1 = 0

(n − 1)a1 +2a2 = 0

. . .. . .

...

(n − k)ak +(k + 1)ak+1 = 0

. . .. . .

...

an−1 +nan = 0

Nous avons donc a0 = a1 = · · · = ak = · · · = an = 0. La famille de n + 1 vecteurs((X − 1)k(X + 1)n−k

)0�k�n

est une famille libre dans l’espace Kn[X] de dimension n + 1, ils’agit donc d’une base.

Conclusion. Nous avons donc, par le principe de récurrence, démontré que

∀n ∈ N la famille((X − 1)k(X + 1)n−k)

0�k�nest une base de Kn[X].

418

Page 426: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Chapitre 2

1. 1. Nous savons que le rang d’une matrice est la dimension de l’espace engendré parses vecteurs colonnes ou par ses vecteurs lignes puisque rg(tM) = rg(M). Nous allons doncétudier l’espace engendré par les vecteurs colonnes de M après avoir soustrait la premièredes deux dernières. Nous avons

rg(M) = rg

(1 0 0

b + c (a − b) (a − c)bc c(a − b) b(a − c)

).

1er cas : c = a = b. Dans ce cas il n’y a qu’un vecteur non nul, le rang de M est 1.

2e cas : c = a �= b. Dans ce cas il y a un vecteur nul et deux vecteurs non nuls noncolinéaires, le rang de M est 2. Il en sera de même si b = a �= c. Si c = b �= a, nous pouvonsfaire un calcul similaire en soustrayant la dernière colonne de M des deux premières et lerang de M est encore 2.

3e cas : a, b, c distincts. Nous avons alors, en divisant les deux dernières colonnes par(a − b) et (a − c) respectivement puis en soustrayant la deuxième colonne de la dernière

rg(M) = rg

(1 0 0

b + c 1 1bc c b

)= rg

(1 0 0

b + c 1 0bc c b − c

).

Le rang de M est alors 3.

2. Posons J =

⎛⎜⎝ 1 · · · 1...

. . ....

1 · · · 1

⎞⎟⎠ ∈ Mn(K). Nous avons J2 = nJ et M = (a − b)I + bJ, et

enfin, parce que I et J commutent,

M2 = (a − b)2I + 2(a − b)bJ + b2J2 = (a − b)2I +(2a + (n − 2)b

)(bJ).

Nous obtenons M2 = (a − b)2I +(2a + (n − 2)b

)(M − (a − b)I

)en remplaçant bJ par

M − (a − b)I, puis

M2 −(2a + (n − 2)b

)M = (a − b)2I − (a − b)

(2a + (n − 2)b

)I

M(M − (2a − 2b + nb)I

)= −(a − b)

(a + (n − 1)b

)I.

1er cas : a = b ou a = (1 − n)b. La matrice M est non inversible ; en effet si M étaitinversible, le produit à gauche de la dernière égalité par M−1 donnerait une contradic-tion ou a = b = 0 ce qui contredit l’inversibilité de M .

2e cas : a �= b et a �= (1 − n)b. la matrice M est inversible et l’on a

M−1 =1

(b − a)(a + (n − 1)b

)(M − (2a − 2b + nb)I

)419

Page 427: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

3. a. Pour la suite géométrique (rn)n∈N, nous avons 1 + r + r2 + · · · + rk−1 =1 − rk

1 − ravec

r �= 1. Ceci nous donne l’identité (1 − r)(1 + r + r2 + · · · + rk−1) = 1 − rk, vraie pourtout réel r.

b. Par analogie avec la question précédente nous faisons les calculs suivant

(I − A)(I + A + A2 + · · · + Ak−1) = I − Ak = I,

(I + A)(I − A + A2 + · · · + (−1)k−1Ak−1) = I − (−1)kAk = I.

Ceci démontre l’inversibilité de I − A et de I + A et donne leur inverse respectif.

2. 1. Soient M, N deux matrices de M2(K) et l, m deux scalaires. On a

f (lM + mN ) = (lM + mN )A − A(lM + mN )= l(MA − AM) + m(NA − AN )= lf (M) + mf (N )

f est une application linéaire, donc un endomorphisme de RN.

2. Nous considérons la base canonique B = (E1,1, E2,1, E1,2, E2,2).Nous avons par exemple

w(E1,1) =(

1 00 0

) (1 30 1

)−

(1 30 1

) (1 00 0

)=

(0 20 0

)= 2E1,2.

De même w(E2,1) =(

−2 00 2

)= −2E1,1 + 2E2,2,

w(E1,2) =(

0 00 0

)= 0,

w(E2,2) =(

0 −20 0

)= −2E1,2.

Nous en déduisons MB(w) =

⎛⎜⎝ 0 −2 0 00 0 0 02 0 0 −20 2 0 0

⎞⎟⎠3. L’application w est un endomorphisme de M2(K) qui est un espace de dimension 4. Nous

observons que �m(w) = Vect(E1,2,−E1,1 + E2,2) est de dimension 2. Le noyau de w estdonc de dimension 2 (théorème du rang).Nous en déduisons Ker(w) = Vect(E1,2, E1,1 + E2,2).L’endomorphisme w est ni injectif ni surjectif.

4. L’image de w2 est engendré par(w(E1,2), w(−E1,1 + E2,2)

). Nous avons

�m(w2) = Vect(E1,2) qui est donc de dimension 1.Nous en déduisons w3 = 0.Les mêmes conclusions pouvaient être obtenues en remarquant que

M2B(w) =

⎛⎜⎝ 0 0 0 00 0 0 00 −8 0 00 0 0 0

⎞⎟⎠ , M3B(w) =

⎛⎜⎝ 0 0 0 00 0 0 00 0 0 00 0 0 0

⎞⎟⎠ .

420

Page 428: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. 1. a. Soient (un), (vn) deux suites à valeurs dans R et l, m deux scalaires. On a

f (l(un)n∈N + m(vn)n∈N) = f((lun + mvn)n∈N

)= (lun+1 + mvn+1)n∈N

= l(un+1)n∈N + m(vn+1)n∈N

= lf ((un)n∈N) + mf ((vn)n∈N)

f est une application linéaire, donc un endomorphisme de RN.

b. Une suite (un) est dans le noyau de f si et seulement si pour tout n ∈ N, un+1 = 0.

Ker(f ) ={

(un) ∈ RN / ∀n ∈ N

∗, un = 0}

Le noyau de f est donc l’ensemble des suites dont tous les termes sont nuls sauf lepremier terme u0 ; Ker(f ) �= {0} et f n’est pas injective.En dimension finie, f injectif équivaut à f surjectif ; nous ne pouvons pas conclure quef n’est pas surjective car nous ne savons rien de la dimension de RN .

c. Il est immédiat de montrer par récurrence sur k que pour toute suite (un) à valeurs dansR, f k((un)n∈N) = (un+k)n∈N. On en déduit que

Ker(f k) ={

(un) ∈ KN / ∀n ∈ N, n � k ⇒ un = 0

}Le noyau de f k est l’ensemble des suites dont tous les termes sont nuls sauf les k + 1premiers termes u0, u1, . . . , uk.Pour tout i ∈ N, définissons la suite (ui

n)n∈N par uin = 1 si n = i et 0 sinon ; la suite

(uin)n∈N a donc tous ses termes nuls sauf celui d’indice i qui vaut 1.

Pour toute suite (un) ∈ Ker(f k) on a alors

(un) =k∑

i=0

ui(uin)n∈N

et donc Ker(f k) = Vect(u0, u1, . . . , uk).Montrons que la famille (u0, u1, . . . , uk) est aussi une famille libre. Supposons avoir

des scalaires a0, a1, . . . , ak tels quek∑

i=0

aiui = 0. Alors en considérant les k + 1 premiers

termes de la suite définie par cette somme, il vient a0 = a1 = · · · = ak = 0.La famille (u0, u1, . . . , uk) est donc une famille libre et génératrice de Ker(f k), c’est-à-dire une base de Ker(f k) qui est donc de dimension k + 1.Nous avons, au cours de cette démonstration, montré qu’il existe des familles libres dek + 1 vecteurs pour tout entier naturel k. L’espace R

N est donc de dimension infinie.

d. Soit (un) une suite à valeurs dans K. On définit la suite (vn) par v0 = 0 et vn = un−1pour n � 1. On a alors f ((vn)n∈N) = (vn+1)n∈N = (un)n∈N. f est donc surjective.

Il existe donc des endomorphismes d’un espace E surjectifs et non injectifs si la dimensionde E est infinie.

2. a. On montre comme pour f que l’application g est linéaire.Une suite (un) est dans le noyau de g si et seulement si pour tout n ∈ N, un = 0. Lenoyau Ker(g) est donc réduit à {0} et g est injective.Il est facile de remarquer que l’espace image de g est l’ensemble des suites (vn)n∈N dontle premier terme v0 est nul. L’endomorphisme g n’est donc pas surjectif.

421

Page 429: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

b. On a pour toute suite u = (un)n∈N l’égalité f ◦ g(u) = u ; nous avons donc f ◦ g = IdRN .Nous savons que ni f ni g ne sont bijectives, on ne peut pas parler de fonction réci-proque.Il existe donc des endomorphismes d’un espace E injectifs et non surjectifs si la dimen-sion de E est infinie, .

4. 1. Si f était bijective alors f k serait bijective comme composée de bijections. Or

f k = 0, donc f n’est pas bijective. Dans le cas où E est de dimension finie, les propriétés finjective, f surjective et f bijective sont équivalentes pour un endomorphisme de E ; f estdonc ni injective ni surjective.

2. a. Soient l0, . . . , lp−1 des scalaires tels quep−1∑k=0

lkf k(x0) = 0.

Nous avons ∀k � p, f k(x0) = 0 et f p−1(x0) �= 0. D’où nous avons successivement

0 = f p−1

(p−1∑k=0

lkf k(x0)

)=

p−1∑k=0

lkf p+k−1(x0) = l0f p−1(x0) =⇒ l0 = 0

0 = f p−2

(p−1∑k=0

lkf k(x0)

)=

p−1∑k=0

lkf p+k−2(x0) = l1f p−1(x0) =⇒ l1 = 0

0 = f p−3

(p−1∑k=0

lkf k(x0)

)=

p−1∑k=0

lkf p+k−3(x0) = l2f p−1(x0) =⇒ l2 = 0

et ainsi de suite jusqu’à

0 = f

(p−1∑k=0

lkf k(x0)

)=

2p−2∑k=p−1

lkf k+1(x0) = lp−1f p−1(x0) =⇒ lp−1 = 0.

Les scalaires l0, . . . , lp−1 sont nuls et la famille (x0, f (x0), . . . , f p−1(x0)) est libre.

b. On vient de trouver une famille libre de E qui compte p vecteurs. On sait alors quep � dim(E) = n.

5. 1. Soient P, Q deux polynômes dans E et l, m deux scalaires. On a

f (lP + mQ) = (X − a)((

(lP + mQ)′ − (lP + mQ)(a)))

− 2(lP + mQ − (lP + mQ)(a)

)= l

((X − a)

(P′ − P′(a)

)− 2

(P − P(a)

))+ m

((X − a)

(Q′ − Q′(a)

)− 2

(Q − Q(a)

))= lf (P) + mf (Q)

f est donc un endomorphisme de Kn[X].

2. Le rôle important que le scalaire a joue dans cet endomorphisme suggère l’utilisation de labase

((X − a)i

)0�i�n

(voir l’exercice page 14).

422

Page 430: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Nous avons alors pour tout i ∈ �1, n�

f((X − a)i

)= (X − a)

(i(X − a)i−1 − 0

)− 2

((X − a)i − 0

)= (i − 2)(X − a)i,

de plus f((X − a)0

)= f (1) = 0.

De ces calculs, il est facile de déduire que l’on a

Ker(f ) = Vect((X − a)0, (X − a)2

)et �m(f ) = Vect

((X − a)1, (X − a)3, (X − a)4, . . . , (X − a)n

).

6. Montrer que f est une projection sur �mf parallèlement à Ker f consiste à montrerque E = �mf ⊕ Ker f puis que, pour tout x de E, la décomposition unique de x en unesomme d’un élément u de �mf et d’un élément v de Ker f est telle que f (x) = u. nousdevrions alors avoir l’égalité x = u + v = f (x) + v et donc v = x − f (x). Ces considérationsconduisent à la solution de l’exercice.Soit f un endomorphisme de E tel que f ◦ f = f .Nous avons pour tout x de E l’égalité x = f (x) +

(x − f (x)

). Il est clair que f (x) ∈ �mf ; par

ailleurs f(x − f (x)

)= f (x) − f

(f (x)

)= f (x) − f (x) = 0 et donc

(x − f (x)

)∈ Ker f . Ce qui

prouve E = �mf + Ker f .Soit maintenant x ∈ �mf ∩ Ker f . Il existe t ∈ E tel que x = f (t) et nous avonsx = f (t) = f ◦ f (t) = f

(f (t)

)= f (x) = 0 ce qui prouve que �mf ∩ Ker f = {0}.

Nous avons donc E = �mf ⊕ Ker f et la décomposition de tout vecteur x selon cettesomme directe est x = f (x) +

(x − f (x)

). Ceci démontre que f est la projection sur �mf

parallèlement à Ker f .

7. 1. a. Nous savons que si p est un projecteur, alors p ◦ p = p.u = p ◦ u − u ◦ p =⇒ p ◦ u = p2 ◦ u − p ◦ u ◦ p = p ◦ u − p ◦ u ◦ p,

d’où : p ◦ u ◦ p = 0

De même, u ◦ p = p ◦ u ◦ p − u ◦ p2 = −u ◦ p,

d’où : u ◦ p = 0

b. D’où u = p ◦ u et donc u2 = p ◦ (u ◦ p) ◦ u = 0.

2. a. Soit x ∈ �mu, il existe z ∈ E tel que x = u(z) et u(x) = u2(z) = 0, donc x ∈ Ker u,ce qui prouve l’inclusion demandée.

b. Nous avons u ◦ q = 0 (car H ⊂ Ker u) et pour tout x ∈ E, q(u(x)

)= u(x) (car u(x)

appartient à �mu, donc à H). Ainsi

q ◦ u − u ◦ q = u

3. Ce qui précède montre que la condition nécessaire et suffisante cherchée est u2 = 0.Il y a en général plusieurs façons de choisir H (si �mu �= Ker u), de plus, pour un sous-espace H il existe en général plusieurs supplémentaires ce qui conduit à plusieurs choix duprojecteur p.

423

Page 431: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 2 – Applications linéaires

4. Nous avons bien u2 = u parce que :(

−2 4−1 2

) (−2 4−1 2

)=

(−2 4−1 2

).

Ici H = �mu = Ker u = Vect(2, 1). N’importe quel projecteur p d’image H convient.

Prenons comme sous-espace supplémentaire S = Ker(p) = Vect

(10

). Nous avons

alors E = H ⊕ S. Décomposons le deuxième vecteur de la base selon cette somme directe(01

)=

(21

)− 2

(10

).

Nous avons maintenant les vecteurs images de la base canonique par un projecteur p sur

H parallèlement à S, sa matrice est P =(

0 20 1

).

Un calcul matriciel nous donne immédiatement PU − UP = U .

8. ⇒ Sens direct. Soit f tel que �mf = Ker f .Pour tout x de E, nous avons f (x) ∈ �mf ⊂ Ker f et f

(f (x)

)= 0 ; l’endomorphisme f ◦ f est

donc l’endomorphisme nul.Le théorème du rang nous donne

n = dim(E) = dim(�mf ) + dim(Ker f)

= 2 dim(�mf ).

⇐ Réciproque. Soit f tel que(f ◦ f = 0 et n = 2 dim(�mf )

).

Le théorème du rang nous impose dim(�mf ) = dim(Ker f ).Nous avons Ker f ⊂ �mf parce que f ◦ f = 0 ; et comme dim(Ker f ) = dim(�mf ) nous avonsKer f = �mf

9. 1. a. ⇒ Sens direct. Soit f ∈ L(E, F) et g ∈ L(F, G) deux endomorphismestels que Ker(g ◦ f ) = Ker(f ).Soit x ∈ Ker g ∩ �mf , il existe alors t ∈ E tel que x = f (t). Nous avons0 = g(x) = g

(f (t)

)= g ◦ f (t), donc t ∈ Ker g ◦ f = Ker f et x = f (t) = 0.

Ceci démontre que Ker g ∩ �mf = {0}.⇐ Réciproque. Soit f ∈ L(E, F) et g ∈ L(F, G) deux endomorphismes tels queKer g ∩ �mf = {0}.Remarquons tout d’abord que l’on a toujours Ker f ⊂ Ker(g ◦ f , en effet, si l’on af (x) = 0 alors on a g

(f (x)

)= 0.

Soit x ∈ Ker(g ◦ f ), alors f (x) ∈ �mf et f (x) ∈ Ker g donc f (x) = 0 et x ∈ Ker f .Ceci démontre Ker(g ◦ f ) = Ker(f ).

b. ⇒ Sens direct. Soit f ∈ L(E, F) et g ∈ L(F, G) deux endomorphismes tels que�m(g ◦ f ) = �m(g).Soit x ∈ F, alors il existe t ∈ E tel que g ◦ f (t) = g(x). Nous avons x =

(x− f (t)

)+ f (t)

avec f (t) ∈ �mf et g(x − f (t)

)= g(x) − g ◦ f (t) = 0, c’est-à-dire

(x − f (t)

)∈ Ker g.

Ceci démontre que Ker g + �mf = F.⇐ Réciproque. Soit f ∈ L(E, F) et g ∈ L(F, G) deux endomorphismes tels queKer g + �mf = F.Remarquons tout d’abord que l’on a toujours �m(g ◦ f ) ⊂ �mg.Soit x ∈ �mg, alors il existe t ∈ F tel que x = g(t) ; il existe alors u ∈ Ker g et v ∈ �mftels que t = u + v et donc tel que x = g(t) = g(u + v) = g(u) + g(v) = g(v) ; et enfin ilexiste w ∈ E tel que w = f (v).Nous avons g ◦ f (w) = g

(f (w)

)= g(v) = x et x ∈ �mg ◦ f .

Ceci démontre que �m(g ◦ f ) = �m(g).

424

Page 432: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. Soit f un endomorphisme de E de dimension finie n.Nous avons toujours �mf ◦ f ⊂ �mf et Ker f ⊂ Ker f ◦ f .Le théorème du rang nous donne pour les endomorphismes f et f ◦ f de E les égalitésn = dim(�mf ◦ f ) + dim(Ker f ◦ f ) = dim(�mf ) + dim(Ker f ).Cela nous permet d’établir la première équivalence que nous devons démontrer.

Ker f ◦ f = Ker f ⇐⇒ dim(Ker f ◦ f ) = dim(Ker f )⇐⇒ dim(�mf ◦ f ) = dim(�mf )⇐⇒ �mf ◦ f = �mf .

Les résultats de la partie 1 de l’exercice en prenant E = F = G et f = g nous permettentd’affirmer que

Ker f 2 = Ker f ⇐⇒ �mf 2 = �mf ⇐⇒{

Ker f 2 = Ker f�mf 2 = �mf

⇐⇒{

Ker f ∩ �mf = {0}Ker f + �mf = E

⇐⇒ Ker f ⊕�mf = E

Chapitre 3

1. 1. l est valeur propre si et seulement si A − lI2 n’est pas inversible. Nouscommençons donc par trianguler par la méthode du pivot de Gauss A − lI2.(

2 − l 41 −1 − l

) (1 −1 − l

2 − l 4

)L1 ↔ L2

(1 −1 − l0 (2 − l)(−1 − l) − 4

)L2 ← (2 − l)L1 − L2

Les valeurs propres sont les solutions de (2 − l)(−1 − l) − 4 = 0. Soit l2 − l − 6 = 0.Les valeurs propres sont −2, 3.

Nous sommes en dimension deux et A possède deux valeurs propres distinctes, A estdiagonalisable.Une équation de E−2 est {

4x + 4y = 0x + y = 0

Soit x = −y. D’oùE−2 = Vect

((−1, 1)

).

De même une équation de E3 est{−x + 4y = 0

x − 4y = 0 ⇔ x = 4y

D’oùE3 = Vect

((4, 1)

).

Une base de vecteurs propres est ((−1, 1), (4, 1)).

425

Page 433: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

En posant P =(

−1 41 1

), on a

P−1AP =(

−2 00 3

)2. Le réel l est valeur propre si, et seulement si, B − lI2 =

(1 − l 1

0 1 − l

)n’est pas

inversible, c’est-à-dire si l = 1.Une équation de E1 est {

y = 00 = 0

D’oùE1 = Vect

((1, 0)

)Le sous espace propre E1 est de dimension un, il n’y a pas d’autre sous-espace propre etnous sommes en dimension deux. B n’est donc pas diagonalisable.

3. Le réel l est valeur propre si, et seulement si, C − lI2 =(

1 − l 1−4 1 − l

)n’est pas

inversible, c’est-à-dire, après triangulation, si(

−4 1 − l

0 4 + (1 − l)2

)n’est pas inversible.

Dans R, cette dernière matrice est inversible quelque soit l, la matrice C n’est pas diago-nalisable.Dans C, la matrice C n’est pas inversible pour l = 1 + 2i et pour l = 1 − 2i, elle a doncdeux valeurs propres, nous sommes en dimension 2, C est diagonalisable.Une équation de E1+2i est{

−4x − 2iy = 00 = 0 ⇐⇒ y = 2ix

D’oùE1+2i = Vect

((1, 2i)

)De même, nous obtenons E1−2i = Vect

((1,−2i)

)4. La matrice A est une matrice réelle symétrique, nous savons donc qu’elle est diagonalisable

quelque soit a.a. l est valeur propre de A si et seulement si A − lI2 n’est pas inversible.

Nous triangulons par la méthode du pivot de Gauss A − lI2.(a − l 1

1 a − l

) (1 a − l

a − l 1

)L1 ↔ L2

(1 −1 − l

0 (a − l)2 − 1

)L2 ← (a − l)L1 − L2

A − l n’est pas inversible si et seulement si l vérifie l’équation (a − l)2 − 1 = 0. Soit(a − l − 1)(a − l + 1) = 0. Les valeurs propres sont a + 1 et a − 1. Ces valeurs étantdistinctes, A est diagonalisable.Une équation de Ea−1 est {

x + y = 0x + y = 0

Soit x = −y, d’où Ea−1 = Vect(−1, 1).

426

Page 434: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

De même une équation de Ea+1 est{−x + y = 0

x − y = 0

Soit x = y, d’où Ea+1 = Vect(1, 1).

Une base de vecteurs propres est donc ((−1, 1), (1, 1)). En posant P =(

−1 11 1

),

on a

P−1AP =(

a − 1 00 a + 1

)b. On a donc An = PBnP−1. Or on sait que Bn =

((a − 1)n 0

0 (a + 1)n

). Il reste à

calculer P−1. Pour cela on résout le système associé

{−x + y = a

x + y = b ⇔

⎧⎪⎨⎪⎩x =

−a + b2

y =a + b

2

D’où

P−1 =

⎛⎜⎝ −12

12

12

12

⎞⎟⎠On trouve finalement

An =(

−1 11 1

) ((a − 1)n 0

0 (a + 1)n

) ⎛⎜⎝ −12

12

12

12

⎞⎟⎠=

12

(−(a − 1)n (a + 1)n

(a − 1)n (a + 1)n

) (−1 1

1 1

)=

12

((a + 1)n + (a − 1)n (a + 1)n − (a − 1)n

(a + 1)n − (a − 1)n (a + 1)n + (a − 1)n

)2. 1. Soit A la matrice à étudier, on triangule A − lI.(

1 − l 0 10 1 − l 01 1 3 − l

)→

(1 1 3 − l0 1 − l 0

1 − l 0 1

)L1 ↔ L3

⎛⎝ 1 1 3 − l0 1 − l 00 l − 1 −l2 + 4l − 2

⎞⎠L3 ← L3 + (l − 1)L1

→ A(l) =

⎛⎝ 1 1 3 − l0 1 − l 00 0 −l2 + 4l − 2

⎞⎠L3 ← L3 + L2

427

Page 435: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

l est valeur propre si et seulement si (1 − l)(l2 − 4l + 2) = 0. 1 est valeur propre ainsique les racines de l2 − 4l + 2 soit

D′ = 4 − 2 = 2, l1 = 2 −√

2, l2 = 2 +√

2

La matrice A possède les trois valeurs propres 1, 2−√

2, 2+√

2, nous sommes en dimension3, elle est diagonalisable.Une équation de E1 est A(1)X = 0 soit{

x + y + 2z = 0−z = 0 ⇔

{x = −yz = 0

D’où E1 = Vect(−1, 1, 0).Une équation de E2−

√2 est A(2 −

√2)X = 0 soit{

x + y + (1 +√

2)z = 0(√

2 − 1)y = 0⇔

{x = −(1 +

√2)z

y = 0

D’où E2−√

2 = Vect(−1 −√

2, 0, 1).

Une équation de E2+√

2 est A(2 +√

2)X = 0 soit{x + y + (1 −

√2)z = 0

(−1 −√

2)y = 0⇔

{x = (

√2 − 1)z

y = 0

D’où E2+√

2 = Vect(√

2 − 1, 0, 1).

2. Soit A la matrice à étudier, on triangule A − lI.( −1 − l 2 −2−6 7 − l −5−6 6 −4 − l

)→

( −6 6 −4 − l−6 7 − l −5

−1 − l 2 −2

)L1 ↔ L3

( −6 6 −4 − l0 1 − l l − 10 6 − 6l −12 + (l + 1)(4 + l)

)L2 ← L2 − L1L3 ← 6L3 − (l + 1)L1

→ A(l) =

⎛⎝ −6 6 −4 − l0 1 − l l − 10 0 l2 − l − 2

⎞⎠L3 ← L3 − 6L2

Les valeurs propres sont donc les solutions de l’équation (1 − l)(l2 − l − 2) = 0 soit1,−1, 2. La matrice A possède trois valeurs propres, nous sommes en dimension 3, elle estdiagonalisable.Une équation de E−1 est A(−1)X = 0 soit{

−6x + 6y − 3z = 02y − 2z = 0 ⇔

⎧⎨⎩ x =12

z

y = z

D’où E−1 = Vect(1, 2, 2).

428

Page 436: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

De même, une équation de E1 est A(1)X = 0, soit{−6x + 6y − 5z = 0

−2z = 0 ⇔{

x = yz = 0

D’où E1 = Vect(1, 1, 0).Enfin, une équation de E2 est A(2)X = 0, soit{

−6x + 6y − 6z = 0−y + z = 0 ⇔

{x = 0y = z

D’où E2 = Vect(0, 1, 1).

3. Soit A la matrice à étudier, on triangule A − lI.(1 − l −2 2−2 1 − l 2−2 −2 5 − l

)→

( −2 −2 5 − l−2 1 − l 2

1 − l −2 2

)L1 ↔ L3

⎛⎝ −2 −2 5 − l0 3 − l l − 30 −6 + 2l l2 − 6l + 9

⎞⎠ L2 ← L2 − L1L3 ← 2L3 + (1 − l)L1

→ A(l) =

⎛⎝ −2 −2 5 − l0 3 − l l − 30 0 l2 − 4l + 3

⎞⎠L3 ← L3 + 2L2

Les valeurs propres sont donc les solutions de l’équation (3−l)(l2 −4l +3). Un premièrevaleur propre est 3. Les autres sont les racines du trinôme l2 −4l+3 dont 1 est une racineévidente et 3 est l’autre racine. La matrice possède donc deux valeurs propres 1 et 3, nousne pouvons pas encore savoir si A est diagonalisable.Une équation de E1 est A(1)X = 0, soit{

−2x − 2y + 4z = 02y − 2z = 0 ⇔

{x = zy = z

D’où E1 = Vect(1, 1, 1).De même une équation de E3 est A(3)X = 0, soit

−2x − 2y + 2z = 0 ⇔ z = x + y

D’où E3 = Vect((1, 0, 1), (0, 1, 1)).La somme des dimensions des sous-espaces propres est 3, la matrice A est donc diagonali-sable.

3. La matrice A est clairement de rang 2, donc on peut déjà conclure que 0 est valeurpropre et que dim(E0) = n − 2.De plus ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩

x1 + x2 + · · · + xn = 0x1 + xn = 0x1 + xn = 0

...x1 + xn = 0

x1 + x2 + · · · + xn = 0

⇔{

x1 = −xnx2 = −x3 + · · · − xn−1

429

Page 437: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

d’où

E0 = Vect

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

−10.........01

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠,

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

0−110......0

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠, . . . ,

⎛⎜⎜⎜⎜⎜⎜⎜⎜⎝

0−10...010

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎠

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠.

Pour les autres valeurs propres déterminons les réels l non nuls tels que le système(A − lI)X = 0 admette une solution non nulle. Résolvons ce système⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩

x1 + x2 + · · · + xn = lx1x1 + xn = lx2x1 + xn = lx3

...x1 + xn = lxn−1

x1 + x2 + · · · + xn = lxn

Comme l �= 0 ce système équivaut à⎧⎪⎪⎨⎪⎪⎩x2 = x3 = x4 = · · · = xn−1 =

1l

(x1 + xn)

x1 = xn =1l

n∑k=1

xk

⎧⎪⎪⎨⎪⎪⎩x2 = x3 = x4 = · · · = xn−1 =

2l

x1

xn = x1

x1 =1l

(2x1 + (n − 2)2l

x1)

⎧⎪⎨⎪⎩x2 = x3 = x4 = · · · = xn−1 =

2l

x1

xn = x1(l2 − 2l − 2(n − 2)

)x1 = 0

Ce système admet une solution non nulle si, et seulement si, l2 − 2l − 2(n − 2) = 0. Nousavons D′ = 1 + 2(n − 2) = 2n − 3.La matrice A possède donc deux autres valeurs propres 1 ±

√2n − 3. D’après la résolution du

système on a, pour l = 1 ±√

2n − 3.

El = Vect

⎛⎜⎜⎜⎜⎝⎛⎜⎜⎜⎜⎝

l1...1l

⎞⎟⎟⎟⎟⎠⎞⎟⎟⎟⎟⎠ .

4. On remarque que

A − (a − 1)I =

⎛⎜⎝ 1 . . . 1...

...1 . . . 1

⎞⎟⎠430

Page 438: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

d’où rg(A − (a − 1)I) = 1. D’après la formule du rang, dim(Ea−1(A)) = n − 1 (en particulier

a − 1 est une valeur propre de A). De plus, pour X =

⎛⎜⎝ x1...

xn

⎞⎟⎠,

X ∈ Ea−1(A) ⇔ x1 + x2 + · · · + xn = 0 ⇔ x1 = −x2 + · · · − xn,

d’où

E1(A) = Vect

⎛⎜⎜⎜⎜⎜⎜⎜⎝

⎛⎜⎜⎜⎜⎜⎜⎜⎝

−110......0

⎞⎟⎟⎟⎟⎟⎟⎟⎠,

⎛⎜⎜⎜⎜⎜⎜⎜⎝

−101......0

⎞⎟⎟⎟⎟⎟⎟⎟⎠, . . . ,

⎛⎜⎜⎜⎜⎜⎜⎝

−10...010

⎞⎟⎟⎟⎟⎟⎟⎠ ,

⎛⎜⎜⎜⎜⎜⎜⎜⎝

−10......01

⎞⎟⎟⎟⎟⎟⎟⎟⎠

⎞⎟⎟⎟⎟⎟⎟⎟⎠Comme dim(Ea−1) = n − 1, il ne reste plus qu’éventuellement une seule autre valeur propre.Mais un peu d’intuition nous fait constater que

A ×

⎛⎜⎝ 1...1

⎞⎟⎠ =

⎛⎜⎝ a + (n − 1)...

a + (n − 1)

⎞⎟⎠ = (a + n − 1)

⎛⎜⎝ 1...1

⎞⎟⎠ ,

donc a + n − 1 est la seconde valeur propre de A et Ea+n−1(A) = Vect

⎛⎜⎝⎛⎜⎝ 1

...1

⎞⎟⎠⎞⎟⎠.

5. 1. Le réel l est valeur propre de A si et seulement si (7 − l)(1 − l) + 8 = 0 soitl2 − 8l + 15 = 0. On résout

D′ = 16 − 15 = 1, l1 = 4 − 1 = 3, l2 = 4 + 1 = 5

A a pour valeurs propres 3 et 5.Une équation de E3 est {

4x + 2y = 0−4x − 2y = 0 ⇔ y = −2x

D’où E3 = Vect((1,−2)).De même une équation de E5 est{

2x + 2y = 0−4x − 4y = 0 ⇔ y = −x

D’où E5 = Vect((1,−1)).Une base de vecteurs propres est donc ((1,−2), (1,−1))

431

Page 439: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

2. En posant P =(

1 1−2 −1

), on a

P−1AP =(

3 00 5

)D’où

An = P(

3n 00 5n

)P−1

Il reste à inverser P en résolvant le système associé{x + y = a

−2x − y = b ⇔{

x = −a − by = 2a + b

D’où P−1 =(

−1 −12 1

).

On en déduit que

An =(

1 1−2 −1

) (3n 00 5n

) (−1 −1

2 1

)=

(3n 5n

−2 × 3n −5n

) (−1 −1

2 1

)=

(−3n + 2 × 5n −3n + 5n

2 × 3n − 2 × 5n 2 × 2n − 5n

)3. On voit que, pour tout entier naturel n, on a Xn+1 = AXn.

4. Par récurrence sur n, on prouve que pour tout n ∈ N, Xn = AnX0.

5. On en déduit que pour n ∈ N, on a(unvn

)=

(−3n + 2 × 5n −3n + 5n

2 × 3n − 2 × 5n 2 × 3n − 5n

)(11

)=

(−2 × 3n + 3 × 5n

4 × 3n − 3 × 5n

)

6. 1. a. Nous avons P(X) = X3 − 2X2 − 5X + 6. Nous observons que 1 est uneracine évidente de ce polynôme puis à l’aide du discriminant D = 25 nous obtenonssuccessivement

P(X) = (X − 1)(X2 − X − 6) = (X − 1)(X − 3)(X + 2).

Les solutions de P(x) = 0 sont −2, 1 et 3.

b. Nous pouvons noter P(A) = A3 − 2A2 − 5A + 6I3.Avec

I3 =

(1 0 00 1 00 0 1

), A =

(7 3 −9

−2 −1 22 −1 −4

),

A2 =

(25 27 −21−8 −7 8

8 11 −4

), A3 =

(79 69 −87

−26 −25 2626 17 −34

),

432

Page 440: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

nous obtenons

P(A) =

(79 − 50 − 35 + 6 69 − 54 − 15 −87 + 42 + 45

−26 + 16 + 10 −25 + 14 + 5 + 6 26 − 16 − 1026 − 16 − 10 17 − 22 + 5 −34 + 8 + 20 + 6

)= 0.

c. Si V est un vecteur propre de A associé à une valeur propre l, nous avons successive-ment I3V = 1V , AV = lV , A2V = l2V et A3V = l3V . Le calcul de P(A)V nousdonne alors

P(A)V = A3V − 2A2V − 5AV + 6I3V = l3V − 2l2V − 5lV + 6V = P(l)V .

Comme le vecteur V est non nul, nous en déduisons que les valeurs propres de A sontsolutions de P(x) = 0, elles sont donc dans {−2, 1, 3}.

2. Pour chaque l ∈ {−2, 1, 3}, déterminons s’il existe des vecteurs X solutions de AX = lX.1er cas l = −2{

7x + 3y − 9z = −2x−2x − y + 2z = −2y

2x − y − 4z = −2z⇐⇒

{3x + y − 3z = 0

−2x + y + 2z = 02x − y − 2z = 0

⇐⇒{

x = zy = 0

l = −2 est une valeur propre et un vecteur propre associé est X−2 = (1, 0, 1).2e cas l = 1{

7x + 3y − 9z = x−2x − y + 2z = y

2x − y − 4z = z⇐⇒

{2x + y − 3z = 0−x − y + z = 0

2x − y − 5z = 0⇐⇒

{2x + y − 3z = 0

x − 2z = 04x − 8z = 0

Ce qui nous donne{

y = −zx = 2z

l = 1 est une valeur propre et un vecteur propre associé est X1 = (2,−1, 1).3e cas l = 3 {

7x + 3y − 9z = 3x−2x − y + 2z = 3y

2x − y − 4z = 3z⇐⇒

{4x + 3y − 9z = 0−x − 2y + z = 02x − y − 7z = 0

⇐⇒{ −x − 2y + z = 0

−5y − 5z = 0−5y − 5z = 0

Ce qui nous donne{

y = −zx = 3z

l = 1 est une valeur propre et un vecteur propre associé est X3 = (3,−1, 1).

3. Nous sommes en dimension 3, la matrice A a trois valeurs propres distinctes, elle est doncdiagonalisable.On a donc

P =

(1 2 30 −1 −11 1 1

)

433

Page 441: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

Pour inverser P on résout le système associé{x + 2y + 3z = a

−y − z = bx + y + z = c

⇔{

x + 2y + 3z = a−y − z = b−y − 2z = −a + c

⇔{

x + 2y + 3z = a−y − z = b

−z = −a − b + c

⇔{

x = a − 2(−a − 2b + c) − 3(a + b − c)y = −a − 2b + cz = a + b − c

⇔{

x = b + cy = −a − 2b + cz = a + b − c

D’où P−1 =

(0 1 1

−1 −2 11 1 1

)et P−1AP =

( −2 0 00 1 00 0 3

).

7. 1. a. On sait qu’une famille génératrice de �mfa est (fa(e1), fa(e2), fa(e3)). Commefa(e1) = fa(e3) et fa(e2) = 0, la famille (fa(e1)) est aussi génératrice. Or fa(e2) est non nulpuisque sa composante sur e2 vaut 1. La famille (fa(e1)) est donc une base de �mfa.

b. D’après le théorème du rang, on sait que dim(Kerfa) = 3 − dim(�mfa) = 2. De plusf (e2) = 0 et f (e1 − e3) = f (e1) − f (e3) = 0 c’est-à-dire que e2, e1 − e3 ∈ Kerfa.Enfin (e2, e1 − e3) forme une famille libre puisque ces vecteurs ne sont clairement pasproportionnels. En conclusion (e2, e1 − e3) forme une base de Kerfa

2. D’après la définition de fa,

A =

(a 0 a1 0 1−a 0 −a

)D’où

A2 =

(0 0 00 0 00 0 0

)Donc fa ◦ fa = 0

3. a. Montrons que c’est une famille libre de E. Soit b, c, d tels que ae′1 + be′2 + ce′3 = 0. Enrepassant dans la base initiale, on a

b(ae1 + e2 − ae3) + c(e1 − e3) + de3 = 0

(ab + c)e1 + be2 + (−ab − c + d)e3 = 0

La coordonnée sur e2 doit être nulle donc b = 0. En annulant celle sur e1, on trouvec = 0. Enfin d’après la coordonnée sur e3 il vient c = 0. La famille (e′1, e′2, e′3) est unefamille libre de trois vecteurs d’un espace de dimension trois, c’est donc une base de E.

b. On a fa(e′1) = fa ◦ fa(e1) = 0, f (e′2) = f (e1 − e3) = 0 et f (e′3) = f (e3) = e′1. D’où

A′ =

(0 0 10 0 00 0 0

)

434

Page 442: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

c. On a

A′ − lI =

( −l 0 10 −l 00 0 −l

)Donc A′ − lI n’est pas inversible si et seulement si l = 0. C’est-à-dire que 0 est laseule valeur propre de A′. Comme A et A′ sont semblables, 0 est la seule valeur proprede A. 0 valeur propre de A équivaut à la non-inversibilité de A−0I = A, donc A n’estpas inversible. Si A était diagonalisable elle serait semblable à une matrice diagonaleavec les valeurs propres sur la diagonale, en l’occurrence la matrice nulle. Or seule lamatrice nulle est semblable à la matrice nulle et A �= 0. Donc A n’est pas diagonalisable.

4. a. 0 étant la seule valeur propre de A, pour tout x �= 0, la matrice A − xI = B(x) estinversible.

b. On a(A − xI)(A + xI) = A2 − x2I − xIA + xAI = −x2I,

soit encore−1x2

(A − xI)(A + xI) = I,

donc

B(x)−1 =−1x2

(A + xI)

c. D’après la formule du binôme, on a

B(x)n =n∑

k=0

(nk

)(−1)n−kxn−kAk︸︷︷︸

=0pour k�2

= (−1)n(xnI − xn−1A)

8. 1. a. On a M2 =

⎛⎜⎜⎜⎜⎜⎝3 3

ab

3ac

3ba

3 3bc

3ca

3cb

3

⎞⎟⎟⎟⎟⎟⎠ = 3M .

b. Soit l une valeur propre de M et X un vecteur propre associé. On a d’une partM2X = MlX = l2X et d’autre part M2X = 3MX = 3lX. On en déduit quel2X = 3lX, comme X �= 0, il vient l2 = 3l, soit encore (l − 3)l = 0. C’est-à-direl ∈ {0, 3}.

2. a. Les seules valeurs propres possibles sont 0 et 3. Une équation de E0 est⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

x +aby +

acz = 0

bax + y +

bcz = 0

cax +

cby + z = 0

⇔ x = −aby − a

cz

435

Page 443: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

Ainsi E0 �= {0}, donc 0 est bien valeur propre et E0 = Vect((−a, b, 0), (−a, 0, c)).De même une équation de E3 est⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

−2x +aby +

acz = 0

bax − 2y +

bcz = 0

cax +

cby − 2z = 0

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

−2x +aby +

acz = 0

−3y + 3bcz = 0

3cby − 3z = 0

L2 ← 2L2 +baL1

L3 ← 2L3 +caL1

⎧⎪⎪⎨⎪⎪⎩2x =

aby +

acz

y =bcz

⎧⎪⎪⎨⎪⎪⎩x =

acz

y =bcz

On en conclut que E3 �= {0}, c’est-à-dire que 3 est bien valeur propre et queE3 = Vect((a, b, c)).

b. On a donc trouvé trois vecteurs propres de M (−a, b, 0), (−a, 0, c), (a, b, c) qui formentune famille libre de R

3. Cette famille est donc une base de R3 formée de vecteurs

propres de M . M est diagonalisable.

3. a. On trouve PQ = 3I , soit encore P × 13

Q = I , donc P est inversible et P−1 =13

Q.

b. On voit que P est formé de trois vecteurs propres de M associés dans l’ordre aux valeurspropres 3, 0, 0. On sait dans ce cas que

P−1MP =

(3 0 00 0 00 0 0

)

Soit encore M = PDP−1.

4. Soit Y =

(a b cd e fg h i

)∈ M3(R),

DY − YD = 3Y ⇔(

3a 3b 3c0 0 00 0 0

)−

(3a 0 03d 0 03g 0 0

)= 3

(a b cd e fg h i

)

⇔{

0 = 3a 3b = 3b 3c = 3c−3d = 3d 0 = 3e 0 = 3f−3g = 3g 0 = 3h 0 = 3i

⇔{

a = d = e = f = g = h = i = 0b, c ∈ R

Les matrices Y telles que DY − YD = 3Y sont celles de la forme

(0 b c0 0 00 0 0

)où

b, c ∈ R.

5. X vérifie l’équation MX − XM = 3X si, et seulement si, PDP−1X − XPDP−1 = 3X,ce qui équivaut en multipliant par P−1 à gauche et P à droite à l’équationDP−1XP − P−1XPD = 3P−1XP. X est donc solution si, et seulement si, P−1XP est

436

Page 444: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

solution de l’équation de la question précédente. Si on note E l’ensemble des solutions,on a

X ∈ E ⇔ ∃a, b ∈ R tels que P−1XP =

(0 a b0 0 00 0 0

)

⇔ ∃a, b ∈ R tels que X = P

(0 a b0 0 00 0 0

)P−1

En notant A =

(0 1 00 0 00 0 0

)et B =

(0 0 10 0 00 0 0

), on a donc

E ={

P(aA + bB)P−1, a, b ∈ R}

={

aPAP−1 + bPBP−1, a, b ∈ R}

= Vect(PAP−1, PBP−1)

E est donc engendré par les deux vecteurs PAP−1, PBP−1. Par ailleurs ces deux vecteursforment une famille libre. En effet si a, b sont tels que aPAP−1 + bPBP−1 = 0 alorsP(aA + bB)P−1 = 0, d’où aA + bB = P−10P = 0. C’est-à-dire(

0 b c0 0 00 0 0

)= 0

et donc a = b = 0.Les deux matrices PAP−1, PBP−1 forment donc une base de E et dimE = 2.

9. 1. a. On triangule la matrice J − lI où l ∈ R( −l 2 10 −1 − l 20 1 −l

)→

( −l 2 10 1 −l0 −1 − l 2

)L2 ↔ L3

→ J(l) =

⎛⎝ −l 2 10 1 −l

0 0 −l2 − l + 2

⎞⎠L3 ← L3 + (1 + l)L2

Les valeurs propres de f sont 0 et les solutions de l’équation −l2 − l + 2 = 0 c’est-à-dire 1 (racine évidente) et −2.Soit (x, y, z) ∈ R

3, on a

(x, y, z) ∈ E−2 ⇔ J(−2)

(xyz

)= 0 ⇔

{2x + 2y + z = 0

y + 2z = 0 ⇔{

x =32

z

y = −2z

et donc E−2 = Vect(3,−4, 2).De même

(x, y, z) ∈ E0 ⇔ J(0)

(xyz

)= 0 ⇐⇒

{2y + z = 0

y = 02z = 0

⇐⇒{

y = 0z = 0

et donc E0 = Vect(1, 0, 0).

437

Page 445: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

Et enfin

(x, y, z) ∈ E1 ⇔ J(1)

(xyz

)= 0 ⇐⇒

{−x + 2y + z = 0

y − z = 0 ⇐⇒{

x = 3zy = z

et donc E1 = Vect(3, 1, 1).

b. J possédant 3 valeurs propres distinctes, elle est diagonalisable. On sait qu’en posant

P =

(3 1 3

−4 0 12 0 1

), matrice de passage de la base canonique vers une base de

vecteurs propres de J , et D =

( −2 0 00 0 00 0 1

), matrice diagonale des valeurs propres,

on a D = P−1JP, soit encore J = PDP−1.

c. En remarquant que Ma = aI + J , on a

P−1MaP = P−1(aI + J)P = aP−1IP + P−1JP = aI + D

=

(a − 2 0 0

0 a 00 0 a + 1

)

En posant Da =

(a − 2 0 0

0 a 00 0 a + 1

), on a donc bien Ma = PDaP−1.

d. D’après la question précédente les valeurs propres de Ma sont a − 2, a, a + 1. Ma estdonc inversible si et seulement si a /∈ {2, 0,−1}.

2. a. i. On a XMa = XX2 = X3 = X2X = MaX. Donc X commute avec Ma. De plusXJ = X(Ma − aI) = XMa − aX = MaX − aX = (Ma − aI)X = JX, donc Xcommute avec J .

ii. Soit v un vecteur propre de f associé à la valeur propre l. D’après la questionprécédente, f et h commutent. On a f (h(v)) = hf (v) = h(lv) = lh(v). Autrementdit f (h(v)) = lh(v). On en déduit que h(v) ∈ El (sous-espace propre de f associéà la valeur propre l). D’après la première question, les sous-espaces propres de fsont de dimension 1. Comme v ∈ El et que v �= 0 (c’est un vecteur propre), onen déduit que El = Vect(v). Il existe donc un réel a tel que h(v) = av. De plusv �= 0, le vecteur v est donc aussi un vecteur propre de h.

iii. La base de vecteurs propres de f déterminée à la question 1.a est donc aussi unebase de vecteurs propres de h. On en déduit qu’en reprenant la matrice de pas-sage P de la question 1.b, la matrice D = P−1XP est diagonale. Soit encoreX = PDP−1, où D est bien une matrice diagonale. On a ensuite

D2 = P−1XPP−1XP = P−1X2P = P−1MaP = Da

438

Page 446: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

iv. Posons D =

(a1 0 00 a2 00 0 a3

). D’après la question précédente, on a⎧⎪⎨⎪⎩

a21 = a − 2

a22 = a

a23 = a + 1

En particulier a − 2 � 0, soit a � 2.

b. Posons X = P

⎛⎝√a − 2 0 00

√a 0

0 0√

a + 1

⎞⎠ P−1 (on peut le faire puisque a � 2). On a

alors

X2 =

⎛⎝P

⎛⎝√a − 2 0 00

√a 0

0 0√

a + 1

⎞⎠ P−1

⎞⎠2

= P

⎛⎝√a − 2 0 00

√a 0

0 0√

a + 1

⎞⎠2

P−1

= P

(a − 2 0 0

0 a 00 0 a + 1

)P−1 = Ma

On a donc trouvé une matrice X telle que X2 = Ma.

c. L’équation X2 = Ma admet une solution en X si et seulement si a � 2.

10. 1. Soit u′2 la restriction de u2 à Ker(u1 ◦ u2). D’après la formule du rang appliquée àu′2 nous avons

rg(u′2) + dim(Ker(u′2)) = dim(Ker(u1 ◦ u2)).

Or �m(u′2) ⊂ Ker(u1) et Ker(u′2) ⊂ Ker(u1 ◦ u2), donc

dim(Ker(u1)) + dim(Ker(u2)) � dim(Ker(u1 ◦ u2)).

2. C’est une récurrence immédiate.

3. On a u3 − IdE = 0, soit encore (u − IdE) ◦ (u − j IdE) ◦ (u − j2 IdE) = 0. On a doncdim(Ker(u3 − IdE)) = dim(E) et d’après la question précédente

dim(u − IdE) + dim(u − j IdE) + dim(u − j2 IdE) � dim(E)

ce qui peut encore s’écrire dim(E1(u)) + dim(Ej(u)) + dim(Ej2 (u)) � dim(E).Certains de ces sous-espaces peuvent être réduits à {0} mais pas tous puisque la somme deleur dimension est supérieure à 3. La juxtaposition des vecteurs de bases de ces sous-espaces(éventuellement en ne tenant pas compte de ceux qui sont réduits à {0}) est une famille Fqui est libre dans E puisque ce sont des bases de sous-espace propres associés à des valeurspropres distinctes.On a donc dim(E1(u)) + dim(Ej(u)) + dim(Ej2 (u)) � dim(E), et en on déduit que

dim(E1(u)) + dim(Ej(u)) + dim(Ej2 (u)) = dim(E),

et donc que u est diagonalisable puis que F est une base de E constituées de vecteurpropres de u.

439

Page 447: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

4. Soit P un tel polynôme annulateur qui peut donc s’écrire sous la forme P =n∏

k=1

(X − lk)

où les réels lk sont distincts deux à deux.Par hypothèse dim(Ker(P(u))) = dim(E). Mais d’après la question 2,

n∑k=1

dim(Ker(u − lk IdE)) � dim(Ker(P(u))) = dim(E).

En posant Elk (u) = Ker(u − lk IdE), nous avonsn∑

k=1

dim(Elk (u)) � dim(E).

Certains des sous-espaces Elk (u) peuvent être réduits à {0} mais pas tous puisque la sommede leur dimension est supérieure à dim(E). La juxtaposition des vecteurs de bases de cessous-espaces (éventuellement en ne tenant pas compte de ceux qui sont réduits à {0}) estune famille qui est libre dans E puisque ce sont des bases de sous-espace propres associés àdes valeurs propres distinctes.

Nous avons doncn∑

k=1

dim(Elk (u)) � dim(E).

Il s’ensuit quen∑

k=1

dim(Elk (u)) = dim(E), la famille F est donc une base de E constituées

de vecteurs propres de u qui est donc diagonalisable.

5. Soit l1, l2, . . . , ln les valeurs propres de u. Posons P =n∏

k=1

(X − lk).

Nous allons montrer que P(u) = 0 en montrant que P(u) est nul sur chacun des sous-espaces propres.Soit i ∈ �1, n�, la restriction de u − li IdE au sous-espace vectoriel Eli (u) est nul, pardéfinition. A fortiori la restriction de P(u) à Eli (u) est également nul.L’endomorphisme P(u) s’annule pour tous les vecteurs propres de u, en particulier sur unebase de vecteurs propres (il en existe puisque u est diagonalisable). P(u) s’annule donc surE et P est un polynôme annulateur de u.

11. 1. a. Soit l une valeur propre de u et x ∈ El(u). On a v(u(x)) = v(lx) = lv(x).Comme uv = vu, il vient u(v(x)) = lv(x) ce qui signifie que v(x) ∈ El(u). L’endomor-phisme v laisse stable El.

b. Comme v est diagonalisable, il existe un polynôme annulateur de v à racines simples(voir l’exercice précédent). Ce polynôme est aussi annulateur de l’endomorphismeinduit par v sur chacun des sous-espaces propres de u. Soit l une valeur propre de u.L’endomorphisme v|El(u) est diagonalisable puisqu’il admet un polynôme annulateur àracines simples. Il existe donc une base Bl de El(u) dans laquelle la matrice de v|El(u)est diagonale. En notant B la base de E obtenue en juxtaposant les bases Bl ; en effet,c’est bien une base de E car d’une part c’est une famille libre de E et d’autre part lasomme des dimensions des espaces El(u) est égale à la dimension de E, le nombre devecteurs de B est donc égal à la dimension de E.Les matrices de u et de v dans cette base, sont diagonales.

440

Page 448: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. Posons

MB(u) = A =

⎛⎜⎜⎜⎝a1 0 · · · 0

0. . .

. . ....

.... . .

. . . 00 · · · 0 an

⎞⎟⎟⎟⎠ , MB(v) = B =

⎛⎜⎜⎜⎝b1 0 · · · 0

0. . .

. . ....

.... . .

. . . 00 · · · 0 bn

⎞⎟⎟⎟⎠alors

AB =

⎛⎜⎜⎜⎝a1b1 0 · · · 0

0. . .

. . ....

.... . .

. . . 00 · · · 0 anbn

⎞⎟⎟⎟⎠ et BA =

⎛⎜⎜⎜⎝b1a1 0 · · · 0

0. . .

. . ....

.... . .

. . . 00 · · · 0 bnan

⎞⎟⎟⎟⎠ = AB.

Il en résulte que uv = vu.

12. • Supposons que uv = vu. Soit x un vecteur propre de u associé à la valeur proprel, alors

u(v(x)) = (uv)(x) = (vu)(x) = v(lx) = lv(x).

Donc v(x) ∈ El(u). Mais, u possédant n valeurs propres, dim(El(u)) = 1, et x étant nonnul, El(u) = Vect(x). Il existe donc un réel a tel que v(x) = ax. Le vecteur x est doncégalement un vecteur propre de v (associé à la valeur propre a).

• Supposons que les vecteurs propres de u soient des vecteurs propres de v. L’endomorphismeu étant diagonalisable, il existe une base B de E formée de vecteurs propres de u. Comme lesvecteurs propres de u sont des vecteurs propres de v, cette base est aussi formée de vecteurspropres de v et v est diagonalisable.

13. 1. Il est clair que si deg(Q) � 2n, alors deg(s(Q)) � 2n.Soient l ∈ R et Q1, Q2 ∈ E, avec

Q1(x) =2n∑

k=0

akxk et Q2(x) =2n∑

k=0

bkxk,

on a alors (lQ1 + Q2) =2n∑

k=0

(lak + bk)xk et donc

s(lQ1 + Q2)(x) =2n∑

k=0

(la2n−k + b2n−k)xk

= l

2n∑k=0

a2n−kxk +2n∑

k=0

b2n−kxk

= lQ1(x) + Q2(x),

s est bien un endomorphisme de E.

441

Page 449: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

2. a. M étant symétrique, elle est diagonalisable.Pour rechercher les valeurs propres de M , on triangule M − lI3 (où l ∈ R)( −l 0 1

0 1 − l 01 0 −l

)→

(1 0 −l0 1 − l 0−l 0 1

)L1 ↔ L3

→ M(l) =

⎛⎝ 1 0 −l0 1 − l 0

0 1 − l2

⎞⎠L3 ← L3 + lL1

Les valeurs propres de M sont les racines de (1 − l)(1 − l2) = (1 − l)(1 − l)(1 + l).Donc les valeurs propres de M sont dans {−1, 1}.

Recherchons une base des sous-espaces propres de M . Soit X =

(xyz

), on a

X ∈ E1 ⇔ M(1)X = 0 ⇔ x − z = 0 ⇔ x = z

d’où E1 = Vect

((101

),

(010

)).

Les deux vecteurs étant non colinéaires,

((101

),

(010

))forme une base de E1.

De même

X ∈ E−1 ⇔ M(−1)X = 0 ⇔{

x + z = 02y = 0 ⇔

{x = −zy = 0

d’où E−1 = Vect

((10

−1

)). Ce vecteur étant non nul,

((10

−1

))est une base

de E−1.

b. On a s(1) = X2, s(X) = X et s(X2) = 1. Il s’ensuit que M est bien la matrice de sdans la base (1, X, X2). Compte tenu de la question précédente, une base de vecteurspropres pour s est (1 + X2, X, 1 − X2).

3. a. Soit Q =2n∑

k=0

akXk, on a

(s ◦ s)(Q) = s(s(Q)) = s

(2n∑

k=0

a2n−kXk

)=

2n∑k=0

a2n−(2n−k)Xk =2n∑

k=0

akXk = Q.

Donc s ◦ s = IdE.

b. D’après la question précédente, le polynôme X2 − 1 est annulateur de s.Or x2 − 1 = 0 ⇔ x ∈ {−1, 1}. Il en résulte que les valeurs propres de s sontnécessairement dans {−1, 1}.

442

Page 450: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

c. Pour k ∈ �0, n − 1�, on a

s(Ak) = s(X2n−k + Xk) = X2n−(2n−k) + X2n−k = Xk + X2n−k = Ak.

De plus s(An) = s(Xn) = X2n−n = Xn = An.Enfin, pour k ∈ �n + 1, 2n�,

s(Ak) = s(Xk − X2n−k) = X2n−k − X2n−(2n−k) = X2n−k − Xk = −Ak.

d. Soient a0, a1, . . . , a2n des réels tels que2n∑

k=0

akAk = 0, on a alors

2n∑k=0

akAk =n−1∑k=0

ak(X2n−k + Xk) + anXn +2n∑

k=n+1

ak(Xk − X2n−k)

=n−1∑k=0

akXk +n−1∑k=1

akX2n−k + anXn +2n∑

k=n+1

akXk −2n∑

k=n+1

akX2n−k

=n−1∑k=0

akXk +2n∑

k′=n+1

a2n−k′Xk′ + anXn +2n∑

k=n+1

akXk −n−1∑k′=0

a2n−k′Xk′

=n−1∑k=0

(ak − a2n−k)Xk + anXn +2n∑

k=n+1

(ak + a2n−k)Xk = 0

La famille (1, X, . . . , X2n) étant libre, on en déduit que an = 0, que pour k ∈ �0, n−1�,ak − a2n−k = 0 et que pour k ∈ �n + 1, 2n�, ak + a2n−k = 0.Soit k ∈ �0, n − 1�, on a donc ak − a2n−k = 0 et comme 2n − k ∈ �n + 1, 2n�,a2n−k + a2n−(2n−k) = 0, soit encore ak + a2n−k = 0. On résout le système{

ak − a2n−k = 0ak + a2n+k = 0 ⇔

{ak − a2n−k = 0

2a2n+k = 0 ⇔ ak = a2n−k = 0

Finalement, ∀k ∈ �0, 2n�, ak = 0. La famille (A0, A1, . . . , A2n) est bien libre.

e. La famille (A0, . . . , A2n) est une famille libre de 2n + 1 vecteurs de E, ordim(E) = 2n + 1. C’est donc une base de E. On en déduit d’après (c) que lafamille (A0, A1, . . . , A2n) est une base de E formée de vecteurs propres de s. s estdiagonalisable. D’après (c), les valeurs propres de s sont −1 et 1. Une base de E1 est(A0, . . . , An) et une base de E−1 est (An+1, . . . , A2n).

14. 1. Soit F une primitive de f (qui existe puisque f est continue), on a alors pour toutréel x

Ta(f )(x) =12a

(F(x + a) − F(x − a)) .

Il en résulte que Ta(f ) est C1 comme somme et composée de fonctions C1.

2. D’après la question précédente,

Ta(f )′(x) =12a

(f (x + a) − f (x − a)) .

443

Page 451: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

• Si f admet 2a comme période, il en résulte immédiatement que T (f )′(x) = 0 pour toutréel x. Par voie de conséquence T (f ) est constante.

• Si T (f ) est constante alors, sa dérivée est nulle. Donc pour tout réel x, f (x+a) = f (x−a),ce qui équivaut à

∀x ∈ R, f (x) = f (x + 2a),

autrement dit f est périodique de période 2a.

3. Remarquons déjà que pour tout f ∈ E, T (f ) est C1 sur R et a fortiori continue sur R, cequi signifie que T est à valeurs dans E.Soient f, g ∈ E et l ∈ R, nous avons pour tout réel x :

Ta(lf + g)(x) =12a

∫ x+a

x−a(lf + g)(t)dt =

12a

∫ x+a

x−alf (t) + g(t)dt

= l × 12a

∫ x+a

x−af (t)dt +

12a

∫ x+a

x−ag(t)dt

= lTa(f )(x) + Ta(g)(x)= (lTa(f ) + Ta(g))(x)

Il en résulte que Ta(lf + g) = lTa(f ) + Ta(g) et donc Ta est un endomorphisme de E.Soit f ∈ E, on sait déjà que si f ∈ Ker(Ta) alors f est périodique de période 2a.Réciproquement, soit f une fonction périodique de E de période 2a, alors Ta(f ) estconstante et

Ta(f ) = 0 ⇔∫ a

−af (t)dt = 0.

Autrement dit le noyau de Ta est constitué des applications périodiques f de E de période

2a et telles que∫ a

−af (t)dt = 0.

D’après la question 1, pour tout f ∈ E, Ta(f ) est C1 sur R. Or il existe des fonctionscontinues qui ne sont pas C1, donc Ta n’est pas surjectif.

4. Soit f ∈ Rn[X] telle que pour tout réel x, f (x) =n∑

k=0

akxk, on a alors

∀x ∈ R, Ta(f )(x) =12a

∫ x+a

x−a

n∑k=0

aktkdt =12a

n∑k=0

ak

∫ x+a

x−atkdt =

12a

n∑k=0

[tk+1

k + 1

]x+a

x−a

=12a

n∑k=0

ak(x + a)k+1 − (x − a)k+1

k + 1

Les termes de la somme pour k � n− 1 sont clairement de degré inférieur ou égal à n. Deplus le coefficient de degré n + 1 de (x + a)n+1 est xn+1 et celui de (x − a)n+1 est aussi xn+1,donc (x + a)n+1 − (x− a)n+1 est aussi de degré inférieur à n. Par voie de conséquence Ta(f )est une fonction polynômial de degré inférieur où égal à n.

444

Page 452: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

5. a. Pour k ∈ �0, n�,

Ta(Xk)(x) =12a

∫ x+a

x−atkdt =

12a

((x + a)k+1 − (x − a)k+1

k + 1

)=

12a(k + 1)

k+1∑i=0

(k + 1

i

) (xiak+1−i − xi(−a)k+1−i

).

On remarque comme dans la question précédente que le terme de degré k + 1 est nul,d’où

Ta(Xk)(x) =1

2a(k + 1)

k∑i=0

(k + 1

i

) (xiak+1−i + (−1)k−ixiak+1−i) .

Donc Ta(f ) est de degré inférieur ou égal à k et le terme de degré k est

12a(k + 1)

(k + 1

k

)2xka = xk.

La matrice de Ta(f ) est triangulaire supérieure avec des 1 sur la diagonale. On en déduitque Sp(Ta) = {1}. Si Ta était diagonalisable, comme 1 est son unique valeur propre,on aurait Ta = IdRn[X], or on vérifie aisément que Ta(X2) �= X2. Ta n’est donc pasdiagonalisable.

b. Soit f un polynôme tel que f (x) = a2x2 + a1x + a0 alors

T (f )(x) = a2T (X2)(x) + a1T (X)(x) + a0T (1)(x) = a2x2 +a2a2

3+ a1x + a0

= a2x2 + a1x +

(a2a2

3+ a0

).

On a donc T (f ) = f ⇔(

a2a2

3+ a0

)= a0 ⇔ a2 = 0. Il n’existe donc pas de

polynôme de degré 2 qui soit vecteur propre de f . Le même calcul prouve d’ailleursque R1[X] ⊂ E1(Ta).

c. Soit f ∈ Rn[X] tel que T (f ) = f . Par définition,

∀x ∈ R, T (f ′)(x) =12a

∫ x+a

x−af ′(t)dt =

12a

(f (x + a) − f (x − a)) .

Or on sait que T (f )′(x) =12a

(f (x + a) − f (x − a)). On en déduit que

∀x ∈ R, T (f ′)(x) = (T (f ))′(x) = f ′(x).

Soit T (f ′) = f ′. En conclusion, si f est un vecteur propre de degré supérieur ou égal à1 alors f ′ est également un vecteur propre.Comme il n’y a pas de vecteur propre de Ta de degré 2, il ne peut y avoir de vecteurpropre de Ta de degré supérieur à 2. En effet si f était un tel vecteur propre, alorsf (deg(f )−2) serait lui-même vecteur propre et de degré 2 ce qui est absurde.On en déduit que E1(Ta) ⊂ R1[X]. D’après la question précédente, il en résulteque E1(Ta) = R1[X].

445

Page 453: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

15. 1. Triangulons A − lI3(1 − l −12 2

1 1 − l 14 8 3 − l

)→

(1 1 − l 1

1 − l −12 24 8 3 − l

)L1 ↔ L2

⎛⎝ 1 1 − l 10 −l2 + 2l − 13 1 + l0 4 + 4l −1 − l

⎞⎠ L2 ← L2 − (1 − l)L1L3 ← L3 − 4L1

→ A(l) =

⎛⎝ 1 1 − l 10 −l2 + 2l − 13 1 + l

0 −l2 + 6l − 9 0

⎞⎠L3 ← L3 + L2

Cette matrice est non inversible si, et seulement si, l = −1 ou −l2 + 6l − 9 = 0. Lediscriminant réduit D′ vaut 9 − 9 = 0, il y a une racine double 3. Les valeurs propres de fsont −1 et 3.

2. Déterminons une base de ces sous-espaces.Soit (x, y, z) ∈ R

3,

(x, y, z) ∈ Ker(f +Id) ⇔ A(−1)

(xyz

)= 0 ⇔

{x + 2y + z = 0

−16y = 0−16y = 0

⇔{

x = −zy = 0

d’où E−1 = Vect((−1, 0, 1)).Pour déterminer Ker(f − 3 Id)2, on calcule la matrice de (f − 3 Id)2 dans la base canonique( −2 −12 2

1 −2 14 8 0

)2

=

(0 64 −160 0 00 −64 16

),

il en résulte que (x, y, z) ∈ Ker(f − 3 Id)2 ⇔ 64y − 16z = 0 ⇔ z = 4y.D’où Ker(f − 3 Id)2 = Vect((1, 0, 0), (0, 1, 4)).Montrons que la famille ((−1, 0, 1), (1, 0, 0), (0, 1, 4)) est une famille libre. Soient a, b, ctrois réels, nous avons

a(−1, 0, 1) + b(1, 0, 0) + c(0, 1, 4) = 0 ⇔{ −a + b = 0

c = 0a + 4c = 0

⇔ a = b = c = 0,

cette famille est donc libre. Comme elle compte trois vecteurs et que dim(R3) = 3, c’estune base de R

3 et Ker(f + Id) et Ker(f − 3 Id)2 sont supplémentaires.

3. Le premier vecteur �e1 de B′ doit vérifier f (�e1) = −�e1, soit �e1 ∈ E−1. D’après ce quiprécède, on peut choisir�e1 = (−1, 0, 1).De même le second vecteur doit appartenir à E3. D’après la triangulation effectuée à lapremière question,

(x, y, z) ∈ E3 ⇔ A(3)

(xyz

)= 0 ⇔

{x − 2y + z = 0−16y + 4z = 0 ⇔

{x = −2yz = 4y

On peut choisir comme deuxième vecteur de la base B′ le triplet�e2 = (−2, 1, 4).

446

Page 454: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Comme (B − 3I)2 =

(1 0 00 0 00 0 0

), le dernier vecteur est nécessairement dans

Ker(f − 3 Id)2. Cherchons deux réels a et b tels que le vecteur �e3 = a(1, 0, 0) + b(0, 1, 4)vérifie f (�e3) = 3�e3 +�e2,

f (�e3) = 3�e3 +�e2 ⇔ a(1, 1, 4) + b(−4, 5, 20) = 3(a, b, 4b) + (−2, 1, 4)

⇔{

a − 4b = 3a − 2a + 5b = 3b + 1

4a + 20b = 12b + 4⇔

⎧⎪⎨⎪⎩a + b =

12

a + 2b = 14a + 8b = 4

⎧⎪⎨⎪⎩a + b =

12

b =12

⇔{

a = 0

b =12

le vecteur�e3 =(

0,12

, 2)

.

Pour conserver des vecteurs à coordonnées entières on peut multiplier les deux derniersvecteur par 2. On pose alors B′ = ((−1, 0, 1), (−4, 2, 8), (0, 1, 4)), dont on montre facile-ment que c’est une base, et dans cette base, par construction, la matrice de f est( −1 0 0

0 3 10 0 3

).

4. On remarque que B = M + N où

M =

( −1 0 00 3 10 0 3

)et N =

(0 0 00 0 10 0 0

).

On vérifie que MN = NM et que N2 = 0. D’après la formule du binôme de Newton,on obtient

Bn =n∑

k=0

(nk

)NkMn−k = Mn + nMn−1N =

⎛⎝ (−1)n 0 00 3n n3n−1

0 0 3n

⎞⎠ .

5. On sait qu’en posant P la matrice de passage de la base canonique vers la base B′, c’est-à-dire

P =

( −1 −4 00 2 11 8 4

),

on a la relation B = P−1AP et par suite An = PBnP−1.

447

Page 455: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

Après calculs, on trouve P−1 =14

(0 −16 4

−1 4 −12 −4 2

), d’où

An =14

( −1 −4 00 2 11 8 4

)⎛⎝ (−1)n 0 00 3n n3n−1

0 0 3n

⎞⎠ (0 −16 4

−1 4 −12 −4 2

)

=14

⎛⎝ (−1)n+1 −4 · 3n −4n · 3n−1

0 2 · 3n 3n + 2n · 3n−1

(−1)n 8 · 3n 4 · 3n + 8n · 3n−1

⎞⎠ (0 −16 4−1 4 −12 −4 2

)

=14

⎛⎝ (12 − 8n)3n−1 16(−1)n + (−48 + 16n)3n−1 4(−1)n+1 + (12 − 8n)3n−1

4n · 3n−1 (12 − 8n)3n−1 4n · 3n−1

16n · 3n−1 16(−1)n+1 + (48 − 32n)3n−1 4(−1)n + 16n · 3n−1

⎞⎠=

⎛⎝ (3 − 2n)3n−1 4(−1)n + (−12 + 4n)3n−1 (−1)n+1 + (3 − 2n)3n−1

n · 3n−1 (3 − 2n)3n−1 n · 3n−1

4n · 3n−1 4(−1)n+1 + (12 − 8n)3n−1 (−1)n + 4n · 3n−1

⎞⎠ .

16. 1. Vérifions les trois points :• C(u) est une partie de L(E).

• C(u) est non vide, puisqu’il contient par exemple 0 (ou encore IdE, u, . . . ).

• Soient v, w deux éléments de C(u) et l un réel, d’après les propriétés usuelles desopérations sur les applications linéaires, nous avons

u(lv + w) = luv + uw = lvu + wu = (lv + w)u,

autrement dit lv + w ∈ C(u).C(u) est bien un sous-espace vectoriel de L(E).

2. Supposons que uv = vu.Soit l une valeur propre et x ∈ El(u), alors

(vu)(x) = v(lx) = lv(x)mais aussi (vu)(x) = (uv)(x) = u(v(x)).

D’où la relation u(v(x)) = lv(x). Par définition, nous avons donc v(x) ∈ El(u).L’endomorphisme v laisse stable les sous-espaces propres de u.

3. Supposons que v laisse stable les sous-espaces propres de u.

Soient l1, l2, . . . , ln les valeurs propres de u. Comme u est diagonalisable E =n⊕

k=1

Elk .

Soit x un vecteur de E. Il existe (x1, . . . , xn) ∈ El1 × · · · × Eln tel que x =n∑

k=1

xk.

On a alors

u(v(x)) = u

(v

(n∑

k=1

xk

))= u

(n∑

k=1

v(xk)

)=

n∑k=1

u(v(xk)) =n∑

k=1

lkv(xk),

448

Page 456: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

puisque v(xk) ∈ Elk . Mais on a également

v(u(x)) = v

(u

(n∑

k=1

xk

))= v

(n∑

k=1

u(xk)

)= v

(n∑

k=1

lkxk

)=

n∑k=1

lkv(xk).

Le vecteur x étant arbitraire, il en résulte que uv = vu.

4. Soit B une base de E formée de la juxtaposition de bases des sous-espaces propres El1 , . . . ,Eln de u.D’après les questions précédentes, un endomorphisme v commute avec u si, et seulements’il laisse stable les sous-espaces propres de u. Les endomorphismes de C(u) sont donc ceuxdont la matrice dans la base B s’écrit sous la forme⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝

A1 (0) . . . (0)

(0) A2. . .

...

.... . .

. . . (0)

(0) . . . (0) An

⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠où Ak est une matrice arbitraire de taille dim(Elk ) × dim(Elk ). Il en résulte que

dim(C(u)) =n∑

k=1

dim(Elk )2.

17. 1. Un petit calcul donne B =

(0 −1 1

−1 0 −11 −1 0

). B étant symétrique réelle, elle

est diagonalisable.

2. Il suffit d’effectuer le calcul.

3. Les valeurs propres de B sont racines de X2−X−2. Les réels −1 et 2 sont racines évidentesde ce trinôme.

De plus, pour X =

(xyz

), nous avons

X ∈ E−1(B) ⇔ (B + I)X = 0 ⇔{

x − y + z = 0−x + y − z = 0

x − y + z = 0⇔ x = y − z,

d’où E−1(B) = Vect

((110

),

( −101

))(en particulier −1 est bien une valeur propre).

449

Page 457: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

De même

X ∈ E2(B) ⇔ (B − 2I)X = 0 ⇔

⎧⎪⎨⎪⎩−2x − y + z = 0

−x − 2y − z = 0

x − y − 2z = 0

⎧⎪⎨⎪⎩−2x − y + z = 0

0 − 3y − 3z = 0

−3y − 3z = 0

L2 ← 2L2 − L1

L3 ← 2L3 + L1

⇔{

x = z

y = −z

d’où E2(B) = Vect

((1

−11

))(et 2 est bien une valeur propre de B).

4. Soit l une valeurs propre de A et X un vecteur propre associé, on a alors

BX = (A2 + 2I)X = A2X + 2X = l2X + 2X = (l2 + 2)X,

et donc l2 + 2 est valeur propre de B.Comme l2 + 2 � 2 pour tout réel l et que Sp(B) = {−1, 2}, la seule valeur propre réellepossible de A est 0. Si A était diagonalisable sur R, elle serait semblable à la matrice nulle.Elle serait donc nulle, ce qui est absurde. A n’est pas diagonalisable sur R.

5. De la relation de la question 2, on déduit que B × 12

(B − I) = I . La matrice B est donc

inversible et B−1 =12

(B − I).

6. a. En évaluant l’égalité en −1 et 2, on trouve que an et bn sont solutions d’un systèmelinéaire que l’on résout

{ −an + bn = (−1)n

2an + bn = 2n ⇔{ −an + bn = (−1)n

3bn = 2n + 2(−1)n L2 ← L2 + 2L1

⇔{ −an + bn = (−1)n

3bn = 2n + 2(−1)n L2 ← L2 + 2L1⇔

⎧⎪⎪⎨⎪⎪⎩an =

13

(2n − (−1)n)

bn =13

(2n + 2(−1)n)

b. En évaluant l’égalité précédente en B, il vient pour n � 2,

Bn =13

(2n − (−1)n)B +13

(2n + 2(−1)n)I,

formule également valable pour n = 0 et n = 1.

450

Page 458: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

c. Soit n ∈ N∗, on vérifie que Bn a pour inverse le candidat proposé en effectuant le

calcul

Bn ×(

13

(2−n − (−1)−n)B +13

(2−n + 2(−1)−n)I)

=

(13

(2n − (−1)n)B +13

(2n + 2(−1)n)I)×(

13

(2−n − (−1)−n)B +13

(2−n + 2(−1)−n)I)

=19

((1 + 1 − (−2)−n − (−2)n)B2 + (1 − 2 − (−2)n + 2(−2)−n + 1 − 2 + 2(−2)n − (−2)−n)B

+ (1 + 4 + 2(−2)n + 2(−2)−n)I)

=19

((2 − (−2)−n − (−2)n)(B + 2I) + (−2 + (−2)n + (−2)−n)B

+(5 + 2(−2)n + 2(−2)−n)I)

= I.

La formule est donc encore valable pour les entiers négatifs.

18. 1. Soit X =

⎛⎜⎝ x1...

xn

⎞⎟⎠ un tel vecteur. Notons k l’entier tel que xk = max1�i�n

|xi|.

L’égalité AX = 0 signifie que pour tout i ∈ �1, n�,

n∑j=1

ai,jxj = 0.

Cette égalité est en particulier vrai pour i = k, il en découle que

ak,kxk =∑1�j�n

j �=k

ak,jxj.

On en déduit que

|ak,kxk| =

∣∣∣∣∣∣∣∑1�j�n

j �=k

ak,jxj

∣∣∣∣∣∣∣ �∑1�j�n

j �=k

∣∣ak,jxj

∣∣ �∑1�j�n

j �=k

∣∣ak,jxk

∣∣ � |xk|∑1�j�n

j �=k

∣∣ak,j

∣∣ .

Or xk �= 0 (puisque X �= 0), il en résulte que

|ak,k| �∑1�j�n

j �=k

∣∣ak,j

∣∣ ,

ce qui est en contradiction avec les hypothèses de l’énoncé. Il n’existe donc pas de vecteurcolonne non nul X tel que AX = 0 et la matrice A est inversible.

2. Soit l ∈ C tel que l /∈n⋃

i=1

D(ai,i,∑j �=i

|ai,j|), notons B = (bi,j) la matrice A− lIn. Montrons

que cette matrice est inversible grâce à la première question.

451

Page 459: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 3 – Réduction

Soit i ∈ �1, n�, comme l /∈ D(ai,i,∑j �=i

|ai,j|), nous avons

|bi,i| = |ai,i − l| >∑j �=i

|ai,j| =∑j �=i

|bi,j|.

D’après la question 1, il en résulte que B est inversible. Le scalaire l n’est donc pas valeurpropre.Il s’ensuit que

Sp(A) ⊂n⋃

i=1

D(ai,i,∑j �=i

|ai,j|).

3. a. D’après la question précédente toute valeur propre l de A est dans le disqueD(0, 1) ∪ D(0, 2) = D(0, 2). Cela signifie que tout valeur propre l vérifie |l| � 2.

b. On recherche un vecteur non nul X =

⎛⎜⎝ x1...

xn

⎞⎟⎠ tel que (A − 2 cos(u)I)X = 0,

c’est-à-dire tel que ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩

−2 cos(u)x1 + x2 = 0x1 − 2 cos(u)x2 + x3 = 0x2 − 2 cos(u)x3 + x4 = 0

...xn−2 − 2 cos(u)xn−1 + xn = 0

xn−1 − 2 cos(u)xn = 0

Posons x0 = 0 et xn+1 = 0. La suite (x0, . . . , xn+1) vérifie

∀k ∈ �0, n − 1�, xk − 2 cos(u)xk+1 + xk+2 = 0,

c’est-à-dire que c’est une suite récurrente linéaire d’ordre 2. Son équation caractéris-tique admet pour racines eiu et e−iu.Supposons dans un premier temps que ces deux racines soient distinctes, c’est-à-direque u ∈ ]0, p[. Il existe donc deux scalaires a et b tels que pour k ∈ �0, n + 1�,

xk = aekiu + be−kiu.

En exprimant ces égalités pour k = 0 et k = n + 1, il vient{a + b = 0

ae(n+1)iu + be−(n+1)iu = 0

Ce système est inversible si e(n+1)iu �= e−(n+1)iu, auquel cas a = b = 0 et donc xk = 0.Autrement dit pour un tel u, l n’est pas valeur propre.Supposons que e(n+1)iu = e−(n+1)iu, ce qui équivaut à 2(n + 1)u ∈ 2pZ. Compte tenude la condition u ∈ ]0, p[, il y a donc n valeurs possibles pour u à savoir

up =pp

n + 1où p ∈ �1, n�.

452

Page 460: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Pour u = up, le système équivaut à a = −b, et alors il existe une solution non nulle au

système (A − 2 cos(u)I)X = 0, à savoir par exemple xk =12i

(ekiup − e−kiup ) = sin(kup).

Il en résulte que pour p ∈ �1, n�, 2 cos( pp

n + 1

)est une valeur propre et un vecteur

propre associé est ⎛⎜⎜⎜⎝sin

( pp

n + 1

)...

sin( npp

n + 1

)⎞⎟⎟⎟⎠ .

Nous avons déjà n valeurs propres, donc il ne peut y en avoir d’autres et les sous-espacespropres sont de dimension 1. On en conclut que

E2 cos( pp

n+1 )(A) = Vect

⎛⎜⎜⎜⎜⎜⎜⎜⎝

sin( pp

n + 1

)sin

(2pp

n + 1

)...

sin( npp

n + 1

)

⎞⎟⎟⎟⎟⎟⎟⎟⎠.

Chapitre 4

1. a. Pour n � 2, ln an = n2 ln(

1 − 1n

)= −n − 1

2+ o (1). Ainsi, an ∼ Ce−n, avec

C =1√e· Les séries étant à terme général positif et la série géométrique de raison

1e∈ [0, 1[

étant convergente, la série∑

an est convergente d’après la règle des équivalents.

b. On a n2e−na

= (na)2a e−na

. Puisque limx→+∞

x2a e−x = 0, an = o

(1n2

). Les séries étant à

terme général positif et la série de Riemann∑ 1

n2 étant convergente, la série∑

an est

convergente en vertu du théorème de comparaison.

c. D’après la formule du binôme, pour tout entier naturel n(2 +

√3)n

+(

2 −√

3)n

=n∑

k=0

(nk

)2n−k3

k2(1 + (−1)k

)= 2

n2 ∑

�=0

(n2�

)2n−2�3�.

Il s’ensuit que(2 +

√3)n

p +(2 −

√3)n

p = 0 (mod 2p) et donc que

an = − sin((

2 −√

3)n

p)

.

453

Page 461: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Or 0 < 2 −√

3 < 1, donc limn→+∞

(2 −

√3)n

= 0 et

an ∼ −(

2 −√

3)n

p.

Les deux suites sont négatives ; du fait que la série géométrique∑ (

2 −√

3)n

est conver-gente, la série

∑an est convergente.

d. La suite (un) est bien définie. Par ailleurs, pour tout entier naturel n non nul

un =1 + an − 1

(1 + a0) · · · (1 + an−1) (1 + an)=

1(1 + a0) · · · (1 + an−1)

− 1(1 + a0) · · · (1 + an)

·

La série∑

un est une série télescopique ; elle est convergente si, et seulement si, la suite

définie par vn =1

(1 + a0) · · · (1 + an)est convergente. Or cette suite est évidemment

à valeurs positives et décroissante ; le théorème des suites monotones permet alors deconclure à la convergence de série

∑un.

e. Puisque limn→+∞

ln nn

= 0,

ln(

1 +ln nn

)∼ ln n

Par ailleurs, pour tout n � 31n

� ln nn

·

Puisque la série harmonique est divergente, la série∑ ln n

nest divergente d’après le théo-

rème de comparaison (les suites sont positives !). Ainsi, d’après la règle des équivalents, lasérie

∑an est divergente.

f. On peut facilement démontrer par récurrence l’inégalité 1! + · · · + n! � 2 n!, mais celamasque la nature du résultat. Il est plus satisfaisant de remarquer que pour tout entiernaturel non nul n et pour tout k ∈ �1, n − 1�

k!n!

=1

n (n − 1) · · · (k + 1)� 1

n,

et donc1! + · · · + n!

n!� (n − 1)

1n

+ 1 = 2 − 1n

� 2.

Ainsin!

(n + p)!� 1! + · · · + n!

(n + p)!� 2

n!(n + p)!

·

Le suites étant positives, le théorème de comparaison permet facilement de démontrer

que les séries∑ n!

(n + p)!et

∑ 1! + · · · + n!(n + p)!

sont de même nature. Enfin, puisque

n!(n + p)!

∼ 1np

, la série∑ 1! + · · · + n!

(n + p)!converge si, et seulement si, p � 2.

454

Page 462: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

g. On note w : N → N l’application définie par w (n) = 10n+1 − 1. Celle-ci est évidem-ment strictement croissante et donc la série

∑an et la série

∑cn sont de même nature,

où cn =w(n)∑

k=w(n−1)+1

ak. Or pour tout entier n � 1, il y a 8 × 9n indices k tels que

w(n − 1) < k � w(n) et ak �= 0. Ainsi

cn � 8 × 9n

w(n − 1) + 1= 8

(910

)n

·

D’après le théorème de comparaison, puisque la série géométrique∑ (

910

)n

est conver-

gente, la série∑

cn converge et donc la série∑

an est convergente.

2. a. On remarque que

n4 + n2 + 1 = n4 + 2n2 + 1 − n2 =(n2 + 1

)2 − n2 =(n2 + n + 1

) (n2 − n + 1

).

Posons un =1

n2 + n + 1· On constate que un−1 =

1n2 − n + 1

et que pour tout entier

naturel non nul n

an =12

(un−1 − un) .

Ainsi, pour tout entier naturel n non nul

n∑k=1

ak =12

(u0 − un) .

On en déduit facilement la convergence et

+∞∑k=0

kk4 + k2 + 1

=12·

b. L’idée est de rechercher deux réels a et b tels que2

(n + 1)2=

a − b1 + ab

. On constate facile-

ment que a = n + 2 et b = n conviennent. Puisque, pour tout entier naturel n, Arctan n

et Arctan (n + 2) sont des éléments de[0,

p

2

[, Arctan (n + 2) − Arctan n ∈

]−p

2,

p

2

[. Il

s’ensuit que

tan(

Arctan (n + 2) − Arctan n)

=2

(n + 1)2

et que

Arctan (n + 2) − Arctan n = Arctan(

2

(n + 1)2

455

Page 463: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Ainsi, pour tout entier naturel n

n∑k=0

Arctan

(2

(k + 1)2

)=

n∑k=0

(Arctan (k + 2) − Arctan k

)=

n+2∑k=2

Arctan k −n∑

k=0

Arctan k

= Arctan (n + 2) + Arctan (n + 1) − Arctan 0 − Arctan 1

Puisque limx→+∞

Arctan x =p

2, que Arctan 0 = 0 et que Arctan 1 =

p

4, la série

∑ak est

convergente et+∞∑k=0

Arctan(

2

(k + 1)2

)=

34

c. Puisque u ∈]0,

p

2

[, pour tout entier n on a cos

(u

2n

)∈ ]0, 1[, et donc la suite (an) est

bien définie.Par ailleurs, on vérifie par récurrence à partir de la relation sin (2a) = 2 sin a cos a que pourtout entier naturel n

sin (2u) = 2n+1 sin

(u

2n

) n∏k=0

cos

(u

2k

Puisqueu

2n∈

]0,

p

2

[,

sin (2u)

2n+1 sin(

u2n

) =n∏

k=0

cos

(u

2k

)et

n∑k=0

ln(

cos(

u

2k

))= ln

(sin (2u)

2n+1 sin(

u2n

))·

D’autre part, limn→+∞

u

2n= 0 et donc sin

(u

2n

)∼ u

2n· Il s’ensuit que

limn→+∞

2n+1 sin(

u

2n

)= 2u. La convergence de la série

∑an est alors immé-

diate et+∞∑k=0

ln

(cos

(u

2k

))= ln

(sin (2u)

2u

d. On sait que pour tout entier naturel n,

1 + · · · + n =n(n + 1)

2,

13 + · · · + n3 =(

n(n + 1)2

)2

·

456

Page 464: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Ainsi, pour tout entier naturel non nul n

1 + · · · + n13 + · · · + n3

=2

n (n + 1)= 2

(1n− 1

n + 1

On est ramené à une série télescopique convergente et on obtient

+∞∑n=1

1 + · · · + n13 + · · · + n3 = 2.

e. On a, pour tout entier naturel n

an =+∞∑

k=n+1

qk =qn+1

1 − q·

Il s’ensuit immédiatement que la série∑

an est convergente et que

+∞∑n=0

(+∞∑

k=n+1

qk

)=

q

(1 − q)2·

f. Il est clair que la suite (un) est à valeurs strictement positives, strictement croissante. Si lasuite (an) a une limite finie L, on aurait alors L = L + L2, i.e. L = 0, ce qui est impossibledu fait de sa monotonie. Donc (un) tend vers +∞.On remarque qu’alors, pour tout entier naturel n

1un

− 1un+1

=1un

(1 − 1

1 + un

)=

1un

× un

1 + un=

un

un+1·

Ainsi la série∑ un

un+1est une série télescopique et puisque lim

n→+∞

1un

= 0, elle est conver-

gente. Enfin+∞∑k=0

uk

uk+1=

1u0·

g. Rappelons que p ∈ N∗ est fixé. Pour tout entier naturel non nul n, on a

1n (n + p)

=1p

(1n− 1

n + p

Il s’ensuit que

n∑k=1

1k (k + p)

=1p

n∑k=1

(1k− 1

k + p

)

=1p

⎛⎝ n∑k=1

1k−

n+p∑k=p+1

1k

⎞⎠=

1p

( p∑k=1

1k−

p∑k=1

1n + k

457

Page 465: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Les p termes de la seconde somme tendent tous vers 0 lorsque l’on fait tendre n vers +∞.On en déduit la convergence de la série

∑an et

+∞∑k=1

1k (k + p)

=1p

p∑k=1

1k·

h. On obtient facilement, par identification, que pour tout entier n � 2

1

n(n2 − 1

) =1

2(n − 1)− 1

n+

12(n + 1)

·

Il s’ensuit que pour tout entier n � 2

n∑k=2

1

k(k2 − 1

) =12

n−1∑k=1

1k−

n∑k=2

1k

+12

n+1∑k=3

1k

=12

(1 +

12

)−

(12

+1n

)+

12

(1n

+1

n + 1

)=

14

+12

(1

n + 1− 1

n

La convergence de la série s’ensuit et

+∞∑k=2

1

k(k2 − 1

) =14·

i. Notons, pour tout entier naturel non nul, Sn =n∑

k=1

ak. On remarque que, pour tout entier

k � 1, a3k = − 23k

=13k

− 1k· Il s’ensuit que tout entier naturel non nul n

S3n =n∑

k=1

(1

3k − 2+

13k − 1

+13k

− 1k

)=

3n∑k=1

1k−

n∑k=1

1k

=3n∑

k=n+1

1k·

D’autre part, toujours pour tout entier naturel n non nul,

3n∑k=n+1

1k

=2n∑

i=1

1n + i

=1n

2n∑i=1

11 + i

n

·

Cette dernière somme est une somme de Riemann associée à la fonction continue

f : [0, 2] → R définie par f (t) =1

1 + tet la subdivision

(0,

1n

,2n

, . . . ,2n − 1

n, 2

)· Il

s’ensuit que

limn→+∞

S3n = limn→+∞

1n

2n∑i=1

11 + i

n

=∫ 2

0

dt1 + t

= ln 3.

458

Page 466: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

De plus, pour tout entier n � 1, 0 < an � 2n

et donc limn→+∞

an = 0. Ainsi

limn→+∞

S3n+1 = limn→+∞

S3n + a3n+1 = ln 3 et limn→+∞

S3n+2 = limn→+∞

S3n+1 + a3n+2 = ln 3. La

convergence de la série∑

an est alors assurée et

+∞∑k=1

ak = ln 3.

3. 1. Notons l et m les racines de P.

Cas l �= m. Il existe alors deux complexes A et B tels que pour tout entier naturel n,un = A ln + B mn. Puisque |l| < 1 et |m| < 1, les séries géométriques

∑ln et

∑mn sont

convergentes et donc par linéarité la série∑

un est convergente.

Cas l = m. De même il existe deux complexes A et B tels que pour tout entier natureln, un = A ln + B nln. Puisque |l| < 1, la série géométrique

∑ln et la série dérivée

d’une série géométrique∑

nln sont convergentes. Il s’ensuit encore que la série∑

un estconvergente.

2. Notons, pour tout entier naturel, Sn la somme partielle d’indice n de la série∑

un. Ensommant la relation un+2 − a un+1 − b un = 0, on obtient, pour tout entier naturel n

(Sn+2 − u0 − u1) − a (Sn+1 − u0) − bSn = 0.

En passant à la limite dans cette relation et en notant S la somme de la série∑

an, onobtient

(1 − a − b) S = (1 − a) u0 + u1.

Puisque 1 − a − b �= 0 (sinon 1 serait racine de P)

+∞∑k=0

uk =(1 − a) u0 + u1

1 − a − b·

4. 1. On suppose b > 0 fixé. La fonction t �→ 1

t lnb test évidemment continue,

décroissante sur ]1, +∞[. Par ailleurs, sur cet intervalle∫dt

t lnb t=

{1

1−bln1−b t, si b �= 1 ;

ln (ln t) , si b = 1.

Il s’ensuit que∫ +∞

2

dt

t lnb test convergente si, et seulement si, b > 1. D’après une

remarque faite page 96, la série∑ 1

n lnb nconverge si, et seulement si, b > 1.

2. Cas a > 1. Alors, pour tout b,1

na lnb n= o

(1

n ln2 n

). D’après le théorème de compa-

raison et la question précédente, la série∑ 1

na lnb nconverge.

459

Page 467: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Cas a < 1. Alors pour tout b,1

n ln n= o

(1

na lnb n

). D’après le théorème de compa-

raison et la question précédente, la série∑ 1

na lnb ndiverge.

Cas a = 1. Ce cas a été traité.En résumé ∑ 1

na lnb nconverge ⇐⇒

{a > 1, oua = 1 et b > 1.

5. 1. La suite (an) étant réelle, décroissante, elle admet une limite L dans [−∞, +∞[.

Cas L non nul. Alors limn→+∞

a2n = L et donc limn→+∞

2na2n = ±∞. Les deux séries∑

an

et∑

2na2n sont divergentes.Cas L nul. La suite (an) étant décroissante, cela implique en particulier que (an) est posi-

tive. Notons S = limn→+∞

n∑k=1

ak et S′ = limn→+∞

n∑k=1

2ka2k , qui sont des éléments de [0, +∞].

Pour tout entier naturel k on a

2ka2k+1 �2k+1−1∑i=2k

ai � 2ka2k .

Ainsi, en sommant, pour tout entier naturel n,

12

n+1∑k=1

2ka2k �2n+1−1∑

i=1

ai �n∑

k=0

2ka2k .

En faisant tendre n vers +∞, on obtient donc que S = +∞ si, et seulement si, S′ = +∞,ce qui donne le résultat annoncé.

2. Puisque a est positif, la suite

(1na

)est décroissante. D’après ce qui précède, la série∑ 1

naest de même nature que la série géométrique

∑ 2n

2an=

∑ (1

2a−1

)n

. Elle est

donc convergente si, et seulement si, 2a−1 > 1, i.e. a > 1.

3. Puisque b est positif, la suite(

1

n lnb n

)est décroissante. La série

∑ 1

n lnb nest de même

nature que la série∑ 1

lnb (2n)=

1

lnb 2

∑ 1nb

. D’après la question précédente, la série∑ 1

n lnb nsi, et seulement si, b > 1.

6. 1. Notons L = limn→+∞

n√

an.

Cas L > 1. Puisque L ∈ ]1, +∞], on peut choisir un réel l tel que 1 < l < L. Pardéfinition de la limite, il existe un rang n0 tel que pour tout n � n0, on ait an � ln. Enfaisant tendre n vers +∞, on en déduit que lim

n→+∞an = +∞ et donc que la série

∑an est

(grossièrement) divergente.

460

Page 468: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Cas L < 1. Soit l un réel, L < l < 1. D’après la définition de la limite, il existe un rangn0 tel que pour tout entier n � n0, an � ln. D’après le théorème de comparaison, la sériegéométrique

∑ln étant convergente, la série

∑an est convergente.

2. Notons L = limn→+∞

an+1

an·

Cas L > 1. Par définition de la limite, il existe un rang n0 tel que pour tout n � n0, onait

an+1

an� 1. On en déduit que la suite (an) est croissante à partir du rang n0 et, pour tout

n � n0, an � an0 . Puisque an0 > 0, la limite — qui existe ! — de la suite (an) ne peut pasêtre nulle et donc la série

∑an est (grossièrement) divergente.

Cas L < 1. Soit l un réel, L < l < 1. Il existe un rang n0 tel que pour tout entiern � n0 on ait

an+1

an� l. On en déduit facilement par récurrence que pour tout n � n0

an � ln−n0an0 = C ln·

D’après le théorème de comparaison, les suites étant positives et la série géométrique∑

ln

étant convergente, la série∑

an est convergente.

3. Si an =1na

, alors

limn→+∞

an+1

an= lim

n→+∞n√

an = 1.

On ne peut donc rien affirmer quant à la convergence d’une série lorsque L = 1 dans lesrègles de Cauchy et de d’Alembert.

7. 1. Pour tout entier naturel non nul n, on a

n∏k=1

(1 − ak

Sk

)=

n∏k=1

(Sk − ak

Sk

)=

n∏k=1

(Sk−1

Sk

)=

a0

Sn·

2. La suite (an) étant à valeurs strictement positives, la limite S dans R de (Sn) est strictementpositive (ne pas oublier que (Sn) est croissante). Par ailleurs, la relation de la questionprécédente peut s’écrire

n∑k=1

ln(

1 − ak

Sk

)= ln a0 − ln Sn.

En faisant tendre n vers +∞ dans cette relation, il vient que la série∑

ln

(1 − ak

Sk

)est

convergente si, et seulement si, la limite de Sn est un réel strictement positif, i.e. la série∑an converge. Ainsi les séries

∑an et

∑ln

(1 − an

Sn

)sont de même nature.

Si∑

an converge. Alorsan

Sn∼ an

S, et d’après la règle des équivalents la série

an

Snest

convergente.

461

Page 469: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Si∑ an

Snconverge. Alors lim

n→+∞

an

Sn= 0. Il s’ensuit que

ln(

1 − an

Sn

)∼ an

Sn

et toujours d’après la règle des équivalents, la série∑

ln(

1 − an

Sn

)converge et donc la

série∑

an converge.

3. D’après ce qui précède,∑ an

Snest divergente. Il reste alors deux cas.

Cas a < 1. Alorsan

Sn= o

(an

San

)— car lim

n→+∞Sn = +∞ — et d’après ce qui précède,∑ an

San

est divergente.

Cas a > 1. Pour tout entier naturel non nul n, puisque l’application t �→ 1ta

est décrois-

sante sur R∗+ ∫ Sn

Sn−1

dtta

�∫ Sn

Sn−1

1Sa

ndt =

an

San·

Il s’ensuit, d’après le relation de Chasles, que pour tout entier naturel non nul n

n∑k=1

ak

Sak

�∫ Sn

S0

dtta

=1

a − 1

(1

Sa−10

− 1Sa−1

n

)� 1

(a − 1) Sa−10

·

Les sommes partielles de la série à terme général positif∑ an

San

étant bornées, la série∑ an

San

est convergente.

8. 1. La relation est immédiate lorsque n = 0. Sinon, en remarquant que, pour toutk � 1, ak = Sk − Sk−1, on obtient

n∑k=0

akbk = b0S0 +n∑

k=1

bk (Sk − Sk−1) =n∑

k=0

bkSk −n−1∑k=0

bk+1Sk

=n−1∑k=0

Sk (bk − bk+1) + bnSn.

2. Notons M un majorant de la suite(|Sn|

). Alors, pour tout entier naturel k,

|Sk (bk − bk+1) | � M (bk − bk+1)

(car la suite (bk) est décroissante). La série télescopique∑

(bk − bk+1) étant convergente, lasérie

∑Sk (bk − bk+1) est absolument convergente. Puisque lim

n→+∞Snbn = 0 (produit d’une

462

Page 470: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

suite bornée et d’une suite tendant vers 0), on a

limn→+∞

n∑k=0

akbk =+∞∑k=0

Sk (bk − bk+1) ,

ce qui assure la convergence de la série∑

akbk.

3. Il suffit de montrer que la série∑ einu

nest convergente, et d’après ce qui précède, il suffit

de montrer que la suite (Sn), où

∀n ∈ N∗ Sn =

n∑k=1

eiku,

est bornée. Or, puisque eiu �= 1, pour tout entier naturel n

|Sn| =∣∣∣∣eiu 1 − einu

1 − eiu

∣∣∣∣ =

∣∣∣∣∣ei n+12 u

sin n2 u

sin u2

∣∣∣∣∣ � 1

sin u2

·

Le résultat s’ensuit.

9. Notons w : N → N l’application définie par w(n) = 10n − 1. Clairement, l’applicationw est strictement croissante et pour tout entier naturel non nul k,

ck = n ⇐⇒ w (n − 1) < k � w (n) .

i) D’après la proposition 7 relative à la sommation par paquets des séries à terme général

positif page 94, les séries∑ 1

cnet

∑an sont de même nature, où pour tout entier naturel

non nul n, an =10n−1∑

k=10n−1

1n

=9 × 10n−1

n· Puisque lim

n→+∞an = +∞, la série

∑an, et donc

la série∑ 1

cn, est divergente.

ii) De même, les séries∑ 1

ncnet

∑an sont de même nature, où pour tout entier naturel

non nul n, an =10n−1∑

k=10n−1

1nk

· Or

10n−1∑k=10n−1

1nk

�10n−1∑

k=10n−1

1n10n

=910

× 1n

,

et donc d’après le théorème de comparaison, la série harmonique étant divergente, la

série∑

an et donc la série∑ 1

ncnest divergente.

463

Page 471: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

iii) Pour tout entier n � 2,(

1cn

)n

�(

12

)n

. La série géométrique∑ 1

2nétant convergente,

le théorème de comparaison permet d’établir que∑ (

1cn

)n

est convergente.

iv) La série∑(

1cn

)cn

et la série∑

an, où

an =10n−1∑

k=10n−1

1nn

=910

(10n

)n

·

Or pour tout n � 11, 0 � an � 910

(1011

)n

· La série géométrique∑ (

1011

)n

étant

convergente, d’après le théorème de comparaison, la série∑

an et donc la série∑ (1cn

)cn

, est convergente.

➤ Remarque

Puisque1

ncn� 1

cnet

(1

cn

)n

�(

1

cn

)cn

, il eût suffit de montrer la divergence de la série∑ 1

ncnet la conver-

gence de la série∑( 1

cn

)cn

pour conclure.

10. 1. Pour tout réel positif t et pour tout entier naturel n, la formule exprimant lasomme des n premiers termes d’une suite géométrique nous donne

n∑k=0

(−ta)k =1 − (−ta)n+1

1 + ta·

(Remarquer que −ta �= 1.) Les fonctions considérées étant continues, on peut intégrer sur[0, x], et donc par linéarité de l’intégrale∫ x

0

n∑k=0

(−ta)k dt =n∑

k=0

(−1)k∫ x

0tak dt =

n∑k=0

(−1)kxak+1

ak + 1·

L’égalité demandée en résulte.

2. D’après la formule précédente, pour tout entier naturel n∣∣∣∣∣n∑

k=0

(−1)kxak+1

ak + 1−

∫ x

0

dt1 + ta

∣∣∣∣∣ =∣∣∣∣−∫ x

0

(−ta)n+1

1 + tadt

∣∣∣∣ =∫ x

0

ta(n+1)

1 + tadt.

Par ailleurs, pour tout t � 0,1

1 + ta� 1 et donc∣∣∣∣∣

n∑k=0

(−1)kxak+1

ak + 1−

∫ x

0

dt1 + ta

∣∣∣∣∣ �∫ x

0ta(n+1) dt =

xa(n+1)+1

a(n + 1) + 1·

464

Page 472: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Il s’ensuit, puisque limn→+∞

xa(n+1)+1

a(n + 1) + 1= 0, que

limn→+∞

n∑k=0

(−1)kxak+1

ak + 1=

∫ x

0

dt1 + ta

·

En particulier, pour tout x ∈ [0, 1],

ln (1 + x) =+∞∑k=1

(−1)k−1

kxk;

Arctan x =+∞∑k=0

(−1)k

2k + 1x2k+1.

3. a. On a immédiatement ln p = − ln1p

= − ln(

1 − p − 1p

). La première formule s’en-

suit en remarquant que 0 � p − 1p

� 1. Par ailleurs, pour tout entier naturel n

+∞∑k=n+1

1k

(p − 1

p

)k

�+∞∑

k=n+1

1n + 1

(p − 1

p

)k

=p

n + 1

(p − 1

p

)n+1

·

L’inégalité demandée est alors immédiate.

b. Au vu de la question précédente, on peut proposer la fonction suivante.

function s = ln(p,epsilon)q=(p-1)/p ; a=q ; s=0 ; r=q ; n=1 ;while p*r>epsilon

s=s+r ;n=n+1 ;a=a*q ;r=a/n ;

endendfunction

4. Il est alors immédiat que

+∞∑k=0

(−1)k

2k + 1=

∫ 1

0

dx1 + x2 = [Arctan x]10 =

p

Cette dernière somme, souvent attribuée à Leibniz, semble être initialement due au mathé-maticien écossais James Gregory (1638-1675).

5. De la formule tan (2u) =2 tan u

1 − tan2 u, valable lorsque u �= p

4,

p

2,

3p

4(mod p), on obtient

que tanp

8=

√2 − 1. Puisque 0 < 1

5 <√

2 − 1 et que la fonction Arctan est strictement

465

Page 473: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

croissante sur R, on a 0 < Arctan15

<p

8. Il s’ensuit que 0 < 2 Arctan

15

<p

4et que

tan

(2 Arctan

15

)=

512

,

puis que 0 < 4 Arctan15

<p

2et que

tan(

4 Arctan15

)=

2 512

1 −(

512

)2 =120119

·

Puisque 4 Arctan15

et Arctan1

239sont des éléments de

]0,

p

2

[, u = 4 Arctan

14−Arctan

1239

est un élément de]−p

2,

p

2

[. On en déduit que

tan u =120119 − 1

239

1 + 120119

1239

= 1

et que

4 Arctan14− Arctan

1239

= Arctan 1 =p

Cette formule est due au mathématicien anglais John Machin (1680-1751), qui fut un desprofesseurs d’un certain Brook Taylor. . .

6. Ainsi, pour tout x ∈ [0, 1]

Arctan x =+∞∑k=0

(−1)k

2k + 1x2k+1

et donc

p =+∞∑k=0

(−1)kuk

2k + 1,

où uk = 16(

15

)2k+1

− 4(

1239

)2k+1

· On constate que la suite (uk) est décroissante ; en

effet, pour tout entier naturel k

uk � uk+1 ⇐⇒ 4(

15

)2k+1 (1 − 1

25

)�

(1

239

)2k+1 (1 − 1

2392

)⇐⇒

(2395

)2k+1

� 2596

(1 − 1

2392

);

cette dernière assertion étant vraie pour tout entier naturel k car

(2295

)2k+1

� 2395

� 1

et2596

� 1. La suite (uk) étant décroissante, a fortiori la suite( uk

2k + 1

)est décroissante et la

466

Page 474: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

série∑

(−1)kuk

2k + 1est une série alternée. D’après l’exercice 2, pour tout entier naturel n

∣∣∣∣∣p −n∑

k=0

(−1)k

2k + 1

(16

(15

)2k+1

− 4

(1

239

)2k+1)∣∣∣∣∣ �

16(

15

)2n+3 − 4(

1239

)2n+3

2n + 3·

De tout cela on peut déduire une méthode de calcul approché de p. C’est cette méthodequi est utilisée par la fonction Scilab suivante.

function n= machin(epsilon)n=0 ; u=1/5 ; v=1/239 ; a=u^ 2 ; b=v^ 2 ; s=0 ; r=(16*u-4*v)/(2*n+1) ;while r>=epsilon

if modulo(n,2)==0s=s+r ;

elses=s-r ;

endn=n+1 ;u=a*u ;v=b*v ;r=(16*u-4*v)/(2*n+1) ;

endendfunction

Dans cette analyse, nous n’avons tenu compte que de l’erreur théorique, et pas des erreursd’arrondis qui s’ajoutent nécessairement à l’erreur théorique.

11. 1. Pour tout entier n � 2 et pour tout k ∈ �1, n − 2�

k!n!

=1

n (n − 1) · · · (k + 1)� 1

n (n − 1)·

On en déduit que pour tout entier n � 2

1 � 1! + · · · + n!n!

� (n − 2)1

n (n − 1)+

1n

+ 1 = 1 +2n − 3

n (n − 1)·

On conclut alors facilement à l’aide du théorème des gendarmes.

2. Pour tout entier naturel n et pour tout entier k � n + 2, on a

n!k!

=1

(n + 1) · · · (k − 1) k� 1

(k − 1) k=

1k − 1

− 1k·

Il s’ensuit que

0 � n!+∞∑

k=n+2

1k!

�+∞∑

k=n+2

(1

k − 1− 1

k

)=

1n + 1

,

467

Page 475: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

et d’après le théorème des gendarmes, limn→+∞

n!+∞∑

k=n+2

1k!

= 0. Ainsi,

limn→+∞

n!+∞∑k=n

1k!

= limn→+∞

1 +1

n + 1+ n!

+∞∑k=n+2

1k!

= 1,

ce qui est ce qu’il fallait démontrer.

12. 1. Soit k un entier naturel. La formule de Taylor-Lagrange appliquée à la fonctionfk donne l’existence d’un réel uk ∈ ]0, 1[ tel que

fk (x + h) − fk(x) − hf ′k (x) =h2

2f ′′k (x + ukh) .

Il est alors immédiat que

|fk (x + h) − fk(x) − hf ′k (x)| � h2

2ak.

Puisque la série∑

an est convergente, le théorème de comparaison donne que la série∑fk (x + h) − fk(x) − hf ′k (x) est absolument convergente et donc convergente. Puisque

les série∑

fn (x) et∑

fn (x + h) sont supposées convergentes et puisque h est non nul, parlinéarité, la série

∑f ′n (x) est convergente.

Les propriétés de linéarité et l’inégalité triangulaire pour les séries donnent alors∣∣∣∣∣f (x + h) − f (x) − h+∞∑k=0

f ′k (x)

∣∣∣∣∣ =

∣∣∣∣∣+∞∑k=0

(f (x + h) − f (x) − hf ′k (x)

)∣∣∣∣∣�

+∞∑k=0

|f (x + h) − f (x) − hf ′k (x) |

� h2

2

+∞∑k=0

ak.

La conclusion quant à la dérivabilité de f est alors immédiate.

2. Soit m un réel, 0 < m < r et posons M un majorant de(|cn| rn

). Notons de plus, pour

tout entier naturel p, gp : [−m, m] → R l’application définie par

gp (x) =+∞∑k=p

k (k − 1) · · · (k − p + 1) ckxk−p.

Puisque, pour tout p ∈ N, pour tout entier k � p et pour tout x ∈ [−m, m]∣∣k (k − 1) · · · (k − p + 1) ckxk∣∣ � k (k − 1) · · · (k − p + 1) |ck|mk

= k (k − 1) · · · (k − p + 1) |ck|rk

(m

r

)k

� M k (k − 1) · · · (k − p + 1)(

m

r

)k

,

la série∑

k (k − 1) · · · (k − p + 1) ckxk converge absolument en vertu du théorème relatifaux séries dérivées des séries géométriques et du théorème de comparaison ; la fonction gpest bien définie.

468

Page 476: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On remarque alors, en notant fp,k(x) = (k + p) · · · (k + 1) ck+pxk, que pour tout entier natu-rel k

ap,k = maxx∈[−m,m]

∣∣f ′′p,k

∣∣ ={

(k + p) · · · (k − 1)∣∣ck+p

∣∣ mk−2, si k � 2 ;0, sinon.

D’après l’étude faite ci-dessus, la série∑

ap,k converge, et donc d’après la question a),g′p = gp+1. On en déduit alors à l’aide d’un facile raisonnement par récurrence que g = g0

est de classe C+∞.

Soit x ∈ ]−r, r[. Puisque x ∈ [−m, m], où m =|x| + r

2et que 0 < m < r, on peut

appliquer ce qui précède ; l’application f : x �→+∞∑k=0

ckxk est définie en x, et donc sur

]−r, r[. La caractère C∞ de f est alors simple à établir.

3. Montrons d’abord que l’application g : x �→+∞∑k=0

e−bkx est bien définie sur [1, +∞[. Puisque

la série∑

e−bk est convergente, limn→+∞

e−bk = 0 et donc bk > 0 à partir d’un certain rang.

Il s’ensuit que pour tout x � 1, 0 < e−bkx � e−bk à partir d’un certain rang. Ainsi, d’aprèsle théorème de comparaison, la série

∑e−bkx est convergente.

Soit m un réel strictement supérieur à 1. Notons, pour tout entier naturel p,

gp : x �→+∞∑k=0

(−bk)p e−bkx.

Puisque limn→+∞

bn = +∞, pour tout x � m, (−bk)p e−bkx = o

(e−bk

)et donc gp est définie

sur [m, +∞[. Les fonctions fp,k : x �→ (−bk)p e−bkx sont de classe C2 et pour tout n > m

ap,k = maxx∈[m,n]

∣∣f ′′p,k

∣∣ = bp+2k e−bkm.

Le théorème de comparaison garantit la convergence de la série∑

ap,k et donc que gp estdérivable sur [m, n]. On conclut de la même manière que plus haut.

13. Les coefficient ck (f ) sont bien définies, car f est continue par morceaux.

1. Pour tout entier naturel n et pour tout réel x ∈ [−p, p]

|Pn (f ) (x)|2 =

(n∑

k=−n

ck (f ) eikx

) (n∑

�=−n

c� (f ) ei�x

)

=

(n∑

k=−n

ck (f ) eikx

) (n∑

�=−n

c� (f )e−i�x

)=

∑−n�k,��n

ck (f ) c� (f )ei(k−�)x.

469

Page 477: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Puisque

12p

∫ p

−p

ei(k−�)x dx =

⎧⎨⎩1, si k = � ;[

ei(k−�)x

i (k − �)

]p

−p

= 0, sinon,

on a, par linéarité de l’intégrale

12p

∫ p

−p

|Pn (f ) (x)|2 dx =1

2p

∑−n�k,��n

ck (f ) c� (f )∫ p

−p

ei(k−�)x dx =n∑

k=−n

|ck (f ) |2.

2. Soit un entier naturel non nul n. Alors

12p

∫ p

−p

f (x)Pn (f ) (x) dx =1

2p

∫ p

−p

n∑k=−n

cn (f )e−ikxf (x) dx

=n∑

k=−n

cn (f )1

2p

∫ p

−p

e−ikxf (x) dx

=n∑

k=−n

|ck (f ) |2.

De même

12p

∫ p

−p

f (x)Pn (f ) (x) dx =1

2p

∫ p

−p

f (x)Pn (f ) (x) dx =n∑

k=−n

|ck (f ) |2.

Ainsi,

12p

∫ p

−p

|f (x) − Pn (f ) (x) |2 dx =1

2p

∫ p

−p

|f (x)|2 dx +1

2p

∫ p

−p

|Pn (f ) (x) |2 dx

− 12p

∫ p

−p

f (x)Pn (f ) (x) dx − 12p

∫ p

−p

f (x)Pn (f ) (x) dx

=1

2p

∫ p

−p

|f (x)|2 dx −n∑

k=−n

|ck (f ) |2.

3. Il s’ensuit pour tout entier naturel n que

n∑k=−n

|ck (f ) |2 � 12p

∫ p

−p

|f (t) |2 dt. (Inégalité de Bessel)

En particuliern∑

k=0

|ck (f ) |2 � 12p

∫ p

−p

|f (t) |2 dt.

Les sommes partielles de la série à terme général positif∑

|cn (f ) |2 sont majorées ; il s’ensuitque la série

∑|cn (f ) |2 converge. On raisonne de même pour la série

∑|c−n (f ) |2.

470

Page 478: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

4. Le terme général d’une série convergente tendant toujours vers 0, |cn (f ) |2 — etdonc cn (f ) — converge vers 0. De même pour la suite

(c−n (f )

). Enfin, puisque∫ p

−p

f (t) cos (nt) dt = p(cn(f ) + c−n(f )

)et

∫ p

−p

f (t) sin (nt) dt = pcn(f ) − c−n(f )

i, on en

déduit que

limn→+∞

∫ p

−p

f (t) cos (nt) dt = limn→+∞

∫ p

−p

f (t) sin (nt) dt = 0.

5. Pour entier naturel n et pour tout réel t, t �= 0 (mod 2p), on a

Dn (t) = e−int2n∑

k=0

eikt = e−int 1 − ei(2n+1)t

1 − eit=

sin( (

n + 12

)t)

sin t2

·

Par ailleurs, pour tout t = 0 (mod 2p), Dn(t) = 2n + 1.

6. D’après le calcul précédent, pour tout entier n∫ p

−p

t2Dn(t)dt =∫ p

−p

t2

sin t2

sin( (

n +12

)t)

dt =∫ p

−p

g(t) sin( (

n +12

)t)

dt.

L’application g : t �→ t2

sin t2

(avec g(0) = 0) est évidemment continue sur [−p, p]. Il

s’ensuit, d’après la question 4, que

limn→+∞

∫ p

−p

t2Dn(t) dt = limn→+∞

∫ p

−p

t2 cos (nt) dt + limn→+∞

∫ p

−p

g(t) cost2

sin (nt) = 0.

7. Il est clair que ∫ p

−p

t2 dt =23

p3·

Pour tout entier naturel non nul k, une intégration par parties donne∫ p

−p

t2eiktdt = − 2ik

∫ p

−p

teikt dt ;

puis une autre donne ∫ p

−p

t2eiktdt = − 2k2

∫ p

−p

eikt dt +2k2

[eikt

]p

−p.

Puisque∫ p

−p

eikt dt = 0, ∫ p

−p

t2eiktdt = 4p(−1)k

k2·

Ainsi, pour tout entier naturel non nul n∫ p

−p

t2Dn(t) dt = 2p

(p2

3+ 4

n∑k=1

(−1)k

k2

).

471

Page 479: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

Ce calcul et la question 6 nous donnent alors+∞∑k=1

(−1)k+1

k2=

p2

12·

En utilisant le fait que la série∑ 1

n2est convergente et en remarquant que

+∞∑k=1

(−1)k+1

k2=

+∞∑k=0

1

(2k + 1)2−

+∞∑k=1

1

(2k)2

=+∞∑k=1

1k2

− 2+∞∑k=1

1

(2k)2

=12

+∞∑k=1

1k2

on obtient finalement+∞∑k=1

1k2

=p2

➤ Remarques

• On obtient facilement+∞∑k=0

1

(2k + 1)2=

p2

• On démontre plus généralement qu’il existe une suite(bp)

de nombres rationnels, telle que pour tout entiernaturel non nul p

+∞∑k=1

1

k2p=

22p−1

(2p)!b2p p2p,

la suite (bp) étant définie par récurrence par b0 = 0 et la relationp∑

k=0

(p + 1

k

)(−1)kbk = 0.

• En revanche on ne connaît pas d’expression « simple » de+∞∑k=1

1k2p+1

14. 1. On a∫ b

af (t) dt − (b − a) f (c) =

∫ b

a

(f (t) − f (c)

)dt

=∫ c

af (t) dt +

∫ b

cf (t) dt (Relation de Chasles)

=∫ c

a(a − t) f ′(t) dt +

∫ b

c(b − t) f ′(t) dt (Intégrations par parties)

=∫ c

a

(a − t)2

2f ′′(t) dt +

∫ b

c

(b − t)2

2f ′′(t) dt.

(Intégrations par parties)

472

Page 480: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Cette dernière égalité provient de ce que

[(a − t)2

2f ′(t)

]c

a

=(b − a)2

8f ′(c) et[

(b − t)2

2f ′(t)

]b

c

= − (b − a)2

8f ′(c). Ainsi

∣∣∣∣∫ b

af (t) dt − (b − a) f (c)

∣∣∣∣ �∫ c

a

(a − t)2

2|f ′′(t)| dt +

∫ b

c

(b − t)2

2|f ′′(t)| dt

�∫ c

a

(b − a)2

8|f ′′(t)| dt +

∫ b

c

(b − a)2

8|f ′′(t)| dt

=(b − a)2

8

∫ b

a|f ′′(t)| dt =

(b − a)2

8

∣∣∣∣∫ b

af ′′(t) dt

∣∣∣∣ ,

(f ′′ est de signe constant)

ce qui est ce qu’il fallait démontrer.

2. On peut, quitte à passer à l’opposée, supposer que f est convexe. Alors

∣∣∣∣∣f (n) −∫ n+ 1

2

n− 12

f (t) dt

∣∣∣∣∣ � 18

(f ′

(n +

12

)− f ′

(n − 1

2

))·

La série télescopique∑ (

f ′(n + 1

2

)− f ′

(n − 1

2

))étant convergente, la série∑

f (n) −∫ n+ 1

2

n− 12

f (t) dt est absolument convergente.

Dans la formule (i), Rn est le reste d’ordre n de la série∑

f (n) −∫ n+ 1

2

n− 12

f (t) dt et donc,

puisque f ′ est croissante

|Rn| �+∞∑

k=n+1

∣∣∣∣∣f (n) −∫ n+ 1

2

n− 12

f (t) dt

∣∣∣∣∣� 1

8

+∞∑k=n+1

(f ′

(k +

12

)− f ′

(k − 1

2

))= −1

8f ′

(n +

12

);

ce qui est l’inégalité demandée.

3. En appliquant ce qui précède à la fonction t �→ 1t, qui est de classe C+∞, convexe et dont

la dérivée tend vers 0, on obtient, pour tout entier n � 1

(ii)n∑

k=1

1k

= ln (2n + 1) + S − Rn,

473

Page 481: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 4 – Séries numériques

avec |Rn| � 1

2 (2n + 1)2· Puisque lim

n→+∞Rn = 0, on peut déduire de la relation (ii)

g = limn→+∞

ln (2n + 1) + S − Rn − ln n = ln 2 + S.

Ainsi S = g − ln 2, et donc

n∑k=1

1k

= ln(

n +12

)+ g − Rn,

ce qui est ce qu’il fallait démontrer.

4. Pour tout ´ > 0, on aura

∣∣∣∣∣n∑

k=1

1k− ln

(n +

12

)− g

∣∣∣∣∣ � ´ dès lors que

1

2 (2n + 1)2� ´ ⇐⇒ n � 1

2

(1√2´

− 1)

.

Au d’autres termes, lorsque n =⌈

12

(1√2´

− 1)⌉

,n∑

k=1

1k

− ln(

n +12

)est une

approximation de g à ´ près. (On rappelle que pour tout réel x, que sa partie entièresupérieure, notée �x�, est le plus petit entier relatif n vérifiant x � n.) On en déduitfacilement la fonction Scilab suivante.

function g = euler(epsilon)n=ceil((1/sqrt(2*epsilon)-1)/2) ;s=0 ;for k=1 :n

s=s+1/k ;end ;g=s-log(n+0.5) ;

endfunction

On peut donc avoir la session suivante.

-->euler(1E-14)ans =

0.5772 1566 4900 6561

Par ailleurs g = 0, 5772 1566 4901 5328 . . . . Ainsi, la douzième décimale deeuler(1E-14) est fausse. Cela provient des erreurs numériques (arrondis) dont nousn’avons pas tenu compte : nous n’avons tenu compte que de l’erreur de méthode.

474

Page 482: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Chapitre 5

1. a. Pour tout (x, y) ∈ R2 � { (0, 0) }, en notant (x, y) = (r cos u, r sin u), on a

x2 + xy + y2 = r2

(1 +

sin 2u

2

)� r2

Il s’ensuit que f est bien définie sur R2 � { (0, 0) }, de classe C1 en tant que quotient depolynômes et

0 � f (x, y) = r2sin2 2u

4

1 + sin 2u2

� ‖(x, y)‖2

On en déduit que lim(x,y)→(0,0)

f (x, y) = 0. On note encore f le prolongement par continuité

de f sur R2.

Pour tout (x, y) ∈ R2

� { (0, 0) }, on a∂f∂x

(x, y) =x2y3 + 2xy4(

x2 + xy + y2)2 et puisque

x �→ f (x, 0) = 0, on a également∂f∂x

(0, 0) = 0. Alors pour tout (x, y) ∈ R2 � { (0, 0) }, en

posant (x, y) = (r cos u, r sin u), on vérifie facilement que∣∣∣∣∂f∂x

(x, y) − ∂f∂x

(0, 0)

∣∣∣∣ = r

∣∣cos2 u sin3 u + 2 cos u sin4 u∣∣(

1 + sin 2u2

)2 � 12‖(x, y)‖.

Il s’ensuit que∂f∂x

est continue en (0, 0). Puisque pour tout (x, y) ∈ R2, f (x, y) = f (y, x),

on a, toujours pour tout (x, y) ∈ R2,∂f∂y

(x, y) =∂f∂x

(y, x). Ainsi∂f∂y

est également continue

sur R2 et le prolongement par continuité de f est de classe C1.

b. Il est clair que f est définie sur R2 � { (0, 0) }. Pour tout (x, y) ∈ R2 � { (0, 0) }, en posant(r cos u, r sin u), on a f (x, y) = r

(cos3 u − sin3 u

). De l’inégalité

|f (x, y)| � 2‖ (x, y) ‖

on déduit que lim(x,y)→(0,0)

f (x, y) = 0. On note encore f le prolongement par continuité sur

R2.

On a pour tout (x, y) ∈ R2

� { (0, 0) },

∂f∂x

(x, y) =x4 + 3x2y2 + 2xy4(

x2 + y2)2 ,

et puisque f (x, 0) = x,∂f∂x

(0, 0) = 1. En particulier, pour tout t ∈ R∗,∂f∂x

(t, t) =32

; si

f était de classe C1, on aurait limt→0+

∂f∂x

(t, t) =32

= 1, ce qui est absurde. Le prolongement

par continuité de f n’est donc pas de classe C1.

475

Page 483: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions de plusieurs variables

c. Si f admet un prolongement par continuité, on aurait limt→0+

f (t, 0) = limt→0+

f (t, t). Or, pour

tout réel non nul t, f (t, 0) = 0 et f (t, t) =12· Il s’ensuit que f ne pas être prolongée par

continuité.

2. 1. Il est clair que l’application (x, y) �→ f (x) − f (y) est de classe C1 ainsi que l’ap-plication polynomiale (x, y) �→ x − y. Il s’ensuit que f est bien de classe C1 sur l’ouvertR2 � D, en tant que quotient de fonctions de classe C1.

2. Pour tout (x, y) ∈ R2 � D, il existe d’après le théorème de Taylor-Lagrange un réelu ∈ ]0, 1[ tel que

∂g∂x

(x, y) =f (y) − f (x) − (y − x)f ′(x)

(x − y)2=

f ′′(x + u(y − x)

)2

·

Par ailleurs, pour tout réel x et pour tout réel h non nul, on a

g(x + h, x) − g(x, x)h

=f (x + h) − f (x) − hf ′(x)

h2 ,

et donc d’après la formule de Taylor-Young,∂g∂x

(x, x) =f ′′(x)

2· En résumé, pour tout

(x, y) ∈ R2, il existe un réel u ∈ ]0, 1[ tel que

∂g∂x

(x, y) =f ′′

(x + u(y − x)

)2

·

Soit un réel x et ´ un réel strictement positif. La continuité de f ′′ en x donne l’exis-tence d’un réel strictement positif h tel que pour tout réel t vérifiant |t| � h on ait|f ′′(x + t) − f ′′(x)| � ´. On fixe un tel h. En remarquant que pour tout couple (h, k) ∈ R2

on a |k − h| � 2‖ (h, k) ‖, on obtient que tout (h, k) vérifiant ‖ (h, k) ‖ � h

3, on a∣∣∣∣ ∂g

∂x(x + h, x + k) − ∂g

∂x(x, x)

∣∣∣∣ =12

∣∣f ′′(x + h + u(k − h))− f ′′(x)

∣∣ � ´·

Il s’ensuit que l’application∂g∂x

est continue en (x, x), et ceci pour tout x ∈ R ; ainsi∂g∂x

est continue sur D et donc sur R2. On conclut en remarquant que f (x, y) = f (y, x) pour

tout couple (x, y) ∈ R2 et donc que

∂g∂y

(x, y) =∂g∂x

(y, x).

3. Soit f une fonction homogène de degré a et x un élément de Rn. Posons w l’appli-

cation définie sur R∗+ par t �→ f (tx). D’après la proposition 5, on a pour tout réel strictement

positif t

w′(t) =n∑

k=1

xk∂f∂xk

(tx) .

Mais, w(t) = taf (x), et donc tout réel strictement positif t

w′(t) = ata−1f (x).

476

Page 484: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Ainsi

w′(1) =n∑

k=1

xk∂f∂xk

(x) = af (x).

Montrons la réciproque, à savoir que si f est une fonction de classe C1 définie sur Rn et qui

vérifie, pour tout x ∈ Rn,n∑

k=1

xk∂f∂xk

(x) = af (x), alors f est a-homogène.

Soit donc x ∈ Rn et posons w : t �→ f (tx), définie sur R

∗+. On a

tw′(t) =n∑

k=1

txk∂f∂xk

(tx) = aw(t).

On conclut en remarquant que les solutions sur R∗+ de l’équation différentielle ty′ − ay = 0

sont les t �→ Ata, avec A une constante réelle et en remarquant également que w(1) = f (x).

4. 1. Il est clair que f est une fonction de classe C2. Pour tout x ∈ Rn � {0} et pourtout k ∈ �1, n�, on a

∂f∂xk

(x) =xk

‖x‖w′(‖x‖)

et∂2f∂x2

k(x) =

x2k

‖x‖2 w′′(‖x‖)

+‖x‖2 − x2

k

‖x‖3 w′(‖x‖).

En sommant ces égalités, on obtient

Df (x) = w′′(‖x‖)

+n − 1‖x‖ w′(‖x‖

).

2. Une fonction f : x �→ w(‖x‖

), où w ∈ C2

(R

∗+, R

)vérifie sur R

3� {0} la rela-

tion Df = lf si et seulement si w est une solution sur R∗+ de l’équation différentielle

(E) y′′ +2t

y′ − ly = 0.

Soit g ∈ C2(R

∗+, R

)une application quelconque et posons h : t �→ tg(t). On a, pour tout

t ∈ R∗+, h′′(t) = tg′′(t) + 2g(t). Ainsi, si g est une solution de (E), alors h est une solution

de z′′ − lz = 0. On vérifie également que si h est une solution sur R∗+ de l’équation

z′′ − lz = 0, alors g : t �→ h(t)t est une solution de (E).

D’après les résultats relatifs aux équations différentielles linéaire d’ordre 2 à coefficientsconstants, on aCas l > 0Il existe deux constantes réelles a et b telle que pour tout x ∈ R3 � {0}

f (x) =ae

√l ‖x‖ + be−

√l ‖x‖

‖x‖ ;

Cas l = 0Il existe deux constantes réelles a et b telle que pour tout x ∈ R3 � {0}

f (x) = a +b

‖x‖ ;

477

Page 485: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions de plusieurs variables

Cas l < 0Il existe deux constantes réelles a et b telle que pour tout x ∈ R

3� {0}

f (x) =a cos

(√−l ‖x‖

)+ b sin

(√−l ‖x‖

)‖x‖ ·

5. 1. La fonction f est polynomiale, donc elle est de classe C1. Cherchons d’abord lespoints critiques. Les points critiques (x, y) sont caractérisés par

(E)

⎧⎪⎪⎪⎨⎪⎪⎪⎩∂f∂x

(x, y) = 3x2 + y = 0

∂f∂y

(x, y) = 3y2 + x = 0.

En soustrayant les deux équations de (E), on obtient (x − y)(3(x + y) − 1

)= 0.

Si 3(x + y) − 1 = 0, alors en additionnant les deux équations de (E), on obtient

3(x2 + y2) +13

= 0, ce qui est absurde. Ainsi f admet exactement deux points critiques

(0, 0) et(−1

3,−1

3

).

Le point (0, 0)Puisque 0 n’est ni un maximum, ni un minimum de x �→ f (x, 0), le point (0, 0) n’est pasun extremum.

Le point(− 1

3 ,− 13

)Posons g(h, k) = f

(−1

3+ h,−1

3+ k

), c’est-à-dire

g(h, k) = −h2 (1 − h) − k2 (1 − k) + hk + a.

(a = f(− 1

3 ,− 13

)) On sait que pour tous réels h et k, on a hk � h2 + k2

2et donc

g(h, k) − g(0, 0) � −h2

(12− h

)− k2

(12− k

).

On en déduit que si ‖(h, k)‖ � 14

,

g(h, k) − g(0, 0) � −h2 + k2

4< 0,

et ainsi le point(− 1

3 ,− 13

)est un maximum local de f . La fonction f n’a pas de maximum

global.

478

Page 486: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. L’hypothèse w′(a) = 0 et w′′(a) �= 0 donne que w admet un extremum strict en a. Dans lecas w′′(a) > 0, le tableau de variations de w est comme suit.

x −∞ a +∞w′(x) − 0 +

w ↘ ↗w(a)

Il s’ensuit que w admet un minimum global en a. Dans le cas w′′(a) < 0, w admet unmaximum global en a. On a des résultats similaires en ce qui concerne c. Par ailleurs, f estévidemment de classe C1 et il est facile de constater que (a, b) est l’unique point critique def . Plusieurs cas se présentent alors.

Cas w′′(a) > 0 et c′′(b) > 0Puisque pour tout réel t on a w(t) � w(a) et c(t) � c(b), on a pour tout couple de réels(x, y)

f (x, y) = w(x) + c(y) � w(a) + c(b),

et donc (a, b) est un minimum global strict de f .

Cas w′′(a) < 0 et c′′(b) < 0De même (a, b) est un maximum global strict de f .

Cas w′′(a)c′′(b) < 0Le point (a, b) est évidemment un col.

3. La fonction f est polynomiale, et donc de classe C1. Les points critiques (x, y) sont carac-térisés ⎧⎪⎪⎪⎨⎪⎪⎪⎩

∂f∂x

(x, y) = 2x + 2ay + 2b = 0

∂f∂y

(x, y) = 2ax + 2y + 2g = 0.

soit encore

(S){

x + ay = −b

(1 − a2)y = ab − g.

Ici encore, plusieurs cas se présentent.

Cas a /∈ {−1, 1}Le système (S) est de Cramer ; le point (x0, y0) =

(ag − b

1 − a2,

ab − g

1 − a2

)est l’unique point

critique. Introduisons la fonction g : (h, k) �→ f (x0 + h, y0 + k) définie sur R2. Il s’agit d’un

polynôme dont (0, 0) est un point critique ; il s’ensuit que les termes de degré un sont nulset donc, pour tout couple de réels (h, k)

g(h, k) = h2 + 2ahk + k2 + g(0, 0) = (h + ak)2 +(1 − a2

)k2 + g(0, 0).

Ainsi lorsque a ∈ ]−1, 1[, le point (x0, y0) est un minimum global strict et que si |a| > 1,le point (x0, y0) est un col.

479

Page 487: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions de plusieurs variables

Cas a ∈ {−1, 1} et ab − g = 0Alors pour tout couple de réels (x, y)

(x + ay + b)2 = x2 + y2 + b2 + 2axy + 2bx + 2aby = f (x, y) + b2.

Il s’ensuit que tous les points critiques, c’est-à-dire tous les points de la droite d’équationX + aY + b = 0, sont des minima globaux.Cas a ∈ {−1, 1} et ab − g �= 0La fonction f n’admet pas de points critiques et donc n’admet pas d’extremum.

6. 1. On a pour tout couple (a, b) de réels,−−−−−−→A(a)A(b)

∣∣∣∣ cos b − cos asin b − sin a

et donc∣∣∣∣∣∣−−−−−−→A(a)A(b)∣∣∣∣∣∣2

= 2 − 2 cos (b − a) = 4 sin2

(b − a

2

Ainsi, pour tout couple(u, u′) vérifiant 0 � u � u′ � 2p,

f (u, u′) = 2 sin(

u

2

)+ 2 sin

(u′

2

)+ 2 sin

(u′ − u

2

),

cela du fait que les trois réelsu

2,

u′

2et

u′ − u

2sont des éléments de [0, p].

2. Considérons l’ouvert V ={(

u, u′) ∈ R2 | 0 < u < u′ < 2p}

. Les points critiques de larestriction de f à V sont les points (u, u′) vérifiant⎧⎪⎪⎪⎨⎪⎪⎪⎩

∂f∂u

(u, u′) = cos(

u

2

)− cos

(u′ − u

2

)= 0

∂f∂u′ (u, u′) = cos

(u′

2

)+ cos

(u′ − u

2

)= 0

Ainsi, on a nécessairement cos(

u′

2

)= − cos

(u

2

), et donc

u′

2= p + ±u

2(mod 2p) et

puisqueu

2et

u′

2sont des éléments de [0, p],

u′

2= p − u

Par ailleurs, u doit vérifier la relation cos(

u

2

)= cos

(u′ − u

2

)= cos (p − u). Ainsi, soit

u

2= p − u (mod 2p) — c’est-à-dire u =

2p

3(mod

4p

3) —, soit

u

2= u − p (mod 2p)

— c’est-à-dire u = 2p (mod 4p) —. Ce dernier cas est exclu, donc(

2p

3,

4p

3

)est

l’unique point critique de f sur l’ouvert V et f(

2p

3,

4p

3

)= 3

√3. Par ailleurs, si u = 0,

ou u′ = 2p ou bien encore si u = u′, alors f(u, u′) � 4. Il s’ensuit que le maximum de

480

Page 488: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

f , dont on a admit l’existence, est atteint en un point de V ; ce point est donc un point

critique. On en déduit que le maximum est atteint en(

2p

3,

4p

3

). Ainsi, les triangles de

périmètre maximum inscrits dans un cercle sont les triangles équilatéraux.

7. 1. Il est clair que la restriction de f à R2 � {(0, 0)} est de classe C2. Par ailleurs

pour tout réel x f (x, 0) = 0 ; on en déduit que∂f∂x

est définie en (0, 0) et∂f∂x

(0, 0) = 0.

De même∂f∂x

(0, 0) = 0. Pour démontrer que f est de classe C1, il suffit maintenant de

démontrer la continuité des applications dérivées partielles en (0, 0). Pour tout couple deréels (x, y), avec (x, y) �= (0, 0), on a

∂f∂x

(x, y) =4x2y3 + x4y − y5(

x2 + y2)2 ·

En notant (x, y) = (r cos u, r sin u), on obtient∣∣∣∣∂f∂x

(x, y)

∣∣∣∣ = r∣∣4 cos2 u sin3 u + cos4 u sin u − sin5 u

∣∣ � 6r

et donc pour tout couple de réels (x, y), on a∣∣∣∣∂f∂x

(x, y) − ∂f∂x

(0, 0)

∣∣∣∣ =∣∣∣∣∂f∂x

(x, y)

∣∣∣∣ � 6 ||(x, y)|| ,

ce qui nous permet de conclure quant à la continuité de∂f∂x

en (0, 0). Puisque

f (x, y) = −f (y, x), on a pour tout couple de réels (x, y),∂f∂y

(x, y) = −∂f∂x

(y, x). Il s’ensuit

que∂f∂y

est également une fonction continue.

2. Pour tout réel y,∂f∂x

(0, y) = −y et donc∂2f

∂y∂x(0, 0) = −1. De même pour tout réel x,

∂f∂y

(x, 0) = x et donc∂2f

∂x∂y(0, 0) = 1.

3. Puisque∂2f

∂x∂y(0, 0) �= ∂2f

∂y∂x(0, 0), d’après le théorème de Schwarz, f n’est pas de classe

C2.

8. Soit f une fonction de classe C2 quelconque, définie sur V. On définit sur V lafonction g par g(u, v) = f (u, uv). Par composition, g est de classe C2. La règle des chaînes, ainsi

481

Page 489: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 5 – Fonctions de plusieurs variables

que le théorème de Schwarz s’appliquent donc et pour tout couple (u, v) élément de V,

∂g∂u

(u, v) =∂f∂x

(u, uv) + v∂f∂y

(u, uv) ,

∂2g∂u2

(u, v) =∂2f∂x2

(u, uv) + 2v∂2f

∂x∂y(u, uv) + v2 ∂2f

∂y2(u, uv) ·

Si f vérifie l’équation étudiée, on a pour tout (u, v) ∈ V

u2 ∂2f∂x2

(u, uv) + 2u2v∂2f

∂x∂y(u, uv) + (uv)2

∂2f∂y2

(u, uv) = u2 ∂2g∂u2

(u, v) = 0.

Il s’ensuit qu’il existe nécessairement deux fonctions w et c définies sur R telles que pour tout(u, v) ∈ R

2, g(u, v) = w(v) + uc(v). La fonction g étant de classe C2, les fonctions w et c sontdonc nécessairement de classe C2. Ainsi, pour tout (x, y) ∈ V

f (x, y) = w( y

x

)+ xc

( yx

).

On vérifie alors sans difficulté que toute fonction f : (x, y) �→ w( y

x

)+ xc

( yx

), définie sur

V, où w et c sont des fonctions de classe C2 quelconques, est une solution de l’équation.

9. Il est clair que m(X) = 0. Pour tout couple de réels (a, b), du fait que l’applicationm : Rn → R est manifestement linéaire, on a

f (a, b) =n∑

k=1

((yk − m(Y )

)− a

(xk − m(X)

)−

(b + am(X) − m(Y )

))2

= a2s2(X) − 2ag(X, Y ) + s2(Y ) +(b + am(X) − m(Y )

)2

= s2(Y − aX

)+

(b + am(X) − m(Y )

)2.

Il s’ensuit que f (a, b) � s2(Y − aX

)pour tout couple (a, b). Une brève étude de la fonction

a �→ a2s2(X) − 2ag(X, Y ) + s2(Y ) montre que le minimum de celle-ci est atteint unique-

ment eng(X, Y )s2(X)

· En effet, l’hypothèse que les abscisses ne sont pas toutes égales garantit que

s2(X) �= 0. Il s’ensuit que pour tout couple (a, b) ∈ R2

� {(a0, b0)}, f (a, b) > f (a0, b0), où

a0 =g(X, Y )s2(X)

; b0 = m(Y ) − a0m(X).

➤ RemarqueLa droite de régression de Y en X d’un « nuage de points » est la droite D qui minimise la somme des carrés desdistances des points Mi au points M′

i , où M′i est le point de même abscisse que Mi sur la droite D.

482

Page 490: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

��

Figure 12.1 Droite de régression

Enfin, voici une implémentation Scilab possible.

function m = moyenne(x)m=0 ;n=length(x) :for k=1:n

m=m+x(k) ;endm=m/n ;

endfunction

function coef = regression(x,y)mx=moyenne(x) ;my=moyenne(y) ;vx=moyenne((x-mx).^ 2) ;cov=moyenne((x-mx).*(y-my)) ;a=cov/vx ;coef=[a,my-a*mx] ;

endfunction

➤ RemarqueLa fonction mean de Scilab calcule la moyenne des éléments d’un tableau. Il existes beaucoup d’autres fonctionsstatistiques telles que moment, cmoment (moments centrés à tout ordre), covar, etc. Rappelons simplement queces fonctions ne sont pas autorisées au concours.

10. 1. Soit (x, y) ∈ R2. Par définition∫ x

0

(∫ y

0

∂P∂y

(u, v) dv)

du =∫ x

0

(P(u, y) − P(u, 0)

)du

et de part le théorème de Fubini et de part le fait que la forme est fermée∫ x

0

(∫ y

0

∂P∂y

(u, v) dv)

du =∫ y

0

(∫ x

0

∂P∂y

(u, v) du)

dv

=∫ y

0

(∫ x

0

∂Q∂x

(u, v) du)

dv

=∫ y

0

(Q(x, v) − Q(0, v)

)dv.

483

Page 491: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

2. Il est immédiat que pour tout (x, y) ∈ R2

∂F∂y

(x, y) = Q(x, y).

D’après la question précédente, pour tout (x, y) ∈ R2, on peut exprimer F(x, y) sous laforme

F(x, y) =∫ x

0P(u, y) du +

∫ y

0Q(0, v) dv,

et donc∂F∂x

(x, y) = P(x, y).

En d’autres termes dF = v.

Chapitre 6

1. 1. Pour tout T ∈ [1, +∞[,∫ T

1Arcsin

1t

dt =[t Arcsin

1t

]T

1

+∫ T

1

1√t2 − 1

dt

= T Arcsin1T

− p

2+ ln

(T +

√T2 − 1

).

Donc∫ T

1

(1t− Arcsin

1t

)dt = ln T − T Arcsin

1T

+p

2− ln

(T +

√T2 − 1

).

Or limt→+∞

ln(

T +√

T2 − 1)− ln T = lim

t→+∞ln

(1 +

√1 − 1

T2

)= ln 2.

Ainsi∫ +∞

1

(1t− Arcsin

1t

)dt = lim

T→+∞

∫ T

1

(1t− Arcsin

1t

)dt =

p

2− 1 − ln 2

≈ −0, 122.

2. Posons In =∫ 1

0(ln t)n dt. Grâce à une intégration par parties, on montre que pour tout

n ∈ N∗, In = −nIn−1, on en déduit In = (−1)nn!.On peut aussi utiliser le changement de variable : u = − ln t, on a alors

In = (−1)n∫ +∞

0une−u du = (−1)nG(n + 1) = (−1)nn!.

3. La fonction f : t ∈ ]0, 1] �→ ln ttx

est continue et négative.

* Si x �= 1. Pour tout ´ ∈]0, 1[,∫ 1

´

f (t) dt =1

1 − x

([t1−x ln t

]1

´−

∫ 1

´

t−x dt.)

=1

1 − x

(−´1−x ln ´ − 1

1 − x(1 − ´1−x)

).

484

Page 492: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

- Si x < 1, on a

lim´→0

(−´1−x ln ´ − 1

1 − x(1 − ´1−x)

)= − 1

1 − x.

- Si x > 1,(−´1−x ln ´ − 1

1 − x(1 − ´1−x)

)n’a pas de limite lorsque ´ tend vers zéro.

* Si x = 1, pour tout ´ > 0, on a∫ 1

´

ln tt

dt = −12

(ln ´)2, donc l’intégrale∫ 1

0f (t)dt

diverge.

4. Pour tout T ∈ [0, +∞[,� désignant la partie imaginaire d’un complexe, on a :

∫ T

0e−xt sin t dt = �

∫ T

0e(−x+i)t dt

= � e(i−x)T − 1i − x

=1 − e−xT (x sin T + cos T )

1 + x2·

La fonction F : T ∈ [0, +∞[�→ 1 − e−xT (x sin T + cos T )1 + x2

a une limite lorsque T tend

vers l’infini si et seulement si x > 0, on a alors∫ +∞

0e−xt sin t dt =

11 + x2

·

2. 1. Pour tout x ∈ R, la fonction t ∈ ]0, +∞[ �→Arctan x

t

1 + t2est continue et pour tout

t ∈ ]0, +∞[, on a

∣∣∣∣Arctan xt

1 + t2

∣∣∣∣ � p/21 + t2

, l’intégrale est donc convergente pour tout x ∈ R.

2. Pour tout x ∈ R, la fonction f : t ∈ ]0, +∞[ �→ e−xt sin tt

est continue et limt→0

f (t) = 1,

l’intégrale∫ 1

0e−xt sin t

tdt est donc convergente.

• Pour tout x > 0, e−xt

∣∣∣∣ sin tt

∣∣∣∣ � e−xt, l’intégrale∫ +∞

1e−xt sin t

tdt est donc absolument

convergente.

On en déduit que pour tout x > 0, l’intégrale∫ +∞

0e−xt sin t

tdt est convergente.

• Si x = 0, on sait que∫ +∞

0

sin tt

dt est convergente.

• Si x < 0, définissons la fonction F : T ∈ ]0, +∞[ �→∫ T

0e−xt sin t

tdt.

Considérons F((n + 1)p) − F(np) =∫ (n+1)p

np

e−xt sin tt

dt.

485

Page 493: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

On a ∫ (n+1)p

np

e−xt sin tt

dt = (−1)ne−xnp

∫ p

0e−xu sin u

u + npdu.

Or

0 �∫ p

0e−xu sin u

u + npdu � 1

(n + 1)p

∫ p

0e−xu sin u du,

donc ∣∣∣∣∫ (n+1)p

np

e−xt sin tt

dt

∣∣∣∣ � e−xnp

(n + 1)p

∫ p

0e−xu sin u du,

x étant négatif, on a limn→+∞

e−xnp

(n + 1)p= +∞.

Si l’intégrale∫ +∞

1e−xt sin t

tdt était convergente, on aurait

limn→+∞

F(np) =∫ +∞

1e−xt sin t

tdt = lim

n→+∞F((n + 1)p

),

donc limn→+∞

F(np) − F((n + 1)p) = 0 ; l’intégrale est donc divergente.

En résumé,

Si x > 0,∫ +∞

1e−xt sin t

tdt est absolument convergente ;

Si x = 0,∫ +∞

1e−xt sin t

tdt est semi convergente ;

Si x < 0,∫ +∞

1e−xt sin t

tdt est divergente.

3. Pour tout x ∈ R, la fonction f : t ∈ [0, +∞[�→ e−xt2

1 + t2est continue.

• Si x � 0, pour tout t ∈ [0, +∞[, 0 � f (t) � 11 + t2

, l’intégrale est donc convergente.

• Si x < 0, limt→+∞

f (t) = +∞, l’intégrale diverge.

4. Pour tout x ∈ R, la fonction f : t ∈ ]0, +∞[ �→ 1 − cos txt2

e−t est continue, positive, et

limt→0

1 − cos txt2

=x2

2, l’intégrale

∫ 1

0f (t) dt est donc convergente.

Pour tout t � 1, f (t) � 2e−t, l’intégrale∫ +∞

1f (t) dt est donc convergente , on en déduit

que∫ +∞

0

1 − cos txt2

e−t dt converge.

5. Pour tout x ∈ R la fonction f : t ∈ ]0, 1[ �→ 1 − tln t

tx est continue, négative et

limt→1

1 − tln t

= −1, donc limt→1

f (t) = −1, et l’intégrale∫ 1

12

f (t) dt converge.

486

Page 494: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

• Si x � 0, limt→0

f (t) = 0, l’intégrale∫ 1

2

0f (t) dt converge et

∫ 1

0f (t) dt converge.

• Si x < 0, limt→0

1 − tln t

= 0, il existe t0 tel que ∀t ∈ ]0, t0[ , |f (t)| � 1t|x|

·

Si |x| < 1, soit x > −1, l’intégrale∫ 1

2

0f (t) dt converge donc l’intégrale

∫ 1

0f (t) dt

converge.

Si x = −1, f (t) ∼o

1t ln t

. Soit ´ > 0, on a∫ 1

2

´

1t ln t

dt = ln(ln 2) − ln(| ln ´|), or

lim´→0

ln(| ln ´|) = +∞, l’intégrale est donc divergente.

Si x < −1,1

t|x|| ln t| � 1t| ln t| , donc l’intégrale diverge.

En résumé, l’intégrale converge si et seulement si x > −1.

6. Pour tout x ∈ R, la fonction f : t ∈ ]0, 1[ �→ ln t ln(1 − t)t

t−x est continue positive,

Considérons la fonction g : t ∈ ]0, 1[ �→ ln t ln(1 − t)t

. Elle est continue et positive.

• Au voisinage de 1, on a g(t) ∼1− ln t ln(1 − t) ∼

1(1 − t) ln(1 − t), donc lim

t→1f (t) = 0,

l’intégrale∫ 1

1/2f (t) dt converge.

• Au voisinage de 0, on a g(t) ∼0− ln t et f (t) ∼

1−t−x ln t, l’intégrale

∫ 1/2

0f (t) dtconverge

si et seulement si x < 1. (On peut se référer à l’exercice 1, question 3.)L’ensemble des réels x tels que l’intégrale converge est donc la demi-droite ]−∞, 1[ .

3. 1. On sait que pour tout u ∈ ]0, +∞[ , ln u � u−1 ( la fonction ln est une fonctionconcave), donc pour tout t ∈ [0,

√n[, on a

ln(

1 − t2

n

)� − t2

n, (u = 1 − t2

n) et ln

(1 +

t2

n

)� t2

n, (u = 1 +

t2

n).

Ainsi en ln(1− t2

n ) � e−t2 , soit

(1 − t2

n

)n

� e−t2 ,

de même, en ln(1+

t2

n)� et2 , soit e−t2 � 1(

1 +t2

n

)n ·

2. • Considérons le changement de variable t =√

n cos u.On a ∫ √

n

0

(1 − t2

n

)n

dt =√

n∫ p/2

0(sin u)2n+1 du.

487

Page 495: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

• Considérons maintenant le changement de variable t =√

n tan u.

On a(

1 +t2

n

)−n

= cos2n u et dt =√

n1

cos2 udu,

donc∫ √

n

0

(1 +

t2

n

)−n

dt =√

n∫ p/4

0(cos u)2n−2 du.

• On en déduit que

√n∫ p/2

0(sin u)2n+1 du �

∫ √n

0e−t2 dt

et que ∫ √n

0e−t2 dt �

√n∫ p/4

0(cos u)2n−2 du �

√n∫ p/2

0(cos u)2n−2 du.

3. Pour tout n ∈ N,∫ p/2

0(sin t)n dt =

∫ p/2

0(cos t)n dt,

On a donc

limn→+∞

√n∫ p/2

0(sin u)2n+1 du =

12

√p

et

limn→+∞

√n∫ p/2

0(cos u)2n−2 du =

12

√p.

Par conséquent,∫ +∞

0e−t2 dt = lim

n→+∞

∫ √n

0e−t2 dt =

12

√p·

4. 1. Soit (´, x) ∈ R2 ; 0 < ´ < x, calculons

∫ x

´

sin tt

dt par une intégration par

parties en choisissant « u =1t, v′ = sin t ». On a alors u′ = − 1

t2, v = C − cos t, C étant

une constante réelle que l’on choisira « au mieux ».On obtient ∫ x

´

sin tt

dt =[

C − cos tt

]x

´

+∫ x

´

C − cos tt2

dt·

Pour tout C, limx→+∞

C − cos xx

= 0, et la limite deC − cos ´

´lorsque ´ tend vers zéro

existe si et seulement si C = 1, on a alors lim´→0

1 − cos ´

´= lim

´→0

t2/2t

= 0·

La fonction f : t ∈ ]0, +∞[ �→ 1 − cos tt

est continue et positive, elle possède une limite

en zéro, donc∫ 1

0

1 − cos tt2

dt converge, de plus f (t) � 2t2

,∫ +∞

1

dtt2

converge, donc∫ +∞

1

1 − cos tt2

dt converge.

488

Page 496: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. Ainsi∫ +∞

0

sin tt

dt = lim(´,x)→(0,+∞)

∫ x

´

sin tt

dt =∫ +∞

0

1 − cos tt2

dt ; en utilisant le change-

ment de variable t = 2u, on obtient∫ +∞

0

sin tt

dt =∫ +∞

0

sin2 tt2

dt·

5. Dans tous les cas étudiés, la fonction f : t ∈ [e, +∞[�→ (ln t)b

taest continue et positive.

1. Pour a > 1. Pour tout réel b, limt→+∞

(ln t)b

th= 0 et 1 + h > 1 On sait alors (voir intégrales

des fonctions dites de Riemann) que l’intégrale∫ +∞

e

1t1+h

dt converge. Il en résulte alors,

par comparaison, que∫ +∞

e

(ln t)b

tadt converge.

2. Pour a < 1. Pour tout réel b, limt→∞

th(ln t)b = +∞, il existe donc A > 0 tel que pour tout

t > A,(ln t)b

ta� 1

t(1−h)et 1−h < 1, l’intégrale

∫ +∞

e

1t(1−h)

dt diverge, donc∫ ∞

e

(ln t)b

tadt

diverge.

3. Supposons a = 1

• Si b �= −1, pour tout T ∈ [e, +∞[,∫ T

e

1t(ln t)b dt =

(ln T )b+1 − 1b + 1

.

Si b + 1 > 0, limT→+∞

(ln T )b+1 = +∞, l′integrale diverge;

Si b + 1 < 0, limT→+∞

(ln T )b+1 = 0, l′integrale converge.

• Si b = −1, pour tout T ∈ [e, +∞[,∫ T

e

1t ln t

dt = ln(ln T )) et limT→+∞

ln(ln T ) = +∞,

l’intégrale est divergente.

6. 1. En utilisant le changement de variable u = ct, on a∫ x

´

e−ct dt =∫ cx

c´e−udu, donc∫ x

´

e−t − e−ct

t=

∫ x

´

e−t

tdt −

∫ cx

e−t

tdt =

∫ c´

´

e−t

tdt −

∫ cx

x

e−t

tdt.

2. Étudions la fonction : x ∈ [1, +∞[�→∫ cx

x

e−t

tdt.

Pour tout t ∈ [1, +∞[, 0 � e−t

t� e−t, l’intégrale

∫ +∞

1

e−t

tdt est donc convergente,

posons I =∫ +∞

1

e−t

tdt.

Soit F : T ∈ [1, +∞[�→∫ T

1

e−t

tdt, on a

∫ cx

x

e−t

tdt = F(cx) − F(x) et

limx→+∞

F(cx) = limx→+∞

F(x) = I , donc limx→+∞

∫ cx

x

e−t

tdt = 0.

489

Page 497: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

3. Étudions maintenant la fonction : ´ ∈ ]0, 1] �→∫ c´

´

e−t

tdt·

Au voisinage de 0, on ae−t

t∼ 1

t, nous allons comparer

∫ c´

´

e−t

tdt avec

∫ c´

´

1t

dt, pour

cela, nous écrivons∫ c´

´

e−t

tdt =

∫ c´

´

e−t − 1t

dt +∫ c´

´

1t

dt.

On a limt→0

e−t − 1t

= −1, l’intégrale∫ 1

0

e−t − 1t

dt converge, posons J =∫ 1

0

e−t − 1t

dt,

on a lim´→0

∫ ´

0

e−t − 1t

dt = lim´→0

∫ c´

0

e−t1

tdt = J ,

donc lim´→0

∫ c´

´

e−t − 1t

dt = 0.

D’autre part∫ c´

´

1t

dt = ln c, ainsi∫ +∞

0

e−t − e−ct

tdt = ln c.

4. Avec le changement de variable u = at, on obtient∫ +∞

0

e−at − e−bt

tdt =

∫ +∞

0

e−u − e−ba u

udu,

d’où le résultat.

7. La fonction : t ∈ ]0, 1] �→ Arctan tt

est continue et limt→0

Arctan tt

= 1, l’intégrale∫ 1

0

Arctan tt

dt est donc convergente, de même que l’intégrale∫ 1

0

Arctan ptt

dt.

Pour tout x ∈ ]0, +∞[ ,∫ x

0

Arctan pt − Arctan tt

dt =∫ px

x

Arctan uu

du.

Au voisinage de l’infini, on a Arctan u ∼ p

2,

alors∫ px

x

Arctan uu

du =∫ px

x

Arctan u − p

2u

du +p

2

∫ px

x

duu·

Pour tout u ∈ ]0, +∞[ , Arctan u − p

2= −Arctan

1u

, doncArctan u − p

2u

∼+∞

− 1u2

et∫ +∞

1

Arctan u − p2

udu converge, on a donc lim

x→+∞

∫ px

x

Arctan u − p2

udu = 0·

D’autre part∫ px

x

1u

du = ln p, donc∫ +∞

0

Arctan pt − Arctan tt

dt =p

2ln p·

8. 1. La fonction f : t ∈ ]0, 1[ �→ (− ln t)a(1 − t)b, f est continue et positive.

• Au voisinage de 1, on a ln t ∼ t−1, donc f (t) ∼ (1 − t)a+b , on en déduit que∫ 1

12

f (t) dt

converge si et seulement si a + b > −1

490

Page 498: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

• Au voisinage de 0, f (t) ∼ (− ln t)a, pour tout a ∈ R, (− ln t)a = o(1√t), l’intégrale∫ 1

2

0f (t) dt converge.

2. Utilisons le changement de variable u = − ln t. Pour tout (a, b) ∈ D, on a∫ 1

0f (t) dt =

∫ +∞

0uae−u(1 − e−u)b du.

On en déduit que, pour tout n ∈ N∫ 1

0(− ln t)a(1 − t)n dt =

∫ +∞

0uae−u(1 − e−u)n du

Soit, en utilisant le binôme de Newton,∫ 1

0(− ln t)a(1 − t)n dt =

n∑k=0

(−1)k(

nk

) ∫ +∞

0uae−(k+1)u du.

Avec le changement de variable v = (k + 1)u, on obtient∫ 1

0(− ln t)a(1 − t)n dt = G(a + 1)

n∑k=0

(−1)k(n

k

)(1 + k)a+1 ·

3. Pour tout réel t ∈ [0, 1[,n∑

k=0

tk =1 − tn+1

1 − t, on a donc :

∫ 1

0

− ln t1 − t

dt =∫ 1

0(− ln t)

n∑k=0

tk dt +∫ 1

0

tn+1

1 − t(− ln t) dt·

= −n∑

k=0

∫ 1

0tk ln t dt +

∫ 1

0

tn+1

1 − t(− ln t) dt.

En utilisant une intégration par parties, on obtient∫ 1

0tk ln t dt = − 1

(k + 1)2.

D’autre part la fonction g : t ∈ ]0, 1[ �→ −t ln t1 − t

est continue et limt→0

g(t) = 0, limt→1

g(t) = 1, g

est donc majorée sur ]0, 1],.

Soit M = sup]0,1[ g(t), on a 0 �∫ 1

0

tn+1

1 − t(− ln t) dt � M

∫ 1

0tn dt, donc

0 �∫ 1

0

tn+1

1 − t(− ln t) dt � M

1n + 1

et limn→+∞

∫ 1

0

tn+1

1 − t(− ln t) dt = 0.

491

Page 499: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

Ainsi∫ 1

0

− ln t1 − t

dt =+∞∑n=1

1n2

.

9. 1. Au voisinage de l’infini e−a√

n = o(

1n2

), la série

∑n∈N

e−a√

n est donc conver-gente.

2. Pour tout k ∈ N et pour tout t ∈ [k, k + 1], on a

e−a√

k+1 � e−a√

t � e−a√

k;

e−a√

k+1 �∫ k+1

ke−a

√t dt � e−a

√k;

n−1∑k=0

e−a√

k+1 �∫ n

0e−a

√t dt �

n−1∑k=0

e−a√

k.

On a donc Sn(a) − 1 � In � Sn−1(a) � Sn(a).En utilisant le changement de variable u = a

√t,on obtient

In(a) =2a2

∫ a√

n

0ue−u du.

Par passage à la limite, on en déduit S(a) − 1 � 2a2

∫ +∞

0ue−u du � S(a).

3. On sait que∫ +∞

0ue−u du = G(2) = 1, donc

a2(S(a) − 1) � 2 � a2S(a)

et

lima→0

a2S(a) = 2, ainsi S(a) ∼0

2a2

.

10. 1. Considérons le changement de variable u = tan t, on sait que sin t = tan t cos t,

donc sin2 t =u2

1 + u2,

ainsi∫ p

2

0

dt1 + a2 sin2 t

=∫ +∞

0

du1 + (1 + a2)u2

·

Posons alors v =√

1 + a2 u,

alors∫ +∞

0

du1 + (1 + a2)u2 =

1√1 + a2

∫ +∞

0

dv1 + v2 =

p

21√

1 + a2.

2. Pour tout n ∈ N,∫ (n+1)p

np

dt1 + et sin2 t

=∫ p

0

du1 + eu+np sin2 u

(changement de variable

t = u + np.)

492

Page 500: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On en déduit∫ (n+1)p

np

dt1 + et sin2 t

�∫ p

0

du1 + enp sin2 u

.

3. On sait que pour tout u ∈ R, sin u = sin(p − u), on a donc

∫ p

0

du1 + enp sin2 u

= 2∫ p

20

du1 + enp sin2 u

=p√

1 + enp.

Au voisinage de l’infini,p√

1 + enp∼ pe

−np

2 .

La série∑n∈N

e−n

p

2 est une série géométrique convergente, donc la série

∑n∈N

∫ p

0

du1 + enp sin2 u

converge.

4. Il résulte de ce qui précède, que la série∑n∈N

∫ (n+1)p

np

dt1 + et sin2 t

converge.

Soit F : T ∈ [0, +∞[�→∫ T

0

dt1 + et sin2 t

,

on a limn→+∞

F(np) =∑k∈N

∫ (k+1)p

kp

dt1 + et sin2 t

,soit L cette limite.

Pour tout T ∈ [0, +∞[, il existe un entier n ∈ N tel que

F(np) � F(T ) � F((n + 1)p) � L,

on en déduit que l’intégrale∫ +∞

0

dt1 + et sin2 t

converge.

11. 1. ∫∫D

exy dxdy =

∫ 4

0

(∫ y/2

−ye

xy dx

)dy

=∫ 4

0y(e1/2 − e−1) dy = 8(e1/2 − e−1).

2. La droite d’équation y = x rencontre la parabole d’équation y = −x2 aux points (0, 0) et(−1,−1).On a donc ∫∫

D

√y − x dxdy =

∫ 0

−1

(∫ −x2

x

√y − x dy

)dx

=23

∫ 0

−1(−x − x2)

3/2dx

493

Page 501: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

soit, avec u = −x ∫∫D

√y − x dxdy =

23

∫ 1

0(u − u2)3/2 du.

Posons alors 2u − 1 = cos v, avec u = 0 pour v = p et u = 1 pour v = 0.

On a alors u − u2 =sin2 v

4, ce qui conduit à (attention aux bornes)

∫ 1

0(u − u2)3/2 du =

116

∫ p

0sin4(v)dv.

Or sin4(v) =116

(eiv − e−iv)4 =18

(cos(4v) − 4 cos(2v) + 3), d’où, après calcul,∫ p

0sin4(v)dv =

38

p et ∫∫D

√y − x dxdy =

p

64.

3. On a∫∫

D ln(1 + x + y) dxdy =∫ 1

0

(∫ 1−x

0ln(1 + x + y)dy

)dx.

Calculons F(x) =∫ 1−x

0ln(1 + x + y)dy

En posant v = 1 + x + y, on obtient F(x) =∫ 2

1+xln v dv

C’est à dire F(x) = [v(ln v − 1)]21+x = 2(ln 2 − 1) − (1 + x)(ln(1 + x) − 1),

Avec un changement de variable et une intégration par parties, on obtient sans peine∫ 1

0(1 + x)(ln(1 + x) − 1) dx =

∫12t(ln t − 1) dt = 2(ln 2 − 1) − 1

4

ainsi∫∫

Dln(1 + x + y) dxdy =

14·

12. Dans cet exercice, les calculs d’intégrales doubles utilisent les coordonnées polaires.

1.∫∫

D(x + y) dxdy =

∫ p

0(cos u + sin u)

(∫ 2 sin u

0r2 dr

)du

=83

∫ p

0sin3 u(cos u + sin u) du

=83

∫ p

0sin4 u du

= p.

494

Page 502: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2.∫∫

D

√x2 + y2 dxdy =

∫ p2

p4

(∫ 2 cos u

0r2 dr

)du

=83

∫ p2

p4

cos3 u du

=83

∫ p2

p4

(1 − sin2 u) cos u du

=83

(23− 5

12

√2)

=19

(16 − 10√

2).

3. On remarque que D ={

(x, y) ∈ R2; 0 � x � 3, 0 � y � 3, y � x

}, donc

∫∫D

√x2 + y2 dxdy =

∫ p4

0

(∫ 3cos u

0r2 dr

)du

= 9∫ p

4

0

1cos3 u

du

= 9∫ 1√

2

0

du(1 − u2)2

(sin u = u)

= 9∫ 1√

2

0

(1

(1 + u)2+

11 + u

+1

(1 − u)2+

11 − u

)du

=92

(√2 + ln(1 +

√2)

)≈ 10, 33.

4. On a ∫∫D

cos(x2 + y2) dxdy =∫ p

2

0du

∫ 2

0r cos(r2) dr =

p

4sin 4 ≈ −0, 59.

13. 1. Soient C1 le cercle d’équation x2 + y2 = 1, et C2 le cercle d’équation

x2 + y2 − 2y = 0, ces deux cercles se coupent aux points (

√3

2,

12

) et (−√

32

,12

).

D est symétrique par rapport à l’axe des ordonnées, on a donc

A(D) =∫∫

Ddxdy = 2

∫ p2

p6

(∫ 2 sin u

1r dr

)du

c’est-à-dire, tout calcul fait

A(D) = [u − sin 2u]p2p6

=p

3+

√3

495

Page 503: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 6 – Extension de la notion d’intégrale

2. En utilisant les coordonnées polaires, l’inégalité x2 + y2 � √xy s’écrit r �

√sin u cos u, on

a donc

A(D) =∫∫

Ddxdy =

∫ p2

0

(∫ √sin u cos u

0rdr

)du =

∫ p2

0sin 2udu =

14.

3. Soit D ={

(x, y); x2 + y2 − ax � 0}

. On a V =∫∫

D√

a2 − (x2 + y2)dxdy.

En utilisant les coordonnées polaires

V =∫ p

2

− p2

(∫ a cos u

0r√

a2 − r2dr

)du =

23

a3∫ p

2

0(1 − sin3 u)du =

2a3

3

(p

2− 2

3

).

14. La fonction f : (x, y) ∈ [0, +∞[×[0, +∞[�→ e−(x+y)(x + y)2 est continue et positive.

Pour tous x � 0, Y > 0,∫ Y

0e−(x+y)(x + y)2dy =

∫ x+Y

xe−uu2du =

[− e−u(u2 + 2u + 2

]x+Y

x.

On a donc pour tout x � 0,∫ +∞

0e−(x+y)(x + y)2dy = e−x(x2 + 2x + 2).

L’intégrale∫ +∞

0e−x(x2 + 2x + 2) dx converge, de plus

∫ +∞

0e−x(x2 + 2x + 2) dx = G(3) + 2G(2) + 2G(1) = 6.

15. 1. La fonction f : (x, y) ∈ ]0, +∞[ × ]0, +∞[ �→ 1(1 + x)(1 + xy2)

est continue et

positive.

Pour tout x > 0,∫ +∞

0

11 + xy2

dy =1√x

p

2.

Considérons alors∫ +∞

0

dx√x(1 + x)

.

On pose x = u2 et l’on a∫ +∞

0

dx√x(1 + x)

= 2∫ +∞

0

du1 + u2

= p.

Ainsi∫∫

]0,+∞[×]0,+∞[

1(1 + x)(1 + xy2)

dxdy =p2

2.

On peut aussi remarquer que, pour tout y �= 1,

1(1 + x)(1 + xy2)

=1

1 − y2

[1

1 + x− y2

1 + xy2

].

496

Page 504: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On a ainsi : ∫ +∞

0

1(1 + x)(1 + xy2)

dx =1

1 − y2

∫ +∞

0(

11 + x

− y2

1 + xy2) dx

=1

1 − y2

[ln

1 + x1 + xy2

]+∞

0

= −2ln y

1 − y2

Si y = 1,∫ 1

0

1(1 + x)2

dx = 1, or limy→1

−2ln y

1 − y2= 1, on a donc

∫∫]0,+∞[×]0,+∞[

dxdy(1 + x)(1 + xy2)

= −2∫ +∞

0

ln y1 − y2

dy·

2. On a∫ +∞

0

ln y1 − y2

dy =∫ 1

0

ln y1 − y2

dy +∫ +∞

1

ln y1 − y2

dy, considérons∫ 1

0

ln y1 − y2

dy, et

faisons le changement de variable t =1y

, on obtient

∫ 1

0

ln y1 − y2

dy =∫ +∞

1

ln t1 − 1

t2

−1t2

dt =∫ 1

0

ln t1 − t2

dt,

on en déduit ∫∫]0,+∞[×]0,+∞[

dxdy(1 + x)(1 + xy2)

= −4∫ 1

0

ln t1 − t2

dt·∫ 1

0

ln t1 − t2

dt = −p2

16. 1. On a e−(x2+y2)x2p−1y2q−1 = e−x2x2p−1e−y2

y2q−1

et donc∫∫]0,+∞[×]0,+∞[

e−(x2+y2)x2p−1y2q−1 dxdy =∫ +∞

0e−x2

x2p−1dx∫ +∞

0e−y2

y2q−1dy

Avec le changement de variable t = x2, on obtient∫ +∞

0e−x2

x2p−1dx =12

∫ +∞

0e−t tp−1 dt·

Comme p > 0, l’intégrale∫ +∞

0e−t tp−1 dt converge et l’on sait que∫ +∞

0e−ttp−1 dt = G(p).

De même∫ +∞

0e−y2

y2q−1dy = G(q).

497

Page 505: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

L’intégrale∫∫

]0,+∞[×]0,+∞[e−(x2+y2)x2p−1y2q−1 dxdy est donc convergente et de plus

∫∫]0,+∞[×]0,+∞[

e−(x2+y2)x2p−1y2q−1 dxdy =14

G(p)G(q).

2. Par passage en coordonnées polaires on a :∫∫]0,+∞[×]0,+∞[

e−(x2+y2)x2p−1y2q−1 dxdy

=∫∫

]0, p2 [×]0,+∞[

e−r2

(r cos u)2p−1(r sin u)2q−1rdrdu

=∫ p

2

0(cos u)2p−1(sin u)2q−1 du

∫ +∞

0e−r2

r2p+2q−1 dr

=12

G(p + q)∫ p

2

0(cos u)2p−1(sin u)2q−1 du.

3. Avec le changement de variable u = cos2 u, on obtient∫ p2

0(cos u)2p−1(sin u)2q−1 du =

12

B(p, q),

d’où le résultat.

Chapitre 7

1. On calcule la probabilité p1 de gagner si le joueur ne change pas son changer etla probabilité p2 de gagner s’il change son choix. On note G l’événement « il gagne » et Cl’événement « il a choisi initialement la bonne porte ». En appliquant la formule des probabilitéstotales avec le système complet d’événements (C, C), on obtient avec la première stratégie

p1 = P(G) = P(G/C)P(C) + P(G/C)P(C) = 1 · 13

+ 0 · 23

=13

et avec la seconde stratégie

p2 = P(G) = P(G/C)P(C) + P(G/C)P(C) = 0 · 13

+ 1 · 23

=23·

Il vaut mieux que le joueur change son choix.

2. 1. On suppose que l’urne contient initialement a boules blanches et b boules noireset que i � 2. Notons B l’événement « on obtient une boule blanche au premier tirage »et Bi l’événement « on obtient une boule blanche au i-ième tirage ». En appliquant laformule des probabilités totales avec le système complet d’événements (B, B), on obtient

pi(a, b) = P(Bi) = P(Bi/B)P(B) + P(Bi/B)P(B).

498

Page 506: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On a clairement P(B) =a

a + b, P(B) =

ba + b

et d’autre part, P(Bi/B) = pi−1(a + c, b),

car après le tirage d’une boule blanche, l’urne contient a + c boules blanches et b boulesnoires et il reste i − 1 tirages à effectuer pour atteindre le i-ième. On obtient de même,P(Bi/B) = pi−1(a, b + c). D’où l’égalité

pi(a, b) =a

a + bpi−1(a + c, b) +

ba + b

pi−1(a, b + c).

2. Montrons que pi(a, b) est indépendant de i, c’est-à-dire que, pour tout i � 1, on a, pourtout (a, b) ∈ (N∗)2, pi(a, b) = p1(a, b) =

aa + b

·C’est vrai pour i = 1 et si on suppose que c’est vrai au rang i − 1 (i � 2), on obtient pourtout (a, b) ∈ (N∗)2,

pi(a, b) =a

a + bpi−1(a + c, b) +

ba + b

pi−1(a, b + c)

=a

a + ba + c

a + b + c+

ba + b

aa + b + c

=a(a + c + b)

(a + b)(a + b + c)=

aa + b

·

3. 1. Pour n � 1, soit An l’événement « il ne subsiste aucune erreur au bout den relectures » et, pour 1 � i � 4, Ai

n l’événement « la i-ième erreur a été corrigéependant les n premières relectures ». On a An = A1

n ∩ A2n ∩ A3

n ∩ A4n. Comme Ai

n estl’événement « la i-ième erreur n’a pas été corrigée pendant les n premières relectures »,

on a P(

Ain

)=

(23

)n

et donc P(Ain) = 1−

(23

)n

. Les corrections des différentes erreurs

étant indépendantes les une des autres, on obtient P(An) =(

1 −(

23

)n)4

. On veut

P(An) � 0, 9 soit(

23

)n

� 1− (0, 9)14 . En prenant le logarithme, on obtient car ln

23

< 0,

n �ln

(1 − (0, 9)

14

)ln 2

3

. On trouve n � 9, 0015 et donc n � 10.

2. On note toujours An l’événement « il ne subsiste aucune erreur au bout de n relectures »

et Bi l’événement « il y a i erreurs » (0 � i � 4). On a, pour tout i, P(Bi) =15· Comme

(Bi)0�i�4 est un système complet d’événements, on obtient en appliquant la formule desprobabilités totales

P(An) =4∑

i=0

P(An/Bi)P(Bi) =15

4∑i=0

P(An/Bi).

Le calcul de P(An/B4) a été effectué dans la première question. On a donc

P(An/B4) =(

1 −(

23

)n)4

499

Page 507: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

et la même méthode conduit à P(An/Bi) =(

1 −(

23

)n)i

. On obtient

P(An) =15

4∑i=0

P(An/Bi) =15

4∑i=0

(1 −

(23

)n)i

=15

1 −(

1 −(

23

)n)5

(23

)n ·

On a évidemment P(A10) � 0, 9, d’après la première question. On trouve P(A7) ≈ 0, 89et P(A8) ≈ 0, 92. Il faut donc n � 8.

4. 1. Pour tout n ∈ N, notons An l’événement « le parapluie est disponible après ntrajets ». On a donc pn = P(An) et qn = P(An). Pour tout n ∈ N, on applique la formuledes probabilités totales avec le système complet d’événements (An, An). On obtient

pn+1 = P(An+1) = P(An+1/An)P(An) + P(An+1/An)P(An).

On a P(An+1/An) = p. En effet, si le parapluie était dans le lieu où se trouvait le banquieret qu’il est encore après le n + 1-ième déplacement, c’est que le banquier l’a emporté etdonc qu’il pleut. On a P(An+1/An) = 1, car si le banquier n’a pas avec lui son parapluie,il ne l’emporte pas avec lui et ainsi il le retrouve à l’issue du n + 1-ième déplacement.Finalement, on obtient

pn+1 = p pn + qn.

On a de même

qn+1 = P(An+1) = P(An+1/An)P(An) + P(An+1/An)P(An).On trouve

P(An+1/An) = 1 − P(An+1/An) = 1 − p = q et P(An+1/An) = 1 − P(An+1/An) = 0

et doncqn+1 = qpn.

On obtient donc(

pn+1qn+1

)= S

(pnqn

), où S =

(p 1q 0

).

2. On cherche les valeurs propres de S. Soit l ∈ R. On a

rg(S − lI2) = rg

(p − l 1

q −l

)= rg

(q −l

p − l 1

)= rg

(q −l0 q + l(p − l)

).

Ainsi l valeur propre de S si et seulement si rg(S − lI2) < 2, i.e.q + l(p − l) = −l2 + pl + q = 0 : 1 est solution de l’équation ; l’autre est−q (c’est le produit des racines). La matrice S possède deux valeurs propres distinctes,

donc elle est diagonalisable. Il existe P matrice inversible telle que S = P(

1 00 −q

)p− 1.

On en déduit que Sn = P(

1 00 (−q)n

)p − 1.

3. De la relation de récurrence, on déduit pour tout entier naturel n,(pnqn

)= Sn

(p0q0

)= P

(1 00 (−q)n

)P−1

(p0q0

).

500

Page 508: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Comme P, p0 et q0 ne dépendent pas de n, pn et qn sont des fonctions affines de (−q)n.Comme ((−q)n) converge vers 0, on en déduit que les suites (pn) et (qn) convergent. Onnote p∞ et q∞ leur limite. En faisant tendre n vers +∞, on obtient(

p∞q∞

)= P

(1 00 0

)P−1

(p0q0

).

On a P(

1 00 0

)=

(a 0b 0

), où

(ab

)est la première colonne de P. Cette colonne contient

un vecteur propre pour la valeur propre 1. On a S−I2 =(

p − 1 1q −1

)=

(−q 1

q −1

)et

(S − I2)

(xy

)=

(00

)si, et seulement si, y = qx. On peut prendre a = 1 et b = q. On pose P−1

(p0q0

)=

(cd

).

On obtient (p∞q∞

)=

(1 0q 0

) (cd

)=

(cqc

)Comme pn + qn = 1 pour tout entier n, on a par passage à la limite p∞ + q∞ = 1. On en

déduit c =1

1 + q, puis p∞ =

11 + q

et q∞ =q

1 + q·

5. 1. On note, pour n ∈ N, An (resp. Bn, resp. Cn) l’événement « l’enfant se trouve enA (resp. en B, resp. en C) après le n-ième saut ». On applique la formule de probabilitéstotales avec le système complet d’événements (An, Bn, Cn). On a

an+1 = P(An+1) = P(An+1/An)P(An) + P(An+1/Bn)P(Bn) + P(An+1/Cn)P(Cn)

=13

an +13

bn + cn,

bn+1 = P(Bn+1) = P(Bn+1/An)P(An) + P(Bn+1/Bn)P(Bn) + P(Bn+1/Cn)P(Cn)

=13

an +13

bn,

cn+1 = P(Cn+1) = P(Cn+1/An)P(An) + P(Cn+1/Bn)P(Bn) + P(Cn+1/Cn)P(Cn)

=13

an +13

bn.

On obtient Xn+1 = AXn, où

A =

⎛⎜⎜⎜⎜⎜⎝13

13

1

13

13

0

13

13

0

⎞⎟⎟⎟⎟⎟⎠ .

Une récurrence immédiate montre que, pour tout n ∈ N, Xn = AnX0.

501

Page 509: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

2. Montrons que 0, −13

, 1 sont valeurs propres de A et cherchons les valeurs propres corres-

pondantes.

On a A

(xyz

)=

(000

)si et seulement si x + y = 0 et z = 0. Ainsi 0 est valeur propre de A

et KerA = Vect(1,−1, 0).

De même, on a (A+13

I3)

(xyz

)=

(000

)si et seulement si

{2x + y + 3z = 0x + 2y + = 0x + y + z = 0

,

ce qui équivaut à x = −2y et z = y. Ainsi −13

est valeur propre de A et

Ker(A +13

I3) = Vect(−2, 1, 1).

Enfin (A − I3)

(xyz

)=

(000

)équivaut à

{ −2x + y + 3z = 0x − 2y = 0x + y − 3z = 0

et donc à

x = 2y et z = y. Cela montre que 1 est valeur propre de A et Ker(A− I3) = Vect(2, 1, 1).Ainsi, A qui possède trois valeurs propres distinctes est diagonalisable. Une matrice de pas-

sage de la base canonique de R3 à une base de vecteurs propres est P =

(1 −2 2

−1 1 10 1 1

).

On cherche P−1. On résout pour cela le système P

(xyz

)=

(x′

y′

z′

)d’inconnue (x, y, z).

On obtient {x − 2y + 2z = x′

−x + y + z = y′

y + z = z′

On en déduit x′+y′+z′ = 4z, donc z =14

(x′+y′+z′), puis y = z′−z =14

(−x′−y′+3z′),

et enfin −y′ + z′ = x. On obtient

P−1 =

⎛⎜⎜⎜⎝0 −1 1

−14

−14

34

14

14

14

⎞⎟⎟⎟⎠ .

On a A = P

⎛⎜⎝0 0 0

0 −13

0

0 0 1

⎞⎟⎠ P−1 et donc

Xn = AnX0 = P

⎛⎜⎝0 0 0

0(−1

3

)n

0

0 0 1

⎞⎟⎠ P−1

(a0b0c0

)=

⎛⎜⎜⎜⎜⎜⎜⎝0 −2

(−1

3

)n

2

0(−1

3

)n

1

0(−1

3

)n

1

⎞⎟⎟⎟⎟⎟⎟⎠⎛⎜⎜⎝−b0 + c0

−14

+ c014

⎞⎟⎟⎠ ,

502

Page 510: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

car a0 + b0 + c0 = 1. Finalement on obtient

an =(

12− 2c0

) (−1

3

)n

+12

bn = cn =(−1

4+ c0

) (−1

3

)n

+14·

6. 1. a. On effectue une suite de lancers du dé. Les résultats sont indépendants. Pour

i ∈ N∗, notons Si l’événement « on tire un six au i-ième tirage ». On a P(Si) =

16

et

P(Si) =56· Il est clair que, pour k ∈ N

∗,

Ak = S1 ∩ . . . ∩ Sk−1 ∩ Sk

et par indépendance des événements,

P(Ak) = P(S1) × . . . × P(Sk−1)P(Sk) =(

56

)k−1 16·

On obtient

+∞∑k=1

P(Ak) =16

∞∑k=1

(56

)k−1

=16

∞∑j=0

(56

)j

=16

1

1 − 56

= 1,

car on reconnaît la somme d’une série géométrique.

b. Notons Bk l’événement « on a obtenu le premier six au plus tard au k-ième lancer ».Il est plus simple de considérer l’événement contraire Bk « on n’a pas obtenu de six

pendant les k premiers lancers ». On obtient P(B3) =(

56

)3

et P(B3) = 1 −(

56

)3

.

c. On a de même P(Bk) =(

56

)k

et P(Bk) = 1 −(

56

)k

.

d. On cherche P(Bk/B2k) =P(Bk ∩ B2k)

P(B2k). L’événement Bk ∩ B2k est réalisé si on n’a pas

obtenu de six pendant les k premiers lancers et si on en obtient (au moins) un pendantles k suivants, i.e. Bk ∩ B2k = Bk ∩ Ck, où Ck est l’événement « on a obtenu au moins

un six entre le (k + 1)-ième et le 2k-ième lancer du dé ». On obtient P(Ck) =(

56

)k

et P(Ck) = 1 −(

56

)k

= P(Bk). Les événements Bk et Ck sont indépendants car les

résultats des tirages (k + 1) à 2k sont indépendants des résultats des k premiers tirages.On obtient P(Bk ∩ B2k) = P(Bk)P(Ck) et

P(Bk/B2k) =P(Bk)P(Ck)

P(B2k)=

(56

)k(

1 −(

56

)k)

1 −(

56

)2k =

(56

)k

1 +

(56

)k ·

503

Page 511: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

2. a. Si les k − 1 premiers lancers n’ont pas donné de six, l’urne contient une boule blancheet k − 1 boules rouges avant qu’on ne lance le dé pour la k-ième fois.

b. On en déduit P(B ∩ Ak) = P(B/Ak)P(Ak) =1k

(56

)k−1 16·

c. Soit n ∈ N∗ et considérons la fonction fn définie sur [0, 1[ par fn(x) =

n∑k=1

xk

k· La

fonction fn est dérivable sur [0, 1[ et

f ′n (x) =n∑

k=1

xk−1 =1 − xn

1 − x·

Comme fn(0) = 0, on en déduit, pour tout x ∈ [0, 1[,

fn(x) =∫ x

0f ′n (t) dt =

∫ x

0

1 − tn

1 − tdt.

On en déduit que fn(x) =∫ x

0

11 − t

dt−∫ x

0

tn

1 − tdt = − ln(1−x)−

∫ x

0

tn

1 − tdt. On

a, pour tout t ∈ [0, x], 1 − t � 1 − x > 0 et donctn

1 − t� tn

1 − x. On en déduit

0 �∫ x

0

tn

1 − tdt �

∫ x

0

tn

1 − xdt.

Comme∫ x

0

tn

1 − xdt =

xn+1

(n + 1)(1 − x), on a lim

n→+∞

∫ x

0

tn

1 − xdt = 0 et a fortiori

limn→+∞

∫ x

0

tn

1 − xdt = 0. On en déduit que lim

n→+∞fn(x) = − ln(1 − x). Ainsi la série de

terme généralxk

kconverge, puisque la somme partielle fn(x) a une limite finie en +∞

et+∞∑k=1

xk

k= − ln(1 − x).

d. Notons A la réunion des événements Ak. Comme ces événements sont incompatibles,

on a P(A) =+∞∑k=1

P(Ak) = 1 d’après la question 1. On en déduit que P(B) = P(B ∩ A)

car P(B ∩ A) � P(A) � 0 et donc

P(B) =+∞∑k=1

P(B ∩ Ak) =+∞∑k=1

1k

(56

)k−1 16

=15

+∞∑k=1

1k

(56

)k

.

On trouve, en appliquant le résultat de la question précédente,

P(B) = −15

ln

(1 − 5

6

)= −1

5ln

(16

)=

ln 65

·

504

Page 512: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

7. Si on lance deux dés, un résultat est un couple (i, j) ∈ [[1, 6]]2. Il y a donc 36 résultatspossibles, équiprobables. Il y a quatre couples qui donnent une somme de 5 (les couples(i, 5 − i), avec 1 � i � 4) et six couples qui donnent une somme de 7 (les couples (i, 7 − i),

avec 1 � i � 6). La probabilité que la somme soit 5 est donc436

=19

, celle que la somme

soit 7 est636

=16

, la probabilité qu’elle ne soit ni 5 ni 7 est 1 − 636

− 436

=1318

·

1. Notons Ak l’événement «au k-ième double lancer, ni la somme de 5 ni celle de 7 n’ap-paraît» et Bk l’événement «la somme de 5 apparaît au k-ième double lancer ». On a alorsEn = A1 ∩ · · · ∩ An−1 ∩ Bn.Comme les lancers sont supposés indépendants

P(En) = P(A1) · · · P(An−1)P(Bn) =(

1318

)n−1 19·

2. Il s’agit de calculer P

(+∞⋃n=1

En

). Par incompatibilité des événements En,

P(

+∞⋃n=1

En

)=

+∞∑n=1

P(En).

En reconnaissant la somme d’une série géométrique, on obtient

P

(+∞⋃n=1

En

)=

11 − 13

18

· 19

=25·

3. Notons Fk l’événement «une somme de 7 apparaît au k-ième double lancer et sur les k− 1premiers lancers ni la somme de 5 ni celle de 7 n’apparaît» et Ck l’événement «la sommede 7 apparaît au k-ième double lancer». On a alors Fn = A1 ∩ · · · ∩ An−1 ∩ Cn et, parindépendance des lancers,

P(Fn) = P(A1) · · · P(An−1)P(Cn) =(

1318

)n−1 16.

Par incompatibilité des événements Fn,

P

(+∞⋃

n

Fn

)=

+∞∑n=1

P(Fn) =1

1 − 1318

· 16

=35·

4. Les événements «le jeu s’arrête sur une somme de 5», «le jeu s’arrête sur une somme de 7»et «le jeu ne s’arrête pas» forment un système complet d’événements. Donc la somme desprobabilités de ces trois événements est égale à 1. Ainsi la probabilité que le jeu ne s’arrêtepas est nulle.

8. 1. On note En l’événement « An joue » et Gn l’événement « An gagne le tournoi ».

On a P(Gn/En) =18

, car si An entre dans la partie, il doit gagner trois parties de suite pour

être déclaré vainqueur. On en déduit

pn = P(Gn) = P(Gn/En)P(En) =18

qn.

2. Les quatre premiers joueurs sont sûrs de jouer car le tournoi comporte au moins troisparties.

505

Page 513: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

Soit n � 5. Quand An entre dans la partie c’est contre An−2 ou An−1. En effet, un joueurAk, k � n − 3 pour jouer contre An devrait avoir gagné la partie par laquelle il est entrédans le jeu, puis avoir vaincu An−2 et An−1 ; il aurait donc gagné le tournoi. Notons E1

n« An entre dans la partie en jouant contre An−1 » et E2

n « An entre dans la partie en jouantcontre An−2 ».Pour que l’événement E1

n soit réalisé, il faut que An−1 entre dans la partie et qu’il gagne sapremière partie. Alors sa deuxième partie sera jouée avec An. On a donc

P(E1n ) = P(E1

n/En−1)P(En−1) =12

qn−1.

De même, l’événement E2n est réalisé si An−2 entre dans la partie et s’il gagne ses deux

premières parties (la deuxième contre An−1). On a donc

P(E2n ) = P(E2

n/En−2)P(En−2) =14

qn−2.

On obtient enfin

qn = P(En) = P(E1n) + P(E2

n) =12

qn−1 +14

qn−2.

3. La suite (qn)n�3 est une suite vérifiant une relation de récurrence linéaire sur deux termes.

L’équation caractéristique est x2 =12

x +14

, i.e. 4x2 − 2x − 1 = 0 donc les solutions sont

x1 =1 +

√5

4et x2 =

1 −√

54

. Le calcul de qn est rendu pénible par le fait que les premiers

termes de cette suite récurrente sont q3 et q4. Pour pallier à cette difficulté, considérons lasuite (q′n)n∈N vérifiant, pour tout n ∈ N,

q′n =12

q′n−1 +14

q′n−2

et telle que q′n = qn pour n � 3. Ceci détermine les premiers termes de manière unique.On doit avoir q′2 = 4q′4 − 2q′3 = 4q4 − 2q3 = 2, q′1 = 4q′3 − 2q′2 = 4q3 − 2q′2 = 0et q′0 = 4q′2 − 2q′1 = 8.Il existe (a, b) ∈ R2 tel que, pour tout n ∈ N, q′n = axn

1 + bxn2. On obtient⎧⎨⎩ 8 = q′0 = a + b

0 = q′1 = ax1 + bx2 =a + b

4+

(a − b)√

54

·

D’où le système ⎧⎨⎩ a + b = 8

a − b = − 8√5

,

qui donne

a = 4 − 4√5

=4(√

5 − 1)√5

et b = 4 +4√5

=4(1 +

√5)√

506

Page 514: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On obtient, pour tout n � 3,

qn = q′n =4(√

5 − 1)√5

(1 +

√5

4

)n

+4(1 +

√5)√

5

(1 −

√5

4

)n

=4√5

((1 +

√5

4

)n−1

−(

1 −√

54

)n−1).

D’autre part q1 = q2 = 1. On en déduit que, pour n � 3,

pn =18

qn =1

2√

5

((1 +

√5

4

)n−1

−(

1 −√

54

)n−1)et p1 = p2 =

18·

9. Pour tout k ∈ N∗, on note Pk l’événement « le k-ième lancer donne pile ».

1. a. On a x1 = P(P1) = p, y1 = P(P1) = q, u1 = P(P1∩P2) = p2, x2 = P(P1∩P2) = pq,y2 = P(P2) = q (car si le deuxième lancer est face, on est sûr de ne pas avoir deuxpiles).Ensuite u2 = P(P1 ∩P2 ∩P3) = qp2, x3 = P(P2 ∩P3) = qp (si le troisième lancer estun pile, il faut que le précédent soit face pour ne pas avoir deux piles consécutifs et lerésultat du premier lancer peut être quelconque) et y3 = P(P1 ∩ P2 ∩P3) = (1− p2)q(si le troisième lancer est un face, il suffit de ne pas avoir deux piles aux deux premierslancers pour que B3 soit réalisé).

b. On a, pour tout n � 1, Un = An ∩ Pn+1. On en déduit

un = P(An ∩ Pn+1) = P(An)P(Pn+1) = xnp,

car le résultat du n-ième lancer est indépendant des résultats des n premiers lancers.

c. Soit n � 1. Si l’événement An est réalisé et si le (n + 1)-ième lancer est pile, alorsobtient deux piles consécutifs et An+1 ne peut être réalisé. Par contre Bn+1 est réalisé sile (n + 1)-ième lancer donne face. On a donc P(An+1/An) = 0 et P(Bn+1/An) = q. SiBn est réalisé, An+1 est réalisé si le (n + 1)-ième lancer donne pile et Bn+1 réalisé si le(n + 1)-ième lancer donne face. On a donc P(An+1/Bn) = p et P(Bn+1/Bn) = q.

d. On remarque que si An+1 ou Bn+1 est réalisé, on n’a pas deux piles consécutifs dans lesn-premiers lancers donc An ou Bn est réalisé. On a donc

An+1 = (An+1 ∩ An) ∪ ((An+1 ∩ Bn) et Bn+1 = (Bn+1 ∩ An) ∪ (Bn+1 ∩ Bn).

On en déduit

xn+1 = P(An+1) = P(An+1 ∩ An) + P((An+1 ∩ Bn)= P(An+1/An)P(An) + P((An+1/Bn)P(Bn) = 0xn + pyn = pyn.

On obtient de même

yn+1 = P(Bn+1) = P(Bn+1 ∩ An) + P((Bn+1 ∩ Bn)= P(Bn+1/An)P(An) + P((Bn+1/Bn)P(Bn) = qxn + qyn.

507

Page 515: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

2. a. Pour n � 2, on a

yn+1 =12

xn +12

yn =14

yn−1 +12

yn.

b. Il s’agit d’une relation récurrence sur deux termes. On a d’après la première question

y1 = y2 =12· Posons y0 = 1. On a alors yn+1 =

14

yn−1 +12

yn pour tout n � 1.

L’équation caractéristique de cette récurrence est x2 − 12

x − 14

= 0, dont les solutions

sont x1 =1 +

√5

4et x2 =

1 −√

54

. Il existe (a, b) ∈ R2 tel que, pour tout n ∈ N,

yn = axn1 +bxn

2. On obtient y0 = a+b = 1 et y1 =12

= ax1 +bx2 =a + b

4+

(a − b)√

54

,

ce qui donne le système {a + b = 1(a − b)

√5 = 1,

ce qui donne

a =√

5 + 1

2√

5et b =

√5 − 1

2√

On a donc, pour tout n � 1,

yn =√

5 + 1

2√

5

(1 +

√5

4

)n

+

√5 − 1

2√

5

(1 −

√5

4

)n

=2√5

((1 +

√5

4

)n+1

−(

1 −√

54

)n+1).

On en déduit, pour tout n � 2,

xn =12

yn−1 =1√5

((1 +

√5

4

)n

−(

1 −√

54

)n).

Cette formule reste valable pour n = 1, car x1 =12· On en déduit que, pour tout

n � 1,

un =12

xn =1

2√

5

((1 +

√5

4

)n

−(

1 −√

54

)n).

c. La suite (un) est somme de deux suites géométriques de raison x1 et x2 appartenant à]−1, 1[. Donc la série de terme général un converge car c’est la somme de deux sériesgéométriques convergentes. On remarque que la formule précédente reste valable pourn = 0 car u0 = 0. On en déduit que

+∞∑n=1

un =1

2√

5

+∞∑n=0

(xn1−xn

2) =1

2√

5

(1

1 − x1− 1

1 − x2

)=

1

2√

5

x1 − x2

1 + x1x2 − x1 − x2·

508

Page 516: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Comme x1 − x2 =√

52

et 1 + x1x2 − (x1 + x2) = 1 − 14− 1

2=

14

, on obtient

∞∑n=1

un =1

2√

5·√

52

· 4 = 1.

Considérons l’événement U =⋃

n∈N∗

Un, i.e. « on obtient deux piles consécutifs ». Les

événements Un sont incompatibles donc

+∞∑n=1

un =+∞∑n=1

P(Un) = P(U) = 1.

Il est quasiment certain qu’on obtient deux piles consécutifs.

10. 1. On a, pour tout k ∈ [[1, n]], P(Ak) =12· Pour 0 � k � n

2, on note Bk l’événe-

ment « on a obtenu 2k piles au cours des n lancers ». On obtient An+1 =⋃

0�k�E( n2 )

Bk.

L’événement Bk est réalisé si parmi les n tirages, 2k donnent un pile et les autres un face.Il faut choisir les tirages qui donnent un pile parmi les n tirages. Les résultats des différents

tirages étant indépendantes et la probabilité qu’un tirage donne pile ou face étant12

, on

obtient P(Bk) =(

n2k

)(12

)n

et donc, par incompatibilité des événements Bk,

P(An+1) =E( n

2 )∑k=0

P(Bk) =12n

E( n2 )∑

k=0

(n2k

).

Den∑

k=0

(nk

)= (1 + 1)n = 2n et

n∑k=0

(nk

)(−1)k = (1− 1)n = 0, on déduit en additionnant

2n =n∑

k=0

(nk

)(1 + (−1)k) = 2

E( n2 )∑

k=0

(n2k

)

puis P(An+1) =12n

2n

2=

12·

2. a. L’événement A1∩ . . .∩An∩An+1 est réalisé si les n lancers donnent pile et si le nombrede piles est pair. On en déduit que P(A1 ∩ . . .∩An ∩An+1) = 0 si n est impair. Si n estpair,

P(A1 ∩ . . . ∩ An ∩ An+1) = P(A1 ∩ . . . ∩ An) =12n·

b. Par ailleurs, onn+1∏k=1

P(Ak) =1

2n+1, ce qui n’est jamais égal à P(A1 ∩ . . . ∩ An ∩ An+1) :

les événements A1, . . . , An, An+1 ne sont pas indépendants.

509

Page 517: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

3. Les événements A1, . . . , An sont indépendants par construction. Cela traduit le fait que lesrésultats des différents lancers sont indépendants.Montrons que, si i ∈ [[1, n]], les événements A1, . . . Ai−1, Ai+1, . . . , An, An+1 sont indé-pendants. Il faut démontrer que si I ⊂ [[1, n + 1]] \ {i}, on a

P

⎛⎝⋂j∈I

Aj

⎞⎠ =∏j∈I

P(Aj).

Si n + 1 /∈ I , cela résulte de l’indépendance des événements A1, . . . , An. Pour traiter tousles autres cas, il suffit de démontrer que pour tout k ∈ [[1, n− 1]] et tout choix de k indices1 � i1 < . . . < ik � n, on a

P(Ai1 ∩ . . . ∩ Aik ∩ An+1) = P(Ai1 ) · · · P(Aik )P(An+1),c’est-à-dire

P(Ai1 ∩ . . . ∩ Aik ∩ An+1) =(

12

)k+1

.

L’événement Ai1 ∩ . . . ∩ Aik ∩ An+1 est réalisé si Ai1 ∩ . . . ∩ Aik est réalisé et si le nombretotal de piles est pair. Il faut pour cela que le nombre de piles obtenus dans les n − kautres tirages soit pair si k est pair et impair si k est impair. On note B l’événement « lenombre de piles dans les n − k autres tirages a la parité de k ». Comme B ne dépend quedes résultats des tirages Aj avec j ∈ [[1, n]] \ {i1, . . . , ik}, les événements Ai1 ∩ . . . ∩ Aik etB sont indépendants et on obtient

P(Ai1 ∩ . . . ∩ Aik ∩ An+1) = P(Ai1 ∩ . . . ∩ Aik )P(B) =(

12

)k

P(B).

Le raisonnement conduit dans la première question pour montrer que P(An+1) =12

se

généralise. On montre de la même façon que la probabilité d’obtenir un nombre pair de

piles sur un ensemble fixé de n − k � 1 lancers est12· La probabilité sur les mêmes lancers

d’obtenir un nombre impair de piles est donc aussi12· On en déduit que P(B) =

12

et

P(Ai1 ∩ . . . ∩ Aik ∩ An+1) =(

12

)k+1

, ce qu’il fallait démontrer.

11. 1. On procède par récurrence sur n ∈ N∗. Pour n = 1, la propriété est évidente :P(A1) � P(A1). On la montre aussi pour n = 2, ce qui est utile pour la suite. On a

P(A1 ∪ A2) = P(A1) + P(A2) − P(A1 ∩ A2) � P(A1) + P(A2),

car une probabilité est positive.Si la propriété est vraie au rang n, on obtient

P(A1 ∪ · · · ∪ An ∪ An+1) = P((A1 ∪ · · · ∪ An) ∪ An+1)� P(A1 ∪ · · · ∪ An) + P(An+1)

�n∑

i=1

P(Ai) + P(An+1) �n+1∑i=1

P(Ai),

en utilisant la propriété au rang 2, puis l’hypothèse de récurrence.

510

Page 518: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. On a montré dans l’exercice 1 que P( +∞⋃

n=0An

)= lim

n→+∞P( n⋃

k=0Ak

). D’après la question

1, on a, pour tout n ∈ N,

P( n⋃

k=0

Ak

)�

n∑k=0

P(Ak).

La série de terme général P(Ak) converge donc le membre de droite de l’inégalité a unelimite fini quand n tend vers +∞. Par passage à la limite, on obtient

P( +∞⋃

n=0

An

)�

+∞∑k=0

P(Ak).

12. 1. Considérons l’événement contraire B : « seul un nombre fini d’événements Anse réalisent », ce qui peut encore s’énoncer « pour n assez grand, An ne se réalise pas ». Ona donc, pour tout v ∈ V,

v ∈ B ⇐⇒ ∃k ∈ N, ∀n � k, v ∈ An ⇐⇒ ∃k ∈ N, v ∈⋂n�k

An ⇐⇒ v ∈⋃k∈N

⋂n�k

An.

On a donc B =⋃k∈N

⋂n�k

An, d’où l’on déduit, en appliquant les règles de Morgan,

B =⋂k∈N

⋃n�k

An =⋂k∈N

Ck.

2. On a clairement B ⊂ Ck et donc P(B) � P(Ck) pour tout k ∈ N. La série de terme généralAn converge, donc en appliquant l’inégalité de Boole (deuxième question de l’exercice

11.), on obtient P(Ck) �+∞∑p=k

P(Ap) et donc

0 � P(B) �+∞∑p=k

P(Ap).

La série de terme général P(An) converge donc le reste de la série converge vers 0. On a

donc limk→+∞

+∞∑p=k

P(Ap) = 0 (il s’agit du reste d’indice k − 1 de la série). En faisant tendre k

vers +∞ dans la double inégalité précédente, on obtient P(B) = 0.

3. a. Soit k ∈ N et N ∈ N, N � k. On a Ck =+∞⋂p=k

Ap et donc Ck ⊂N⋂

p=k

Ap. On en déduit

P(Ck) � P

⎛⎝ N⋂p=k

Ap

⎞⎠ ,

puis comme l’indépendance des événements An implique celle des événements An,

P(Ck) �N∏

p=k

P(Ap).

511

Page 519: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 7 – Espaces probabilisés

b. S’il existe p0 � k tel que P(Ap) = 0, alorsN∏

p=k

P(Ap) = 0 si N � p0 et

limN→+∞

N∏p=k

P(Ap) = 0.

On suppose dorénavant que P(Ap) �= 0 si p � k et on prend le logarithme de l’expres-

sion considérée : ln

⎛⎝ N∏p=k

P(Ap)

⎞⎠ =N∑

p=k

ln(P(Ap)

). On considère la série de terme

général P(Ap). Elle est à termes négatifs car P(Ap) ∈ ]0, 1].∗ Si la suite

(P(Ap)

)p�k

ne converge pas vers 1, la suite(

ln(P(Ap)

) )p�k

ne tend pasvers 0 et la série diverge trivialement.∗ Si la suite

(P(Ap)

)p�k

converge vers 1, on a

− ln(P(Ap)

)∼

p→+∞−(P(Ap) − 1) ∼

p→+∞P(Ap).

La série de terme général P(Ap) diverge, donc d’après le théorème de comparaison desséries à termes positifs, il en est de même de la série de terme général − ln

(P(Ap)

)et

donc de la série de terme général ln(P(Ap)

).

Dans tous les cas, la série de terme général ln(P(Ap

)diverge. Comme c’est une

série est à termes négatifs, ses sommes partielles tendent vers −∞. On a donc

limN→+∞

N∑p=k

ln(P(Ap)

)= −∞. Comme la limite de exp en −∞ est 0, on obtient par

le théorème de composition des limites,

limN→+∞

N∏p=k

P(Ap) = 0.

c. On a, pour tout N � k,

0 � P(Ck) �N∏

p=k

P(Ap).

En faisant tendre N vers +∞, on obtient P(Ck) = 0.

On a B =+∞⋃k=0

P(Ck

). La série de terme général P

(Ck

)converge (c’est la série nulle).

On obtient de l’inégalité de Boole

P(B)

�+∞∑k=0

P(Ck

)� 0,

d’où l’on déduit P(B)

= 0, c’est-à-dire P(B) = 1.

4. On considère, pour tout n ∈ N∗, l’événement An : « le n-ième lancer donne pile » et l’évé-

nements B : « pile apparaît une infinité de fois ». La suite (An) est constituée d’événementsindépendants. Pour tout n ∈ N∗, P(An) = p > 0, donc la série de terme général P(An)diverge. D’après la question 2, on a P(B) = 1, ce qui est le résultat demandé.

512

Page 520: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Soit m � 1. Pour n ∈ N∗, on considère l’événement A′

n = Anm ∩Anm+1 ∩ . . .∩A(n+1)m−1.Comme les résultats des différents lancers sont indépendants, la suite (A′

n) est constituéed’événements indépendants. D’autre part, on a P(A′

n) = pm pour tout n ∈ N∗, donc lasérie de terme général diverge trivialement. Considérons l’événement B′ : « une infinitéd’événements A′

n se réalisent ». En appliquant le résultat de la question 2, on obtientP(B′) = 0. Or si B′ est réalisé, une infinité de séquences de m piles consécutifs apparaît carsi A′

n est réalisé, il apparaît des piles entre le mn-ième et le (mn+m−1)-ième lancer (ce quifait une séquence de m lancers) et les séquences de m-piles ainsi obtenues sont disjointes.Ainsi, il apparaît une infinité de séquences de m piles consécutifs de façon quasi-certaine.

Chapitre 8

1. 1. Suivons le nombre de boules restant dans l’urne après chaque tirage. On obtient

n − 1, n − 1, n − 2, n − 2, · · · , 1, 1, 0.

Il y a donc eu exactement N = 2(n − 1) + 1 = 2n − 1 tirages pour vider l’urne.

2. a. Comme il n’y a pas remise lors des tirages impairs, il vient, pour 1 � j � n − 1

[X2j = 1] = [X1 = 0] ∩ [X3 = 0] ∩ · · · ∩ [X2j−1 = 0] ∩ [X2j = 1].

Par la formule des probabilités composées on obtient

P([X2j = 1]) = P([X1 = 0])P([X3 = 0]/[X1 = 0]) . . . P([X2j−1 = 0]/[X1 = 0] ∩ · · ·∩ [X2j−3 = 0])P([X2j = 1]/[X1 = 0] ∩ · · · ∩ [X2j−1 = 0])

Il reste n − k boules dans l’urne après le (2k − 1)-ième tirage donc

P([X2j = 1]) =n − 1

n· n − 2

n − 1· · · n − j

n − j + 11

n − j=

1n·

On a , de même, pour 0 � j � n − 1,

[X2j+1 = 1] = [X1 = 0] ∩ [X3 = 0] ∩ · · · ∩ [X2j−1 = 0] ∩ [X2j+1 = 1]

puis

P([X2j+1 = 1]) = P([X1 = 0])P([X3 = 0]/[X1 = 0]) . . . P([X2j−1 = 0]/[X1 = 0] ∩ · · ·∩ [X2j−3 = 0])P([X2j+1 = 1]/[X1 = 0] ∩ · · · ∩ [X2j−1 = 0])

= P([X2j = 1]) =1n

,

car le contenu de l’urne avant le (2j)-ième tirage et avant le (2j + 1)-ième tirage est lemême.

Ainsi, pour tout k ∈ �1, 2n − 1�, Xk suit la loi de Bernoulli de paramètre1n

, donc

E(Xk) =1n·

513

Page 521: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

b. Comme X =n∑

k=1

Xk, on obtient, par linéarité de l’espérance,

E(X) =2n−1∑k=1

E(Xk) =2n − 1

3. a. On a Y (V) ⊂ [[1, 2n − 1]].L’événement [Y = 2n − 1] correspond à « la boule noire est sortie pour la premièrefois au dernier tirage ». Le tirage précédent étant pair, il y a eu remise, et c’est la mêmeboule qui est sortie au (2n − 2)-ième tirage. Ainsi la boule noire ne peut être sortie audernier tirage pour la première fois et P([Y = 2n − 1]) = 0.Pour 1 � k � 2n − 2, on a

[Y = k] = [X1 = 0] ∩ [X2 = 0] ∩ · · · ∩ [Xk−1 = 0] ∩ [Xk = 1].

Par la formule des probabilités composées, il vient en distinguant les cas k impair et kpair, pour 1 � j � n − 1,

P([Y = 2j − 1]) =n − 1

n· n − 2

n − 1· n − 2

n − 1· · · n − j

n − j + 1· 1

n − j + 1

=(n − 1)(n − 2)2 · · · (n − j)n(n − 1)2 · · · (n − j + 1)2

=n − j

n(n − 1)

P([Y = 2j]) =n − 1

n· n − 2

n − 1· n − 2

n − 1· · · n − j

n − j + 1· n − j

n − j + 11

n − j

=(n − 1)(n − 2)2 · · · (n − j)2

n(n − 1)2 · · · (n − j + 1)2(n − j)=

n − jn(n − 1)

·

On en déduit

E(Y ) =2n−2∑k=1

kP([X = k]) =n−1∑j=1

((2j − 1)P([Y = 2j − 1]) + (2j)P([Y = 2j])

)=

n−1∑j=1

(4j − 1)n − j

n(n − 1)

= − 4n(n − 1)

n−1∑j=1

j2 +4n + 1

n(n − 1)

n−1∑j=1

j − 1n − 1

n−1∑j=1

1

= −4(n − 1)n(2n − 1)6n(n − 1)

+(4n + 1)n(n − 1)

2n(n − 1)− n − 1

n − 1

= −4n − 23

+4n + 1

2− 1 =

4n + 16

·

b. Seuls les tirages d’ordre impair font disparaître la boule noire dès son apparition. Donc

[X = 1] =n−1⋃j=1

[Y = 2j−1]. Ces derniers événements étant deux à deux incompatibles,

514

Page 522: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

il vient

P([X = 1]) =n−1∑j=1

P([Y = 2j − 1]) =1

n(n − 1)

n−1∑j=1

(n − j) =12·

4. L’événement [X = n] correspond à « la boule noire est sortie à tous les tiragespairs et n’a pas été choisie lors des tirages impairs, sauf lors du dernier ». On a donc[X = n] = [X1 = 0] ∩ [X2 = 1] ∩ · · · ∩ [X2n−2 = 1] ∩ [X2n−1 = 1] En utilisant denouveau la formule des probabilités composées, on obtient

P([X = n]) =n − 1

n· 1

n − 1· n − 2

n − 1· 1

n − 2· · · 1 · 1 =

1n!·

2. 1. a. Si n � N , alors Tn(V) = [[1, n]] et si n � N , Tn(V) = [[1, N ]], ce que l’onpeut écrire

Tn(V) = [[1, min(n, N )]].

b. • Il y a Nn listes de tirages possibles, toutes équiprobables, et N listes pour lesquelles[Tn = 1] est réalisé (obtenir toujours le même numéro), ce qui donne

P([Tn = 1]) =1

Nn−1·

• Si n > N , l’événement [Tn = n] est impossible, et si n � N les listes réalisant[Tn = n] sont les listes de n éléments distincts pris parmi les N éléments présents, soit

P([Tn = n]) =N (N − 1) · · · (N − n + 1)

Nn=

N !(N − n)! Nn

·

c. Les listes réalisant [Tn = 2] sont constituées ainsi :• on choisit les deux éléments a et b obtenus parmi les N ; il y a

(N2

)choix ;

• il existe 2n n-listes ne contenant que des a et b dont il faut exclure celles qui necontienne que a ou b qui réalisent [Tn = 1] et pas [Tn = 2]. On obtient

P([Tn = 2]) =

(N2

)(2n − 2)

Nn·

2. Si on réalise [Tn+1 = k], alors au rang précédent Tn n’a pu prendre que les valeurs k − 1ou k. Dans le premier cas, on obtient au n-ième tirage un nouveau numéro, parmi lesN − (k − 1) numéros non encore obtenus, et dans le second cas, on obtient au n-ièmetirage, un des k numéros déjà obtenus. On a donc

P([Tn+1 = k]) = P([Tn+1 = k] ∩ [Tn = k]) + P([Tn+1 = k] ∩ [Tn = k − 1])= P[Tn=k]([Tn+1 = k])P([Tn = k]) + P[Tn=k−1]([Tn+1 = k])P([Tn = k − 1])

=kN

P([Tn = k]) +N − (k − 1)

NP([Tn = k − 1]).

Notons que la relation reste vérifiée pour k = 1, car P([Tn = 0]) = 0.

3. a. On a Gn =N∑

k=1P([Tn = k])Xk, donc G′

n =N∑

k=1kP([Tn = k])Xk−1.

515

Page 523: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

En utilisant la question précédente, on obtient

Gn+1 =N∑

k=1

P([Tn+1 = k])Xk

=N∑

k=1

kN

P([Tn = k])Xk +N∑

k=1

N − (k − 1)N

P([Tn = k − 1])Xk

=XN

N∑k=1

kP([Tn = k])Xk−1 +1N

N−1∑j=0

(N − j)P([Tn = j])Xj+1

=XN

G′n +

N∑j=1

P([Tn = j])Xj+1 − 1N

N∑j=1

jP([Tn = j])Xj+1.

ce qui s’écrit finalement

Gn+1 =XN

G′n + XGn −

X2

NG′

n.

b. On remarque que E(Tn) = G′n(1). En dérivant la relation précédente, il vient

G′n+1 =

1N

(1 − 2X)G′n +

1N

(X − X2)G′′n + Gn + XG′

n

ce qui donne en 1, en sachant que Gn(1) = 1,

E(Tn+1) = − 1N

E(Tn) + 1 + E(Tn)

c’est-à-dire

E(Tn+1) =(1 − 1

N

)E(Tn) + 1.

Le traitement d’une telle suite arithmético-géométrique est standard : son point fixeest N , d’où l’on déduit

E(Tn+1) − N =(

1 − 1N

)(E(Tn) − N ) .

La suite (E(Tn) − N ) est géométrique donc pour tout n ∈ N,

E(Tn) − N =(

1 − 1N

)n−1

(E(T1) − N ).

La variable T1 est la variable certaine égale à 1 donc

E(Tn) = N +(

1 − 1N

)n−1

(1 − N ) = N(

1 −(

1 − 1N

)n).

516

Page 524: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

c. On peut écrireE(TN )

N= 1 −

(1 − 1

N

)N

= 1 − eN ln(1− 1N ). De ln(1 − u) ∼

u→0−u, on

tire

limN→∞

E(TN )N

= 1 − e−1.

3. 1. On a, pour tout k ∈ N∗,

P[(X = k]) = P([X > k − 1]) − P([X > k]).

On en déduit, par un changement d’indice,n∑

k=0

kP([X = k]) =n∑

k=1

kP([X = k]) =n∑

k=1

k(P([X > k − 1]) − P([X > k])

)=

n∑k=1

kP([X > k − 1]) −n∑

k=1

kP([X > k])

=n−1∑k=0

(k + 1)P([X > k]) −n∑

k=1

kP([X > k])

=n−1∑k=0

P([X > k]) − nP([X > n]).

2. a. La série∑

kP([X = k]) converge et, pour tout n ∈ N,

P([X > n]) =+∞∑

k=n+1

P([X = k]).

On en déduit que

0 � nP([X > n]) �+∞∑

k=n+1

nP([X = k]) �+∞∑

k=n+1

kP([X = k]).

Comme+∞∑

k=n+1

kP([X = k]) est le reste d’une série convergente, on a

limn→+∞

+∞∑k=n+1

kP([X = k]) = 0

et, par encadrement,lim

n→+∞nP([X > n]) = 0.

On en déduit

limn→+∞

n−1∑k=0

P([X > k]) = limn→+∞

(n−1∑k=0

kP([X = k]) + P([X > n])

)

=+∞∑k=0

kP([X = k]) = E(X).

Autrement dit la série de terme général P([X > n]) converge et sa somme est E(X).

517

Page 525: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

b. D’après la question 1, on a, pour tout n ∈ N∗,

n∑k=0

kP([X = k]) �n−1∑k=0

P([X > k]) �+∞∑k=0

P([X > k]).

La série de terme général positif kP([X = k]) a ses sommes partielles majorées donc elleconverge. Ainsi X admet une espérance et d’après la question précédente,

E(X) =+∞∑k=0

P(X > k).

3. On sait que si X suit une loi géométrique de paramètre p, on a, pour tout entier k,P([X > k]) = qk, où q = 1 − p. Comme q ∈ ]0, 1[, la série de terme général converge et+∞∑k=0

qk =1

1 − q=

1p· D’après la question 2 b, la variable X possède une espérance égale

à1p·

4. On a Y (V) ⊂ N. On obtient

[Y = 0] = [X impair] ∪ [X = 0] =⋃k∈N

[X = 2k + 1] ∪ [X = 0]

et pour k ∈ N∗,

[Y = k] = [X = 2k].

Comme X est une variable aléatoire, [X = k] est un événement pour tout k ∈ N. On en déduitque [Y = k] est un événement pour tout k ∈ N, car c’est une réunion au plus dénombrabled’événements. Cela montre que Y est une variable aléatoire discrète.

• Supposons que X suive une loi géométrique de paramètre p. Comme X(V) = N∗, on

obtient

P([Y = 0]) =+∞∑k=0

P([X = 2k + 1]) =+∞∑k=0

q2kp = p+∞∑k=0

(q2)k =p

1 − q2=

11 + q

·

Pour tout k ∈ N∗, on a

P([Y = k]) = P([X = 2k]) = q2k−1p.

Sous réserve de convergence, on a

E(Y ) =+∞∑k=1

kP([Y = k]) =+∞∑k=1

kq2k−1p = pq+∞∑k=1

k(q2)k−1.

On reconnaît une série géométrique dérivée, de raison q2 ∈ ]0, 1[, donc convergente. AinsiY possède une espérance et

E(Y ) =pq

(1 − q2)2=

qp(1 + q)2

·

518

Page 526: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

• Supposons que X suit une loi de Poisson de paramètre l. On obtient

P([Y = 0]) = P([X = 0]) ++∞∑k=0

P([X = 2k + 1]) = e−l + e−l

+∞∑k=0

l2k+1

(2k + 1)·

De

⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩el =

+∞∑k=1

lk

k!

e−l =+∞∑k=1

(−1)klk

k!

, on tire el − e−l = 2∞∑

k=0

l2k+1

(2k + 1)!. On en déduit

P([Y = 0]) = e−l + e−l el − e−l

2= e−l +

12

(1 − e−2l).

Pour tout k ∈ N∗, on a

P([Y = k]) = P([X = 2k]) = e−l l2k

(2k)!·

Sous réserve de convergence, on a

E(Y ) =+∞∑k=1

kP([Y = k]) =+∞∑k=1

ke−l l2k

(2k)!=

+∞∑k=1

e−l l2k

2(2k − 1)!=

e−ll

2

+∞∑k=1

l2k−1

(2k − 1)!·

D’après ce qui précède,

+∞∑k=1

l2k−1

(2k − 1)!=

+∞∑k=0

l2k+1

(2k + 1)!=

el − e−l

On en déduit que E(Y ) existe et

E(Y ) =e−ll

2el − e−l

2=

l(1 − e−2l)4

·

5. 1. Comme X suit une loi de Poisson de paramètre 10 000, X admet une espéranceet E(X) = 10 000.

2. Comme les dix entrées sont équiprobables, la probabilité qu’un visiteur rentre par l’entrée

E1 est110

·

3. D’après la formule des probabilités totales avec le système complet d’événements([X = n])n∈N,

P([X1 = k]) =+∞∑n=0

P([X1 = k]/[X = n])P([X = n])

Pour k � n + 1, P([X1 = k]/[X = n]) = 0 et pour k � n,

P([X1 = k]/[X = n]) =(

nk

)1

10k

(910

)n−k

.

519

Page 527: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

On en déduit

P([X1 = k]) =+∞∑n=k

(nk

)1

10k

(910

)n−k e−10 00010 000n

n!

=e−10 000103k

k!

+∞∑n=k

1(n − k)!

(9.103

)n−k

=e−10 000103k

k!

+∞∑n=0

1n!

(9.103

)n

=e−10 000103k

k!e9 000 =

e−1 000103k

k!·

Donc X1 suit une loi de Poisson de paramètre 103. Ainsi X1 admet une espérance et unevariance E(X1) = V (X1) = 103.

4. Soit Y1 le nombre de visiteurs entrant par E1 en payant. On a Y1 =9X1

10et E(Y1) = 900.

6. 1. a. On note que si x ∈ ]0, 1[, ln x < 0 donc f (x) > 0. De plus f (0) = f (1) = 0donc f (x) � 0 pour tout x ∈ [0, 1]. Pour tout x ∈ E, P([X = x]) ∈ [0, 1] doncf (P([X = x])) � 0. On en déduit que

H(X) � 0.

b. Si X est constante, il existe a ∈ E tel que P([X = a]) = 1 et, pour x ∈ E \ {a},P([X = x]) = 0. On a donc H(X) = 0, puisque f (0) = f (1) = 0.

c. Si X suit une loi uniforme, on a, pour tout x ∈ E, P([X = x]) =1N

et donc

f (P([X = x])) = − 1N

ln1N

=ln NN

· On en déduit

H(X) = Nln NN

= ln N .

2. a. Posons, pour x � 0, g(x) = f (x) + x− 1. On a, pour x > 0, g′(x) = − ln x. La fonctiong croît strictement sur ]0, 1] et décroît strictement sur [1, +∞[. Son maximum sur]0, +∞[ est atteint en 1 seulement et vaut g(1) = 0. On a donc g(x) � 0 pour x > 0.Cela reste vrai en 0 car g(0) = −1.On a donc pour tout x � 0, g(x) � 0, donc f (x) � 1 − x avec égalité si et seulementsi x = 1.

b. On a, pour tout x ∈ E, f (NP([X = x])) � 1 − NP([X = x]). En additionnant cesinégalités, on obtient∑

x∈E

f (NP([X = x])) �∑x∈E

(1 − NP([X = x])) .

Comme∑x∈E

P([X = x]) = 1, d’après les propriétés de la loi d’une variable aléatoire

discrète, on a∑x∈E

(1 − NP([X = x])) = N − N∑x∈E

P([X = x]) = N − N = 0,

520

Page 528: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

d’où l’on déduit ∑x∈E

f (NP([X = x])) � 0.

c. On remarque que si P([X = x]) �= 0, on

f (NP([X = x])) = −NP([X = x]) ln (NP([X = x]))

= −NP([X = x]) ln N − NP([X = x]) ln (P([X = x]))

= f (N )P([X = x]) + Nf (P([X = x])) .

On remarque que cette égalité reste vérifiée si P([X = x]) = 0. On en déduit que∑x∈E

f (NP([X = x])) = f (N )∑x∈E

P([X = x]) + N∑x∈E

f (P([X = x]))

= f (N ) + NH(X).

De l’inégalité de la question précédente, on déduit H(X) � − f (N )N

, c’est-à-dire

H(X) � ln N .

3. a. On a vu que pour tout X, H(X) � 0. La valeur minimale est 0. On sait que siX est constante, on a H(X) = 0. Si X n’est pas constante, il existe a ∈ E tel queP([X = a]) ∈ ]0, 1[. On a alors f (P([X = a])) > 0 et comme f (P([X = x])) � 0 six �= a, on a a fortiori H(X) > 0.On conclut : l’entropie H(X) est minimale (c’est-à-dire nulle) si et seulement X estune variable constante.

b. On vu que H(X) � ln N et que H(X) = ln N si X est uniforme. Supposons réci-proquement que H(X) = ln N . D’après les questions 2.(b) et (c), cela équivaut à∑x∈E

f (NP([X = x])) = 0, c’est-à-dire à

∑x∈E

f (NP([X = x])) =∑x∈E

(1 − NP([X = x]))

ou encore à ∑x∈E

(f (NP([X = x])) − 1 + NP([X = x])) = 0.

On a, pour tout x ∈ E, f (NP([X = x])) − 1 = NP([X = x]) � 0. Cette somme determes négatifs est donc nulle si chaque terme est nul. D’après 2.(a) cela équivaut (cas

d’égalité) à NP([X = x] = 1 et donc à P([X = x]) =1N

, pour tout x ∈ E : X suit une

loi uniforme.On conclut : l’entropie est maximale (c’est-à-dire égale à ln N ) si et seulement si X suitune loi uniforme.

7. 1. Au cours du premier échange, on prend un jeton numéroté 0 dans la boîte A etun jeton numéroté 1 dans la boîte. À l’issue de cette opération, il y un jeton 0 et un jeton1 dans chaque boîte, donc X1 est la variable certaine égale à 1.

521

Page 529: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

2. Pour tout n ∈ N∗, on a Xn+1(V) = {0, 1, 2}. On applique la formule des probabili-

tés totales avec le système complet d’événements ([Xn = 0], [Xn = 1], [Xn = 2]). Onremarque que si Xn = 0 ou Xn = 2, alors Xn+1 = 1, car on échange un jeton 0 et un jeton1. On en déduit que, si k = 0 ou 2, alors

P([Xn+1 = k] ∩ [Xn = 0]) = P([Xn = k] ∩ [Xn = 2]) = 0.

On a donc

P([Xn+1 = 0]) = P([Xn+1 = 0] ∩ [Xn = 1]) = P([Xn+1 = 0]/[Xn = 1])P([Xn = 1])

=14

P([Xn = 1]).

En effet si Xn = 1, pour obtenir Xn+1 = 0, il faut échanger le jeton numéroté 1 de la boîte

A avec le jeton numéroté 0 de la boîte B. La probabilité est12· 1

2=

14· On obtient de

même

P([Xn+1 = 2]) = P([Xn+1 = 0] ∩ [Xn = 1]) = P([Xn+1 = 2]/[Xn = 1])P([Xn = 1])

=14

P([Xn = 1]).

Enfin, on a

P([Xn+1 = 1]) = P([Xn+1 = 1]/[Xn = 0])P([Xn = 0])+ P([Xn+1 = 1]/[Xn = 1])P([Xn = 1])

+ P([Xn+1 = 1]/[Xn = 2])P([Xn = 2])

= P([Xn = 0])] +12

P([Xn = 1]) + P([Xn = 2]).

En effet, comme on l’a déjà noté P([Xn+1 = 1]/[Xn = 0]) = P([Xn+1 = 1]/[Xn = 2]) = 1.Si Xn = 1, pour avoir Xn+1 = 1, il faut soit échanger les deux jetons numérotés 1, ce qui

est réalisé avec une probabilité14

, soit échanger les deux jetons numérotés 1, ce qui est

réalisé aussi avec une probabilité14· On obtient donc P([Xn+1 = 1]/[Xn = 1] = 2

14

=12·

3. La dernière relation obtenue peut s’écrire

P([Xn+1 = 1]) = P([Xn = 0])] + P([Xn = 2]) +12

P([Xn = 1])

= 1 − P([Xn = 1]) +12

P([Xn = 1])

= 1 − 12

P([Xn = 1]).

La suite (P([Xn = 1]) est arithmético-géométrique. Le point fixe de l’application

x �−→ 1 − 12

x est23· On obtient, pour tout n ∈ N

∗,

P([Xn+1 = 1]) − 23

= −12

(P([Xn = 1]) − 2

3

).

522

Page 530: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On en déduit que, pour tout n ∈ N∗,

P([Xn = 1]) − 23

=(−1

2

)n−1 (P([X1 = 1]) − 2

3

)=

13

(−1

2

)n−1

et

P([Xn = 1]) =23

+13

(−1

2

)n−1

On en déduit que, pour tout n � 2,

P([Xn = 0]) = P([Xn = 2]) =14

P([Xn−1 = 1]) =16

+112

(−1

2

)n−2

=16−1

6

(−1

2

)n−1

.

De plus, on aP([X1 = 0]) = P([X1 = 2]) = 0.

4. La variable aléatoire X1 est la variable certaine égale à 1, donc E(X1) = 1. Si n � 2, ontrouve

E(Xn) = P([Xn = 1]) + 2P([Xn = 2]) =23

+13

(−1

2

)n−1

+13− 1

3

(−1

2

)n−1

= 1.

8. 1. L’événement Bj,m est réalisé si les m premiers donnent un autre jeton que le

j-ième. La probabilité qu’un tirage donne un autre jeton que le j-ième estn − 1

n· Les

résultats des différents tirages étant indépendants, on en déduit que P(Bj,m) =(

n − 1n

)m

.

Plus généralement, (Bj1,m ∩Bj2,m ∩· · ·∩Bjk,m est réalisé si les m premiers tirages ne donnentaucun des jetons numérotés j1, . . . , jk. La probabilité qu’un tirage ne donne aucun des

jetons numérotés j1, . . . , jk estn − k

n· Les résultats des différents tirages étant indépendants,

on en déduit que

P(Bj1,m ∩ Bj2,m ∩ · · · ∩ Bjk,m) =(

n − kn

)m

.

2. a. L’événement [X > m] est réalisé si on n’a pas obtenu les n jetons pendant les m pre-miers tirages, c’est-à-dire si l’un des n jetons n’a pas été obtenu, c’est-à-dire si l’un desévénements B1,m, B2,m, · · · , Bn,m est réalisé. On a donc

P([X > m]) = B1,m ∪ B2,m ∪ · · · ∪ Bn,m.

b. On applique la formule du crible. On obtient

P([X > m]) =n∑

k=1

(−1)k−1∑

1æ1<...<jk�n

P(Bj1,m ∩ Bj2,m ∩ · · · ∩ Bjk,m).

La somme∑

1�j1<...<jk�n

P(Bj1,m ∩ Bj2,m ∩ · · · ∩ Bjk,m) contient(n

k

)termes tous égaux à(

n − kn

)m

d’après la première question. On en déduit

P([X > m]) =n∑

k=1

(−1)k−1

(nk

) (n − k

n

)m

.

523

Page 531: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

Pour tout k ∈ [[1, n]], on a 0 � n − kn

< 1, donc limm→+∞

(−1)k−1

(nk

) (n − k

n

)m

= 0,

car c’est une suite géométrique dont la raison appartient à [0, 1[. On en déduit que lasuite (P([X > m])) converge vers 0, car c’est la somme de n suites tendant vers 0.Notons B l’événement « on n’obtient jamais les n jetons ». On a pour tout m ∈ N,B ⊂ [X > m] et donc 0 � P(B) � P([X > m]). Par passage à la limite, on obtientP(B) = 0 et donc P(B) = 1. Il est donc quasi-certain qu’on obtient les n jetons au boutd’un nombre fini de tirages. La variable X est donc définie presque sûrement.

c. D’après l’exercice 3., pour montrer que X admet une espérance, il suffit de montrerque la série de terme général P([X > m]) converge. L’expression de P([X > m])trouvée à la question précédente montrer que c’est une somme de n séries géométriquesconvergentes, donc c’est une série convergente dont la somme est, toujours d’aprèsl’exercice 3., égale à E((X). On a, pour 1 � k � n,

+∞∑m=0

(−1)k−1

(nk

)(n − k

n

)m

= (−1)k−1

(nk

)1

1 − n − kn

= n(−1)k−1

(nk

)k·

Par linéarité de la somme d’un série convergente, on en déduit

E(X) = nn∑

k=1

(−1)k−1

(nk

)k·

d. Considérons la fonction f définie sur R par

f (x) =n∑

k=1

(−1)k−1

(nk

)xk

On note que E(X) = nf (1). La fonction f est dérivable et

f ′(x) =n∑

k=1

(−1)k−1

(nk

)xk−1 =

n∑k=1

(nk

)(−x)k−1.

Pour x �= 0, on a donc

f ′(x) = −1x

n∑k=1

(nk

)(−x)k = − (1 − x)n − 1

x=

1 − (1 − x)n

Comme f (0) = 0, on en déduit

f (1) = f (1) − f (0) =∫ 1

0

1 − (1 − x)n

xdx.

Avec le changement de variable t = 1 − x, on obtient

f (1) =∫ 1

0

1 − tn

1 − tdt =

∫ 1

0(1 + t + · · · + tn−1) dt = 1 +

12

+ · · · +1n

524

Page 532: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

et donc

E(X) = n(

1 +12

+ · · · +1n

).

Il est connu que, quand n tend vers +∞, 1 +12

+ · · · +1n∼ ln n. On en déduit que

E(X) ∼ n ln n.

9. 1. Supposons que X suit la loi binomiale de paramètre (n, p) et étudions le sens de

variation de la suite(P([X = k])

)0�k�n

. On a pour k ∈ [[0, n]], P([X = k]) =(

nk

)pkqn−k

et donc pour k ∈ [[1, n]],

uk =P([X = k])

P([X = k − 1])=

(nk

)pkqn−k( n

k−1

)pk−1qn−k+1

=(n − k + 1)p

kq·

On a u1 =npq

, un =pnq

et uk décroît avec k.

• Si u1 < 1, c’est-à-dire np < q ou encore p <1

n + 1, on a uk < 1 pour tout k. La suite(

P([X = k]))

0�k�ndécroît strictement. Il y a un seul mode 0.

• Si un > 1, c’est-à-dire p > nq, ou encore p >n

n + 1, on a uk > 1 pour tout k. La suite

croît strictement. Il y a un seul mode n.

On suppose désormais1

n + 1� p � n

n + 1, c’est à dire u1 � 1 et un � 1. Soit k0 le plus

grand entier tel que uk � 1. On a

uk � 1 ⇐⇒ (n − k + 1)p � kq ⇐⇒ k � (n + 1)p.

On a k0 = E((n + 1)p

)∈ [[1, n]], où E désigne la partie entière.

• Si (n + 1)p /∈ N, on a uk > 1 si k � k0 et uk < 1 si k > k0. La valeur maximale deP([X = k]) est obtenue uniquement pour k = k0. Il y a un seul mode k0.• Si (n + 1)p ∈ N, on a k0 = (n + 1)p, uk > 1 si k < k0 et uk < 1 si k > k0. On aP([X = k0]) = P([X = k0 − 1]). La valeur maximale de P([X = k]) est obtenue pourk = k0 et k = k0 − 1. Il y a deux modes k0 = (n + 1)p et k0 − 1 = (n + 1)p − 1.

2. Supposons que X suit la loi de Poisson de paramètre l et étudions le sens de variation de

la suite(P([X = k])

)k∈N

. On a pour k ∈ N, P([X = k]) =e−llk

k!et donc pour k ∈ N∗,

uk =P([X = k])

P([X = k − 1])=

l

On observe que uk décroît avec k et quel

k� 1 équivaut à k � l ou encore à k � E(l).

Posons k0 = E(l).• Si k0 = 0, on a, pour tout k � 1, uk < 1 donc la suite la suite

(P([X = k])

)k∈N

décroîtstrictement. Il y a un seule mode 0.

525

Page 533: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

• Si k0 � 1 et si l n’est pas entier, on a uk > 1 si k � k0 et uk < 1 si k > k0. La suite(P([X = k])

)k∈N

croît strictement jusqu’à l’entier k0 puis décroît strictement. Il y un seulemode k0.• Si l ∈ N∗, on a k0 = l. On obtient uk > 1 si k < k0, uk0 = 1 et uk < 1 si k > k0. Il y adeux modes k0 et k0 − 1, c’est-à-dire l et l − 1.

10. 1. a. Si uk =1

k + 2, alors 1 − uk =

k + 1k + 2

et pour tout n ∈ N,

qn =n∏

k=0

k + 1k + 2

=1 · 2 · · · (n + 1)2 · 3 · · · (n + 2)

=1

n + 1·

On en déduit que limn→+∞

qn = 0. Le produit∏

(1 − uk) est divergent.

Si uk =1

(k + 2)2, alors 1 − uk =

(k + 1)(k + 3)(k + 2)2

et pour tout n ∈ N,

qn =n∏

k=0

(k + 1)(k + 3)(k + 2)2

=

n∏k=0

(k + 1)n∏

k=0

(k + 3)

n∏k=0

(k + 2)2=

n+1∏k=1

kn+3∏k=3

k

n+2∏k=2

k2

=(n + 3)2(n + 2)

·

On en déduit que limn→+∞

qn =12· Le produit

∏(1 − uk) est convergent.

b. On a, pour tout k ∈ N, 1 − uk > 0, donc pour tout n ∈ N, qn > 0 et

ln qn =n∑

k=0

ln(1 − uk).

• On note que ln qn est la somme partielle d’indice n de la série de terme généralln(1 − un). Ainsi la suite (ln qn) converge si et seulement si la série de terme généralln(1 − un) converge.• Si le produit

∏(1−uk) converge, la suite (qn) converge vers � > 0, donc la suite (ln qn)

converge vers ln � et la série de terme général ln(1− un) converge. Réciproquement, sila série de terme général ln(1−un) converge, la suite (ln qn) converge vers une limite �′

donc par composition des limites, (qn) converge vers e�′> 0 donc le produit

∏(1−uk)

converge.• Si la série de terme général un converge, la suite (un) converge vers 0, donc− ln(1 − un) ∼ un. Comme (un) est à terme positif, la série de terme général− ln(1 − un) converge et il en est de même de la série de terme général ln(1 − un).Réciproquement si la série de terme général ln(1 − un) converge, la suite

(ln(1 − un)

)converge vers 0 et par composition des limites (1 − un) converge vers e0 = 1 et (un)converge vers 0. On a de nouveau un ∼ − ln(1 − un) et comme la série de termegénéral − ln(1 − un) converge, il en est de même de la série de terme général un.On a démontré qu’il y a équivalence entre la convergence du produit

∏(1 − uk), la

convergence de la série de terme général ln(1 − un) et la convergence de la série determe général un.

526

Page 534: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. a. On a, pour tout n ∈ N,

xn = P([X = n]/[X � n]) =P([X = n])P([X � n])

=P([X � n]) − P([X � n + 1])

P([X � n])

et donc P([X � n + 1]) = (1 − xn)P([X � n]). De plus P([X � 0]) = 1, donc onobtient par une récurrence évidente, pour n � 1,

P([X � n]) =n−1∏k=0

(1 − xk),

puis

pn = P([X = n]) = xnP([X � n]) = xn

n−1∏k=0

(1 − xk).

Par ailleurs, on a p0 = P([X = 0]) = x0.

b. Si la variable X est à valeurs dans N∗ et a un taux de panne constant, on a x0 = 0 et il

existe p ∈ R tel que, pour tout n � 1, xn = p. On en déduit, pour tout n ∈ N∗,

P([X = n]) = p(1 − p)n−1.

Comme P([X � n]) > 0 pour tout n ∈ N, on a p ∈ ]0, 1[ et X suit la loi géométriquede paramètre p.Réciproquement si, X suit la loi géométrique de paramètre p, X est à valeurs dans N

∗,et pour n � 1, P([X = n]) = p(1 − p)n−1, P([X � n]) = (1 − p)n−1 > 0 (le tempsd’attente du premier succès est supérieur ou égal à n si les n − 1 premiers résultats sontdes échecs). On a donc pour n � 1,

xn = P([X = n]/[X � n]) =P([X = n])P([X � n])

= 1 − p.

Le taux de panne est constant.

c. Si la suite (xk) est un taux de panne, on a, pour tout k ∈ N, xk ∈ [0, 1] (c’est uneprobabilité) et xk �= 1, sinon P([X � k + 1]) = 0, ce qui est contraire à l’hypothèse,donc 0 � xk < 1. Pour tout n ∈ N

∗,

P([X � n]) =n−1∏k=0

(1 − xk).

Comme

limn→+∞

P([X � n]) = limn→+∞

+∞∑k=n

P([X = k]) = 0,

car c’est la limite du reste d’une série convergente, on a limn→+∞

n−1∏k=0

(1 − xk) = 0. Par

définition d’un produit convergent, le produit∏

(1−xk) diverge. De par l’équivalencedémontrée à la question précédente, la série de terme général xk diverge.

527

Page 535: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

Réciproquement, soit (xk) une suite à valeurs dans [0, 1[ telle que la série de terme

général xk diverge. On pose p0 = x0 et, pour tout n � 1, pn = xn

n−1∏k=0

(1 − xk). On a,

pour tout n ∈ N, pn ∈ [0, 1]. On remarque de plus que si on pose, pour tout n � 0,

qn =n∏

k=0

(1 − xk), on a, pour n � 1, pn = xnqn−1 et

pn = xn

n−1∏k=0

(1 − xk) = (1 − (1 − xn))qn−1 = qn−1 − (1 − xn)qn−1 = qn−1 − qn.

On en déduit que, pour n � 1,n∑

k=0

pk = p0 +n∑

k=1

(qk−1 − qk) = p0 + q0 − qn.

La série de terme général xk diverge, donc de l’équivalence démontrée à la questionprécédente on définit la divergence du produit

∏(1− xk). La suite (qn) est décroissante

et minorée par 0 donc elle converge vers une limite positive ou nulle. Par définitionde la convergence d’un produit, cette limite ne peut pas être strictement positive : (qn)converge vers 0. On en déduit lim

n→+∞pk = p0 + q0 = x0 + 1 − x0 = 1. Par définition,

la série de terme général pn converge et+∞∑k=0

pk = 1.

On en déduit qu’il existe une variable aléatoire X à valeur dans N telle que, pour toutn ∈ N, P([X = xn) = pn. Étudions le taux de panne de X. On a, pour tout n ∈ N∗,

P([X � n − 1] =n−1∑k=0

pk = p0 + q0 − qn−1 = 1 − qn−1

donc P([X � n]) = qn−1. On en déduit, pour n � 1,

P([X = n]/[X � n]) =P([X = n])P([X � n])

=pn

qn−1= xn.

De plus P([X = 0]/[X � 0]) = P([X = 0]) = p0 = x0. La suite (xk) est le taux depanne de la variable X.

11. Pour tout entier n ∈ N∗, on note An l’événement « la n-ième épreuve est un suc-

cès » et Bn l’événement « au cours des n premières épreuves, on a obtenu au moins r succèsconsécutifs ». On a donc Pn = P(Bn).

1. a. On ne peut obtenir r succès consécutifs en moins de r épreuves. On a doncP0 = P1 = . . . = Pr−1 = 0. L’événement Pr est réalisé si les r premières épreuvessont des succès, ce qui donne Pr = pr .

b. Il est clair que Bn ⊂ Bn+1, ce qui implique Pn � Pn+1 et Pn+1 − Pn = P(Bn+1 \ Bn).Il faut donc montrer que P(Bn+1 \ Bn) = (1 − Pn−r)pr(1 − p). L’événement Bn+1 \ Bnest réalisé si les n premières épreuves n’ont pas donné r succès consécutifs et si les n + 1premières donnent r succès consécutifs qui sont obtenus au r dernières épreuves, i.e.aux épreuves n − r + 2, . . . , n, n + 1. L’épreuve précédente, la (n − r + 1)-ième est un

528

Page 536: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

échec, car sinon Bn est réalisé, et les n − r épreuves précédentes ne doivent pas donnerr succès consécutifs. On a donc

Bn+1 \ Bn = Bn−r ∩ An−r+1 ∩ An−r+2 ∩ . . . ∩ An+1.

Les épreuves étant indépendantes, on obtient

P(Bn+1 \ Bn) = P(Bn−r)P(An−r+1)P(An−r+2) . . . P(An+1) = (1 − Pn−r)(1 − p)pr .

c. On a déjà vu que la suite (Pn)n∈N est croissante. Comme elle est majorée par 1 (car Pnest une probabilité), elle converge. Notons � sa limite. La suite (Pn−r) tend aussi vers �et par passage à la limite dans l’égalité démontrée à la question précédente, on obtient� = � + (1 − �)pr(1 − p) et donc � = 1, puisque p ∈ ]0, 1[.

2. a. Soit C l’événement « on n’obtient jamais r succès consécutifs ». On a, pour tout n ∈ N∗,

C ⊂ Bn et donc 0 � P(C) � 1 − Pn. En faisant tendre n vers +∞, on obtientP(C) = 0. On est quasi-certain d’obtenir r succès consécutifs. L’application T est doncdéfinie presque sûrement.

b. On utilise le résultat de l’exercice 3.. On a, pour tout k ∈ N, [T > k] = Bk. On endéduit que P([T > k]) = 1 − Pk. Montrons que la série de terme général P([T > k])

converge. Il résulte de la question 1 que, pour tout n � r, 1 − Pn−r =Pn+1 − Pn

(1 − p)pr et

donc, pour tout k ∈ N,

P([T > k]) = 1 − Pk =Pk+r+1 − Pk+r

(1 − p)pr·

Pour n ∈ N, on obtient

n∑k=0

P([T > k]) =n∑

k=0

Pk+r+1 − Pk+r

(1 − p)pr=

Pn+r+1 − Pr

(1 − p)pr·

Comme la suite (Pn) converge vers 0, on obtient

limn→+∞

n∑k=0

P([T > k]) =1 − Pr

(1 − p)pr=

1 − pr

(1 − p)pr·

La série de terme général P([T > k]) converge, donc d’après l’exercice 3., la variableT possède une espérance et

E(T ) =+∞∑n=0

P([T > k]) =1 − pr

(1 − p)pr·

12. 1. On a, pour n ∈ N et t ∈ [−1, 1], |pntn| � pn. Comme la série de terme généralpn est convergente, de somme 1, la série de terme général pntn est absolument conver-gente pour t ∈ [−1, 1] donc l’ensemble de définition de GX contient [−1, 1]. De plus

GX (1) =+∞∑n=0

pn = 1. Si X est une variable finie, pn est nul pour n assez grand ; la somme

de la série se réduit à une somme finie et GX est définie sur R.

529

Page 537: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

2. a. On a, pour tout t ∈ [0, 1[,

GX (t) − GX (1)t − 1

=+∞∑n=1

pntn − 1t − 1

=+∞∑n=1

pn(1 + t + · · · + tn−1).

Soit t et t′ deux réels tel que 0 � t � t′ < 1. On a, pour tout n ∈ N∗,

1 + t + · · · + tn−1 � 1 + t′ + · · · + t′n−1

et doncGX (t) − GX (1)

t − 1� GX (t′) − GX (1)

t′ − 1: la fonction t �−→ GX (t) − GX (1)

t − 1est crois-

sante sur [0, 1[.

b. Soit t ∈ [0, 1[. On a, pour tout n ∈ N∗,

pn(1 + t + · · · + tn−1) � npn.

Comme X possède une espérance, la série de terme général npn converge. Par crois-sance de la somme d’une série, on obtient, pour tout t ∈ [0, 1[,

+∞∑n=1

pn(1 + t + · · · + tn−1) �+∞∑n=1

npn c’est-à-direGX (t) − GX (1)

t − 1� E(X).

La fonction t �−→ GX (t) − GX (1)t − 1

est croissante sur [0, 1[ et est majorée par E(X). Elle

possède donc une limite finie en 1 à gauche. Autrement dit, la fonction GX possèdeune dérivée à gauche en 1 et par passage à la limite dans l’inégalité précédente, onobtient

(GX )′(1) = limt→1

GX (t) − GX (1)t − 1

� E(X).

c. D’après la question a, on a, pour n ∈ N∗ et t ∈ [0, 1[,

n∑k=1

pk(1 + t + · · · + tk−1) � GX (t) − GX (1)t − 1

·

Comme GX est dérivable en 1 à gauche, on obtient en faisant tendre t vers 1 par valeursinférieures,

n∑k=1

kpk � (GX )′(1).

La série à termes positifs∑

kpk a ses sommes partielles majorées, donc elle convergeet X possède une espérance. En faisant tendre n vers +∞ dans l’inégalité précédente,on obtient

E(X) � (GX )′(1).

Il résulte qu’il y équivalence entre X admet une espérance et GX dérivable à gaucheen 1. Des inégalités démontrées, il résulte que, dans le cas où l’espérance existe,

E(X) = (GX )′(1).

530

Page 538: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. Pour la loi binomiale, on trouve pour tout réel t,

GX (t) =n∑

k=0

pktk =n∑

k=0

(nk

)pk(1 − p)n−ktk =

n∑k=0

(nk

)(pt)k(1 − p)n−k = (pt + 1 − p)n.

La fonction GX est dérivable sur R et pour tout réel t, (GX )′(t) = np(pt + 1 − p)n−1. Onobtient

E(X) = (GX )′(1) = np.

Si X suit la loi géométrique de paramètre p, on a pour tout réel t et tout n ∈ N∗,

pntn = p(1 − p)n−1t = pt(1 − p)n−1.

La série de terme général pntn converge absolument pour |t(1 − p)| < 1, soit |t| <1

1 − p·

On obtient, pour |t| <1

1 − p,

GX (t) = pt+∞∑n=1

((1 − p)t)n−1 =pt

1 − (1 − p)t·

La fonction est dérivable pour |t| <1

1 − pet

(GX )′(t) =p

(1 − (1 − p)t)2·

Comme 1 <1

1 − p, GX possède une dérivée en 1, donc X possède une espérance et

E(X) = (GX )′(1) =p

(1 − (1 − p))2=

1p·

Si X suit une loi de Poisson de paramètre l, la fonction GX est définie sur R, et pour toutréel t,

GX (t) =+∞∑n=0

e−l ln

n!tn = e−l

+∞∑n=0

(lt)n

n!= e−lelt.

La fonction GX est dérivable sur R et pour tout réel t,

(GX )′(t) = le−lelt.

On en déduit que E(X) existe et

E(X) = (GX )′(1) = le−lel = l.

13. On pose X(V) = {xn, n ∈ I}, avec I = [[1, n]] ou I = N et on considèreJ = {n ∈ I, xn � l}. On a alors

[X � l] =⋃n∈J

[X = xn].

531

Page 539: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 8 – Variables aléatoires discrètes

Ces événements étant incompatibles, on en déduit

P([X � l]) =∑n∈J

P([X = xn]).

D’autre part, on a E(X) =∑n∈I

xnP([X = xn]). La variable X est positive donc xn � 0 pour

tout n ∈ I . On en déduit

E(X) �∑n∈J

xnP([X = xn]) �∑n∈J

lP([X = xn]),

c’est-à-dire E(X) � lP([X � l]) ou encore P([X � l]) � E(X)l

car l > 0.

1. La fonction exp est croissante et l > 0, donc on a

[Sn − np � nx] = [l(Sn − np) � lnx] = [el(Sn−np) � elnx].

La variable el(Sn−np) possède une espérance car elle est finie. On en déduit en appliquantl’inégalité démontrée précédemment à la variable el(Sn−np),

P([Sn − np � nx]) = P([el(Sn−np) � elnx]) � E(el(Sn−np))enlx

·

2. En appliquant la formule de transfert à la variable el(Sn−np) = g(Sn), où g : t �−→ el(t−np),on obtient

E(el(Sn−np)) =n∑

k=0

g(k)(

nk

)pkqn−k =

n∑k=0

el(k−np)

(nk

)pkqn−k

= e−lnpn∑

k=0

(nk

)(pel)kqn−k = e−lnp(pel + q)n

=(e−lp(pel + q)

)n= (pelq + qe−lp)n.

3. Démontrons que, pour tout réel t, et � t + et2 , i.e. te−t + et2−t � 1.Considérons la fonction f : t �−→ te−t + et2−t. Sa dérivée est donnée, pour tout réel t, par

f ′(t) = (1 − t)e−t + (2t − 1)et2−t = e−t(

(1 − t) + (2t − 1)et2)

.

On observe que f ′(0) = 0. On a et2 � 1 pour tout réel t. On en déduit si t � 12

,

(1 − t) + (2t − 1)et2 � 1 − t + 2t − 1 � t > 0 et donc f ′(t) > 0.

Si t < 0, on obtient

(1 − t) + (2t − 1)et2 � 1 − t + 2t − 1 � t < 0 et donc f ′(t) < 0.

532

Page 540: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Si 0 � t <12

, f ′(t) > 0 équivaut à1 − t1 − 2t

> et2 ou encore ln1 − t1 − 2t

> t2. Considérons la

fonction g définie pour 0 � t <12

par

g(t) = ln1 − t1 − 2t

− t2.

On obtient

g′(t) =1

(1 − t)(1 − 2t)− 2t > 0,

car 0 < (1− t)(1−2t) � 1 donc1

(1 − t)(1 − 2t)� 1 et 2t < 1. La fonction g est croissante

sur[0,

12

[et g(0) = 0 donc g(t) > 0 sur

]0,

12

[, c’est-à-dire f ′(t) > 0 si 0 < t <

12

.

Finalement on obtient que f décroît sur R− et croît sur R+. Son minimum est obtenu en0 et f (0) = 1. On a donc f (t) � 1 pour tout réel t, ce qu’il fallait démontrer.

En appliquant cette inégalité à elq et e−lp, on obtient

pelq + qe−lp � p(lq + el2q2

) + q(−lp + el2p2

) � pel2q2

+ qel2p2

.

Comme l2p2 � l2 et l2q2 � l2, on en déduit

pelq + qe−lp � (p + q)el2 � el2

.

On a ensuiteE(el(Sn−np)) �

(el2

)n� enl2

puis en utilisant l’inégalité de la première question

P([Sn − np � nx]) � enl2

enlx� en(l2−lx).

4. La fonction w : l �−→ l2 − lx a pour dérivée l �−→ 2l− x. Cette dérivée s’annule enx2

,

est négative sur]0,

x2

[et positive sur

]x2

, +∞[. Le minimum de w sur R∗

+ est obtenu en

l

2· En prenant l =

x2

dans la relation précédente, on obtient

P([Sn − np � nx]) � en( x2

4 − x2 x) � e−

nx2

4 .

5. On remarque que[∣∣∣∣Sn

n− p

∣∣∣∣ � x]

= [|Sn − np| � nx] = [Sn − np � nx] ∪ [Sn − np � −nx].

On en déduit que

P([∣∣∣∣Sn

n− p

∣∣∣∣ � x])

� P([Sn − np � nx]) + P([Sn − np � −nx]) � 2e−nx2

4 .

533

Page 541: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

Chapitre 9

1. 1. On a Y (V) = [[1, n]]. En appliquant la formule des probabilités totales, onobtient, pour tout k ∈ [[1, n]],

P([Y = k]) =n∑

i=0

P([Y = k]/[X = i])P([X = i]).

Si i ∈ [[1, n]], i �= k, P([Y = k]/[X = i]) = 0 ; P([Y = k]/[X = k]) = 1 et

P([Y = k]/[X = 0]) =1n· On a donc

P([Y = k]) = P([X = k]) +1n

P([X = 0]) =(

nk

)pkqn−k +

qn

2. On obtient

E(Y ) =n∑

k=1

kP([Y = k]) =n∑

k=1

k(

P([X = k]) +qn

n

)

=n∑

k=1

kP([X = k]) +qn

n

n∑k=1

k

= E(X) +qn

n· n(n + 1)

2= np +

(n + 1)qn

On a bien E(Y ) − E(X) =(n + 1)qn

2� 0.

2. Si n � m, les variables (X1, . . . , Xn, Xm+1, . . . , Xm+n) sont indépendantes et donc parle lemme des coalitions U et V sont indépendantes. On a donc Cov(U, V ) = 0 et rU,V = 0.

Si n > m, on a en utilisant la linéarité de la covariance,

Cov(U, V ) =n∑

i=1

m+n∑j=m+1

Cov(Xi, Xj).

Si i �= j, les variables Xi et Xj sont indépendantes donc Cov(Xi, Xj) = 0. Par ailleurs, on aCov(Xi, Xi) = V (Xi) = s2. Il y autant de termes non nuls dans la double somme que d’indicei appartenant à [[1, n]] et [[m + 1, m + n]], c’est-à-dire tels que m + 1 � i � n. Il y en a n − m.On obtient donc Cov(U, V ) = (n − m)s2.

Comme les variables X1, . . . , Xn d’une part et Xm+1, . . . , Xm+n sont indépendantes,

on a V (U) =n∑

i=1

V (Xi) = ns2 et V (V ) =m+n∑

i=m+1

V (Xi) = ns2. On en déduit

s(U) = s(V ) =√

n s et finalement

rU,V =n − m

534

Page 542: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. PréliminaireOn constante que f est de classe C∞ sur ]−1, 1[ comme quotient de fonctions C∞. Une

récurrence immédiate sur p ∈ N montre que, pour tout x ∈ ]−1, 1[, f (p)(x) =p!

(1 − x)p+1· En

effet c’est vrai pour p = 0 et si c’est vrai au rang p alors, pour tout x ∈ ]−1, 1[,

f (p+1)(x) = p!(−(p + 1))(−1)(1 − x)−(p+2) =(p + 1)!

(1 − x)p+2·

La dérivée p-ième de x �−→ xn est nulle si n < p et est pour n � p la fonctionx �−→ n(n − 1) . . . (n − p + 1)xn−p. En utilisant le résultat que l’énoncé demande d’admettre,on obtient donc, pour tout x ∈ ]−1, 1[,

f (p)(x) =+∞∑n=p

n(n − 1) . . . (n − p + 1)xn−p =+∞∑n=p

n!(n − p)!

xn−p

= p!+∞∑n=p

(np

)xn−p = p!

+∞∑k=0

(p + k

p

)xk,

en posant n − p = k. En comparant avec l’expression de f (p) trouvée précédemment, onobtient, pour tout x ∈ ]−1, 1[,

+∞∑k=0

(p + k

p

)xk =

1(1 − x)p+1

·

1. Par propriété de la loi d’un couple, on a

+∞∑n=0

(+∞∑m=0

P([X = m] ∩ [Y = n]

))= 1.

Soit n ∈ N. On a

+∞∑m=0

P([X = m] ∩ [Y = n]

)=

+∞∑m=0

c(

m + nn

)(l

2l + 1

)m+n+1

= c(

l

2l + 1

)n+1 +∞∑m=0

(m + n

n

)(l

2l + 1

)m

.

En appliquant le résultat du préliminaire avec p = n et x =l

2l + 1qui appartient à ]0, 1[

car l > 0, on obtient, puisqu’alors1

1 − x=

2l + 1l + 1

,

+∞∑m=0

P([X = m] ∩ [Y = n]

)= c

(l

2l + 1

)n+1 (2l + 1l + 1

)n+1

= c(

l

l + 1

)n+1

.

535

Page 543: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

On a ensuite

+∞∑n=0

(+∞∑m=0

P([X = m] ∩ [Y = n]

))= c

+∞∑n=0

(l

l + 1

)n+1

= cl

l + 1· 1

1 − ll+1

= cl,

car on reconnaît la somme d’une série géométrique de raisonl

l + 1∈ ]0, 1[, donc conver-

gente. On a donc

c =1l·

2. Pour tout n ∈ N, on a

P([Y = n]) =+∞∑m=0

P([X = m] ∩ [Y = n]

).

Ce calcul a déjà été effectué dans la question précédente. On trouve

P([Y = n]) = c(

l

l + 1

)n+1

=1

l + 1

(l

l + 1

)n

.

Comme 1− 1l + 1

=l

l + 1, on trouve une loi géométrique à valeurs dans N de paramètre

1l + 1

· On en déduit

E(Y ) = l + 1 − 1 = l et V (Y ) =l

l + 1(l + 1)2 = l(l + 1).

L’expression de la loi conjointe est parfaitement symétrique en (m, n). Pour chercher la loide X, on somme sur n. On obtient la même expression : la variable X suit la même loigéométrique. Elle a donc même espérance et même variance.

3. On sait que XYpossède une espérance car X et Y ont un moment d’ordre 2.

Pour tout m > 0, on m(

m + nn

)= (n + 1)

(m + nn + 1

)et donc, sous réserve de convergence,

+∞∑m=0

m(

m + nn

) (l

2l + 1

)m

= (n + 1)l

2l + 1

+∞∑m=1

(m + nn + 1

) (l

2l + 1

)m−1

= (n + 1)l

2l + 1

+∞∑k=0

(k + n + 1

n + 1

) (l

2l + 1

)k

.

On reconnaît une des sommes calculées dans le préliminaire avec p = n + 1 et toujours

x =l

2l + 1. Ainsi la série converge et

+∞∑m=0

m(

m + nn

) (l

2l + 1

)m

= (n + 1)l

2l + 1

(2l + 1l + 1

)n+2

.

536

Page 544: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On sait que

E(XY ) =+∞∑n=0

(+∞∑m=0

mnP([X = m] ∩ [Y = n])

)

=+∞∑n=0

(+∞∑m=0

mnc(

m + nn

) (l

2l + 1

)m+n+1)

=+∞∑n=0

nc(

l

2l + 1

)n+1(

+∞∑m=0

m(

m + nn

) (l

2l + 1

)m)

= c+∞∑n=0

n(n + 1)(

l

2l + 1

)n+2 (2l + 1l + 1

)n+2

= c+∞∑n=0

(n2 + n)(

l

l + 1

)n+2

.

En écrivant cela

E(XY ) =l

l + 1

+∞∑n=0

(n2 + n)1

l + 1

(l

l + 1

)n

,

on reconnaît

E(XY ) =l

l + 1(E(X) + E(X2))

=l

l + 1(E(X) + V (X) + (E(X))2)

=l

l + 1(l + l(l + 1) + l2) = 2l2.

On en déduit

Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 2l2 − l2 = l2.

4. La variable Z est à valeurs dans N et pour tout k ∈ N,

P([Z = k]) =k∑

i=0

P([X = i] ∩ [Y = k − i]) =k∑

i=0

c(

ki

) (l

2l + 1

)k+1

= c(

l

2l + 1

)k+1 k∑i=0

(ki

)=

1l

(l

2l + 1

)k+1

2k

=1

2l + 1

(2l

2l + 1

)k

.

La variable aléatoire Z suit la loi géométrique à valeurs dans N de paramètre1

2l + 1·

537

Page 545: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

Soit k ∈ N. On a, pour tout i ∈ N,

P([X = i]/[Z = k]) =P([X = i] ∩ [Z = k])

P([Z = k])=

P([X = i] ∩ [Y = k − i])P([Z = k])

.

Si i > k, k − i < 0, donc P([X = i]/[Z = k]) = 0.Si 0 � i � k, on obtient

P([X = i]/[Z = k]) =

1l

(ki

) (l

2l + 1

)k+1

12l + 1

(2l

2l + 1

)k =(

ki

)(12

)k

.

La loi de X conditionnelle à [Z = k] est la loi binomiale de paramètre(

k,12

).

4. La variable Z est à valeurs dans N. Pour k ∈ N∗, on a

P([Z = k]) = P([X − Y = k]) =+∞∑i=0

P([X − Y = k] ∩ [Y = i])

=+∞∑i=0

P([X = i + k] ∩ [Y = i])

=+∞∑i=0

P([X = i + k])P([Y = i])

=+∞∑i=0

a(1 − a)k+iP([Y = i])

= a(1 − a)k+∞∑i=0

(1 − a)iP([Y = i]).

Comme la série de terme général converge absolument, on peut dire d’après le théorème detransfert que

a = E((1 − a)Y ) =+∞∑i=0

(1 − a)iP([Y = i])

et donc, pour tout k ∈ N∗,P([Z = k]) = aa(1 − a)k.

538

Page 546: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On a de plus

P[Z = 0]) = P([X � Y ] =+∞∑i=0

P([X � Y ] ∩ [Y = i])

=+∞∑i=0

P([X � i] ∩ [Y = i])

=+∞∑i=0

P([X � i])P([Y = i]).

On a pour tout i ∈ N,

P([X � i]) =i∑

j=0

P([X = j]) =i∑

j=0

a(1 − a)j = 1 − (1 − a)i+1.

On en déduit

P[Z = 0]) =+∞∑i=0

(1 − (1 − a)i+1

)P([Y = i])

=+∞∑i=0

P([Y = i]) − (1 − a)+∞∑i=0

(1 − a)iP([Y = i])

= 1 − a(1 − a).

5. 1. Les variables S et E sont à valeurs dans N. La loi de S sachant [N = n] est la loibinomiale de paramètre (n, p). On a, pour tout k ∈ N,

P([S = k]) =+∞∑n=0

P([S = k] ∩ [N = n]) =+∞∑n=0

P([S = k]/[N = n])P([N = n])

=+∞∑n=k

(nk

)pkqn−k e−lln

n!= e−l

+∞∑n=k

1k!(n − k)!

pkqn−kln

=e−l(pl)k

k!

+∞∑n=k

(ql)n−k

(n − k)!·

Avec le changement d’indice j = n − k, on obtient

P([S = k]) =e−l(pl)k

k!

+∞∑j=0

(ql)j

j!=

e−l(pl)k

k!eql =

e−pl(pl)k

k!·

La variable S suit la loi de Poisson de paramètre pl.La loi de E sachant que N = n est la loi binomiale de paramètre (n, q). Le même calculpermet de montrer que E suit la loi de Poisson de paramètre ql.

539

Page 547: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

Montrons que les variables S et E sont indépendantes. On note que S + E = N . Onobtient donc, pour (k, �) ∈ N

2,

P([S = k] ∩ [E = �]) = P([S = k] ∩ [N − S = �]) = P([S = k] ∩ [N = k + �]).

La loi de S sachant [N = k + �] est la loi binomiale de paramètre (k + �, p). On en déduitque

P([S = k] ∩ [E = �]) = P([S = k]/[N = k + �])P([N = k + �])

=(

k + �

k

)pkq� e−llk+�

(k + �)!=

pkq�e−l

k!�!.

Comme e−l = e−pl · e−ql, on obtient

P([S = k] ∩ [E = �]) =pke−plq�e−ql

k!�!= P([S = k])P([E = �]).

Les variables S et E sont indépendantes.

2. a. En utilisant de nouveau l’égalité N = S + E, on obtient, pour (m, n) ∈ N2 par indé-pendance des variables S et E,

P([S = m])P([E = n]) = P([S = m] ∩ [E = n])= P([S = m] ∩ [N − S = n])= P([S = m])P([N = m + n]).

Comme P([N = m + n]) �= 0, on peut écrire

P([S = m])P([E = n]) = P([S = m]/[N = m + n])P([N = m + n])

=(

m + nn

)pmqnP([N = m + n])

= (m + n)!P([N = m + n])pmqn

m!n!

soit encore

(m + n)!P([N = m + n]) =P([S = m])m!

pm

P([E = n])n!qn

·

En posant um =P([S = m])m!

pmet vn =

P([E = n])n!qn

, on obtient l’expression voulue.

b. On en déduit que pour (m, n) ∈ N × N∗,

umvn = (m + n)!P([N = m + n]) = ((m + 1) + (n − 1))P([(m + 1) + (n − 1)])= um+1vn−1.

Comme P([N = m + n]) �= 0, um et vn−1 ne sont pas nuls. On a donc pour(m, n) ∈ N × N

∗,um+1

um=

vn

vn−1·

540

Page 548: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Fixons n ∈ N∗ et posons l =

vn

vn−1> 0. On a alors, pour tout m ∈ N,

um+1

um= l,

donc la suite (um) est une suite géométrique de raison l. Cette raison ne dépend quede la suite (um), elle est donc indépendant de n.On a donc, pour tout n ∈ N

∗,vn

vn−1= l. La suite (vn) est donc elle aussi géométrique

de raison l.On obtient, pour tout (m, n) ∈ N2, um = u0lm et vn = v0ln. On en déduit(m + n)!P([N = m + n]) = u0v0lm+n, c’est-à-dire

P([N = m + n]) =u0v0lm+n

(m + n)!

et donc, pour tout n ∈ N,

P([N = n]) =u0v0ln

n!·

On calcule u0v0. On a

+∞∑n=0

P([N = n]) = u0v0

+∞∑n=0

ln

n!= u0v0el = 1.

On a donc u0v0 = e−l et, pour tout n ∈ N,

P([N = n]) =e−lln

n!·

La variable N suit une loi de Poisson.

6. 1. a. Soit k ∈ [[0, N ]]. Pour tout i ∈ N , on a

P([X = xi]/[T = k]) =P([X = xi] ∩ [T = k])

P([T = k])� P([X = xi]

P([T = k])

et donc

|xi|P([X = xi]/[T = k]) � |xi|P([X = xi]P([T = k])

·

La série de terme général |xi|P([X = xi] converge puisque X admet une espérance,

donc la série de terme général |xi|P([X = xi]P([T = k])

converge et aussi la série de terme général

|xi|P([X = xi]/[T = k]) d’après le théorème de comparaison des séries à termes positifs.D’où l’existence de E(X/[T = k]).On a, d’après la formule des probabilités totales, pour tout i ∈ N,

xiP([X = xi]) =N∑

k=0

xiP([X = xi]/[T = k])P([T = k]).

Pour tout k ∈ [[0, N ]], la série de terme général xiP([X = xi]/[T = k])converge d’après ce qui précède et sa somme est E(X/[T = k]) donc la sériede terme général xiP([X = xi]/[T = k])P([T = k]) converge et a pour sommeE(X/[T = k])P([T = k]). La série de terme général xiP([X = xi]) converge et a

541

Page 549: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

pour somme E(X). Par linéarité de l’application qui à une série associe sa somme, onobtient

E(X) =N∑

k=0

E(X/[T = k])P([T = k]).

b. Supposons réciproquement que, pour tout k ∈ [[0, N ]], E(X/[T = k]) existe. Pour toutk ∈ [[0, N ]], la série de terme général xiP([X = xi]/[T = k]) converge absolument,donc la série de terme général xiP([X = xi]/[T = k])P([T = k]) aussi et a poursomme E(X/[T = k])P([T = k]). Alors la série de terme général xiP([X = xi])converge absolument comme somme de N + 1 séries absolument convergentes, doncE(X) existe et est donnée par (∗) par linéarité de l’application qui à une série associe sasomme.

2. Pour tout z ∈ S(V) et k ∈ N∗, on a

zP(S = z/[T = k]) = zP([X1 + · · · + Xk]/[T = k]) = zP([X1 + · · · + Xk = z]),

car les variables X1 +· · ·+Xk et T sont indépendantes. Sous réserve d’absolue convergence,on a

E(S/[T = k]) =∑

z∈S(V)

zP([X1 + · · ·+ Xk = z]) =∑

z∈(X1+···+Xk)(V)

zP([X1 + · · ·+ Xk = z]),

car (X1 + · · · + Xk)(V) ⊂ S(V) et P([X1 + · · · + Xk = z]) = 0 si z /∈ (X1 + · · · + Xk)(V).On reconnaît dans la somme de la série l’expression de l’espérance de X1 + · + Xk.Chacune des variables Xn a une espérance donc X1 + · · · + Xk a une espérance et

E(X1 + · · · + Xk) =k∑

i=1

E(Xi) = kE(X1), car toutes les variables Xi ont même loi. On en

déduit que E(S/[T = k]) existe et

E(S/[T = k]) = kE(X1).

Cette formule reste vérifiée pour k = 0 car la loi de S conditionnelle à [T = 0] est celled’une variable nulle.De la question 1.(b), on déduit que S possède une espérance et que

E(S) =N∑

k=0

E(S/[T = k])P([T = k]) =N∑

k=0

kE(X1)P([T = k])

= E(X1)N∑

k=0

kP([T = k]) = E(X1)E(T ).

3. Considérons une suite (Xi) de variables indépendantes de même loi que U1. Soit n ∈ N.On peut écrire Un+1 comme une somme de Un variables indépendantes de même loique U1, chaque variable étant égale au nombre de descendants directs d’un membre de lan-ième génération. On peut donc écrire

Un+1 = X1 + X2 + · · · + XUn .

542

Page 550: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On peut supposer que la variable Un est indépendante des variables Xi. Chaque variable Xipossède une espérance car est finie, à valeurs dans [[0, N ]]. Les variables Un sont finies aussipour tout n ∈ N. En effet chaque individu ayant au plus N descendants, la plus grandevaleur prise par Un est Nn. Les hypothèses de la question précédente sont vérifiées et on a

E(Un+1) = E(X1)E(Un) = E(U1)E(Un).

On en déduit, pour tout n ∈ N,

E(Un) = (E(U1))nE(U0) = (E(U1))n,

car U0 est la variable certaine égale à 1.

4. La variable S est à valeurs dans N. En appliquant la formule des probabilités totales, onobtient, pour tout n ∈ N,

P([S = n]) =+∞∑k=0

P([S = n]/[T = k])P([T = k])

=+∞∑k=0

P([X1 + · + Xk = n]/[T = k])P([T = k])

=+∞∑k=0

P([X1 + · + Xk = n])P([T = k]),

car les variables X1 + · + Xk et T sont indépendantes.La variable X1 + · · · + Xk est une somme de k variables indépendantes suivant une loide Bernoulli de paramètre p. Elle suit une loi binomiale de paramètre (k, p). On a donc

P([X1 + · · · + Xk = n]) ={

0 si k < n(kn

)pnqk−n sinon.

On en déduit

P([S = n]) =+∞∑k=n

(kn

)pnqk−n e−llk

k!

=e−l(pl)n

n!

+∞∑k=n

(ql)k−n

(k − n)!

=e−l(pl)n

n!eql =

e−pl(pl)n

n!·

La variable S suit la loi de Poisson de paramètre pl.On a donc E(S) = pl = E(X1)E(T ). Bien que les hypothèses de la deuxième question nesoient pas vérifiées (T n’est pas finie), le résultat reste vrai.

7. 1. La variable U est à valeurs dans N et V à valeurs dans Z. Soit (i, j) ∈ N × Z.

Si j � 0, on a

[U = i] ∩ [V = j] = [inf(X, Y ) = i] ∩ [X − Y = j] = [Y = i] ∩ [X − i = j]= [X = i + j] ∩ [Y = i],

543

Page 551: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

car si X � Y , inf(X, Y ) = Y . On en déduit, par indépendance des variables X et Y ,

P([U = i] ∩ [V = j]) = P([X = i + j] ∩ [Y = i]) = P([X = i + j])P([Y = i])

= pqi+jpqi = p2q2i+j.

Si j < 0, on obtient de même

[U = i] ∩ [V = j] = [X = i] ∩ [X − Y = j] = [X = i] ∩ [Y = i − j].

On en déduit

P([U = i] ∩ [V = j]) = P([X = i] ∩ [Y = i − j]) = P([X = i])P([Y = i − j])

= pqipqi−j = p2q2i−j.

On a donc, pour tout (i, j) ∈ N × Z,

P([U = i] ∩ [V = j]) = p2q2i+|j|.

On obtient les lois marginales en sommant sur l’une des variables.Pour tout i ∈ N,

P([U = i]) =∑j∈Z

P([U = i]∩[V = j]) = 2+∞∑j=0

P([U = i]∩[V = j])−P([U = i]∩[V = 0]),

car la fonction j �−→ P([U = i] ∩ [V = j]) est paire ; on enlève P([U = i] ∩ [V = 0]) quiest compté deux fois. On obtient

P([U = i]) = 2+∞∑j=0

p2q2i+|j| − p2q2i = 2p2q2i+∞∑j=0

qj − p2q2i =2p2q2i

1 − q− p2q2i = p(2 − p)q2i.

Pour tout j ∈ Z,

P([V = j]) =+∞∑i=0

P([U = i] ∩ [V = j]) = p2q|j|+∞∑i=0

(q2)i =p2q|j|

1 − q2=

pq|j|

1 + q=

pq|j|

2 − p·

On vérifie que, pour tout (i, j) ∈ N × Z,

P([U = i])P([V = j]) = p(2 − p)q2i pq|j|

2 − p= p2q2i+|j| = P([U = i] ∩ [V = j]).

Le variables U et V sont donc indépendantes.

2. a. On a, pour tout n ∈ N,

[U = n] ∩ [V = 1] = [inf(X, Y ) = n] ∩ [X − Y = 1]= [Y = n] ∩ [X − Y = 1] = [Y = n] ∩ [X = n + 1].

On en déduit

P([U = n] ∩ [V = 1]) = P([Y = n] ∩ [X = n + 1]).

544

Page 552: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On a de même

[U = n] ∩ [V = 0] = [inf(X, Y ) = n] ∩ [X − Y = 0] = [X = n] ∩ [Y = n]

et doncP([U = n] ∩ [V = 0]) = P([X = n] ∩ [Y = n]).

On a pour tout n ∈ N, P([X = n]) �= 0 et P([Y = n]) �= 0. On en déduit

P([X = n] ∩ [Y = n]) = P([X = n])P([Y = n]) �= 0.

On peut donc diviser les deux égalités. On obtient

P([X = n + 1] ∩ [Y = n]

)P([X = n] ∩ [Y = n]

) =P([U = n] ∩ [V = 1]

)P([U = n] ∩ [V = 0]

)et en tenant compte de l’indépendance des variables X et Y d’une part, U et V del’autre

P([X = n + 1])P([Y = n])P([X = n])P([Y = n])

=P([U = n])P([V = 1])P([U = n])P([V = 0])

= r,

c’est-à-dire P([X = n + 1]) = rP([X = n]).

b. La suite(P([X = n])

)est géométrique de raison r et donc

P([X = n]) = P([X = 0])rn

pour tout n ∈ N. On a P([X = 0]) > 0 et r > 0, car P([X = n]) > 0 pour tout n ∈ N.La série de terme général P([X = n]) converge donc 0 < r < 1 et

+∞∑n=0

P([X = n]) = P([X = 0])+∞∑n=0

rn =P([X = 0])

1 − r= 1.

On a donc P([X = 0]) = 1 − r et, pour tout n ∈ N,

P([X = n]) = (1 − r)rn.

La variable X et donc Y également suit la loi géométrique de paramètre 1 − r. L’indé-pendance des variables U et V caractérise donc la loi géométrique.

8. 1. On a, pour tout n ∈ N,

P([Y = n]) =+∞∑k=0

P([Y = n]/[X = k])P([X = k]).

Pour tout k ∈ N, la loi de Y conditionnelle à [X = k] est la loi uniforme sur [[0, k]]. On adonc

P([Y = n]/[X = k]) =

⎧⎨⎩1

k + 1si 0 � n � k

0 si n > k.

545

Page 553: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

On en déduit

P([Y = n]) =+∞∑k=n

1k + 1

P([X = k]).

On obtient de même

P([Y = n + 1]) =+∞∑

k=n+1

1k + 1

P([X = k]).

En soustrayant, tous les termes se simplifient sauf un, et il vient

P([Y = n]) − P([Y = n + 1]) =1

n + 1P([X = n]),

ce qui est la relation voulue.On opère de la même façon pour X−Y . La variable X−Y est à valeur dans N car X � Y .Pour tout n ∈ N,

P([X − Y = n]) =+∞∑k=0

P([X − Y = n]/[X = k])P([X = k])

=+∞∑k=0

P([Y = k − n]/[X = k])P([X = k])

=+∞∑k=n

1k + 1

P([X = k]).

On a donc, pour tout n ∈ N,

P([X − Y = n]) = P([Y = n]).

Les variables X − Y et Y ont même loi et donc même espérance. Par linéarité de l’espé-rance, on obtient E(Y ) = E(X − Y ) = E(X) − E(Y ) et donc

E(Y ) =E(X)

2. a. Supposons qu’il existe p ∈ ]0, 1] tel que, pour tout n ∈ N, P([Y = n]) = qnp.On a d’après la première question, pour tout n ∈ N,

P([X = n]) = (n + 1)(P([Y = n]) − P([Y = n + 1]))

= (n + 1)(pqn − pqn+1) = (n + 1)pqn(1 − q)

= (n + 1)p2qn.Pour tout (m, n) ∈ N

2, on a

P([X − Y = m] ∩ [Y = n]) = P([X = m + n] ∩ [Y = n])= P([Y = n]/[X = m + n])P([X = m + n])

=1

m + n + 1(m + n + 1)p2qm+n

= p2qm+n

Mais comme la loi de X − Y est la même que celle de Y , on a par ailleurs

P([X − Y = m])P([Y = n)] = pqmpqn = p2qm+n = P([X − Y = m] ∩ [Y = n]).

Les variables X − Y et Y sont indépendantes.

546

Page 554: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

b. Supposons réciproquement que les variables X − Y et Y sont indépendantes.D’après la première question, on a

P([Y = n]) − P([Y = n + 1]) =1

n + 1P([X = n])

= P([Y = 0]/[X = n])P([X = n])= P([X = n] ∩ [Y = 0]).

En faisant intervenir la variable X − Y qui a même loi que Y et est indépendante deY , on obtient

P([Y = n]) − P([Y = n + 1]) = P([X − Y = n] ∩ [Y = 0])= P([X − Y = n])P([Y = 0])= P([Y = n])P([Y = 0]).

Posons p = P([Y = 0]) ∈ [0, 1] et q = 1 − p. On a, pour tout n ∈ N,

P([Y = n + 1]) = (1 − p)P([Y = n]) = qP([Y = n])

et doncP([Y = n]) = qnp.

On note que p > 0 sinon, pour tout n ∈ N, P([Y = n]) = 0, ce qui est impossible car∞∑

n=0

P([Y = n]) = 1. L’équivalence est démontrée.

9. 1. Les variables aléatoires Y et Z sont à valeurs dans N∗ et, pour tout (i, j) ∈ N∗2,

[Y = i] ∩ [Z = j] = [X1 = . . . = Xi, Xi+1 �= Xi, Xi+1 = . . . = Xi+j, Xi+j+1 �= Xi+j]= [X1 = . . . = Xi = 1, Xi+1 = . . . = Xi+j = 0, Xi+j+1 = 1]∪ [X1 = . . . = Xi = 0, Xi+1 = . . . = Xi+j = 1, Xi+j+1 = 0].

Les variables Xn étant indépendantes, on en déduit

P([Y = i] ∩ [Z = j]) = P([X1 = . . . = Xi = 1, Xi+1 = . . . = Xi+j = 0, Xi+j+1 = 1])+ P([X1 = . . . = Xi = 0, Xi+1 = . . . = Xi+j = 1, Xi+j+1 = 0])

= piqjp + qipjq = pi+1qj + qi+1pj.

On obtient les lois marginales en sommant par rapport à une variable. On a, pourtout i ∈ N∗,

P([Y = i]) =+∞∑j=1

P([Y = i] ∩ [Z = j]) = pi+1+∞∑j=1

qj + qi+1+∞∑j=1

pj

= pi+1 q1 − q

+ qi+1 p1 − p

= piq + qip

547

Page 555: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

et pour tout j ∈ N∗,

P([Z = j]) =+∞∑i=1

P([Y = i] ∩ [Z = j]) = qj+∞∑i=1

pi+1 + pj+∞∑j=1

qi+1

= qj p2

1 − p+ pj q2

1 − q= p2qj−1 + q2pj−1.

Si Y et Z ont même loi, on a P([Y = 1]) = P([Z = 1]) soit 2pq = p2 + q2, ce qui donne

(p − q)2 = 0 et donc p = q =12·

Il est clair que réciproquement si p = q =12

, on a, pour tout i ∈ N∗,

P([Y = i]) = P([Z = i]) =(

12

)i

.

Les variables aléatoires Y et Z ont même loi.

2. On a, pour tout i ∈ N∗,

iP([Y = i]) = ipiq + iqip = p(ipi−1q) + q(iqi−1p).

La série de terme général ipi−1q converge et sa somme est l’espérance d’une loi géométrique

à valeurs dans N∗, de paramètre q, c’est-à-dire1q· De même la série de terme général ipi−1q

converge et a pour somme1p·

On en déduit que Y possède une espérance et

E(Y ) = p+∞∑i=1

ipi−1q) + q+∞∑i=1

iqi−1p =pq

+qp·

De E(Y ) − 2 =p2 + q2 − 2pq

pq=

(p − q)2

pq� 0, on déduit que E(Y ) � 2.

En écrivant de mêmejP([Z = j]) = p(jqj−1p) + q(jpj−1q),

on trouve de même que Z a une espérance et que

E(Z) = p+∞∑j=1

jqj−1p + q+∞∑j=1

jpj−1q =pp

+qq

= 2.

On procède de même pour l’espérance de Y 2 et de Z2. On fait apparaître E(U2) et E(V 2),où U suit la loi géométrique de paramètre q et V suit une loi géométrique de paramètre

p. On a E(U2) = V (U) +(E(U)

)2 =pq2

+1q2

=p + 1

q2et de même E(V 2) =

q + 1p2

·

548

Page 556: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On obtient

E(Y 2) = p+∞∑i=1

i2pi−1q + q+∞∑i=1

i2qi−1p = pE(U2) + qE(V 2) = pp + 1

q2+ q

q + 1p2

et donc

V (Y ) = E(Y 2)−(E(Y )

)2 = pp + 1

q2+q

q + 1p2

− p2

q2− q2

p2−2 =

pq2

+qp2

−2 =p3 + q3

p2q2−2.

En écrivant p3 + q3 = (p + q)(p2 + q2 − pq) = p2 + q2 − pq = (p + q)2 − 3pq = 1 − 3pq, onobtient

V (Y ) =1 − 3pq

(pq)2− 2.

Un calcul semblable pour Z donne

E(Z2) = pq + 1

p2+ q

p + 1q2

=q + 1

p+

p + 1q

=p2 + q2 + 1

pq=

2 − 2pqpq

et

V (Z) = E(Z2) − 4 =2pq

− 6.

On en déduit que V (Z)−2 =2pq

−8. Le maximum de pq = p(1−p) quand p décrit [0, 1]

est14

, comme le montre une simple étude de fonction. On en déduit V (Z)−2 � 8−8 � 0

et V (Z) � 2.Par ailleurs

V (Y ) − V (Z) =1

(pq)2− 3

pq− 2 − 2

pq+ 6 =

1(pq)2

− 5pq

+ 4 =(

1pq

− 4)(

1pq

− 1)

.

Comme1pq

� 4, on en déduit V (Y ) − V (Z) � 0. On a donc

V (Y ) � V (Z) � 2.

3. Les variables Y et Z ont des moments d’ordre 2 donc YZ possède une espérance et

E(YZ) =+∞∑j=1

+∞∑i=1

ij(pi+1qj + qi+1pj

)= p

+∞∑j=1

jqj+∞∑i=1

ipi + q+∞∑j=1

jpj+∞∑i=1

iqi.

On a+∞∑j=1

jqj =qp

+∞∑j=1

jqj−1p =qp· 1

p=

qp2

et toutes les autres sommes se calculent de la même manière. On obtient

E(YZ) = p · qp2

· pq2

+ q · pq2

· qp2

=1pq·

549

Page 557: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

On en déduit

Cov(Y, Z) = E(YZ) − E(Y )E(Z) =1pq

− 2(p2 + q2)pq

=(p + q)2 − 2(p2 + q2)

pq= − (p − q)2

pq·

4. Si les variables Y et Z sont indépendantes, on a Cov(Y, Z) = 0 donc p = q =12·

Supposons réciproquement que p = q =12· On a alors, pour tout (i, j) ∈ (N∗)2,

P([X = i] ∩ [Y = j]) = 2(

12

)i+j+1

=(

12

)i+j

.

On a déjà démontré que dans ce cas P([X = i]) =(

12

)i

et P([Y = j]) =(

12

)j

. On a

doncP([X = i] ∩ [Y = j]) = P([X = i])P([Y = j]).

Les variables Y et Z sont indépendantes.

10. 1. La variable aléatoire Tn représente l’effet du n-ième saut sur l’abscisse de la puce.

On a Tn(V) = {−1, 0, 1}, P([Tn = −1]) = P([Tn = 1]) =14

et P([Tn = 0] =12· En

effet, [Tn = 0] signifie que le saut est effectué vers le nord ou le sud, [Tn = −1] qu’il esteffectué vers l’ouest et [Tn = 1] qu’il est effectué vers l’est. On a donc E(Tn) = 0.Par linéarité de l’espérance, on en déduit que E(Xn) − E(Xn−1) = 0 pour tout n � 1. Lasuite (E(Xn)) est constante et comme M0 = O, X0 = 0 donc E(X0) = 0. On a donc, pourtout n ∈ N, E(Xn) = 0.Pour calculer E(X2

n ), on écrit X2n = X2

n−1 + T2n + 2Xn−1Tn. On obtient par linéarité de

l’espéranceE(X2

n ) = E(X2n−1) + E(T2

n ) + 2E(Xn−1Tn).

La variable Xn−1 ne dépend que du résultat des n − 1 premiers sauts : en fait, ona Xn−1 = T1 + · · · + Tn−1. On suppose que les résultats des différents sauts sontindépendants, c’est-à-dire que les variables (Tk) sont indépendantes. On en déduitque Xn−1 = T1 + · · · + Tn−1 et Tn sont indépendantes. On a donc

E(Xn−1Tn) = E(Xn−1)E(Tn) = 0.

D’autre part, on a T2n (V) = {0, 1}, P([T2

n = 1]) = P([Tn = −1]] + P([Tn = −1]) =12

et

P([T2n = 0]) = P([Tn = 0]) =

12· On en déduit E(T2

n ) =12

et

E(X2n ) = E(X2

n−1) +12·

550

Page 558: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

La suite(E(X2

n ))

est arithmétique de raison12

et pour tout n ∈ N,

E(X2n ) = E(X2

0 ) +n2

=n2·

2. On démontre comme dans la question précédente que E(Yn) = 0 et E(Y 2n ) =

n2·

De OM2n = X2

n + Y 2n , on déduit

E(OM2n ) = E(X2

n ) + E(Y 2n ) =

n2

+n2

= n.

On a V (OMn) = E(OM2n ) −

(E(OMn)

)2. La variance est positive (c’est l’espérance d’une

variable positive) donc (E(OMn)

)2 � E(OM2n ) � n

Comme la variable OMn est positive, son espérance est positive et

E(OMn) �√

n.

3. Les variables Xn et Yn ne sont pas indépendantes pour n � 1. En effet, on a

P([Xn = n]) = P([Yn = n]) =(

14

)n

,

car pour avoir Xn = n et Yn = n, il faut faire n sauts dans la même direction. Il estimpossible d’avoir simultanément Xn = n et Yn = n. On a donc

P([Xn = n] ∩ [Yn = n]) = 0 �= P([Xn = n])P([Yn = n]).

4. Pour que la puce se retrouve à l’origine après n sauts, il faut qu’elle fait le même nombrede sauts k vers l’ouest et vers l’est et le même nombre de sauts � vers le nord et le sud. Celanécessite que le nombre total de sauts soit pair. On a donc an = 0 si n est impair.Supposons que n est pair, n = 2m. Avec les notations précédentes, on doit avoir2k + 2� = 2m, soit � = m − k. La probabilité d’avoir effectué k saut vers le l’ouest, k sautvers l’est, m − k saut vers le nord et m − k saut vers le sud est

bk =(

2mk

)(2m − k

k

)(2m − 2km − k

) (14

)2m

,

les coefficients binomiaux correspondant aux différentes façons de répartir les sauts versl’ouest, puis les sauts vers l’est, enfin les sauts vers le nord parmi les 2m sauts (les sauts vers

le sud étant les m − k sauts restant), chaque saut ayant ensuite une probabilité14

d’être

réalisé. On simplifie(2mk

)(2m − k

k

)(2m − 2km − k

)=

(2m)!k!(2m − k)!

(2m − k)!k!(2m − 2k)!

(2m − 2k)!(m − k)!(m − k)!

=(2m)!

(k!)2((m − k)!)2=

(2m)(m!)2

((m)!2

(k!)2((m − k)!)2

=(

2mm

)(mk

)2

551

Page 559: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

ce qui donne

bk =(

2mm

)(mk

)2 (14

)2m

.

Comme k peut prendre une valeur quelconque entre 0 et m, on obtient

a2m =2m∑

k=0

bk =(

2mm

) (14

)2m m∑k=0

(mk

)2

.

On utilise la formule de Vandermonde pour simplifier le somme

m∑k=0

(mk

)2

=m∑

k=0

(mk

)(m

m − k

)=

(2mm

).

Finalement, on obtient

a2m =

(2mm

)2

42m ·

11. 1. La variable X − Y est à valeurs dans Z. Pour tout k ∈ Z, on a, puisque([Y = i])i∈Z est un système complet d’événements,

P([X − Y = k] =∑i∈Z

P([X − Y = k] ∩ [Y = i]) =∑i∈Z

P([X = i + k] ∩ [Y = i])

=∑i∈Z

P([X = i + k])P([Y = i]),

car le variables X et Y sont indépendantes. On en déduit que

P([X − Y = −k] =∑i∈Z

P([X = i − k])P([Y = i]).

Avec le changement d’indice j = i − k, on obtient

P([X − Y = −k] =∑i∈Z

P([X = j])P([Y = j + k]).

Les variables X et Y ont même loi donc

P([X = j]) = P([Y = j]) et P([Y = j + k]) = P([X = j + k]).

Finalement, on obtient

P([X − Y = −k] =∑i∈Z

P([Y = j])P([X = j + k]) = P([X − Y = k]).

La variable X − Y est symétrique.

552

Page 560: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

2. La variable X + Y est à valeurs dans Z. Pour tout k ∈ Z, on a, puisque([Y = i])i∈Z est un

système complet d’événements,

P([X + Y = k] =∑i∈Z

P([X + Y = k] ∩ [Y = i]) =∑i∈Z

P([X = k − i] ∩ [Y = i])

=∑i∈Z

P([X = k − i])P([Y = i]),

car le variables X et Y sont indépendantes. On en déduit

P([X + Y = −k] =∑i∈Z

P([X = −k − i])P([Y = i]).

Comme les variables sont symétriques, on a P([X = −k − i]) = P([X = k + i]) etP([Y = i]) = P([Y = −i]) d’où l’on déduit

P([X + Y = −k] =∑i∈Z

P([X = k + i])P([Y = −i]).

On fait enfin le changement d’indice j = −i qui donne

P([X + Y = −k] =∑J∈Z

P([X = k − j])P([Y = j]) = P([X + Y = k]).

La variable X + Y est symétrique.

3. On démontre la propriété par récurrence sur n. Elle est évidente pour n = 1 et a étédémontrée pour deux variables aléatoires dans la question précédente. On suppose qu’elleest vraie au rang n et on la démontre pour n + 1 variables symétriques, X1, . . . , Xn, Xn+1indépendantes. Les variables X1, . . . , Xn sont indépendantes et symétriques doncX1 + · · · + Xn est symétrique par hypothèse de récurrence. D’autre part, d’après le lemmedes coalitions, les variables X1 + · · · + Xn et Xn+1 sont indépendantes. Comme ellessont symétriques, leur somme X1 + · · · + Xn + Xn+1 est symétrique et la récurrence estterminée.

12. 1. On pose q = 1 − p. On a N (V) = N∗ et X(V) = N. La variable N suit la loi

géométrique de paramètre p et pour tout n ∈ N∗, la loi de X conditionnelle à [N = n] est

la loi binomiale de paramètre (n, p).Pour tout couple (n, k) ∈ N∗ × N, par définition de la probabilité conditionnelle,

P([N = n] ∩ [X = k]) = P[N=n]([X = k])P([N = n]).

Si k > n, P([N = n] ∩ [X = k]) = 0 et si k � n,

P([N = n] ∩ [X = k]) =(

nk

)pkqn−kpqn−1

=(

nk

)pk+1q2n−k−1.

553

Page 561: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 9 – Couples de variables aléatoires discrètes

2. La loi de X s’obtient en écrivant P([X = k]) =+∞∑n=1

P([N = n]∩ [X = k]). Pour tout entier

k non nul,

P([X = k]) =+∞∑n=k

(nk

)pk+1(1 − p)2n−k−1 =

(pq

)k+1 +∞∑n=k

(nk

) (q2

)n

=(

pq

)k+1 q2k

(1 − q2)k+1,

d’après l’égalité donnée dans l’énoncé. On note que 1 − q2 = p(1 + q). On obtient

P([X = k]) =qk−1

(1 + q)k+1 ·

Si k = 0, la somme commence à 1 et pas à k. On obtient

P([X = 0]) =+∞∑n=1

pq2n−1 = pq+∞∑n=1

(q2)n−1 =pq

1 − q2 =q

1 + q·

3. On considère une variable aléatoire Y qui suit une loi de Bernoulli de paramètre p′ etune variable aléatoire Z qui suit une loi géométrique de paramètre p′. On suppose Y et Zindépendantes et l’on pose W = YZ. On a alors W (V) = N.Si k = 0, alors P([W = 0]) = P([Y = 0]) = 1 − p′, car YZ = 0 équivaut à Y = 0.Si k � 1, alors [YZ = k] = [Y = 1]∩ [Z = k] et par indépendance des variables aléatoiresY et Z,

P([W = k]) = P([Y = 1] ∩ [Z = 1]) = P([Y = 1])P([Z = k]) = p′2(1 − p′)k−1.

On voit qu’en posant en posant p′ =1

1 + q, X et W ont même loi.

Ainsi X a la même loi qu’un produit de deux variables indépendantes, l’une étant unevariable aléatoire de Bernoulli et l’autre une variable aléatoire géométrique de même para-

mètre1

1 + q·

4. Comme Y et Z sont indépendantes, E(X) = E(Y )E(Z) = 1.Comme Y 2 et Z2 sont indépendantes, E(X2) = E(Y 2)E(Z2). On a

E(Y 2) = p′ et E(Z2) = V (Z) +(E(Z)

)2 =1 − p′

p′2+

1

p′2=

2 − p′

p′2.

On en déduit E(X2) =2 − p′

p′et V (X) =

2 − p′

p′− 1 = 2q.

554

Page 562: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Chapitre 10

1. 1. a. La variable Y est à valeurs dans R+ donc sa fonction de répartition est nullesur R

∗−. Pour x � 0, on a

FY (x) = P([√

X � x]) = P([X � x2]) = 1 − e−lx2

.

La fonction FY est continue sur R (on vérifie que sa limite à droite en 0 est 0) etdérivable sauf en 0. Ainsi possède une densité définie par

fY (x) =

{0 si x < 02lxe−lx2

si x � 0.

b. Comme Y est une variable aléatoire positive, son espérance est donnée, sous réserve

de convergence, par∫ +∞

0xfY (x) dx. La fonction x �−→ xfY (x) est continue et positive

sur R+ et négligeable en +∞ devant1x2

(grâce à l’exponentielle). Donc E(Y ) existe.

Pour la calculer, on se ramène à la densité de la loi normale centrée réduite en posant

lx2 =12

t2, soit x =t√2l

. On obtient

E(X) =∫ +∞

02lx2e−lx2

dx =1√2l

∫ +∞

0t2e−

12 t2 dt

=1

2√

2l

∫ +∞

−∞t2e−

12 t2 dt =

√p

2√

l

∫ +∞

−∞

1√2p

t2e−12 t2 dt.

On reconnaît dans l’intégrale le moment d’ordre 2 d’une variable normale centrée

réduite qui vaut 1. On a donc E(Y ) =√

p

2√

D’autre part, on a E(Y 2) = E(X) =1l· On en déduit

V (Y ) = E(Y 2) −(E(Y )

)2 =1l− p

4l=

4 − p

4l·

2. Les variables X2 et X3 sont à valeurs dans R+. Leurs fonctions de répartition sont nullessur R

∗−.

a. Pour tout x � 0, P([X2 � x]) = P([X � √x]) = 1− e−l

√x. La fonction de répartition

de X2 est continue sur R (on vérifie que la limite à droite en 0 est 0) et de classe C1

sur R∗. Donc X2 possède une densité g qui s’obtient en dérivant cette fonction de

répartition. On obtient

g(x) =

⎧⎨⎩l

2√

xe−l

√x si x > 0

0 si x � 0.

555

Page 563: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

b. Pour tout x � 0, P([X3 � x]) = P([X � x13 ]) = 1 − e−lx

13 . La fonction de répartition

de X3 est continue sur R (on vérifie que la limite à droite en 0 est 0) et de classe C1

sur R∗. Donc X3 possède donc une densité h qui s’obtient en dérivant cette fonction

de répartition. On obtient

h(x) =

⎧⎨⎩l

3x−

23 e−lx1/3

si x > 0

0 si x � 0.

2. 1. a. La fonction f est continue sur R sauf en 0 et positive. Il faut montrer que∫ +∞

−∞f (x) dx =

∫ +∞

0

1

x√

2pe−

12 (ln x−1)2 dx

converge et vaut 1. On fait le changement de variable défini par ln x = y + 1 oux = ey+1. On obtient, pour 0 < a < b,∫ b

a

1

x√

2pe−

12 (ln x−1)2 dx =

∫ ln b−1

ln a−1

1

ey+1√

2pe−

12 y2

ey+1 dy =∫ ln b−1

ln a−1

1√2p

e−12 y2

dy.

Quand a tend vers 0 et b vers +∞, ln a − 1 et ln b − 1 tendent respectivement vers

−∞ et +∞ et la dernière intégrale tend vers∫ +∞

−∞

1√2p

e−12 y2

dy = 1. En effet, on

reconnaît l’intégrale sur R de la densité de la normale centrée réduite. On a donc∫ +∞

0

1

x√

2pe−

12 (ln x−1)2 dx = 1.

La fonction f est bien une densité de probabilité.Si x > 0, on a d’après ce qui précède

F(x) =∫ x

0

1

t√

2pe−

12 (ln t−1)2dt =

∫ − ln x−1

−∞

1√2p

e−12 y2

dy = f(ln x − 1).

b. Le même changement de variable montre que

E(X) =∫ +∞

0x

1

x√

2pe−

12 (ln x−1)2 dx =

∫ +∞

0

1√2p

e−12 (ln x−1)2 dx

=1√2p

∫ +∞

−∞e−

12 y2

ey+1 dy

=1√2p

∫ +∞

−∞e−

12 (y−1)2e

32 dy = e

32 ,

car on reconnaît la densité d’une variable aléatoire qui suit N (1, 1).

556

Page 564: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On obtient, de même,

E(X2) =∫ +∞

0x2 1

x√

2pe−

12 (ln x−1)2 dx =

∫ +∞

0

1√2p

xe−12 (ln x−1)2 dx

=∫ +∞

−∞

1√2p

ey+1e−12 y2

ey+1 dy =∫ +∞

−∞

1√2p

e−12 y2+2y+2 dy

=∫ +∞

−∞

1√2p

e−12 (y−2)2e4 dy = e4,

car on reconnaît la densité d’une variable aléatoire qui suit N (2, 1).On en déduit que

V (X) = E(X2) −(E(X)

)2 = e4 − e3.

2. a. Il a été démontré dans le cours que si Y est une variable à densité, il en est de même deeY . La variable aléatoire Z est à valeurs dans R∗

+ et sa fonction de répartition est définiepour x > 0 par

FZ(x) = P([Z � x]) = P([eY � x]) = P([Y � ln x]) = FY (ln x).

La fonction FZ est continue sur R (le seul problème de continuité est en 0, où sa limiteest nulle) et de classe C1 sauf en 0. La variable Z possède donc une densité g nulle surR− et donnée pour x > 0 par

g(x) =1x

F′Y (ln x) =

1√2ps2x

e−12 (ln x−m)2 ,

car F′Y est une densité de la loi N (m, s2).

b. D’après le théorème de transfert, on a, si l’intégrale converge absolument,

E(Z) = E(eY ) =∫ +∞

−∞et 1√

2pse−

(t−m)2

2s2 dt.

On transforme l’exposant de e en écrivant

t − (t − m)2

2s2= − 1

2s2

(t2 − 2(m + s2)t + m2

)= − 1

2s2

((t − (m + s2)

)2 − (s4 + 2ms2))

= − 12s2

(t − (m + s2)

)2+

s2

2+ m.

On en déduit la convergence de l’intégrale et l’égalité

E(Z) =1√

2ps

∫ +∞

−∞e−

(t−(m+s2)2)2s2 e

s2

2 +m dt

= es2

2 +m.

557

Page 565: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

De même, on a, sous réserve de convergence

E(Z2) = E(e2Y ) =∫ +∞

−∞e2t 1√

2pse−

(t−m)2

2s2 dt.

On écrit de même,

2t − (t − m)2

2s2= − 1

2s2

(t2 − 2(m + 2s2) + m2

)= − 1

2s2

((t − (m + 2s2)

)2 − (4s4 + 4ms2))

= − 12s2

(t − (m + 2s2)

)2+ 2s2 + 2m.

On en déduit la convergence de l’intégrale et l’égalité

E(Z2) =1√

2ps

∫ +∞

−∞e−

(t−(m+2s2)2)2s2 e2s2+2m dt = e2s2+2m.

On obtient enfin

V (Z) = E(Z2) −(E(Z)

)2 = e2s2+2m − es2+2m = (es2 − 1)es2+2m.

3. 1. a. La fonction w : t �−→ ta−1(1 − t)b−1 est continue au moins sur ]0, 1[ et

positive. En 0, on a w(t) ∼ ta−1 et∫ 1

2

0ta−1 dt =

∫ 12

0

1t1−a

dt converge si et seulement

si 1 − a < 1, c’est-à-dire a > 0. D’après le théorème de comparaison des intégrales

des fonctions positives,∫ 1

2

0w(t) dt converge si et seulement si a > 0. On a de même

en 1, w(t) ∼ (1 − t)b−1 et comme∫ 1

12

(1 − t)b−1 dt =∫ 1

12

1(1 − t)1−b

dt converge si et

seulement si 1 − b < 1, c’est-à-dire b > 0, il en est de même de∫ 1

12

w(t) dt.

Finalement B(a, b) converge si et seulement si a et b sont strictement positifs.

b. Comme a > 0 et b > 0, a fortiori a + 1 > 0 et b + 1 > 0 donc toutes les intégralesconvergent.On a bB(a + 1, b) =

∫ 10 ta b(1 − t)b−1 dt. On intègre par parties, en intégrant

t �−→ b(1 − t)b−1 et en dérivant t �−→ ta. Les différentes fonctions puissances sont declasse C1 sur ]0, 1[. On a donc, pour 0 < a < b < 1,∫ b

ata b(1 − t)b−1 dt =

[ta(−(1 − t)b)

]b

a+

∫ b

aata−1(1 − t)b dt.

Comme limt→0

ta = 0 et limt→1

(1− t)b = 0, on obtient, en faisant tendre a vers 0 et b vers 1,

bB(a + 1, b) = aB(a, b + 1).

558

Page 566: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Par ailleurs, on a, par linéarité de l’intégrale,

B(a, b + 1) + B(a + 1, b) =∫ 1

0ta(1 − t)b−1 dt +

∫ 1

0ta−1(1 − t)b dt

=∫ 1

0

(ta(1 − t)b−1 + ta−1(1 − t)b

)dt

=∫ 1

0ta−1(1 − t)b−1(t + 1 − t) dt

= B(a, b).

On en déduit

bB(a + 1, b) = aB(a, b + 1) = a(B(a, b) − B(a + 1, b))

et doncB(a + 1, b) =

a

a + bB(a, b).

2. a. La fonction f est positive ou nulle et continue sauf éventuellement en 0 et 1. D’après

la première question,∫ 1

0f (x) dx converge et

∫ 1

0f (x) dx =

1B(a, b)

∫ 1

0xa−1(1 − x)b−1 dx =

B(a, b)B(a, b)

= 1.

Comme f est nulle hors de [0, 1],∫ +∞

−∞f (x) dx converge et

∫ +∞

−∞f (x) dx =

∫ 1

0f (x) dx = 1.

La fonction f est donc une densité de probabilité.

b. Pour tout n ∈ N, le moment d’ordre n de X est donné si l’intégrale converge par∫ 1

0xn 1

B(a, b)xa−1(1 − x)b−1 dx =

∫ 1

0

1B(a, b)

xa+n−1(1 − x)b−1 dx. On sait que∫ 1

0xa+n−1(1 − x)b−1 dx = B(a + n, b) converge d’après la première question car

a + n � a > 0. Donc X possède un moment d’ordre n donné par

E(Xn) =B(a + n, b)

B(a, b)·

On a en particulier

E(X) =B(a + 1, b)

B(a, b)=

a

a + b

559

Page 567: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

d’après 1 b. On obtient de même, en appliquant deux fois le résultat de 1 (b),

E(X2) =B(a + 2, b)

B(a, b)=

a + 1a + 1 + b

B(a + 1, b)B(a, b)

=a(a + 1)

(a + b + 1)(a + b)·

On en déduit

V (X) = E(X2) −(E(X)

)2 =a(a + 1)

(a + b + 1)(a + b)− a2

(a + b)2

=a((a + 1)(a + b) − a(a + b + 1)

(a + b + 1)(a + b)2

=ab

(a + b + 1)(a + b)2·

4. 1. a. La fonction f est positive ou nulle sur R, continue sauf en a. On a, pour toutx > a, ∫ x

af (t)dt =

∫ x

aa

aa

ta+1dt = [−aat−a]xa = −aax−a + 1.

On a limx→+∞

x−a = 0, car a > 0, donc limx→+∞

∫ x

af (t)dt = 1. Ainsi,

∫ +∞

af (t)dt

converge et vaut 1. Comme f est nulle sur ] −∞, a[,∫ 0

−∞f (t)dt = 0. Finalement

∫ +∞

−∞f (t) dt = 1

et f est une densité de probabilité.

b. Comme f est nulle sur ] − ∞, a[, on a F(x) = 0 si x � a. Si x > a, le calcul de laquestion précédente montre que

F(x) =∫ x

af (t)dt = −aax−a + 1 = 1 −

( ax

)a

.

c. L’espérance existe si∫ +∞

−∞tf (t) =

∫ +∞

aa

aa

tadt converge. On sait que

∫ +∞

a

1ta

dt

converge si, et seulement si, a > 1. Ainsi X possède une espérance si, et seulement si,a > 1. Pour a > 1 et x > a, on obtient∫ x

aa

aa

tadt =

[− a

a − 1aa

ta−1

]x

a

= − a

a − 1aa

xa−1 +aa

a − 1.

Comme xa−1 tend vers +∞ quand x tend vers = ∞ car a > 1, on obtient en faisanttendre x vers +∞,

E(X) =aa

a − 1·

560

Page 568: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

d. De même, X possède un moment d’ordre 2 et donc une variance si, et seulement si,∫ +∞

aa

aa

ta−1 dt converge, ce qui nécessite a−1 > 1 et donc a > 2. Si cette condition

est réalisé, on a, pour x > a,∫ x

aa

aa

ta−1dt =

[− a

a − 2aa

ta−2

]x

a

= − a

a − 2aa

xa−2+

aa2

a − 2·

On obtient, en faisant tendre x vers +∞,

E(X2) =aa2

a − 2·

On a alors,

V (X) = E(X2) −(E(X)

)2 =aa2

a − 2−

(aa

a − 1

)2

=aa2

(a − 1)2(a − 2)·

2. a. Notons FY et FZ les fonctions de répartition de Y et Z. La variable Y est à valeursdans ]0, +∞[. Comme g > 1, l’application x �−→ bgx réalise une bijection croissantede ]0, +∞[ sur ]b, +∞[. On a donc FZ(x) = 0 si x � b. Pour x > b, on obtient

FZ(x) = P([Z � x]) = P([

bgY � x])

= P([

gY � xb

])= P

([Y ln g � ln

xb

])= P

([Y �

ln xb

ln g

])= FY

( ln xb

ln g

),

car ln g > 0. Commeln x

b

ln g> 0, on a, par définition de la loi exponentielle,

FZ(x) = 1−exp(−l

ln xb

ln g

)= 1−exp

(−l

ln gln

xb

)= 1−

(xb

)−lln g

= 1−(

b

x

) lln g

.

On note quel

ln g> 0. D’après la question FZ est la fonction de répartition d’une

variable aléatoire qui suit la loi de Pareto de paramètre

(l

ln g, b

). On conclut que Z

suit la loi de Pareto de paramètre(

l

ln g, b

).

b. Supposons réciproquement que Z suit la loi de Pareto de paramètre (a, a). Considérons

g > 1 et la variable aléatoire Y définie par Z = agY , c’est-à-dire Y =ln Z − ln a

ln g·

Cette définition a un sens car Z est à valeurs dans ]a, +∞[⊂]0, +∞[. De plus, l’appli-

cation x �−→ ln x − ln aln g

réalise une bijection de ]a, +∞[ sur ]0, +∞[, donc Y est à

valeurs dans ]0, +∞[. On a donc FY (x) = 0 si x � 0 et si x > 0,

FY (x) = P([Y � x]) = P([

ln Z − ln aln g

� x])

= P([

lnZa

� ln gx

]).

561

Page 569: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

On obtient, d’après la question 1 (b),

FY (x) = 1 −(

1gx

)a

= 1 − g−ax = 1 − ea ln gx.

On note que l = a ln g > 0. La variable Y suit donc la loi exponentielle de paramètrel.Ainsi une variable Z suit une loi de Pareto de paramètre (a, a) si, et seulement si, ilexiste g > 1 tel que Z = agY , où Y suit une loi exponentielle de paramètre a ln g.

c. D’après la question précédente, on peut écrire Z = agY , où g > 1 et Y suit la loiexponentielle de paramètre l = a ln g. On a alors

Zc = acgcY = ac (gc)Y .

De la question a, on déduit que Zc suit la loi de Pareto de paramètre(l

ln gc, ac

)=

(a

c, ac

).

5. 1. On fixe x > 0. On a

Q(x) = P([X > x])∫ +∞

x

1√2p

e−t2

2 dt.

On écrit, pour t > 0,1√2p

e−t2

2 =−1

t√

2p(−te−

t2

2 ) et on intègre par parties, en posant

u(t) =−1

t√

2p, u′(t) =

1

t2√

2p, v(t) = e−

t2

2 , v′(t) = −te−t2

2 .

Les fonctions u et v sont de classe C1 sur R∗+ et donc, pour a > x,∫ a

x

1√2p

e−t2

2 dt =∫ a

xu(t)v′(t) dt = [u(t)v(t)]ax −

∫ a

xu′(t)v(t) dt

=−1

a√

2pe−

a2

2 +1

x√

2pe−

x2

2 −∫ a

x

1

t2√

2pe−

t2

2 dt.

L’ intégrale∫ +∞

x

1

t2√

2pe−

t2

2 dt converge car en +∞,1

t2√

2pe−

t2

2 est négligeable devant

1t2

et , par croissances comparées, lima→+∞

−1

a√

2pe−

a2

2 = 0, donc en faisant tendre a vers

+∞, on obtient

Q(x) =1

x√

2pe−

x2

2 −∫ +∞

x

1

t2√

2pe−

t2

2 dt.

Cette dernière intégrale est positive, car c’est l’intégrale d’une fonction positive, donc

Q(x) � 1

x√

2pe−

x2

2 .

562

Page 570: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On intègre de nouveau par parties∫ +∞

x

1

t2√

2pe−

t2

2 dt. On écrit, pour t > 0,

1

t2√

2pe−

t2

2 =−1

t3√

2p(−te−

t2

2 )

et on pose

u(t) =−1

t3√

2p, u′(t) =

3

t4√

2p, v(t) = e−

t2

2 , v′(t) = −te−t2

2 .

Les fonctions u et v sont de classe C1 sur R∗+ et donc, pour a > x,∫ a

x

1

t2√

2pe−

t2

2 dt =∫ a

xu(t)v′(t) dt = [u(t)v(t)]ax −

∫ a

xu′(t)v(t) dt

=−1

a3√

2pe−

a2

2 +1

x3√

2pe−

x2

2 −∫ a

x

3

t4√

2pe−

t2

2 dt.

L’ intégrale∫ +∞

x

3

t4√

2pe−

t2

2 dtconverge car en +∞,3

t4√

2pe−

t2

2 est négligeable devant

1t4

et , par croissances comparées, lima→+∞

−1

a3√

2pe−

a2

2 = 0, donc en faisant tendre a vers

+∞, on obtient∫ +∞

x

1

t2√

2pe−

t2

2 dt =1

x3√

2pe−

x2

2 −∫ +∞

x

3

t4√

2pe−

t2

2 dt

et donc

Q(x) =1

x√

2pe−

x2

2 − 1

x3√

2pe−

x2

2 +∫ +∞

x

3

t4√

2pe−

t2

2 dt,

et comme la dernière intégrale est positive, on en déduit

Q(x) � 1

x√

2pe−

x2

2 − 1

x3√

2pe−

x2

2 .

2. De l’encadrement, valable pour x > 0,

1

x√

2pe−

x2

2 − 1

x3√

2pe−

x2

2 � Q(x) � 1

x√

2pe−

x2

2 ,

on déduit

1 � Q(x)1

x√

2pe−

x22

� 1 − 1x2

·

On a limx→+∞

(1 − 1

x2

)= 1, donc par encadrement

limx→+∞

Q(x)1

x√

2pe−

x22

= 1.

563

Page 571: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

Autrement dit,

Q(x) ∼x→+∞

1

x√

2pe−

x2

2 .

3. Soit ´ > 0. Quand a tend vers +∞, a + ´ tend aussi vers +∞. On a, d’après la questionprécédente

p(a, ´) =QX (a + ´)

QX (a)) ∼

a→+∞

1(a+´)

√2p

e−(a+´)2

2

1a√

2pe−

a22

∼a→+∞

a

a + ´e−´2−´a

2 .

De lima→+∞

a

a + ´= 1 et lim

a→+∞e−´2−´a

2 = 0, on déduit

lima→+∞

p(a, ´) = 0.

4. On a, pour (a, ´) ∈ ]0, +∞[2,

P([a < X < a + ´])P([a < X])

=P([a < X]) − P([a + ´ � X])

P([a < X]=

Q(a) − Q(a + ´)Q(a)

= 1−p(a, ´).

De la question précédente, on déduit

lima→+∞

P([a < X < a + ´])P([a < X])

= lima→+∞

(1 − p(a, ´)) = 1,

c’est-à-direP([a < X < a + ´]) ∼

a→+∞P([a < X]).

6. 1. On a, pour tout réel x,

FZ(x) = P([Z � x]) = P([X � x] ∩ [Y � x])= P([X � x])P([Y � x]) = FX (x)FY (x).

Pour T , on passe par l’événement contraire

FT (x) = 1 − P([T > x]) = 1 − P([X > x] ∩ [Y > x])= 1 − P([X > x])P([Y > x]) = 1 − (1 − FX (x))(1 − FY (x)).

2. Les fonctions FX et FY sont continues sur R et de classe C1 sauf en un nombre fini depoints. Il en est de même de FZ et FT . Donc Z et T admettent une densité qui s’obtienten dérivant FX et FY sauf en un nombre fini de points où le choix est arbitraire. Onobtient, pour tout réel x,

fZ(x) = fX (x)FY (x) + FX (x)fY (x)fT (x) = fX (x)(1 − FY (x)) + (1 − FX (x)fY (x).

3. Si x �∈ [0, 1], fX (x) = fY (x) = 0 donc fZ(x) = fT (x) = 0.Si x ∈ [0, 1], FX (x) = FY (x) = x et fX (x) = fY (x) = 1 donc

fZ(x) = 2x et fT (x) = 2 − 2x.

564

Page 572: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Les fonctions fZ et fT sont nulles en dehors de [0, 1] et continues sur [0, 1] donc les variablesZ et T possèdent des moments de tout ordre. En particulier

E(Z) =∫ 1

02x2 dx =

23

, E(T ) =∫ 1

0(2x − 2x2) dx =

[x2 − 2x3

3

]1

0

=13

,

E(Z2) =∫ 1

02x3 dx =

12

, E(T2) =∫ 1

0(2x2 − 2x3) dx =

[2x3

3− x4

2

]1

0

=16·

On en déduit

V (Z) = E(Z2) −(E(Z)

)2 =118

et V (T ) = E(T2) −(E(T )

)2 =118

·

4. Les densités et fonctions de répartition de X et Y sont nulles sur R∗−. Il en est de même

pour Z et T . Pour x � 0, fX (x) = le−lx, fY (x) = me−mx, FX (x) = 1 − e−lx etFY (x) = 1 − e−mx. On en déduit

FT (x) = 1 − e−lxe−mx = 1 − e−(l+m)x.

La variable T suit une loi exponentielle de paramètre l + m. On en déduit que

E(T ) =1

l + met V (T ) =

1(l + m)2

.

Pour Z, on obtient

fZ(x) = le−lx(1 − e−mx) + (1 − e−lx)me−mx = le−lx + me−mx − (l + m)e−(l+m)x.

La variable Z possède un moment d’ordre 1 car∫ +∞

−∞xfZ(x) dx converge. En effet, on a

xfZ(x) = xfX (x) + xfY (x) − xfT (x). On a une somme d’intégrales absolument convergentescar X,Y et Z possèdent une espérance. On obtient

E(Z) = E(X) + E(Y ) − E(T ) =1l

+1m

− 1l + m

·

On trouve de même que Z possède un moment d’ordre 2 et que

E(Z2) = E(X2) + E(Y 2) − E(T2).

On a E(X2) = V (X) +(E(X)

)2 =2l2 et le même résultat pour les deux autres variables.

On obtient

E(Z2) =2l2

+2

m2− 2

(l + m)2,

puis

V (T ) = E(T2) −(E(T )

)2 =2l2

+2

m2− 2

(l + m)2−

(1l

+1m

− 1l + m

)2

.

7. 1. Pour t > 0, l’événement [X1 > t] est réalisé s’il n’est arrivé aucun voyageur entre

les instants 0 et t. On a donc [X1 > t] = [Nt = 0]. Pour t � 0, [X1 > t] = V, car on necompte que les voyageurs qui arrivent à partir de l’instant 0. Cela montre que, pour toutréel t, [X > t1] est un événement donc son complémentaire [X � t1] aussi. Par définition,

565

Page 573: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

cela signifie que X1 est une variable aléatoire. On a d’après ce qui précède,

P([X > t1]) ={

P([Nt = 0]) = e−at si t > 01 si t � 0.

On en déduit

FX1 (t) ={

1 − e−at si t > 00 si t � 0.

On reconnaît la fonction de répartition d’une variable suivant la loi exponentielle de para-mètre a. Ainsi X1 suit la loi exponentielle de paramètre a. On en déduit

E(X1) =1a

et V (X1) =1

a2.

2. a. On raisonne comme pour X1. Pour t � 0, [Xn > t] = V. Pour tout t > 0, l’événement[Xn > t] est réalisé si entre les instants 0 et t il n’est pas arrivé n voyageurs. On a donc[Xn > t] = [Xt � n − 1]). On en déduit que Xn est une variable aléatoire et que, sit > 0,

P([Xn > t]) = P([Nt � n − 1]) =n−1∑k=0

e−at (at)k

k!·

On a donc, pour t > 0,

FXn (t) = 1 − P([Xn > t]) = 1 − e−atn−1∑k=0

(at)k

k!·

Par ailleurs, pour t � 0, FXN (t) = 0.La fonction FXn est clairement continue sur R∗. On a

limt→0+

FXn (t) = 1 − 1 = 0 = limt→0−

FXn (t) = FXn (0).

Ainsi FXn est continue en 0 donc sur R. D’autre part FXn est de classe C1 sur R∗. On

en déduit que Xn est une variable à densité dont une densité fXn s’obtient en dérivantFXn (là où c’est possible). On a donc fXn (t) = 0 si t � 0 et pour t > 0,

fXn (t) = F′Xn

(t) = ae−atn−1∑k=0

(at)k

k!− e−at

n−1∑k=1

ka(at)k−1

k!

= ae−atn−1∑k=0

(at)k

k!− ae−at

n−1∑k=1

(at)k−1

(k − 1)!

= ae−at

(n−1∑k=0

(at)k

k!−

n−2∑k=0

(at)k

k!

)

= ae−at (at)n−1

(n − 1)!·

566

Page 574: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

b. Pour r ∈ N, la variable Xn possède un moment d’ordre r si∫ +∞

−∞tr fXn (t) dt, c’est-à-dire

si∫ +∞

0atr e−at (at)n−1

(n − 1)!dt converge. La fonction t �−→ tr e−at (at)n−1

(n − 1)!est continue sur

R+, positive et, par croissances comparées, négligeable devant1t2

au voisinage de +∞.

Donc l’intégrale converge et Xn possède un moment d’ordre r pour tout entier naturelr. On a

E(Xrn) =

∫ +∞

0atr e−at (at)n−1

(n − 1)!dt =

an

(n − 1)!

∫ +∞

0tn+r−1e−at dt.

On a, pour tout entier n ∈ N∗,∫ +∞

0fn(t) =

an

(n − 1)!

∫ +∞

0tn−1e−at dt = 1,

donc∫ +∞

0tn−1e−at dt =

(n − 1)!an

· Comme c’est vrai pour tout entier naturel non nul,

on a ∫ +∞

0tn+r−1e−at dt =

(n + r − 1)!an+r

et

E(Xrn) =

an

(n − 1)!(n + r − 1)!

an+r=

(n + r − 1)!(n − 1)!ar

·

On en déduit E(Xn) =na

et E(X2) =(n + 1)n

a2, d’où l’on déduit

V (Xn) = E(X2n ) −

(E(Xn)

)2 =(n + 1)n

a2− n2

a2=

na2

·

8. 1. Notons que F est continue sur R+, dérivable sur R∗+ (f est continue sur R

∗+) et,

pour tout élément t de R∗+, F′(t) = f (t) > 0. Donc F est strictement croissante sur R+.

Comme limt→∞

F(t) = 1, on a pour tout t � 0, F(t) < 1 et par conséquent P([T > t]) > 0.

Cela justifie l’existence de P([t < T � t + u]/[T > t]) pour t et u strictement positifs. Ona alors

P([t < T � t + u]/[T > t])u

=P([t < T � t + u])

uP([T > t])=

F(t + u) − F(t)u(1 − F(t))

La fonction F est dérivable en t et F′(t) = f (t) donc limu→0

F(t + u) − F(t)u

= f (t). On en

déduit que, pour tout t > 0,

h(t) =f (t)

1 − F(t)·

2. La fonction h est définie et continue sur ]0, +∞[. Soit t > 0 et ´ ∈ ]0, t[. Comme F′ = f ,on a ∫ t

´

h(u) du =∫ t

´

f (u)1 − F(t)

du = [− ln(1 − F(u))]t´.

567

Page 575: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

La fonction F est continue en 0 donc lim´0+

F(´) = F(0) = 0. Donc∫ t

0h(u) du converge et

L(t) =∫ t

0h(u) du = − ln(1 − F(t)) = − ln P([T > t]).

On en déduit queP([T > t]) = e−L(t).

Sous réserve d’absolue convergence, on a, d’après la formule de transfert

E(L(T )) =∫ +∞

0L(t)f (t) dt =

∫ +∞

0− ln(1 − F(t))f (t) dt.

La fonction t �−→ − ln(1 − F(t))f (t) est positive donc l’absolue convergence équivaut à laconvergence. Soit a et b deux réels tels que 0 < a < b. La fonction F est de classe C1 sur]0, +∞[. On obtient, en faisant le changement de variable x = F(t),∫ b

a(− ln(1 − F(t)))f (t) dt =

∫ b

a− ln(1 − F(t)) F′(t)dt =

∫ F(b)

F(a)− ln(1 − x) dx,

puis en intégrant par parties,∫ b

a− ln(1 − F(t))f (t) dt = [(1 − x) ln(1 − x)]F(b)

F(a) +∫ F(b)

F(a)dx

= (1 − F(b)) ln(1 − F(b)) − (1 − F(a)) ln(1 − F(a))+ F(b) − F(a).

On fait tendre a vers 0 et b vers 1. On sait que lima→0

F(a) = F(0) = 0 et

limb→+∞

F(b) = 1. On en déduit que lima→0

(1 − F(a)) ln(1 − F(a)) = ln 1 = 0 et

limb→+∞

(1 − F(b)) ln(1 − F(b)) = limx→0

x ln x = 0. Finalement∫ b

a− ln(1 − F(t))f (t) dt tend

vers 1 quand a tend vers 0 et b vers 1 donc∫ +∞

0− ln(1 − F(t))f (t) dt converge et vaut 1.

On conclutE(L(T )) = 1.

3. • Supposons que T soit une variable aléatoire qui suit une loi exponentielle de paramètrem. On a alors, pour tout t > 0, f (t) = me−mt et F(t) = 1 − e−mt et donc

h(t) =f (t)

1 − F(t)=

me−mt

e−mt = m.

Le taux de panne de T est donc constant sur R∗+.

• Supposons réciproquement que le taux de panne h soit constant sur R∗+. Il existe donc

un réel m � 0 tel que, pour tout t > 0, h(t) = m. On a alors, pour tout t > 0,

L(t) =∫ t

0h(u) du =

∫ t

0m du = mt

568

Page 576: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

et P([T > t]) = e−L(t) = e−mt. On a donc

F(t) = 1 − e−mt.

Comme limt→+∞

F(t) = 1, limt→+∞

e−mt = 0 et donc m est strictement positif. Donc T suit une

loi exponentielle de paramètre m. La variable aléatoire T a un taux de panne constant si etseulement si elle suit une loi exponentielle.

4. Soit F1 et F2 les fonctions de répartition de T1 et T2. Les variables T1, T2 et T sontpositives et, pour tout t � 0,

F(t) = P([T � t]) = P([sup(T1, T2) � t])= P([T1 � t] ∩ [T2 � t]) = P([T1 � t])P([T2 � t])

= (1 − e−l1t)(1 − e−l2t)

= 1 − e−l1t − e−l2t + e−(l1+l2)t.

On en déduit que, pour t > 0,

f (t) = F′(t) = l1e−l1t + l2e−l2t − (l1 + l2)e−(l1+l2)t

et donc

h(t) =f (t)

1 − F(t)=

l1e−l1t + l2e−l2t − (l1 + l2)e−(l1+l2)t

e−l1t + e−l2t − e−(l1+l2)t

=l1el2t + l2el1t − (l1 + l2)

el2t + el1t − 1,

ce qui se simplifie en

h(t) = (l1 + l2) −l1el1t + l2el2t

el2t + el1t − 1·

La fonction h est dérivable sur R∗+ et

h′(t) =−(l2

1el1t + l2

2el2t)(el2t + el1t − 1) + (l1el1t + l2el2t)2

(el2t + el1t − 1)2

=l2

1el1t + l2

2el2t + e(l1+l2)t(2l1l2 − l2

1 − l22)

(el2t + el1t − 1)2

=e(l1+l2)t

(l2

1e−l2t + l2

2e−l1t − (l1 − l2)2

)(el2t + el1t − 1)2

·

Le signe de h′(t) est celui de g(t) = l21e

−l2t + l22e

−l1t − (l1 − l2)2.Si l1 = l2, on a, pour tout t > 0, g(t) > 0 et h′(t) > 0 : la fonction h est croissante. Il y ausure.Si l1 �= l2, la fonction g est strictement décroissante ; de plus, lim

0g = 2l1l2 > 0 et

lim+∞

g = −(l1 − l2)2 < 0. La fonction s’annule une seule fois sur ]0, +∞[ en t0, g(t) > 0 si

t ∈ ]0, t0] et g(t) < 0 si t > t0. On en déduit que h croît sur ]0, t0] et décroît sur [t0, +∞[.Il y donc d’abord usure puis rodage.

569

Page 577: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

5. On suppose qu’il y a usure, c’est-à-dire que h croît sur ]0, +∞[. On a pour (s, t) ∈ (R∗+)2,

L(s + t) − L(s) =∫ s+t

0h(u) du −

∫ s

0h(u) du =

∫ s+t

sh(u) du,

ce qui s’écrit avec le changement de variable v = u − s,

L(s + t) − L(s) =∫ t

0h(v + s) dv.

Comme h croît, on a h(v + s) � h(v) pour tout v ∈ [0, t] donc

L(s + t) − L(s) �∫ t

0h(v) dv � L(t)

etL(s + t) � L(s) + L(t).

On en déduit

P([T > s + t]) = e−L(s+t)] � e−L(s)−L(t) � e−L(s)eL(t) � P([T > s])P([T > t]).

9. 1. Comme f est continue sur ]0, +∞[, F est dérivable sur ]0, +∞[, de dérivéef > 0. Comme de plus elle est continue sur [0, +∞[, elle est strictement croissante sur[0, +∞[. Comme f est nulle sur ] −∞, 0[, on a F(0) = 0 et, par propriété des fonctionsde répartition, lim

x→+∞F(x) = 1. On en déduit que F réalise une bijection de [0, +∞[ sur

[0, 1[. En particulier, il existe un unique réel m tel que F(m) =12

.

2. Une densité de la loi exponentielle est définie par f (x) = 0 si x < 0 et f (x) = le−lx six � 0. Elle vérifie les hypothèses. La fonction de répartition est définie par F(x) = 1−e−lx

pour x � 0. La médiane m vérifie e−lm =12

donc −lm = − ln 2 et m =ln 2ln m

·3. a. La fonction f est bien nulle sur ]−∞, 0], strictement positive et continue sur ]0, +∞[.

b. La fonction F est nulle sur R− et pour x � 0, F(x) =∫ x

0te−t dt. On intègre par

parties, en intégrant l’exponentielle. On obtient

F(x) =[−te−t]x

0+

∫ x

0e−t dt =

[−te−t − e−t]x

0= 1 − (x + 1)e−x.

c. On a F(1) = 1 − 2e

et F(2) = 1 − 3e2

.

De e < 3, on déduit2e

� 23

et F(1) <12

. De même, e2 > 6 donc3e2

<12

et F(2) >12

.

On a donc F(1) < F(m) < F(2). Comme F est strictement croissante sur [0, +∞[, onen déduit 1 < m < 2.

570

Page 578: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

d. La médiane m vérifie F(m) = 1 − (m + 1)e−m =12

, c’est-à-dire (m + 1)e−m =12

ou

encore (2m + 2) = em. En prenant le logarithme, on obtient ln(2m + 2) = m, soitg(m) = m.

e. La fonction g est strictement croissante sur [1, 2] donc si x ∈ [1, 2], alorsg(1) � g(x) � g(2).Comme g(1) = ln 4 > 1 et g(2) = ln 6 � ln e2 � 2, on a a fortiori g(x) ∈ [1, 2].

La fonction g est dérivable sur [1, 2] et g′(x) =2

2x + 2=

1x + 1

. Pour x ∈ [1, 2], on a

donc 0 � g′(x) � 12

. On en déduit , d’après l’inégalité des accroissements finis que,

pour tout x ∈ [1, 2],

|g(x) − m| � |g(x) − g(m)| � 12|x − m|.

f. Comme u0 appartient à [1, 2] et que cet intervalle est stable par g, tous les termes de la

suite sont dans cet intervalle et donc, pour tout n ∈ N, |g(un) − m| � 12|un − m|, i. e.

|un+1 − m| � 12|un − m|. On montre alors par récurrence sur n que |un − m| �

(12

)n

.

Pour n = 0, |u0 − m| = |1 − m| � 1, car m ∈ [1, 2].

Si |un − m| �(

12

)n

, alors

|un+1 − m| � 12|un − m| � 1

2

(12

)n

�(

12

)n+1

,

et la propriété est vraie au rang n + 1.

g. un est une valeur approchée de m à 10−2 près si(

12

)n

� 10−2 soit 2n � 100. On peut

prendre n = 7.

4. a. Comme la densité est nulle sur R∗−, on a

V (X) =

+∞∫0

(t − E(X))2 f (t) dt

=

m∫0

(t − E(X))2 f (t) dt +

+∞∫m

(t − E(X))2 f (t) dt.

Comme ces deux intégrales sont positives, puisque la fonction qu’on intègre est posi-tive, ainsi que m, on a

V (X) �m∫

0

(t − E(X))2 f (t) dt et V (X) �+∞∫m

(t − E(X))2 f (t) dt.

571

Page 579: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

b. Supposons m � E(X). On a alors, pour tout t ∈ [0, m],

E(X) − t � E(X) − m � 0 et donc(E(X) − t

)2 � (E(X) − m)2.

En utilisant la première inégalité de la question précédente et la positivité de l’intégrale,on obtient

V (X) �∫ m

0

(E(X) − m)

)2f (t) dt �

(E(X) − m)

)2∫ m

0f (t) dt.

Comme∫ m

0f (t) dt = F(m) =

12

, on obtient en multipliant par 2,

2V (X) �(E(X) − m

)2puis

√2V (X) � |E(X) − m|,

en prenant la racine carrée.Si m > E(X), on utilise l’autre inégalité. Pour tout t � m, on a

t − E(X) � m − E(X) > 0 et donc(t − E(X)

)2 �(m − E(X)

)2.

On en déduit

V (X) �+∞∫m

(m − E(X))2 f (t) dt �(m − E(X)

)2∫ +∞

mf (t) dt.

Comme∫ +∞

mf (t) dt = 1 − F(m) =

12

, on conclut comme dans le premier cas,

2V (X) �(m − E(X)

)2, puis

√2V (X) � |E(X) − m|.

10. 1. a. La variable X étant à valeurs positives, sa partie entière Y est à valeurs dansN. Pour tout k ∈ N, [Y = k] = [k � X < k + 1] est un événement, donc Y est unevariable aléatoire discrète. On a, pour tout k ∈ N, puisque X est une variable à densité

P([Y = k]) = P([k � X < k + 1]) = P([k < X � k + 1]) = F(k + 1) − F(k).

b. La variable aléatoire Y possède une espérance si et seulement si la série de terme généralpositif k(F(k + 1) − F(k) converge, c’est-à-dire si et seulement si ses sommes partielles

Sn =n∑

k=1

k(F(k + 1) − F(k)) sont majorées.

La variable X possède une espérance si et seulement si l’intégrale∫ +∞

0tf (t) dt

converge. Comme la fonction qu’on intègre est positive, cela équivaut à : la fonction

g : x �−→∫ x

0tf (t) dt est majorée sur R+.

572

Page 580: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Nous allons comparer Sn à∫ n

0tf (t) dt. On a, pour tout k ∈ N∗ et t ∈ [k, k + 1],

kf (t) � tf (t) � (k + 1)f (t). On en déduit

k∫ k+1

kf (t) dt �

∫ k+1

ktf (t) dt � (k + 1)

∫ k+1

kf (t) dt,

soit

k(F(k + 1) − F(k) �∫ k+1

ktf (t) dt � (k + 1)(F(k + 1) − F(k).

En additionnant ces inégalités, pour k variant de 0 à n, on obtient

Sn � g(n + 1) �∫ n+1

0f (t) dt �

n∑k=0

(k + 1)(F(k + 1) − F(k)

).

On a

n∑k=0

(k + 1)(F(k + 1) − F(k)

)= Sn +

n∑k=0

(F(k + 1) − F(k) = Sn + F(n + 1) − F(0)

= Sn + F(n + 1) � Sn + 1.

On obtient finalementSn � g(n + 1) � Sn + 1.

• Si E(X) existe, la fonction g est majorée par M et on a, pour tout n ∈ N∗,

Sn � g(n + 1) � M .

Donc E(Y ) existe.• Réciproquement si E(Y ) existe, la suite (Sn) est majorée par M . On a, pour toutn ∈ N

∗, g(n + 1) � Sn + 1 � M + 1. Soit x ∈ R+. Il existe n ∈ N∗ tel que x � n + 1

(on peut prendre n = �x�). On a alors, puisque la fonction qu’on intègre est positive,g(x) � g(n + 1) � M . La fonction g est majorée donc X possède une espérance.

2. a. D’après ce qui précède, on a X(V) ⊂ N et, pour tout k ∈ N,

P([Y = k]) = F(k + 1) − F(k) = 1 − e−l(k+1) − 1 + e−lk

= e−lk(1 − e−l

)=

(e−l

)k (1 − e−l

).

La variable Y suit une loi géométrique à valeurs dans N de paramètre p = 1− e−l. Ona donc

E(Y ) =qp

=e−l

1 − e−let V (Y ) =

qp2

=e−l

(1 − e−l)2·

b. On a Z(V) = [0, 1[.

573

Page 581: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

Pour tout x ∈ [0, 1[,

P([Z � x]) =+∞∑k=0

P([Z � x] ∩ [Y = k]) =+∞∑k=0

P([k � X � k + x])

=+∞∑k=0

(F(k + x) − F(k)

)=

+∞∑k=0

(1 − e−l(k+x) − 1 + e−lk

)=

+∞∑k=0

(1 − e−lx)e−lk =

(1 − e−lx) +∞∑

k=0

(e−l

)k.

On reconnaît la somme d’une série géométrique convergente car e−l ∈ ]0, 1[. Onobtient

P([Z � x]) =1 − e−lx

1 − e−l·

La fonction de répartition de Z est donc définie par

FZ(x) =

⎧⎪⎪⎨⎪⎪⎩0 si x < 01 − e−lx

1 − e−lsi x ∈ [0, 1[

1 si x � 1.

Elle est continue sur R. Il suffit de le vérifier en 0 et 1. On trouve limx→0

F(x) = 0 = F(0)

et limx→1

F(x) = 0 = F(1). Elle est de classe C1 sauf en 0 et 1. Elle possède donc une

densité obtenue en dérivant FZ où elle est dérivable. On obtient

f (x) =

⎧⎨⎩le−lx

1 − e−lsi x ∈ [0, 1]

0 si x /∈ [0, 1].

c. La fonction x �−→ xf (x) est continue sur [0, 1] et nulle hors de cet intervalle. Sonintégrale sur R est donc absolument convergente. Donc Z possède une espérance et

E(Z) =∫ +∞

−∞xf (x) dx =

∫ 1

0

lxe−lx

1 − e−ldx =

11 − e−l

∫ 1

0lxe−lx dx.

On calcule cette intégrale en intégrant par parties en intégrant l’exponentielle. Onobtient ∫ 1

0lxe−lx =

[−xe−lx

]1

0+

∫ 1

0e−lx dx = −e−l +

[− e−lx

l

]1

0

= −e−l +1 − e−l

On en déduit

E(Z) =1l− e−l

1 − e−l·

574

Page 582: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On remarque que E(Z) = E(X) − E(Y ), ce qui résulte de Z = X − Y par linéarité del’espérance. Cette propriété reste vraie bien qu’on ait un mélange de variables discrèteset de variables à densité.

11. 1. a. Pour n � 1, la fonction x �−→ xn−1 e−x2 est continue sur R+ et positive. Au

voisinage de +∞, on a xn−1 e−x2 = o

(1x2

)donc In converge.

On intègre par parties, en intégrant l’exponentielle. Pour n � 2 et a � 0,∫ a

0xn−1 e−

x2 dx =

[−2xn−1 e−

x2]a

0+

∫ a

02(n − 1)xn−2e−

x2 dx

= −2an−1 e−a2 + 2(n − 1)

∫ a

0xn−2 e−

x2 dx.

Quand a tend vers +∞, 2an−1 e−a2 tend vers 0 et on obtient

In = 2(n − 1)In−1.

En réitérant cette relation , on obtient

In = (2(n − 1))(2(n − 2)) . . . (2)I1 = 2n−1(n − 1)!I1.

Comme I1 =[−2 e−

x2]+∞

0= 2, on obtient

In = 2n(n − 1)!.

b. La fonction fn est positive, continue sur R, sauf en 0 et d’après (a), son intégraleconverge et ∫ +∞

−∞fn(x) dx =

∫ +∞

0fn(x) dx =

1(n − 1)!2n

In = 1.

La fonction fn est bien une densité.

2. La variable Xn possède une espérance sous réserve d’absolue convergence de∫ +∞

−∞xfn(x) dx =

∫ +∞

0xfn(x) dx =

1(n − 1)!2n

∫ +∞

0xn e−

x2 dx.

On reconnaît dans cette intégrale In+1. Donc elle converge (absolument car la fonction estpositive). Ainsi possède une espérance et

E(Xn) =1

(n − 1)!2nIn+1 =

In+1

In= 2n.

On montre de même que Xn possède un moment d’ordre 2 et

E(X2n ) =

In+2

In= 2(n + 1) · 2n = 4n(n + 1).

Ainsi Xn possède une variance et V (Xn) = 4n(n + 1) − 4n2 = 4n.

3. a. Il s’agit simplement de la formule de Taylor à l’ordre n appliquée à la fonction expentre 0 et l.

575

Page 583: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

b. Une densité de Xn est fn. On en déduit, pour l > 0,

P([Xn > 2l]) = 1 − P([Xn � 2l]) = 1 −∫ 2l

0

1(n − 1)!2n

xn−1e−x2 dx

= 1 −∫ l

0

1(n − 1)!

tn−1e−t dt

avec le changement de variable x = 2t. En multipliant par e−l l’égalité démontrée dansla question a, on obtient

1 =n−1∑k=0

e−l lk

k!+

∫ l

0e−t tn−1

(n − 1)!dt

et donc

P([Xn > 2l]) =n−1∑k=0

e−l lk

k!= P([Yl < n]),

puisque Yl suit une loi de Poisson de paramètre l.

12. 1. Considérons, pour 1 � k � n, la variable Zk indicatrice de l’événement [Xk � x](on rappelle que c’est la variable qui vaut 1 si [Xk � x] est réalisé et 0 sinon). Elle suit uneloi de Bernoulli de paramètre P([Xk � x]) = F(x). On a clairement

Nx = Z1 + Z2 + · · · + Zn.

Pour tout k ∈ [[1, n]], la variable Zk est une fonction de la variable Xk uniquement. Lesvariables X1, . . . , Xn étant indépendantes, il en est de même des variables Z1, . . . , Zn. Ainsila variable Nx est une somme de n variables de Bernoulli de même paramètre F(x). On saitqu’alors Nx suit la loi binomiale de paramètre (n, F(x)).

2. Pour k ∈ [[1, n]] et v ∈ V, Yr(v) est le k-ième réel si on classe X1(v), . . . , Xn(v) par ordrecroissant (avec éventuellement des termes égaux). On a Yk(v) � x si les k plus petitesvaleurs de cette listes sont inférieures ou égales à x, ce qui équivaut à : il y a au moins kvaleurs de cette liste inférieures ou égales à x (car alors a fortiori les k plus petites valeurssont inférieures ou égales à x). On en déduit que

[Yk � x] = [Nx � k].

3. On déduit des deux questions précédentes que, pour tout x ∈ R,

Fk(x) = P([Yk � x]) = P([Nx � k]) =n∑

i=k

P([Nx = i]) =n∑

i=k

(ni

)(F(x))i(1 − F(x))n−i.

La fonction F est continue sur R et de classe C1 sauf en un nombre fini de points. Il en estde même de Fk. On en déduit que Yk possède une densité fk qui s’obtient en dérivant Fk(la où c’est possible). On obtient, pour tout réel x,

fk(x) =n∑

i=k

(ni

)(if (x)

(F(x)

)i−1(1 − F(x)

)n−i − (n − i)f (x)(F(x)

)i(1 − F(x)

)n−i−1).

576

Page 584: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

En un point x où F est dérivable et F′(x) = f (x), cela résulte des règles de la dérivation ;ailleurs, ce qui représente un nombre fini de points, on peut choisir fk(x) arbitrairement etdonc garder la même expression. On a donc, pour tout réel x,

fk(x) = f (x)n∑

i=k

i(

ni

)(F(x))i−1(1 − F(x))n−i − f (x)

n−1∑i=k

(n − i)(

ni

)(F(x))i(1 − F(x))n−i−1.

Pour 1 � i � n, on a i(

ni

)= n

(n − 1i − 1

)et pour 0 � i � n−1, (n− i)

(ni

)= n

(n − 1

i

).

On en déduit

fk(x) = nf (x)n∑

i=k

(n − 1i − 1

)(F(x))i−1(1−F(x))n−i−nf (x)

n−1∑i=k

(n − 1

i

)(F(x))i(1−F(x))n−i−1.

On faisant le changement d’indice j = i + 1 dans la deuxième somme, on obtient

fk(x) = nf (x)n∑

i=k

(n − 1i − 1

)F(x))i−1(1 − F(x))n−i

− nf (x)n∑

j=k+1

(n − 1j − 1

)(F(x))j−1(1 − F(x))n−j

= nf (x)

(n − 1k − 1

)F(x))k−1(1 − F(x))n−k,

car tous les termes se retrouvent dans les deux sommes sauf le premier.

4. On suppose que les variables Xk suivent la loi uniforme sur [0, 1]. On a f (x) = 0 et doncfk(x) = 0 si x /∈ [0, 1]. Si x ∈ [0, 1], f (x) = 1 et F(x) = x donc

fk(x) = n(

n − 1k − 1

)xk−1(1 − x)n−k.

On se reporte à l’exercice 3.. On montre que Yk suit la loi B(k, n−k+1). En effet, fk étantune densité de probabilité, on a

1 =∫ 1

0fk(x) dx = n

(n − 1k − 1

) ∫ 1

0xk−1(1 − x)n−k dx = n

(n − 1k − 1

)B(k, n − k + 1).

On a donc n(

n − 1k − 1

)=

1B(k + 1, n − k + 1)

et, pour tout x ∈ R,

fk(x) =

⎧⎨⎩1

B(k + 1, n − k + 1)xk−1(1 − x)n−k si x ∈ [0, 1]

0 sinon.

577

Page 585: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 10 – Variables aléatoires à densité

On reconnaît une densité de la loi B(k, n − k + 1) (elle ne diffère de la définition donnéedans l’exercice 3. qu’en 0 et 1). On en déduit, en appliquant les résultats de l’exercice 3.,

E(Yk) =k

n + 1et V (Yk) =

k(n − k + 1)(n + 1)2(n + 2)

·

13. On note F la fonction de répartition de la loi normale centrée réduite.

1. La variableD − 80, 4

suit la loi normale centrée réduite. On obtient donc

P([D < 7, 5]) = P([

D − 80, 4

< −0, 50, 4

])= F(−1, 25) = 1 − F(1, 25) ≈ 0, 1056,

P([D > 9]) = P([

D − 80, 4

>1

0, 4

])= 1 − F(2, 5) ≈ 0, 0062

P([7, 5 < D < 8, 5]) = P([

−0, 50, 4

<D − 80, 4

<0, 50, 4

])= F(1, 25) − F(−1, 25) = 2F(1, 25) − 1 ≈ 0, 7888.

2. On cherche p = 1 − P([7, 5 < D < 8, 5]). On trouvea.

p = 1 − P([

0 <D − 7, 5

0, 4< 2, 5

])= 1 − F(2, 5) + F(0) ≈ 0, 5062 ;

b.

p = 1 − P([

−1, 25 <D − 80, 4

< 1, 25])

= 1 − (2F(1, 25) − 1) = 2 − 2F(1, 25) ≈ 0, 2112 ;

c.

p = 1 − P([

−2, 5 <D − 8, 5

0, 4< 0

])= 1 − F(0) + F(−1, 25) = −F(0) + 2 − F(1, 25) ≈ 0, 6056.

3. On veut calculer p′ = P[D<8,5]([7, 5 < D < 8, 5]

)=

P([7, 5 < D < 8, 5]

)P([D < 8, 5]

) . D’après la

première question P([7, 5 < D < 8, 5]

)≈ 0, 7888. D’autre part,

P([D < 8, 5]

)= P

([D − 80, 4

< 1, 25])

= F(1, 25) ≈ 0, 8944.

On en déduit p′ ≈ 0, 8819.

578

Page 586: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

4. On a donc

P([Z = 0]) = P([7, 5 < D < 8, 5]) = P([

7, 5 − m0, 4

<D − m

0, 4<

8, 5 − m0, 4

])= F

(8, 5 − m

0, 4

)− F

(7, 5 − m

0, 4

),

P([Z = 10]) = P([D � 7, 5]) = F

(7, 5 − m

0, 4

)P([Z = 3]) = P([D � 8, 5]) = 1 − F

(8, 5 − m

0, 4

).

On en déduit

E(Z) = 3P([Z = 3]) + 10P([Z = 10]) = 3 − 3F

(8, 5 − m

0, 4

)+ 10F

(7, 5 − m

0, 4

).

Posons g(m) = E(Z). La fonction F est dérivable sur R et F′(x) =1√2p

e−12 x2

. On en

déduit que g est dérivable sur R et

g′(m) =3

0, 4F′

(8, 5 − m

0, 4

)− 10

0, 4F′

(7, 5 − m

0, 4

)=

1

0, 4√

2p

(3e−

12 (8,5−m)2 − 10e−

12 (7,5−m)2

)=

3

0, 4√

2pe−

12 (7,5−m)2

(e

12 (−(8,5−m)2+(7,5−m)2) − 10

3

)=

3

0, 4√

2pe−

12 (7,5−m)2

(em−8 − 10

3

).

Ainsi g′(m) = 0 si et seulement si m−8 = ln103

, soit m = 8+ln103· Posons m0 = 8+ln

103·

On a, g′(m) > 0 si et seulement m > m0. La fonction g est décroissante sur ] −∞, m0] etcroissante sur [m0, +∞[. La fonction possède un minimum absolu en m0. Ainsi E(Z) est

minimale pour m = m0 = 8 + ln103

≈ 9, 20.

Chapitre 11

1. 1. Soit f une densité de la loi uniforme sur [0, 1] : f (x) = 1 si x ∈ [0, 1] et f (x) = 0si x /∈ [0, 1].Soit g une densité de T = X + Y . La variable T est à valeurs dans [0, 2] donc on peutprendre g(t) = 0 si t /∈ [0, 2].Nous proposons deux méthodes pour déterminer g sur [0, 2].

579

Page 587: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

• g est donnée par le produit de convolution de f et f . On a, pour tout t ∈ [0, 2],

g(t) =∫ +∞

−∞f (x)f (t − x) dx =

∫ 1

0f (t − x) dx.

Si t ∈ [0, 1], on a, pour x ∈ [0, 1], f (t − x) = 1 si x ∈ [0, t] et f (t − x) = 0 si x ∈ ]t, 1].On en déduit

g(t) =∫ t

0dx = t.

Si t ∈ ]1, 2], pour tout x ∈ [0, 1], t − x � 0 et t − x � 1 si x � t − 1. On a donc

g(t) =∫ 1

t−1dt = 2 − t.

• Le couple (X, Y ) suit une loi uniforme sur [0, 1]2. Pour toute partie D de [0, 1]2, on aP([(X, Y ] ∈ D]) = A(D) où A représente l’aire. Pour tout x ∈ [0, 2],

FT (t) = P([T � t]) = P([(X, Y ) ∈ Dt]),

où Dt = {(x, y) ∈ [0, 1]2, x + y � t}.

Si t � 1, Dt est un triangle isocèle rectangle de côté t. On en déduit FT (t) =12

t2.

1

1

Dt

t

t

Si 1 < t � 2, [0, 1]2 \ Dt est un triangle de côté 2 − t. On a donc FT (t) = 1 − 12

(2 − t)2.

1

1

Dt

t

580

Page 588: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On peut vérifier que le fonction de répartition de T est continue sur R et dérivable saufen 0, 1, 2. Une densité de T s’obtient en dérivant la fonction de répartition. On obtient

g(t) ={

t si t ∈ [0, 1]2 − t si t ∈ ]1, 2] .

2. Posons U =12

T . La variable aléatoire U est à valeurs dans [0, 1]. On a, pour tout x ∈ R,

FU (x) = P([U � x]) = P([T � 2x]) = FT (2x).

On en déduit une densité h de U . Pour tout x ∈ R, h(x) = 2g(2x). On en déduit donch(x) = 0 si x /∈ [0, 1] et

h(x) =

⎧⎪⎪⎨⎪⎪⎩4x si t ∈

[0,

12

]4 − 4x si t ∈

]12

, 1

].

3. Soit V = X + Y + Z = T + Z = Z + T . La variable V est valeurs dans [0, 3]. Les variablesX, Y, Z étant indépendantes, les variables T et Z sont indépendantes. Un densité k de Vest donnée par le produit de convolution de f et g. On a, pour tout x /∈ [0, 3], k(x) = 0.Si x ∈ [0, 3], on a

k(x) =∫ +∞

−∞f (t)g(x − t) dt =

∫ 1

0g(x − t) dt.

Si x ∈ [0, 1], on a

k(x) =∫ x

0g(x − t) dt =

∫ x

0g(u)du =

∫ x

0udu =

x2

Si x ∈ [1, 2], on a

k(x) =∫ x−1

0g(x − t) dt +

∫ 1

x−1g(x − t) dt =

∫ x

1g(u)du +

∫ 1

x−1g(u) du

=∫ x

1(2 − u) du +

∫ 1

x−1u du =

[2u − u2

2

]x

1

+[

u2

2

]1

x−1

= 2x − x2

2− 2 +

12

+12− (x − 1)2

2= −x2 + 3x − 3

Si enfin x ∈ [2, 3], on a x − t � 2 si t � x − 2 ; x − 2 ∈ [0, 1] donc

k(x) =∫ 1

x−2g(x − t) dt =

∫ 2

x−1g(u) du =

∫ 2

x−1(2 − u) du =

[2u − u2

2

]2

x−1

= 4 − 2 − 2(x − 1) +(x − 1)2

2=

x2

2− 3x +

92·

581

Page 589: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

2. 1. On a, pour (x, y) ∈ (R+)2,

(1 + ax)(1 + ay) − a = 1 − a + ax + ay + a2xy � 0,

car a ∈ ]0, 1[ donc f (x, y) � 0. La fonction f est positive ou nulle et continue saufsur R+ × {0} ∪ {0} × R+. Comme elle est nulle hors de (R+)2, il faut montrer que∫∫

(R+)2f (x, y) dxdy = 1. Soit y � 0. On a, pour u � 0,

∫ u

0f (x, y) dx =

∫ u

0((1 + ax)(1 + ay) − a) exp(−x − y − axy) dx

= e−y∫ u

0((1 + ax)(1 + ay) − a) exp(−x(1 + ay)).

On intègre par parties, en intégrant l’exponentielle. On obtient∫ u

0((1 + ax)(1 + ay) − a) exp(−x(1 + ay))

=[− (1 + ax)(1 + ay) − a

1 + ayexp(−x(1 + ay))

]u

0

+∫ u

0a exp(−x(1 + ay)) dx

=[(

− (1 + ax)(1 + ay) − a1 + ay

− a1 + ay

)exp(−x(1 + ay))

]u

0

=[−(1 + ax) exp(−x(1 + ay))

]u

0= −(1 + au) exp(−u(1 + ay)) + 1.

Comme, par croissances comparées, limu→+∞

(1 + au) exp(−u(1 + ay)) = 0, on en déduit que∫ u

0f (x, y) dx converge et ∫ +∞

0f (x, y) dx = e−y.

Pour tout v � 0,∫ v

0e−y dv =

[−e−y

]v

0= −e−v + 1. Cette intégrale tend vers 1 quand v

tend vers +∞. Ainsi∫ +∞

0 e−y dy converge et vaut 1. On en déduit que∫ +∞

0

(∫ +∞

0f (x, y) dx

)dy = 1.

La fonction f est donc une densité de probabilité.

2. Pour obtenir une densité fY de Y , on intègre par rapport à x. On obtient, pour tout réel

y, fY (y) =∫ +∞

−∞f (x, y) dx.

Si y < 0, fY (y) = 0 car f (x, y) = 0 pour tout réel x.Si y � 0, le calcul a été déjà effectué dans la question précédente. On trouve fY (y) = e−y.La variable Y suit donc la loi exponentielle de paramètre 1.Étant donné la symétrie de l’expression de f (x, y), le calcul est le même pour X. On trouvele même résultat : X suit la loi exponentielle de paramètre 1.

582

Page 590: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. Les variables X et Y sont indépendantes si f (x, y) = fX (x)fY (y) sauf éventuellement sur unensemble d’aire nulle. Pour (x, y) ∈ (R+)2, on a

f (x, y) = fX (x)fY (y) ⇐⇒ ((1 + ax)(1 + ay) − a) e−x−y−axy = e−xe−y

⇐⇒ (1 + ax)(1 + ay) − a = eaxy.

On sait que, pour tout réel t, on a et � t + 1. On a donc, pour x � 2 et y � 2,

eaxy = ea(x−1)y+ay = ea(x−1)yeay � (1 + a(x − 1)y)(1 + ay) � (1 + 2a(x − 1))(1 + ay).

Comme 2(x − 1) � x pour x � 2, on en déduit

eaxy � (1 + ax)(1 + ay) > (1 + ax)(1 + ay) − a.

Ainsi pour x � 2 et y � 2, on af (x, y) �= fX (x)fY (y).

Les variables X et Y ne sont donc pas indépendantes.

3. 1. La fonction est continue sauf sur une demi-droite {(x, x), x � 1} et une partie

d’une hyperbole

{(x,

1x

), x � 1

}, ensembles d’aire nulle. Elle est positive ou nulle si

k � 0. Elle doit vérifier de plus∫∫

R2

f (x, y) dxdy = 1.

Pour x fixé, calculons w(x) =∫ +∞

−∞f (x, y) dx.

Si x < 1, on a f (x, y) = 0 pour tout réel y donc w(x) = 0.

Si x � 1, f (x, y) = 0 si y /∈[

1x

, x]. On a donc

w(x) =∫ x

1x

f (x, y) dy =∫ x

1x

kx2y

dy =[

k ln yx2

]x

1x

=kx2 (ln x − ln

1x

) =2k ln x

x2 ·

Il faut calculer∫ +∞

1w(x) dx. Pour a � 1, on obtient en intégrant par parties,

∫ a

1w(x) dx =

∫ a

1

2k ln xx2

dx =[−2k ln x

x

]a

1

+∫ a

1

2kx2

dx

= −2k ln aa

+[−2k

x

]a

1

= −2k ln aa

− 2ka

+ 2k.

On en déduit que lima→+∞

∫ a

1w(x) dx = 2k. Par définition, on a donc

∫∫R2

f (x, y) dxdy =∫ +∞

1w(x) dx = 2k.

Finalement f est une densité de probabilité si, et seulement si, 2k = 1, soit k =12·

583

Page 591: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

2. Les lois marginales s’obtiennent en intégrant f par rapport à une variable.

On a déjà calculé∫ +∞

−∞f (x, y) dy = w(x) pour x fixé, qui donne une densité fX de X.

Compte tenu de k =12

, on obtient

fX (x) =

⎧⎨⎩0 si x < 1ln xx2

si x � 1·

Considérons maintenant un réel y. Si y � 0, on f (x, y) = 0 pour tout réel x donc fY (y) = 0.

Supposons y > 0. On a f (x, y) �= 0 si x � 1 et1x

� y � x, c’est-à-dire x � 1, x � 1y

et

x � y, ou encore x � max(1, y,1y

).

• Si y � 1, ces conditions se réduisent à x � y et on a

fY (y) =∫ +∞

yf (x, y) dx =

∫ +∞

y

12x2y

dx.

Une primitive de x �−→ 12x2y

est x �−→ − 12xy

· La limite de cette primitive en +∞ est 0

et sa valeur en y est − 12y2

· On obtient donc

fY (y) = 0 +1

2y2=

12y2

·

• Si 0 < y < 1, les conditions deviennent x � 1y

et

fY (y) =∫ +∞

1y

12x2y

dx.

On considère la même primitive que dans le cas précédents. Sa valeur en1y

est −12

, donc

fY (y) =12·

On a donc

fY (y) =

⎧⎪⎪⎪⎨⎪⎪⎪⎩0 si y � 012

si 0 < y < 11

2y2si y � 1.

Déterminons les densités conditionnelles.Pour x > 1, fX (x) �= 0, donc on peut définir la loi de Y conditionnelle à [X = x]. Onobtient

fY/[X=x](y) =f (x, y)fX (x)

=

⎧⎨⎩1

2y ln xsi

1x

� y � x

0 sinon.

584

Page 592: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Pour y > 0, fY (y) �= 0 donc on peut définir la loi de X conditionnelle à [Y = y].On obtient, pour 0 < y < 1,

fX/[Y=y] =f (x, y)fY (y)

=

⎧⎨⎩1

x2ysi x � 1

y0 sinon.

Enfin, pour y � 1, on a

fX/[Y=y] =f (x, y)fY (y)

=

{ yx2

si x � y

0 sinon.

4. 1. Le couple (A, B) suit une loi uniforme sur [0, 1]2 de densité 1 sur [0, 1]2 et 0ailleurs. Pour toute partie élémentaire D du plan, on a

P([(A, B) ∈ D]) = P([(A, B) ∈ D ∩ [0, 1]2]) = A(D ∩ [0, 1]2),

où A est l’aire.Posons D = 4A2 − 4B = 4(A2 − B).a. La probabilité d’obtenir deux racines réelles est

p1 = P([D > 0]) = P([A2 > B]) = P([(A, B) ∈ D1]) = A(D1),

où D1 = {(x, y) ∈ [0, 1]2, x2 > y}. Il s’agit de l’aire de la partie du carré limitée parl’axe des abscisses et la parabole y = x2.

1

1

D1

On a donc

p1 =∫ 1

0x2 dx =

13·

b. De même, la probabilité d’obtenir deux racines complexes non réelles est

p2 = P([A2 < B]) = P([(A, B) ∈ D2 = A(D2),

où D2 = {(x, y) ∈ [0, 1]2, x2 < y}. Il s’agit de la partie du carré entre la parabole et ladroite y = 1.

585

Page 593: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

1

1

D2

On a donc

p2 =∫ 1

0(1 − x2) dx = 1 − 1

3=

23·

c. Comme l’événement « l’équation possède une unique racine » est le complémentairede la réunion des deux événements précédents, sa probabilité est p3 = 1− p1 − p2 = 0.On pourrait aussi dire que A2 − B est une variable à densité. En effet A2 et −B sontdes variables à densité indépendantes donc A2−B est une somme de variables à densitéindépendantes. Pour une variable à densité X, on a, pour tout réel x, P([X = x]) = 0.On a donc P([D = 0]) = P([A2 − B = 0]) = 0.

2. a. Commençons par la troisième question. Pour la raison mentionnée à la fin de la ques-tion précédente, on a encore p3 = P([D = 0]) = 0.

b. Le couple (A, B) est à valeurs dans (R+)2 de densité f , produit des densités de A et Bdonc définie par

f (x, y) ={

e−xe−y si x � 0 et y � 00 sinon.

On a

p1 = P([D > 0]) =∫∫

D1

f (x, y) dx dy,

où D1 = {(x, y) ∈ (R+)2, x2 − y � 0} = {(x, y) ∈ (R+)2, 0 � y � x2}.Pour x � 0, on calcule

w(x) =∫ x2

0f (x, y) dy =

∫ x2

0e−xe−y dy = e−x

[−e−y

]x2

0

= e−x(−e−x2

+ 1)

= −e−(x+x2) + e−x.

Il s’agit ensuite de calculer∫ +∞

0w(x) dx.

586

Page 594: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On sait que∫ +∞

0e−x = 1, car on reconnaît l’intégrale de la densité d’une variable

suivant une loi exponentielle. Pour l’autre partie de l’intégrale, on se ramène à ladensité de la normale centrée réduite. On écrit

e−(x+x2) = e−(x+ 12 )

2+ 14 .

d’où l’on déduit∫ +∞

0e−(x+x2) dx = e

14

∫ +∞

0e−(x+ 1

2 )2

dx = e14

∫ +∞

12

e−t2 dt

= e14

∫ +∞

12

e−(t√

2)2

2 dt = e14

1√2

∫ +∞

√2

2

e−u2

2 du

= e14√

p

∫ +∞

√2

2

1√2p

e−u2

2 du = e14√

p

(1 − F

(√2

2

)).

On en déduit

p1 = −∫ +∞

0e−(x+x2) dx +

∫ +∞

0e−x dx = −e

14√

p

(1 − F

(√2

2

))+ 1.

c. Comme la probabilité que l’équation ait une racine double est nulle, on en déduit

p2 = 1 − p1 = e14√

p

(1 − F

(√2

2

)).

5. On prend 15 heures comme origine des temps. l’unité de temps est l’heure. Soient Xet Y les variables aléatoires représentant l’heure d’arrivée de A et B. Ce sont des variables aléa-toires indépendantes suivant le loi uniforme sur [0, 1]. Le couple (X, Y ) suit une loi uniformesur [0, 1]2

1. L’événement R « les deux personnes se rencontrent » est réalisé si leurs heures d’arrivéesont séparées par un intervalle de temps inférieur à 10 minutes. On a donc

P(R) = P([

|X − Y | � 16

]).

Cette probabilité est égale à A(D), où A est l’aire et

D ={

(x, y) ∈ [0, 1]2, |x − y| � 16

}.

L’ensemble [0, 1]2 \ D est la réunion de deux triangles de côtés56·

587

Page 595: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

1

1

D

On a donc

P(R) = A(D) = 1 − 2 · 12·(

56

)2

=1136

·

2. L’heure d’arrivée de A n’est plus une variable aléatoire, c’est un réel x de [0, 1]. L’espaceprobabilisé n’est plus le même que dans la question 1. Les deux personnes se rencontrent

si B arrive entre x − 16

et x +16· On a donc P(R) = P

([x − 1

6� Y � x +

16

]). On

obtient

si x � 16

, P([

x − 16

� Y � x +16

])= P

([0 � Y � x +

16

])= x +

16

;

si16

< x <56

, P([

x − 16

� Y � x +16

])=

13

;

si x � 56

, P([

x − 16

� Y � x +16

])= P

([x − 1

6� Y � 1

])=

76− x·

3. Notons S l’événement « B n’est pas là quand A arrive ». On demande de calculer

P(R/S) =P(S ∩ R)

P(S).

Ils se rencontreront si B arrive entre x et x +16

. On a donc

P(S ∩ R) = P(([

x � Y � x +16

]).

On obtient

si x � 56

, P([

x � Y � x +16

])=

16

;

si x >56

, P([

x � Y � x +16

])= P ([x � Y � 1]) = 1 − x.

588

Page 596: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Par ailleurs, l’événement S est réalisé si B arrive après A, i.e. si x � Y � 1 ou s’il est déjà

reparti, i.e Y < x − 16

(ce qui n’est possible que si x >16

). On a donc

S = [x < Y � 1] ∩[Y < x − 1

6

].

On obtient

si x � 16

, P(S) = P([x < Y � 1]) = 1 − x ;

si x >16

, P(S) = P([x < Y � 1]) + P([Y < x − 1

6

]) = 1 − x + x − 1

6=

56·

On en déduit,

si x � 16

, P(R/S) =1

6(1 − x);

si16

< x � 56

, P(R/S) =15

;

si x >56

, P(R/S) =6(1 − x)

6. 1. Les variables U et V sont à valeurs dans [0, 1]. On a donc FU (x) = FV (x) = 0 six < 0 et FU (x) = FV (x) = 1 si x > 1. Soit x ∈ [0, 1]. On a alors, par indépendance desvariables X et Y ,

FU (x) = P([U � x]) = P([X � x] ∩ [Y � x]) = P([X � x])P([Y � x]) = x2,

FV (x) = P([V � x]) = 1 − P([V > x]) = 1 − P([X > x] ∩ [Y > x])

= 1 − P([X > x])P([Y > x]) = 1 − (1 − x)2 = 2x − x2.

Les fonctions FU et FV sont continues sur R (il suffit de vérifier la continuité en 0 et 1)et de classe C1 sur R \ {0, 1}. Donc U et V sont des variables à densité dont des densitéss’obtiennent en dérivant FU et FV . On obtient

fU (x) ={

2x si x ∈ [0, 1]0 sinon

et fV (x) ={

2 − 2x si x ∈ [0, 1]0 sinon

Comme les variables U et V sont bornées elles possèdent une espérance et une variance.On obtient

E(U) =∫ 1

0xfU (x) dx =

∫ 1

02x2 dx =

23

E(V ) =∫ 1

0xfV (x) dx =

∫ 1

0(2x − 2x2) dx =

13

,

E(U2) =∫ 1

0x2fU (x) dx =

∫ 1

02x3 dx =

12

E(V 2) =∫ 1

0x2fV (x) dx =

∫ 1

0(2x2 − 2x3) dx =

16

,

589

Page 597: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

et donc

V (U) = E(U2) − (E(U))2 =12− 4

9=

118

V (V ) = E(V 2) − (E(V ))2 =16− 1

9=

118

·

On remarque que UV = XY . On en déduit que

E(UV ) = E(XY ) = E(X)E(Y ) =14

,

car X et Y sont indépendantes et l’espérance de la loi uniforme sur [0, 1] est12· On en

déduit

Cov(U, V ) = E(UV ) − E(U)E(V ) =14− 2

9=

136

puis

r(U, V ) =Cov(U, V )s(U)s(V )

=136118

=12·

2. La variable W = |X − Y | est à valeurs dans [0, 1]. On a donc FW (w) = 0 si w < 0,FW (w) = 1 si t > 1. Le couple (X, Y ) suit la loi uniforme sur [0, 1]2 et pour w ∈ [0, 1],

FW (w) = P([|X − Y | � w]) = P([(X, Y ) ∈ Dw) = A(Dw),

où A est l’aire et Dw = {(x, y) ∈ [0, 1]2, |x − y| � w}. Le complémentaire de Dw dans[0, 1]2 est la réunion de deux triangles de côtés 1 − w, donc

FW (w) = 1 − 2(1 − w)2

2= 1 − (1 − w)2 = 2w − w2.

La loi de W est donc la même que celle de V . On a donc

fW (w) ={

2 − 2w si t ∈ [0, 1]0 sinon.

3. Les variables aléatoires X, Y, Z sont mutuellement donc par le lemme des coalitions, lesvariables aléatoires W et Z sont indépendantes. Une densité f du couple (W, Z) s’obtienten faisant le produit d’une densité de W par une densité de Z. On obtient, pour tout(w, z) ∈ R2,

f (w, z) ={

2 − 2w si (w, z) ∈ [0, 1]2

0 sinon.

4. Le temps total de présence de C dans la poste est la somme son temps d’attente V (il peuttéléphoner dès que A ou B a terminé) et de son temps de communication Z. C’est doncV + Z. Entre A et B le temps de communication le plus long est U . Ainsi l’événement « Ctermine sa communication en dernier » est

[U < V + Z] = [U − V < Z].

590

Page 598: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On remarque que U − V = |X − Y | = W , car pour tout (x, y) ∈ R2,

|x − y| = max(x, y) − min(x, y), comme on le voit en distinguant x � y et x > y. Ainsi[U < V + Z] = [W < Z] et la probabilité que C termine sa communication en dernierest P([W < Z]).Connaissant une densité f de (W, Z), on en déduit que

P([W < Z]) =∫∫

Df (w, z) dw dz =

∫∫D

(2 − 2w) dw dz,

où D = {(w, z) ∈ [0, 1]2, w < z}. On obtient

P([W < Z]) =∫ 1

0

(∫ z

0(2 − 2w) dw

)dz =

∫ 1

0(2z − z2) dz =

23·

5. Le temps total passé dans le bureau de poste par C est d’après ce qui précède, T = V + Z.Les variables X, Y, Z sont mutuellement indépendantes donc V = inf(X, Y ) et Z sontindépendantes, d’après le lemme des coalitions. Une densité g de (V, Z) s’obtient en faisantle produit d’une densité de V et d’une densité de Z. Comme V et W ont même densité,on obtient g = fLa variable T est à valeurs dans [0, 2] et pour t ∈ [0, 2],

P([T � t]) = P([V + Z � t]) =∫∫

Dt

f (v, z) dv dz =∫∫

Dt

(2 − 2v) dv dz,

où Dt = {(v, z) ∈ [0, 1]2, v + z � t}.Si t ∈ [0, 1], (v, z) ∈ Dt si z ∈ [0, t] et v � t − z et

P([T � t]) =∫ t

0

(∫ t−z

0(2 − 2v) dv

)dz =

∫ t

0(2(t − z) − (t − z)2) dz

=[−(t − z)2 +

13

(t − z)3]t

0

= −13

t3 + t2.

Si t ∈ [1, 2], il est plus simple de calculer P([T > t]), car (v, z) /∈ Dt, i.e. v + z > t, siz ∈ [t − 1, 1] et v > t − z et

P([T > t]) =∫ 1

t−1

(∫ 1

t−z(2 − 2v) dv

)dz =

∫ 1

t−1

[2v − v2]1

t−zdz

=∫ 1

t−1(1 − 2(t − z) + (t − z)2) dz =

[z + (t − z)2 − 1

3(t − z)3

]1

t−1

= 1 + (t − 1)2 − 13

(t − 1)3 − (t − 1) − 1 +13

= −13

t3 + 2t2 − 4t +83·

On en déduit

P([T � t]) = 1 − P([T > t]) =13

t3 − 2t2 + 4t − 53·

591

Page 599: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

On obtient une densité de T en dérivant

fT (t) =

⎧⎨⎩−t2 + 2t si t ∈ [0, 1]t2 − 4t + 4 = (t − 2)2 si t ∈ ]1, 2]0 sinon.

6. La variable est bornée donc possède une espérance et une variance. On obtient

E(T ) =∫ 2

0tfT (t) dt =

∫ 1

0(−t3 + 2t2) dt +

∫ 2

1(t3 − 4t2 + 4t) dt

=[−1

4t4 +

23

t3]1

0

+

[14

t4 − 43

t3 + 2t2]2

1

=56

E(T2) =∫ 2

0t2fT (t) dt =

∫ 1

0(−t4 + 2t3) dt +

∫ 2

1(t4 − 4t3 + 4t2) dt

=[−1

5t5 +

12

t4]1

0

+[

15

t5 − t4 +43

t3]2

1

=56

et donc

V (T ) = E(T2) − (E(T ))2 =56− 25

36=

536

·

7. On rappelle qu’étant donnés trois réels positifs x, y, z, il existe un triangle dont leslongueurs des côtés sont x, y et z si, et seulement si, chaque longueur est strictement inférieureà la somme des deux autres, i.e. x < y + z, y < z + x et z < x + y. Ici les trois longueurs sontinf(X, Y ), sup(X, Y ) − inf(X, Y ) et � − sup(X, Y ). On a donc les conditions

inf(X, Y ) < sup(X, Y ) − inf(X, Y ) + � − sup(X, Y ), c’est-à-dire inf(X, Y ) <�

2,

sup(X, Y ) − inf(X, Y ) < inf(X, Y ) + � − sup(X, Y ), c’est-à-dire sup(X, Y ) − inf(X, Y ) <�

2

et � − sup(X, Y ) < inf(X, Y ) + sup(X, Y ) − inf(X, Y ), c’est-à-dire sup(X, Y ) >�

2Le couple [X, Y ] suit une loi uniforme sur [0, �]2. Il a pour densité la fonction f définie par

f (x, y) =

{ 1�2

si (x, y) ∈ [0, �]2

0 sinon.

La probabilité p cherchée est

p = P([

inf(X, Y ) <�

2, sup(X, Y ) >

2, sup(X, Y ) − inf(X, Y ) <

2

])=

1�2A(D),

592

Page 600: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

où D ={

(x, y) ∈ [0, �]2, min(x, y) <�

2, max(x, y) >

2, max(x, y) − min(x, y) <

2

}. En

distinguant les cas x < y et x � y, on montre que D = D′ ∪ D′′, où

D′ ={

(x, y) ∈ [0, �]2, x <�

2, y >

2, y − x <

2

},

D′′ ={

(x, y) ∈ [0, �]2, y <�

2, x >

2, x − y <

2

}.

Comme D′ et D′′ sont des triangles rectangles isocèles de côté�

2, on a

A(D) = 2 · 12·(

2

)2

=�2

4et

p =14·

8. Soit (O,−→ı −→j ) le repère. On peut repérer le point M par une mesure de l’angle

(−→ı ,−−→OM). Soit Q la variable aléatoire égale à cette mesure. Le point M étant choisi au hasard

sur le cercle, on supposera que Q suit la loi uniforme sur [0, 2p]. La densité f de Q est définiepar

f (u) =

⎧⎨⎩1

2psi u ∈ [0, 2p]

0 sinon.

1. On a X = cos Q et Y = sin Q. Les variables X, Y et XY sont bornées donc admettentune espérance donnée par la formule de transfert. On obtient

E(X) =∫ +∞

−∞cos(u)f (u) du =

∫ 2p

0

12p

cos(u) du =[

12p

sin(u)]2p

0

= 0,

E(Y ) =∫ +∞

−∞sin(u)f (u) du =

∫ 2p

0

12p

sin(u) du =[− 1

2pcos(u)

]2p

0

= 0,

E(XY ) =∫ +∞

−∞sin(u) cos(u)f (u) du =

∫ 2p

0

14p

sin(2u) du =[− 1

8pcos(2u)

]2p

0

= 0.

On en déduit queCov(X, Y ) = E(XY ) − E(X)E(Y ) = 0.

On a

P([

0 � X � 12

])= P

([0 � cos(Q) � 1

2

])= P

([p

3� Q � p

2

]∪

[3p

2� Q � 5p

3

])=

p2 − p

3

2p+

5p3 − 3p

2

2p=

16

593

Page 601: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

et de même,

P([

0 � Y � 12

])= P

([0 � sin(Q) � 1

2

])= P

([0 � Q � p

6

]∪

[5p

6� Q � p

])=

p6

2p+

p − 5p6

2p=

16·

Mais

P([

0 � X � 12

]∩

[0 � Y � 1

2

])= P

([0 � cos Q � 1

2

]∩

[0 � sin Q � 1

2

])= 0,

car, pour tout réel x, on ne peut pas avoir 0 � cos x � 12

et 0 � sin x � 12

, car alors

cos2 x + sin2 x � 12· Comme

P([

0 � X � 12

]∩

[0 � Y � 1

2

])�= P

([0 � X � 1

2

])P

([0 � Y � 1

2

]),

les variables X et Y ne sont pas indépendantes.

2. La variable L est à valeurs dans [0, 2]. On a

L2 = (X − 1)2 + Y 2 = X2 + Y 2 + 1 − 2X = 2 − 2X = 2(1 − cos Q) = 4 sin2 Q

2

et donc L = 2 sinQ

2, car si u ∈ [0, 2p], sin

u

2� 0.

Déterminons sa fonction de répartition FL. On a donc FL(x) = 0 si x < 0, FL(x) = 1 six > 2 et pour tout x ∈ [0, 2],

FL(x) = P([0 � L � x]) = P([

sinQ

2� x

2

])= P

([0 � Q

2� Arcsin

x2

]∪

[p − Arcsin

x2

� Q

2� p

])= P

([0 � Q � 2 Arcsin

x2

]∪

[2p − 2 Arcsin

x2

� Q � 2p])

=1

2p4 Arcsin

x2

=2p

Arcsinx2·

La fonction FL est continue en 0 et 2, car limx→0

2p

Arcsinx2

=2p

Arcsin 0 = 0 et

limx→0

2p

Arcsinx2

=2p

Arcsin 1 = 1. Elle est dérivable sauf en 0 et 2 et à dérivée continue

donc elle possède une densité g définie par g(x) = 0 si x � 0 ou x � 2 et pour x ∈ ]0, 2[,

g(x) = F′L(x) =

2p

· 12· 1√

1 − x2

4

=2

p√

4 − x2·

594

Page 602: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

On peut calculer E(L) en utilisant cette densité

E(L) =∫ 2

0xg(x) dx =

∫ 2

0

2x

p√

4 − x2dx =

1p

[−2

√4 − x2

]2

0=

4p

,

mais il est plus simple d’utiliser la formule de transfert

E(L) = E(

2 sinQ

2

)=

12p

∫ 2p

02 sin

u

2du =

12p

[−4 cos

u

2

]2p

0

=1

2p(4 + 4) =

4p·

On obtient de même,

E(L2) = E(2(1−cos Q)) =1

2p

∫ 2p

02(1−cos u) du =

12p

[2(u − sin u)]2p0 =

12p

·4p = 2.

On en déduit

V (L) = E(L2) − (E(L))2 = 2 − 16p2 ·

9. Les variables X et Y sont indépendantes donc une densité de (X, Y ) s’obtient en faisantle produit d’une densité de X et d’une densité de Y . On a donc

f (x, y) ={

l2e−lxe−ly si (x, y) ∈ (R+)2

0 sinon.

1. La variable U est à valeurs dans R+. On a donc FU (u) = 0 si u � 0 et pour u > 0,

FU (u) = P([X + Y � u]) =∫∫

Du

f (x, y) dx dy,

où Du = {(x, y) ∈ (R+)2, x + y = u, donc

FU (u) =∫ u

0

(∫ u−x

0l2e−lxe−ly dy

)dx =

∫ u

0le−lx

[−e−ly

]u−x

0dx

=∫ u

0l

(−e−lu + e−lx) dx =

[−lxe−lu − e−lx]u

0

= −lue−lu − e−lu + 1 = 1 − (lu + 1)e−lu.

Comme X + Y est une variable à densité P([X + Y = 0]) = 0, la variable V est définiepresque sûrement. Les variables X et Y sont positives donc V est à valeurs dans [0, 1]. Ona donc FV (v) = 0 si v � 0, FV (v) = 1 si v � 1 et pour v ∈ ]0, 1[,

FV (v) = P([

XX + Y

� v])

= P([X � vX + vY ]) = P([

X � v1 − v

Y])

.

Comme une densité de (X, Y ) est le fonction (x, y) �−→ f (x)f (y), on obtient

FV (v) =∫∫

Dl2e−lxe−ly dx dy,

595

Page 603: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

où D ={

(x, y) ∈ (R+)2, x � v1 − v

y}

et donc

FV (v) =∫ +∞

0

(∫ v1−v y

0l2e−lxe−ly dx

)dy =

∫ +∞

0−le−ly

[e−lx

] v1−v y

0dy

=∫ +∞

0−le−ly

(e−l v

1−v y − 1)

dy =∫ +∞

0−l

(e−

ly1−v − e−ly

)dy

=[(1 − v)e−

ly1−v − e−ly

]+∞

0= −(1 − v) + 1 = v.

On en déduit queX

X + Ysuit la loi uniforme sur [0, 1].

2. On calcule FU,V (u, v) = P([U � u] ∩ [V � v]) pour tout (u, v) ∈ R2.

Si u < 0 ou v < 0, on a FU,V (u, v) = 0.Si u � 0 et v ∈ ]0, 1[, on a

[U � u]∩[V � v] = [X+Y � u]∩[

1 − vv

X � Y]

=[

1 − vv

X � Y � u − X]∩[X � uv].

On en déduit

FU,V (u, v) =∫ uv

0

(∫ u−x

(1−v)xv

l2e−lxe−ly dy

)dx =

∫ uv

0le−lx [

−e−ly]u−x(1−v)x

vdx

=∫ uv

0l

(e−

lxv − e−lu

)dx

=[−ve−l x

v − lxe−lu]uv

0= −ve−lu − luve−lu + v

= v(1 − (1 + lu)e−lu

).

Enfin si u � 0 et v � 1, on a FU,V (u, v) = P([U � u] ∩ [V � v]) = P([U � u]).On vérifie que, pour tout (u, v) ∈ R

2,

FU,V (u, v) = FU (u)FV (v).

Les variables U et V sont indépendantes.

10. 1. a. La fonction fa est continue et positive sur R. On a, pour tout réel x,

fa(x) =1

pa· 1

1 +(

xa

)2

donc une primitive de fa est Fa définie par Fa(x) =1p

Arctan(

xa

). On en déduit

∫ +∞

−∞fa(x) dx = lim

+∞Fa − lim

−∞Fa =

1p

(p

2+

p

2

)= 1.

Donc fa est une densité de probabilité.

596

Page 604: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

La fonction de répartition de X est définie pour tout réel x par

F(x) = fa(x) − lim−∞

Fa =1p

(Arctan

(xa

)+

p

2

)=

1p

Arctan(x

a

)+

12·

On a xfa(x) ∼x→+∞

1pax

. On en déduit que∫ +∞

−∞xfa(x) dx ne converge pas. La variable

X ne possède pas d’espérance.

b. Le couple (X, Y ) suit donc une loi uniforme sur le disque de centre (0, 0) et de rayon 1.Comme Y est une variable à densité, on a P([Y = 0]) = 0, donc Z est définie presquesûrement. On a, pour tout réel z,

FZ(z) = P([Z � z) =∫∫

Dg(x, y) dx dy =

1pA(D)

où A(D) est l’aire de D = {(x, y) ∈ R∗ × R, x2 + y2 � 1,yx

� z}. On a

D = D′ ∪ D′′, où D′ = {(x, y) ∈ R∗ × R, x2 + y2 � 1, x > 0, y � xz} etD′′ = {(x, y) ∈ R

∗ × R, x2 + y2 � 1, x < 0, y � xz}. Les deux ensembles D′ et D′′

ont même aire, car ils sont symétriques par rapport à (0, 0).

1−1

1

−1

u

D′

D′′z

On pose u = Arctan(z).Si z � 0, D′ est la réunion d’un quart de disque et d’un secteur angulaire d’angle u.

On a donc A(D′) =p

4+

u

2et

FZ(z) =1p

· 2

(p

4+

u

2

)=

12

+u

p=

12

+1p

Arctan(z).

597

Page 605: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

Si z � 0, D′ est obtenu en enlevant d’un quart de disque un secteur angulaire d’angle

|u|. On a donc A(D′) =p

4− |u|

2=

p

4+

u

2et on trouve encore

FZ(z) =12

+1p

Arctan(z).

Ainsi, pour tout z ∈ R, FZ(z) =12

+1p

Arctan(z). On reconnaît la fonction de

répartition d’une loi C(1). Donc Z suit une loi C(1).

c. Le couple possède une densité f définie sur R2 par

f (x, y) =1√2p

e−12 x2 1√

2pe−

12 y2

=1

2pe−

12 (x2+y2).

On a, pour tout réel z,

FZ(z) = P([Z � z) =∫∫

Df (x, y) dx dy,

où D = {(x, y) ∈ R∗ × R,

yx

� z}. Comme f et paire et D symétrique par rapport à

l’origine, on peut écrire

FZ(z) = 2∫∫

D′f (x, y) dx dy,

où D′ = {(x, y) ∈ R∗+ × R,

yx

� z} On passe en coordonnées polaires (r, a).

Le domaine D′ devient D = {(r, u) ∈ R∗+ ×

]−p

2,

p

2

[, tan a � z}. En posant

Arctan z = u, la conditionyx

� z devient tan a � tan u et donc comme

a ∈]−p

2,

p

2

[, a ∈

]−p

2, u

]. On obtient

FZ(v) = 2∫∫

D

12p

e−12 r2

r dr da

=1p

∫ u

− p2

da

∫ +∞

0e−

12 r2

r dr

=1p

(u +

p

2

) [−e−

12 r2

]+∞

0︸ ︷︷ ︸=1

=1p

u +12

=1p

Arctan(z) +12·

La variable Z suit la loi C(1).

2. a. Soit X ′ = lX. On a, pour tout réel x,

FX′ (x) = P([X ′ � x]) = P([lX � x]) = P([

X � xl

])= FX

( xl

)=

1p

Arctan( x

al

)+

12

d’après la première question. On en déduit que X ′ suit la loi C(la).

598

Page 606: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

b. Après avoir réduit au même dénominateur le membre de droite de l’égalité, le numé-rateur obtenu est

N = (2tx + x2 − b2 + 1)((t − x)2 + 1) + (t2 + b2)(x2 + b2 − 1 − 2(t − x)x)

= (2tx + x2 − b2 + 1)(t2 − 2tx + x2 + 1) + (t2 + b2)(−2tx + 3x2 + b2 − 1).

Il s’agit de montrer que cette fonction polynomiale de t de degré inférieur ouégal à 3 est constante, égale c. Le coefficient de t3 est 2x − 2x = 0, celui de t2,x2 − b2 +1−4x2 +3x2 + b2 −1 = 0, celui de t, 2x(x2 +1)−2x(x2 − b2 +1)−2xb2 = 0,donc

N = (x2 − b2 + 1)(x2 + 1) + b2(3x2 + b2 − 1)

= (x2 + 1)2 + b2(−x2 − 1 + 3x2 + b2 − 1) = (x2 + 1)2 + b4 + 2b2(x2 − 1)

= (x2 + 1 + b2)2 − 2b2(x2 + 1) + 2b2(x2 − 1) = (x2 + 1 + b2)2 − 4b2

= (x2 + 1 + b2 + 2b)(x2 + 1 + b2 − 2b) =(x2 + (b + 1)2

) (x2 + (b − 1)2

)= c.

c. On suppose pour commencer que X suit une loi C(1) et Y une loi C(b). La variableX + Y possède une densité f qui s’obtient en faisant le produit de convolution de f1 etfb. On obtient, pour tout réel x,

f (x) =∫ +∞

−∞f1(x − t)fb(t) dt =

∫ +∞

−∞

1p(1 + (x − t)2)

· bp(b2 + t2)

dt

=b

p2c

∫ +∞

−∞

c[(1 + (x − t)2)][b2 + t2]

dt.

On fixe x et on considère w : t �−→ c[(1 + (x − t)2)][b2 + t2]

· D’après la question

précédente, on a pour tout t ∈ R,

w(t) = x ·[

2tt2 + b2

− 2(t − x)[(t − x)2 + 1)

]+

(x2 + b2 − 1)(t − x)2 + 1

+x2 − b2 + 1

t2 + b2·

On en déduit une primitive F de w. Pour tout réel t,

F(t) = x lnt2 + b2

(t − x)2 + 1+ (x2 + b2 − 1) Arctan(t − x) +

x2 − b2 + 1b

Arctan( t

b

On obtient

limt→+∞

F(t) = x ln 1 + (x2 + b2 − 1)p

2+

x2 − b2 + 1b

p

2

= px2(b + 1) + (b2 − 1)(b − 1)

2b= p

(b + 1)(x2 + (b − 1)2

)2b

etlim

t→−∞F(t) = − lim

t→+∞F(t).

On en déduit

f (x) =b

p2c(lim+∞

F − lim−∞

F) =b

p2cp

(b + 1)[x2 + (b − 1)2]b

=b + 1

p(x2 + (b + 1)2

) ·On constate que f = f1+b donc X + Y suit la loi C(1 + b).

599

Page 607: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

Passons au cas général et supposons que X suit une loi C(a) et Y une loi C(b). D’après

la question a,1a

X suit une loi C(1) et1a

Y suit une loi C(

ba

). De b, on déduit

que1a

X +1a

Y suit une loi C(

b + aa

). En utilisant de nouveau a, on obtient que

X + Y = a(

1a

X +1a

Y)

suit une loi C(a + b), ce qui est le résultat demandé.

11. 1. a. La fonction w : x �−→ e−xxa−1 est continue et positive sur ]0, +∞[. On a

w(x) ∼x→0

1x1−a

· Comme 1 − a < 1, car a > 0∫ 1

0

1x1−a

dx converge et il en est de

même de∫ 1

0w(x) dx.

D’autre part, au voisinage de +∞, w(x) = o(

1x2

)donc

∫ +∞

1w(x) dx converge.

Finalement l’intégrale G(a) est convergente pour tout a.Pour a > 0, G(a) et G(a + 1) sont toutes deux définies. On intègre par parties, endérivant la fonction puissance. Pour 0 < a < b, on a∫ b

a

e−xxa dx =[−e−xxa

]b

a+ a

∫ b

a

e−xxa−1 dx.

On a limx→0

e−xxa = 0, car a > 0 et limx→+∞

e−xxa = 0, par croissance comparée d’une

fonction puissance et d’une exponentielle. En faisant tendre a vers 0 et b vers +∞, onobtient

G(a + 1) = aG(a).

La fonction ga,l(x) est continue sauf peut-être en 0 et positive. Reste à montrer que∫ +∞

0ga,l(x) dx converge et vaut 1. Pour 0 < a < b, on obtient avec le changement

de variable t = lx,∫ b

a

ga,l(x) dx =la

G(a)

∫ b

a

e−lxxa−1 dx =la

G(a)

∫ lb

la

e−t( t

l

)a−1 1l

dt

=1

G(a)

∫ lb

la

e−t ta−1 dt.

Quand a tend vers 0 et b vers +∞,1

G(a)

∫ lb

la

e−tßa−1 dt tend vers

1G(a)

∫ +∞

0e−t ta−1 dt =

G(a)G(a)

= 1.

Autrement dit,∫ +∞

0ga,l(x) dx converge et vaut 1.

600

Page 608: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

b. Sous réserve de convergence, on a

E(X) =∫ +∞

0xga,l(x) dx =

la

G(a)

∫ +∞

0e−lxxa dx.

Il résulte de la question précédente que, pour tout a > 0,∫ +∞

0e−lxxa−1 dx converge

et vautG(a)la

. On en déduit que∫ +∞

0e−lxxa dx converge et vaut

G(a + 1)la+1

. Ainsi E(X)

existe et

E(X) =la

G(a)G(a + 1)

la+1=

G(a + 1)lG(a)

=al

,

car G(a + 1) = aG(a).De même sous réserve de convergence,

E(X2) =la

G(a)

∫ +∞

0e−lxxa+1 dx.

Par le même raisonnement,∫ +∞

0e−lxxa+1 dx converge et vaut

G(a + 2)la+2

. Ainsi X pos-

sède un moment d’ordre 2 et

E(X2) =la

G(a)G(a + 2)

la+2=

G(a + 2)l2G(a)

=a(a + 1)

l2,

car en appliquant deux fois le résultat de la première question, on obtient

G(a + 2) = (a + 1)G(a + 1) = (a + 1)aG(a).

On en déduit que X possède une variance

V (X) = E(X2) −(E(X)

)2 =a(a + 1)

l2− a2

l2=

al2

·

2. a. Les variables X et Y étant indépendantes, X + Y possède une densité f donnée par leproduit de convolution de ga,l et gb,l. Les variables X et Y étant positives, f est nullesur R− et d’après le corollaire 1 page 371, on a, pour x > 0,

f (x) =∫ x

0ga,l(t)gb,l(x − t) =

la+b

G(a)G(b)

∫ x

0e−ltta−1e−l(x−t)(x − t)b−1 dt

=la+b

G(a)G(b)e−lx

∫ x

0ta−1(x − t)b−1 dt.

On fait le changement de variable u =tx· On obtient, pour x > 0,

f (x) =la+b

G(a)G(b)e−lx

∫ 1

0(xu)a−1(x(1 − t))b−1 x du

=la+b

G(a)G(b)e−lxxa+b−1

∫ 1

0ta−1(1 − t)b−1 dt.

601

Page 609: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

On remarque qu’en posant c =G(a + b)G(a)G(b)

∫ 1

0ta−1(1 − t)b−1 dt, on a, pour tout x ∈ R,

f (x) = cga,l(x) (pour x � 0, c’est vrai car f (x) = ga+b,l(x) = 0). Les fonctions f etga+b,l sont des densités de probabilités. On en déduit que

1 =∫ +∞

−∞f (x) dx = c

∫ +∞

−∞ga,l(x) dx = c.

Ainsi c = 1, f = ga+b,l et X + Y suit la loi G(a + b, l).De plus on tire, de c = 1, l’égalité∫ 1

0ta−1(1 − t)b−1 dt =

G(a)G(b)G(a + b)

·

b. On a G(1) =∫ +∞

0e−x dx =

[−e−x

]+∞0

= 1. On a donc pour tout x > 0,

g1,l(x) = le−lx.

On reconnaît la densité d’une loi exponentielle de paramètre l. On a doncE(l) = G(l, 1).On déduit de la question a, par une récurrence évidente sur n ∈ N∗, que si X1, . . . , Xnsont des variables aléatoires indépendantes telles que Xk suive la loi G(ak, l), alors

n∑k=1

Xk suit une loi G

(n∑

k=1

ak, l

).

Pour n = 1, il n’y a rien à démontrer. Supposons que la propriété est vraie au rangn et considérons n + 1 variables indépendantes X1, . . . , Xn+1 telles que Xk suive la loiG(ak, l). Les variables X1, . . . , Xn sont des variables aléatoires indépendantes donc par

hypothèse de récurrencen∑

k=1

Xk suit une loi G

(n∑

k=1

ak, l

). Les variables

n∑k=1

Xk et

Xn+1 sont indépendantes d’après le lemme des coalitions, donc d’après la question a,n+1∑k=1

Xk =n∑

k=1

Xk+Xn+1 suit une loi G

(n∑

k=1

ak + an+1, l

), c’est-à-dire G

(n+1∑k=1

ak, l

).

Si X1, . . . , Xn sont des variables aléatoires indépendantes suivant une loi exponentiellede paramètre l, c’est-à-dire une loi G(l, 1), la variable S = X1 + · · ·+ Xn suit, d’aprèsce qui précède, une loi G(l, n) .

3. a. La variable Y suit la loi N (0, 1). Nous savons que Z = Y 2 est une variable à densité.Cherchons sa fonction de répartition. La variable Z est positive donc FZ(z) = 0 siz � 0 et, pour z > 0,

FZ(z) = P([Z � z]) = P([−√

z � Y �√

z]) = FY (√

z) − FY (−√

z).

La fonction FY est dérivable sur R de dérivée fY : y �−→ 1√2p

e−y2

2 . On obtient une

densité fZ de Z en dérivant FZ . Pour z � 0, fZ(z) = 0 et pour z > 0,

fZ(z) =1

2√

z

(fY (

√z) + fY (−

√z)

)=

12√

z2√2p

e−z2 =

1√p

z−12 e−

z2 =

1√p

z12−1e−

z2 .

602

Page 610: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

Comme, pour tout z > 0, g( 12 , 1

2 )(z) =1√

2G(

12

)z12−1e−

z2 et que fZ et g( 1

2 , 12 ) sont

toutes les deux nulles sur R−, on voit qu’en posant c =√

2√p

G(

12

), on a, pour tout

réel z,fZ(z) = cg( 1

2 , 12 )(z).

Le même raisonnement que dans la question 2.a permet de conclure, puisque fZ etg( 1

2 , 12 ) sont des densités de probabilité, que c = 1 et donc fZ = g( 1

2 , 12 ). La variable Z

suit donc la loi G(

12

,12

). Par ailleurs, de c = 1 on tire G

(12

)=

√p

b. Les variables Y1, . . . , Yn étant indépendantes, il en est de même de Y 21 , . . . , Y 2

n . D’après

la question précédente, chaque variable Y 2k suit une loi G

(12

,12

). D’après ce qui a été

démontré dans la question 2.a, la variable Z = Y 21 + · · · + Y 2

n suit une loi G(

n2

,12

).

D’après les résultats de la question 1, on a

E(Z) =

n212

= n et V (Z) =

n214

= 2n.

12. 1. Comme f est une densité de probabilité, on a∫∫

R2

f (x, y) dx dy = 1. On vérifie

aisément l’égalité proposée par l’énoncé. En l’utilisant, on trouve, pour tout couple deréels (x, y),

exp(− 1

2(1 − r2)(x2 − 2rxy + y2)

)= exp

(− (x − ry)2

2(1 − r2)− 1

2y2

)= exp

(− (x − ry)2

2(1 − r2)

)exp

(−1

2y2

).

On en déduit, pour tout réel y∫ +∞

−∞f (x, y) dx = k exp

(−1

2y2

) ∫ +∞

−∞exp

(− (x − ry)2

2(1 − r2)

)dx.

La densité d’une variable suivant la loi N (ry, 1 − r2) est

x �−→ 1√2p(1 − r2

exp(− (x − ry)2

2(1 − r2)

).

On a donc∫ +∞

−∞exp

(− (x − ry)2

2(1 − r2)

)dx =

√2p(1 − r2 et

∫ +∞

−∞f (x, y) dx = k

√2p(1 − r2) exp

(−1

2y2

).

603

Page 611: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

On en déduit∫∫R2

f (x, y) dx dy = k√

2p(1 − r2)∫ +∞

−∞exp

(−1

2y2

)dy

= k√

2p(1 − r2)√

2p = 2kp√

1 − r2 = 1

et

k =1

2p√

1 − r2·

2. a. On obtient les densités marginales en intégrant f par rapport à une des variables. Celaa déjà été fait dans la question précédente pour Y . On trouve, pour tout réel y,

fY (y) =∫ +∞

−∞f (x, y) dx = k

√2p(1 − r2) exp

(−1

2y2

)=

1√2p

exp(−1

2y2

).

La loi de Y est la loi normale N (0, 1). L’expression de la densité du couple (X, Y ) étantsymétrique par rapport à x et y, le calcul donnerait le même résultat pour X qui suit laloi N (0, 1).

b. On a Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(XY ). Cette espérance existe car X et Yont des moments d’ordre 2 et

E(XY ) =∫∫

R2

xyf (x, y) dx dy.

On calcule pour commencer∫ +∞

−∞xyf (x, y) dx = ky exp

(−1

2y2

) ∫ +∞

−∞x exp

(− (x − ry)2

2(1 − r2)

)dx

=1√2p

y exp(−1

2y2

) ∫ +∞

−∞

1√2p(1 − r2)

x exp(− (x − ry)2

2(1 − r2)

)dx.

On reconnaît dans l’intégrale l’espérance d’une variable suivant la loi N (ry, 1 − r2),c’est-à-dire ry. On a donc∫ +∞

−∞xyf (x, y) dx =

1√2p

ry2 exp(−1

2y2

).

On en déduit

E(XY ) =∫ +∞

−∞

1√2p

ry2 exp(−1

2y2

)dy = rE(Y 2) = r.

Si les variables X et Y sont indépendantes, elles ne sont pas corrélées. Réciproquement,si X et Y ne sont pas corrélées, leur coefficient de corrélation r est nul. On alors

k =1

2pet pour tout (x, y) ∈ R

2,

f (x, y) =1

2pexp

(−1

2(x2 + y2)

)=

1√2p

e−12 x2 1√

2pe−

12 y2

= fX (x)fY (y).

Donc les variables X et Y sont indépendantes.

604

Page 612: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. Pour tout y ∈ R, on a fY (y) �= 0, donc la densité conditionnelle fX/[Y=y] est définie et,pour tout x ∈ R,

fX/[Y=y](x) =f (x, y)fY (y)

=1

2p√

1 − r2exp

(− 1

2(1 − r2)(x2 − 2rxy + y2)

)√2pe

y2

2

=1√

2p(1 − r2)exp

(− 1

2(1 − r2)(x2 − 2rxy + r2y2)

)=

1√2p(1 − r2)

exp(− 1

2(1 − r2)(x − ry)2

).

La loi de X conditionnelle à [Y = y] est la loi normale N (ry, 1 − r2).Le résultat est le même pour la loi de Y conditionnelle à [X = x].

13. 1. La fonction f est positive et continue sauf en 1 et pour tout a � 1,∫ a

1

1x2

dx = −1a

+ 1. On en déduit∫ +∞

1

1x2

dx = lima→+∞

−1a

+ 1 = 1 et donc∫ +∞

−∞f (x) dx = 1. Ainsi f est une densité de probabilité.

2. a. Les variables X et Y sont à valeurs dans [1, +∞[ donc U est à valeurs dans [1, +∞[

et V à valeurs dans R∗+. On a de plus UV = X2 et

UV

= Y 2 donc UV etUV

sont à

valeurs dans [1, +∞[. Cela montre que (U, V ) est à valeurs dans A.

b. Soit (u, v) ∈ A. Comme les variables X et Y sont indépendantes, une densité du couple(X, Y ) est (x, y) �−→ f (x)f (y). On en déduit que

F(u, v) = P([U � u] ∩ [V � v]) = P(

[XY � u] ∩[

XY

� v])

=∫∫

Df (x)f (y) dx dy,

où D = {(x, y) ∈ {1, +∞[2, xy � u,xy

� v}.

Soit x et y deux réels strictement positifs. Alors (x, y) ∈ D si x � 1, y � 1 etxv

� y � ux

. Pour que cela soit possible, il fautxv

� ux

, c’est-à-dire x � √uv.

Comme uv � 1, on obtient 1 � x � √uv et donc

D = {(x, y) ∈ R2, 1 � x �

√uv,

xv

� y � ux

, y � 1}.

Si v � 1, on a, pour x � 1, y � xv

� 1v

� 1 et

D = {(x, y) ∈ R2, 1 � x �

√uv,

xv

� y � ux}.

605

Page 613: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 11 – Couples de variables à densité

On en déduit

F(u, v) =∫ √

uv

1

(∫ ux

xv

1x2y2 dy

)dx =

∫ √uv

1

1x2

[−1

y

] ux

xv

dx

=∫ √

uv

1

(− 1

xu+

vx3

)dx =

[−1

uln x − v

2x2

]√uv

1

= −1u

ln√

uv − v2

(1uv

− 1)

= − 12u

ln uv − 12u

+v2·

Si v > 1, on obtient D = D′ ∪ D′′, où

D′ = {(x, y) ∈ R2, 1 � x � v, 1 � y � u

x}

D′′ = {(x, y) ∈ R2, v � x �

√uv,

xv

� y � ux}

et donc

F(u, v) =∫ v

1

(∫ ux

1

1x2y2

dy

)dx +

∫ √uv

v

(∫ ux

xv

1x2y2

dy

)dx

=∫ v

1

1x2

[−1

y

] ux

1

dx +∫ √

uv

v

1x2

[−1

y

] ux

xv

dx

=∫ v

1

(− 1

xu+

1x2

)dx +

∫ √uv

v

(− 1

xu+

vx3

)dx

=[−1

uln x − 1

x

]v

1

+[−1

uln x − v

2x2

]√uv

v

= −1u

ln v − 1v

+ 1 − 1u

ln√

uvv

− 12u

+12v

= − 12u

ln uv + 1 − 12v

− 12u

·

Si (u, v] /∈ A, on a u < 1, v < 1, uv < 1 ou u < v. On a alors dans les trois premiers cas

F(u, v) = P([U � u] ∩ [V � v]) = 0.

Si u < v, on obtient F(u, v) = P([U � u]).

c. La fonction F est de classe C2 sur R2 \ B, où

B = {(u, v) ∈ [1, +∞[2, u = v ou uv = 1 ou v = 1 ou u = 1}.

606

Page 614: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

L’ensemble B est d’aire nulle (c’est la réunion de deux demi-droites et d’une partied’une hyperbole). Si (u, v) /∈ B, on obtient

si (u, v) /∈ A, g(u, v) =∂2F∂u∂v

(u, v) = 0 ;

si (u, v) ∈ A et v < 1,∂F∂v

(u, v) = − 12uv

+12

et donc

g(u, v) =∂2F∂u∂v

(u, v) =1

2u2v;

si (u, v) ∈ A et v > 1,∂F∂v

(u, v) = − 12uv

+1

2v2et donc

g(u, v) =∂2F∂u∂v

(u, v) =1

2u2v·

Comme on peut choisir arbitrairement g sur B, on obtient le résultat voulu.

d. Pour obtenir les lois marginales, on intègre g par rapport à une des variables.La variable U est à valeurs dans [1, +∞[, donc fU (u) = 0 si u < 1 et pour u � 1,

fU (u) =∫ +∞

−∞g(u, v) dv =

∫ u

1u

12u2v

dv =1

2u2

(ln u − ln

1u

)=

ln uu2

·

La variable V est à valeurs dans ]0, +∞[, donc fV (v) = 0 si v � 0 et pour v > 0,

fV (v) =∫ +∞

−∞g(u, v) du. On a (u, v) ∈ A si u � 1, uv � 1 et u � v.

Si v � 1, cela équivaut à u � v et donc

fV (v) =∫ +∞

v

12u2v

du =[− 1

2uv

]+∞

v

=1

2v2·

Si 0 < v � 1, cela équivaut à u � 1v

et donc

fV (v) =∫ +∞

1v

12u2v

du =[− 1

2uv

]+∞

1v

=12·

On obtient

fV (v) =

⎧⎪⎪⎪⎨⎪⎪⎪⎩0 si v � 012

si 0 < v < 11

2v2 si v � 1.

Si u > 1 et1u

< v < 1, fU (u)fV (v) =ln u2u2

�= g(u, v) : les variables U et V ne sont pas

indépendantes.

607

Page 615: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergence de variables aléatoires

Chapitre 12

1. Si X est une variable aléatoire suivant la loi normale centrée réduite et F sa fonction

de répartition, on a F(x) =1√2p

∫ x

−∞e−

t2

2 dt. En divisant par√

2p, l’inégalité à démontrer

s’écrit donc F(x) �(

1 − 12x2

). Comme la variable X est centré et réduite, l’inégalité de

Bienaymé-Tchebychev s’écrit, pour x > 0,

P([|X| � x]

)� 1

x2.

On a, puisqu’une densité de X est paire,

P([|X| � x]

)= P

([X � x]

)+ P

([X � −x]) = 2P

([X � x]

)= 2(1 − F(x)).

Ainsi 2(1 − F(x)) � 1x2

et donc F(x) � 1 − 12x2

, ce qui est le résultat voulu.

2. 1. La variable aléatoire Zn,x est à valeurs dans �0, n�. Pour tout k ∈ �0, n�, l’évé-

nement Zn,x est la réunion des événements⋂i∈I

[Xi � x]⋂

i∈�1,n�/∈I

[Xi > x], pour toutes les

parties I de �1, n� de cardinal k. Par indépendance des variables un tel événement a pour

probabilité(F(x)

)k(1 − F(x)

)n−k.

Comme il y a(n

k

)choix pour la partie I de �1, n�, on obtient

P([Zn,x = k]) =(

nk

)(F(x)

)k(1 − F(x)

)n−k.

Ainsi Zn,x suit la loi binomiale de paramètre (n, F(x)) et

E(Zn,x) = nF(x), V (Zn,x) = nF(x)(1 − F(x)

).

On a, pour tout p ∈ [0, 1], p(1 − p) � 14

et donc V (Zn,x) � n4·

2. On en déduit que E(Tn,x) = F(x) et V (Tn,x) =1n2

V (Zn,x) � 14n

·On applique l’inégalité de Bienaymé-Tchebychev. Pour tout ´ > 0,

0 � P([|Tn,x − F(x)| � ´]

)= P

([|Tn,x − E(Tn,x| � ´]

)� V (Tn,x)

´2� 1

4n´2·

Par encadrement, on en déduit limn→+∞

P([|Tn,x − F(x)| � ´]

)= 0.

608

Page 616: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

3. 1. La variable Mn est à valeurs dans [0, 1] donc P([Mn � x]

)= 0 si x < 0 et 1 si

x > 1. Pour x ∈ [0, 1],

P([Mn � x]) = P

(n⋂

k=1

[XK � x]

)=

n∏k=1

P([Xk � x]

)= xn.

Comme

P([Yn � x]) = P([n(1 − Mn) � x]) = P([

Mn � 1 − xn

])= 1 − P

([Mn � 1 − x

n

]),

on en déduit

FYn (x) = P([Yn � x]) =

⎧⎪⎨⎪⎩1 − 1 = 0 si x < 0

1 −(

1 − xn

)nsi x ∈ [0, n]

1 − 0 = 1 si x > 1.

2. Pour x < 0, la suite(FYn (x)

)est nulle donc lim

n→+∞(FMn (x) = 0.

Pour x � 0, on a pour n > x, FYn (x) = 1−(

1 − xn

)n= 1− en ln(1− x

n ). Quand n tend vers

+∞,xn

tend vers 0 donc ln(

1 − xn

)∼ −x

net n ln

(1 − x

n

)∼ −x. On en déduit que

limn→+∞

FYn (x) = limn→+∞

1 −(

1 − xn

)n= 1 − e−x.

La suite (Yn) converge en loi vers une variable Z dont la fonction de répartition F estdéfinie par F(x) = 0 si x < 0 et F(x) = 1 − e−x pour x � 0, c’est-à-dire vers une variablequi suit la loi exponentielle de paramètre 1.

4. 1. a. La variable Sn, somme de n variables de Bernoulli de paramètre12

, indépen-

dantes, suit la loi binomiale de paramètre(

n,12

).

b. On a donc E(Sn) =n2

et V (Sn) =n4·

2. a. On déduit de la question précédente que

E(

Sn

n

)=

12

et V(

Sn

n

)=

V (Sn)n2

=14n

·

Soit ´ > 0. En appliquant l’inégalité de Bienaymé-Tchebychev à la variableSn

n, on

obtient

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � ´

])�

V(

Sn

n

)´2

� 14n´2

·

C’est l’inégalité demandé avec K´ =1

4´2·

609

Page 617: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergence de variables aléatoires

b. En prenant, pour n � 1, ´ =1nr

dans l’inégalité précédente, on obtient

0 � P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1nr

])� n2r

4n� 1

4n1−2r ·

Comme r <12

, on a 1 − 2r > 0. On en déduit limn→+∞

14n1−2r

= 0 et par encadrement

limn→+∞

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1nr

])= 0.

3. Comme Sn est une somme de variables aléatoires de même loi, la variable centrée réduite

associée àSn

n, c’est-à-dire Zn =

Snn − 1

21

2√

n

converge en loi vers une variable Z qui la loi

normale centrée réduite. On a pour n � 1,

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1√n

])= P

([|Zn| � 2

])= 1 − P

([|Zn| < 2

]).

On a donc

limn→+∞

P([∣∣∣∣Sn

n− 1

2

∣∣∣∣ � 1√n

])= 1 − P(|Z| < 2) �= 0.

5. On peut considérer que la probabilité qu’un mot soit mal orthographié est1

500· Le

nombre X de fautes dans un devoir contenant 200 mots suit une loi binomiale de paramètre(200,

1500

). Comme 200 > 30 et

1500

< 0, 1, on peut approcher la loi de X par un loi de

Poisson de paramètre l =200500

= 0, 4. On a donc

P([X � 5]) ≈ e−0,45∑

k=0

(0, 4)k

k!≈ 0, 99994.

6. Soit X le nombre de T-Shirts achetés. On a X ↪→ B(5 000, 0,4). Comme 5 000 � 30,5 000 × 0,4 � 5 et 5 000 × 0,6 � 5 on peut approcher la loi de X∗ par la loi normale centréeréduite.Soit n le nombre de T-Shirts dont on dispose, on cherche donc n tel que P(X > n) < 0,1, soit

P(

X − 2 000

20√

3>

n − 2 000

20√

3

)< 0,1 ⇔ P

(X∗ >

n − 2 000

20√

3

)< 0,1

⇔ 1 − F

(n − 2 000

20√

3

)< 0,1

⇔ F

(n − 2 000

20√

3

)> 0,9

Soit d’après la loi normale,n − 2 000

20√

3≈ 0,8159, c’est-à-dire n valant au moins

20√

3 × 0,8159 + 2 000 ≈ 2 029.

610

Page 618: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

7. Soit X le nombre de 6 obtenus sur les 9 000 lancers, on sait que X ↪→ B(9 000, 1/6).En approchant la loi de X∗ par la loi normale centrée réduite, on obtient

1. Sans correction de continuité,

P([1 400 � X � 1 600]) = P

⎛⎝⎡⎣1 400 − 1 500√9 000 × 5

36

� X∗ � 1 600 − 1 500√9 000 × 5

36

⎤⎦⎞⎠= P(−2, 83 � X∗ � 2, 83)≈ 2F(2, 83) − 1 = 2 × 0, 9977 − 1 ≈ 0, 9954.

2. Avec correction de continuité,

P(1 400 � X � 1 600) = P([1 399, 5 � X � 1 600, 5]

)= P

⎛⎝⎡⎣1 399, 5 − 1 500√9 000 × 5

36

� X∗ � 1 600, 5 − 1 500√9 000 × 5

36

⎤⎦⎞⎠= P

([−2, 84 � X∗ � 2, 84]

)≈ 2F(2, 84) − 1 = 2 × 0, 9977 − 1 ≈ 0, 9954.

C’est-à-dire la même valeur.

Par l’inégalité de Bienaymé-Tchebychev, on remarque que

P([1 400 � X � 1 600]

)= P

([|X − 1 500| � 100]

)= 1 − P([|X − E(X)| � 101]).

Or l’inégalité donne

P([|X − E(X)| � 101]) � V (X)1012

=√

1 250(101)2

≈ 3, 47

soitP([1 400 � X � 1 600]) � 1 − 3, 47 · 10−2 ≈ 0, 9965

8. La probabilité qu’un soldat ne soit pas dévoré est910

· Si on envoie n soldats, le nombre

de soldats qui arrivent sur l’autre rive suit la loi binomiale de paramètre (n; 0, 9). Pour n � 30,0, 1 n � 5 et 0, 9 n � 5 soit n � 50, on peut approcher la loi de X par la loi normale de

paramètre (0, 9 n; 0, 09 n) et donc la loi deX − 0, 9 n

0, 3√

npar la loi normale centrée réduite.

On veut que P([X � 300]) � 0, 95. On a

P([X � 300]) = P([

X − 0, 9 n0, 3

� 300 − 0, 9 n0, 3

√n

])≈ 1 − F

(300 − 0, 9 n

0, 3√

n

),

où F est la fonction de répartition de la loi normale centrée réduite.

Il faut F

(300 − 0, 9 n

0, 3√

n

)� 0, 05. Grâce à une table, on trouve F(1, 645) ≈ 0, 95 et donc

F(−1, 645) = 1−F(1, 645) ≈ 0, 05. Comme F est croissante, il faut300 − 0, 9n

0, 3√

n� −1, 645.

611

Page 619: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergence de variables aléatoires

Ainsi√

n est solution de l’inéquation

0, 9x2 − 0, 4935x − 300 � 0.

Les solutions de l’équation du second degré sont approximativement −17, 99 et 18, 53. Il fautprendre

√n � 18, 53, soit n � 344.

9. On note n le nombre de lignes installées et X le nombre d’employés qui téléphonentà l’instant un instant donné t. On cherche n tel que P([X � n]) � 0, 025.

La probabilité pour qu’un employé téléphone à l’instant t est660

=110

· Les appels des

employés étant supposés indépendants, X suit la loi binomiale B(

300,110

). L’espérance de

X vaut 300 · 110

= 30, et l’écart-type

√300 · 1

10· 9

10= 3

√3.

Posons X∗ =X − 30

3√

3· On peut approcher X∗ par loi normale N (0, 1). On note F la fonction

de répartition de la loi normale. On a

P([X � n]) = P([

X∗ � n − 30

3√

3

])≈ 1 − F

(n − 30

3√

3

).

Il faut choisir n tel que 1 − F

(n − 30

3√

3

)� 0, 025, c’est-à-dire F

(n − 30

3√

3

)� 0, 975. On

constate que F(1, 96) = 0, 975. Il faut doncn − 30

3√

3� 1, 96 soit n � 41. Il faut installer au

moins 41 lignes.

10. 1. Une somme de variables indépendantes, suivant une loi de Poisson, suit une loide Poisson dont le paramètre est la somme des paramètre des différentes variables aléatoires.Ainsi Sn suit une loi de Poisson de paramètre n.

2. On a donc

P([Sn � n]) =n∑

k=0

P([Sn = k]) =n∑

k=0

e−n nk

k!= e−n

n∑k=0

nk

k!·

3. On sait que E(Sn) = n et V (Sn) = n. D’après le théorème central limite, la variableSn − n√

nconverge en loi vers la loi normale centrée réduite. En appelant F la fonction de répartitionde celle-ci, on obtient

limn→+∞

P([Sn � n]) = limn→+∞

P([

Sn − n√n

� 0])

= F(0) =12

,

c’est-à-dire

limn→+∞

e−nn∑

k=0

nk

k!=

12.

612

Page 620: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

©D

unod

–L

aph

otoc

opie

non

auto

risé

ees

tun

déli

t

SOLU

TION

S

Solutions

11. 1. On a, pour tout k ∈ N, P([X = k]) =e−1010k

k!et P([X = k + 1]) =

e−1010k+1

(k + 1)!et donc

P([X = k + 1])P([X = k)

=10k·

On a donc P([X = 11]) = P([X = 10]), P([X = k + 1]) > P([X = k) si k < 10 etP([X = k + 1]) < P([X = k) si k > 10. Ainsi la suite

(P([X = k])

)croît si k � 10 décroît

si k � 11. Les valeurs de k ayant la probabilité maximale sont 10 et 11.

2. La probabilité qu’il y ait entre 7 et 12 œufs pondus en 15 minutes est

P([7 � X � 15]) =12∑

k=7

e−1010k

k!≈ 0, 66.

3. On fait l’hypothèse que les états des différents œufs (déclassés ou non) sont indépendants.Alors YN suit la loi binomiale de paramètre (N ; 0, 03).

4. a. Ici, YN suit la loi B(4 000; 0, 03). On a E(YN ) = 4 000 · 0, 03 = 120 etV (Y ) = 4 000 · 0,03 · 0,97 = 116,4. On peut approcher YN par une variable Zsuivant une loi normale de même espérance et de même variance, c’est-à-dire une loiN (120, 116,4). On a, pour tout réel x,

f (x) =1√

232,8pe−

(x−120)2

232,8 et F(x) =∫ x

−∞

1√232,8p

e−(t−120)2

232,8 dt.

b. La fonction F est dérivable de dérivée f , donc w est dérivable et, pour tout réel x,

w′(x) = f (x + h) − f (x − h) =1√

232,8p

(e−

(x+h−120)2

232,8 − e−(x−h−120)2

232,8

).

Comme la fonction exponentielle est strictement croissante w′(x) a le signe deg(x) = −(x + h − 120)2 + (x − h − 120)2 = −(2x − 240)(2h) = −4h(x − 120). Ainsiw′(x) = 0 si x = 120 , w′(x) > 0 si x < 120 et w′(x) < 0 si x > 120. La fonction wcroît sur ] − ∞, 120] et décroît sur [120, +∞[. La fonction w possède un maximumobtenu en 120.

Notons 2h l’amplitude fixée de l’intervalle [a, b], i.e. 2h = b − a et x =a + b

2· On a

alors x = a− h et b = x + h. Comme on approche YN par Z de fonction de répartitionF, on remplace P([a � YN � b]) par

P([a � Z � b]) = F(b) − F(a) = F(x + h) − F(x − h) = w(x).

Cette probabilité est maximale pour x = 120, c’est-à-dire pour a = 120 − h etb = 120 + h.

c. On prend donc x = 120. On cherche h minimal tel que a = 120 − h etb = 120 + h, tel que P([a � YN � b] > 0, 95. On a remplacé P([a � YN � b] par

w(x) = w(120) = P([120 − h � Z � 120 + h]). La variableZ − 120√

116,4suit la loi

613

Page 621: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Chapitre 12 – Convergence de variables aléatoires

normale centrée réduite de fonction de répartition F. On a donc

P([120 − h � Z � 120 + h]) = P([

− h√116,4

� Z − 120√84

� h√116,4

])= F

(h√

116,4

)− F

(− h√

116,4

)= 2F

(h√

116,4

)− 1.

On cherche donc h tel que 2F

(h√

116,4

)− 1 � 0, 95, c’est-à-dire

F

(h√

116,4

)� 0, 975. Comme F(1, 96) = 0, 975 et que F croît, il faut

h√116,4

� 1, 96. La valeur minimale de h est

h = 1, 96√

116,4 ≈ 11,4.

614

Page 622: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Index

absolue convergence, 101adhérence, 120adhérent, 120application

linéaire, 24partielle, 124

approximation d’une loibinomiale par une loi de Poisson,

398binomiale par une loi normale, 401de Poisson par une loi normale, 401hypergéométrique par une loi bino-

miale, 397automorphisme, 35

base, 9canonique, 10

Bêta (fonction), 176boule

fermée, 125ouverte, 125

champ de vecteurs, 145Chasles (relation de), 153, 163classe

C1, 127composition, 129, 130opérations algébriques, 127, 129

C2, 138composition, 139opérations algébriques, 139

coefficient de corrélation linéaire, 303,387

combinaison linéaire, 3comparaison série-intégrale, 159continuité, 122

application partielle, 124opérations, 123polynôme, 123

convergenceabsolue, 170en loi, 396série, 83

couple à densité, 361covariance, 300, 384critères de comparaison, 157, 164

développement décimal d’un réel, 90densité

de probabilité, 314du couple, 362

dérivée partielle, 126seconde, 138

différentielle, 143forme, 143

classe, 143composante, 144exacte, 144fermée, 144primitive, 144travail, 145

notation, 142

Page 623: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Index

dimension, 12domaine élémentaire, 179droite

de régression, 149vectorielle, 15

écart-type, 336endomorphisme, 24équiprobabilité, 206espérance, 248espace

probabilisé, 200probabilisable, 197

espace vectoriel, 1de dimension finie, 11

événement(s), 195, 197certain, 195élémentaire, 195impossible, 195incompatibles, 196

extrema, 134point critique, 134

famillede vecteurs, 2génératrice, 7liée, 8libre, 8sommable, 111

fonctionclasse C1, 127classe C2, 138de répartition, 234

d’une variable à densité, 315du couple (X, Y ), 361

formulede Bayes, 220de Kœnig-Huygens, 257, 334des probabilités composées, 213des probabilités totales, 217du crible ou de Poincaré, 207

Gamma (fonction), 175Gauss (intégrale de), 174gradient, 127

homothétie, 58

image, 26indépendance, 351

d’une famille d’événements, 224de variables aléatoires, 287entre deux événements, 222linéaire, 8

inégalitéde Bienaymé-Tchebychev, 393de Markov, 393

intégrale(s)d’Euler, 174de Gauss, 174, 188double, 176doubles impropres, 184généralisées, 152impropre, 151, 160, 161

isomorphisme, 29

limitecomposition, 121définition, 120opérations algébriques, 122

loi(s)binomiale, 262conditionnelle, 284conjointe, 280de Bernoulli, 261de Morgan, 196de probabilité, 199exponentielle, 340faible des grands nombres, 394géométrique, 265hypergéométrique, 263marginale, 282marginales, 282normale centrée réduite, 345normale générale, 348Poisson, 271uniforme, 261, 337

616

Page 624: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Index

matriced’une application linéaire, 39d’une famille de vecteurs, 38de passage, 51diagonalisable, 63semblable, 54symétrique, 4, 64transposée, 64

maximum, 134minimum, 134moments d’une variable

à densité, 332aléatoire discrète, 255

monôme (plusieurs variables), 123

notation différentielle, 142noyau, 27

ouvert, 125

pavé de R2, 176

plan vectoriel, 15point critique

col, point selle, 134extrema, 134

polynôme(s), 123annulateur, 78de Lagrange, 23monôme, 128plusieurs variables, 123

possible, 194probabilité, 199

conditionnelle, 212uniforme, 206

produit de convolution, 371

rangd’une application linéaire, 30d’une famille de vecteurs, 30d’une matrice, 46

règle des chaînes, 131reste, 84Riemann (intégrales de), 157, 164

sans mémoire, 343scalaire, 2série, 82

absolument convergente, 101, 109alternée, 87comparaison avec une intégrale, 95convergente, 83« dérivée » d’une série géométrique,

104divergente, 83exponentielle, 102géométrique, 88harmonique, 84harmonique alternée, 86reste, 84Riemann, 96somme, 83somme partielle, 82télescopique, 88

sommable, 111sommation par paquets, 94somme, 83

de deux sous-espaces vectoriels, 15de variables indépendantes, 371directe, 16partielle, 82

sous-espacepropre, 55supplémentaire, 17

spectre, 55stabilité

de la loi normale, 372des lois binomiales et de Poisson

pour la somme, 295Stirling, 99système complet d’événements, 199

théorèmeapproximation, 128composition des fonctions C1, 129,

130composition des fonctions C2, 139de Bernoulli, 395de comparaison, 159

617

Page 625: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Index

de comparaison (séries), 91de Fubini, 184de la base incomplète, 13de la limite centrée, 399de transfert, 253, 331des chaînes, 131du rang, 31Fubini (séries), 109Poincaré, 147, 150règle des équivalents, 92Schwarz, 139

tribu, 197

univers, 194

valeur propre, 55variable à densité, 351variable aléatoire, 233, 343

centrée, 252, 329constante, certaine, 239discrète, 237indicatrice d’un événement, 239réelle à densité, 313

variance, 257, 333vecteur

colinéaire, 8composantes d’un, 9coordonnées d’un, 9propre, 55

618

Page 626: MATHÉMATIQUES TOUT-EN-UN BCPST 2e année

Cet ouvrage couvre en un seul volume la totalité du programmede mathématiques de la 2e année des classes préparatoiresBCPST.

Conçu comme un ouvrage de référence, ce livre propose aulecteur une vision globale du cours dans le strict respect desprogrammes.

À la fin de chaque chapitre, de nombreux énoncés d’exercicescomplètent le cours et permettent au futur candidat de s’entraînerefficacement dans l’optique du concours.

Tous les exercices sont corrigés de façon détaillée à la fin del’ouvrage.

J’INTÈGRE

MATHÉMATIQUES

PHYSIQUE

CHIMIE

SCIENCES DE LA VIE

SCIENCES DE LA TERRE

www.dunod.com

Sous la direction de Christian Gautier et André WarusfelFrançois Lussier • Gonzague de Monicault • SergeNicolas • Monique Ramis • Bruno Caminade

MATHÉMATIQUES TOUT-EN-UN • BCPST 2e ANNÉECours et exercices corrigés

CHRISTIAN GAUTIER

ancien élève de l’Écolenormale supérieure deSaint-Cloud, est professeurau lycée La Bruyère àVersailles.

ANDRÉ WARUSFEL

ancien élève de l’Écolenormale supérieure de larue d’Ulm, a étéprofesseur deMathématiques Spécialesau lycée Louis-le-Grand àParis et Inspecteur généralde mathématiques.

ISBN 978-2-10-053976-5