88
Statistiques et Probabilités 2001/2010 Pierre L.Douillet 7 décembre 2016

Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Statistiques et Probabilités2001/2010

Pierre L.Douillet

7 décembre 2016

Page 2: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Ces évaluations ont été données en 2001-20XX pour le module statstant en promotion A1 qu’en promotion E1.

— Les url des documents ont été modifiés pour suivre la réorganisation du site.— Dans le but de coller au mieux aux réalités industrielles, l’usage des documents personnels,

en particulier des notes de cours, a toujours été autorisée (et en fait encouragée) pendant lesévaluations.

— Pour les trois années 2001-2004, l’évaluation s’est faite par un devoir surveillé avec usage descalculatrices personnelles.

— Pour les années suivantes, l’évaluation s’est faite sous forme de "travaux surveillés" surordinateur, un étudiant par ordinateur, et un nombre suffisant de "surveillants" (l’enseignantet les chargés de TD).

— Durant les trois années 2004-07, le logiciel utilisé pour les TD et les évaluations étaitMaple, avec une feuille de calcul issue des TD: simul.mws. Version de l’époque http://www.douillet.info/~douillet/mathapp/maple/simul09.mws. Version Maple 18: http://www.douillet.info/~douillet/mathapp/maple/simul18.mws.

— Durant les années 2007-10, le logiciel utilisé pour les TD et les évaluations était Scilab, avecune feuille de calcul issue des TD: stats.sce.

— En 2005-2007, la taille de la promotion E1 a nécessité deux sessions successives, de 08h00 à10h15 et de 10h15 à 12h15, avec des valeurs numériques différentes.

— En 2007-10, il y a eu trois sessions d’affilée avec, ici encore, des énoncés légèrement différents,chacun d’eux étant protégé par un mot de passe donné en début d’évaluation.

— Comme on l’imagine, tout cela a supposé à la fois un parc informatique conséquent...et lamobilisation des personnels du centre informatique. Qu’ils soient à nouveau remerciés pourleur compétence et leur engagement.

Page 3: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Table des matières

Table des Matières 3

Table des Figures 7

— 2001-2002 — 9

1 DS1 E1-01 (01, corrigé) 91.1 Loi binomiale (durée conseillée : 20 mn) . . . . . . . . . . . . . . . . . . . . . . . . . 91.2 Corrélation (durée conseillée : 40 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 projet E1-01 (02, corrigé) 132.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.2 Loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.3 Approximations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 DS2 E1-01 (03, corrigé) 153.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2 Loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.3 Approximations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

— 2002-2003 — 19

4 A1-02 entraînement (04, sujet) 194.1 Statistiques univariées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194.2 Corrélation (données simples) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194.3 Corrélation (données groupées) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

5 DS A1-02 2002-12-10 (05, corrigé) 215.1 Statistiques univariées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215.2 Corrélation (données simples) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225.3 Corrélation (données groupées) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

6 E1-02 entraînement (06, sujet) 256.1 Calculs élémentaires (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256.2 Loi binomiale et loi de Poisson (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . 256.3 Corrélation (40 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266.4 Probabilités (20 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

7 DS E1-02 2003-01-27 (07, corrigé) 277.1 Calculs élémentaires (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277.2 Loi binomiale et loi de Poisson (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . 287.3 Corrélation (40 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297.4 Probabilités (20 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3

Page 4: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

TABLE DES MATIÈRES 4

8 DS E1-02s 2003-09-08 (08, sujet) 318.1 Calculs élémentaires (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318.2 Loi binomiale et loi de Poisson (30 mn) . . . . . . . . . . . . . . . . . . . . . . . . . 318.3 Corrélation (40 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328.4 Probabilités (20 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

9 DS A1-02s 2003-09-19 (09, sujet) 339.1 Statistiques univariées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339.2 Corrélation (données simples) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339.3 Corrélation (données groupées) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

— 2003-2004 — 35

10 DS A1-03 2004-03-03 (10, sujet) 3510.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3510.2 Loi binomiale et loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3510.3 Corrélation (40 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3610.4 Probabilités (20 mn) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

11 DS E1-03 2004-05-04 (12, sujet) 3711.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3711.2 Loi binomiale et loi de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3711.3 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3811.4 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

12 DS AE1-03s 2004-09-07 (13, sujet) 3912.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3912.2 Loi binomiale et loi de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3912.3 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4012.4 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

— 2004-2005 — 41

13 DS E1-04 2005-05-04 (15, corrigé) 4113.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4113.2 Loi de la somme de deux variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4213.3 Loi binomiale et loi de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4313.4 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4413.5 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

14 DS A1-04 2005-06-20 (16, sujet) 4714.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4714.2 Loi binomiale et loi de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4814.3 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4814.4 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

15 DS AE1-04s 2005-09-06 (17, sujet) 4915.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4915.2 Loi de la somme de deux variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5015.3 Loi binomiale et loi de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5015.4 Corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

— 2005-2006 — 51

Page 5: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

5 TABLE DES MATIÈRES

16 DS E1-05 2006-05-29 (19, sujet) 5116.1 Série temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5116.2 Régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

17 DS A1-05 2005-06-16 (20, sujet) 5317.1 Calculs élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5317.2 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5317.3 Transformée de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

18 DS AE1-05 2006-09-06 (21, sujet) 5518.1 Série temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5518.2 Régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

— 2006-2007 — 57

19 DS E1-06 2007-05-07 (22, sujet) 5719.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5719.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5719.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5719.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

20 DS A1-06 2007-06-27 (23, sujet) 5920.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5920.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5920.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5920.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

21 DS AE1-06s 2007-09-04 (25, sujet) 6121.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6121.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6121.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6121.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

— 2007-2008 — 63

22 A1-07 entraînement (26, sujet) 6322.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6322.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6322.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6422.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

23 DS A1-07 2007-12-12 (27, sujet) 6523.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6523.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6523.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6623.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

24 DS E1-07 2008-01-23 (28abc, corrigé) 6724.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6824.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6824.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6924.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

Page 6: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

TABLE DES MATIÈRES 6

25 DS AE1-07s 2008-09-03 (29, sujet) 7325.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7325.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7425.3 Somme de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7425.4 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

— 2008-2009 — 75

26 DS A1-08 2008-12-10 (30, sujet) 7526.1 Lois de probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7526.2 Loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7526.3 Régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

27 DS E1-08 2009-01-21 (31abcd, sujet) 7727.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7727.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7827.3 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7827.4 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7827.5 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

28 DS AE1-08s 2009-09-03 (32, sujet) 7928.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7928.2 Usage des tables de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7928.3 Loi binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7928.4 Loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8028.5 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

— 2009-2010 — 81

29 DS E1-09 2010-01-19 (33abc, corrigé) 8129.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8229.2 Lecture d’un histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8329.3 Écriture d’un histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8329.4 Série génératrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8429.5 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

30 DS AE1-09s 2010-09-03 (34, sujet) 8730.1 Regroupement de deux populations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8730.2 Lecture d’un histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8730.3 Écriture d’un histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8830.4 Série génératrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8830.5 Droite de régression affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Page 7: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Table des figures

1.1 Histogrammes (en gras: la loi exacte). . . . . . . . . . . . . . . . . . . . . . . . . . . 101.2 Détermination de l’optimum de ε (λ). . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Droite de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

5.1 Diagrammes des effectifs cumulés versus histogramme. . . . . . . . . . . . . . . . . . 215.2 Données brutes (à gauche) et corrélation (à droite). . . . . . . . . . . . . . . . . . . . 235.3 tableau de calcul. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

13.1 La convolution donne un trapèze isocèle. . . . . . . . . . . . . . . . . . . . . . . . . . 4313.2 Loi binomiale et loi de Gauss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4413.3 Corrélation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

24.1 Les X et les Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7024.2 Football et régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

29.1 Somme de 5 événements (courbe lissée et loi normale) . . . . . . . . . . . . . . . . . 85

7

Page 8: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

TABLE DES FIGURES 8

Page 9: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 1

DS1 E1-01 (01, corrigé)

– durée : 1h –

1.1 Loi binomiale (durée conseillée : 20 mn)

On considère n = 8 variables de Bernoulli indépendantes X1, X2, · · · , X7, X8 chacune d’ellesayant une probabilité de succès p .

= Pr (Xj = 1) = 0, 2. On sait que la variable X = X1 + X2 +· · ·+X7 +X8 suit une loi binomiale.

1. Donner la formule de Pr (X = k).On a Pr (X = k) =

(8k

)(0.2)k (0.8)8−k

2. Donner les valeurs à trois décimales de Pr (X = k) pour k = 0, 1, · · · , 8. On donnera lesdétails des calculs pour Pr (X = 4) et on négligera les valeurs inférieures à 10−3.

(a) Pour X = 4, on a Pr (X = 4) = 8.7.6.51.2.3.4 × (0.2)4 × (0.8)4 ≈ 0.046

(b) On trouve successivement 0 1 2 3 4 5 6 7 8.168 .336 .294 .147 .046 .009 .001 .000 .000

. Bien

entendu, le total vaut 1 (en fait on trouve 1.001 et l’on corrige le nombre "le plus arrondi",ici .337, que l’on diminue d’un millième.

3. Rappeler les formules de calcul de l’espérance et de la variance d’une variable aléatoire dis-crète.On a µ = E (X) =

∑k Pr (X = k) et σ2 = E

(X2)− µ2

4. Utiliser les formules de Q3 et les valeurs de Q2 pour calculer des valeurs approchées E (X) etvar (X). Comparer avec les valeurs exactes (rappeler les formules valables pour une variablesuivant la loi binomiale). Un histogramme est demandé.

(a) On a donc µ = (0× .168 + 1× .336 + 2× .294 + · · · ) = 1.599.

(b) De même σ2 =(02 × .168 + 12 × .336 + 22 × .294 + · · ·

)− µ2 = 1.274.

(c) Ces valeurs sont à comparer avec les valeurs exactes, qui sont µ = n p = 1.6 et σ2 =n p q = 1.28. La deuxième série de calculs, qui est plus longue, engendre des erreursd’arrondi plus importantes.

5. La table ci-dessous donne les valeurs de Pr (X = x) pour des variables de Poisson ayant pourparamètres 1.2, 1.4 et 1.6. Quel est le lien entre cette question et les autres ? Quelle est lameilleure valeur possible pour le paramètre ?

x = 0 x = 1 x = 2 x = 3 x = 4 x = 5 x ≥ 6

Poiss (1.2) .301 .361 .217 .087 .026 .006 .001

Poiss (1.4) .247 .345 .242 .113 .039 .011 .003

Poiss (1.6) .202 .323 .258 .138 .055 .018 .005

9

Page 10: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№1.DS1 E1-01 (01, corrigé) 10

(a) On sait que le comportement limite, pour n → ∞, d’une variable binomiale dépend ducomportement de n p. Dans les cas où n p → λ, le comportement limite est décrit parune loi de Poisson de paramètre λ. Dans le cas où σ →∞, le comportement limite de lavariable réduite est décrit par la loi normale.

(b) Pour n = 8, on est de toutes les façons loin de n → ∞. Le modèle de Poisson n’est pasdéraisonnable vu que p est petit. En ce cas, le choix de λ = n p = 1.6 est le plus naturel.On constate en tout cas que la ligne λ = 1.6 correspond le mieux aux valeurs trouvéesprécédemment (la Figure 1.1 donne, en gras, la loi exacte –binomiale– et, en grisé, lemodèle de Poisson correspondant à λ = 1.6).

P

N

0

0.3

0 4 8

Figure 1.1 – Histogrammes (en gras: la loi exacte).

6. En appelant µ (k) la valeur de Pr (X = k) trouvée à la question 2 et ϕ (k) la valeur dePr (X = k) correspondant à la loi de Poisson de paramètre λ = 1.2, le calcul numérique de

ε =√

19

∑8k=0 (µ (k)− ϕ (k))2 donne ε ≈ 0.056. Est-ce beaucoup ou pas beaucoup ? Autre-

ment dit, à quelle quantité peut-on comparer ε pour se faire une opinion ?

(a) On peut comparer à l’écart-type des 9 valeurs de µ (k) qui est de 0.1245. L’écart moyenentre la loi exacte et son modèle approché est donc inférieur de plus de moitié à la"variabilité naturelle" de cette loi.

(b) On peut comparer à la valeur de ε obtenue pour λ = 1.6, qui est 0.0178 (on retrouve lefait que le choix de λ = 1.6 est plus naturel que le choix λ = 1.2).

7. Compléments de réponse à la question 6

(a) On peut aussi se demander quelle est la valeur de λ qui minimise ε. On trouve λ = 1.68,conduisant à εmin = 0.0156. Ce léger décalage par rapport à la valeur λ = n p est du aufait que la loi de Poisson autorise des valeurs supérieures à X = 8, qui sont évidemmentimpossibles pour la loi binomiale.

(b) On peut aussi se demander quelle est la valeur de ε associée au modèle normal, c’est àdire Pr (X = k) = F (z (k + 0.5))− F (z (k − 0.5)), qui donne les valeurs

.134, .299, .322, .167, .041, .005, .000, .000, .000

On obtient εnorm = 0.0202, c’est à dire à peine moins bien que le modèle de Poissonoptimal. Cela tient au fait que le choix de n = 8 ... permet de faire les calculs en tempslimité, mais n’est pas un bon modèle de n→∞ !

Page 11: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

11 №1.DS1 E1-01 (01, corrigé)

0

0.1

1 1.68 2

Figure 1.2 – Détermination de l’optimum de ε (λ).

1.2 Corrélation (durée conseillée : 40 mn)

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 3) = 0.05.

↓ y x→ 1 3 4 51 .05 .05 .05 .05

3 .1 .05 .05 .05

4 .1 .1 .1

1. Déterminer Pr (X = 1, Y = 4).La somme des probabilités faisant 1, on voit que Pr (X = 1, Y = 4) = .25.

2. Que valent Pr (X = 5 | Y = 1) et Pr (X = 5 | Y = 2) ?

(a) Lorsque Y = 1, les quatre valeurs possibles pour X sont équiprobables etPr (X = 5 | Y = 1) = 1/4 = .25.

(b) La valeur Y = 2 n’étant pas atteinte, la probabilité conditionnelle n’est pas définie.

3. Les variables X et Y sont-elles indépendantes ?Si les variables étaient indépendantes, les conditionnements de X par les différents Y seraientidentiques. Comme Y = 1 induit la loi uniforme pour X et que ce n’est pas le cas pour, parexemple, Y = 3 on en conclut qu’il y a dépendance entre les deux variables.

4. Donner la distribution marginale de X, son espérance et sa variance.Le tableau de calcul se présente comme suit.

↓ x y → 1 3 4∑

y p x∑

y p∑

y y p x∑

y y p x2∑

y p

1 .05 .10 .25 .40 .40 1.35 1.35 .40

3 .05 .05 .10 .20 .60 .60 1.80 1.80

4 .05 .05 .10 .20 .80 .60 2.40 3.20

5 .05 .05 .10 .20 .60 3.00 5.00∑x p .20 .25 .55 1.00 10.40

y∑

x p .20 .75 2.20 3.15∑x x p .65 .70 1.45 2.80

y∑

x p .65 2.10 5.80 8.55

y2∑

x p .20 2.25 8.80 11.25

Page 12: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№1.DS1 E1-01 (01, corrigé) 12

(a) On a E (X) =∑

xy x pxy. Le calcul∑

x

(x∑

y pxy

)consiste à obtenir E (X) comme

l’espérance de la distribution marginale. C’est le plus facile. Le calcul∑

y (∑

x x pxy)permet de contrôler ce résultat... et aussi de contrôler les

∑x x p qui seront utilisés par

la suite. On trouve E (X) = 2.8.

(b) On trouve E(X2)

= 10.40 et donc var (X) = 10.40− (2.8)2 = 2.56.

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

(a) Pour E (Y ), les deux modes de calcul donnent E (Y ) = 3.15.

(b) On obtient en outre E(Y 2)

= 11.25 et donc var (Y ) = 11.25− (3.15)2 = 1.3275

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

(a) Le tableau donne deux calculs de E (X Y ). En tant que∑

x

(x∑

y y pxy

)et en tant que∑

y (y∑

x x pxy). On trouve E (XY ) = 8.55. D’où cov (X, Y ) = 8.55 − (2.8× 3.15) =−.27.

(b) Le coefficient de corrélation est r = covσx σy

= (−.27)÷ (2.56× 1.3275) ≈ −.146

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un dessin.

(a) On obtient a = covvar(X) ≈ −.1055, et la droite de tendance s’écrit yprev = E (Y ) +

a (x− E (X)), soit yprev = 3.15− 0.1055 (x− 2.8).

(b) La réécriture de ce résultat sous la forme y = 3.44 − 0.11x est discutable, car y = 0 sesitue en dehors de la distribution.

1

3.15

4

1 2.8 5

Figure 1.3 – Droite de régression

8. Obtient-on une réduction de variance significative ?Le facteur de réduction de variance est 1 − r2 ≈ 0.98. Autant dire que la variance n’a pasbougé, c’est à dire que X n’apporte pas grand chose pour la prévision de Y .

Page 13: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 2

projet E1-01 (02, corrigé)

2.1 Calculs élémentaires

1. Calculez Pr (X > 25) si X est une v.a. Norm (23 ; 1.5). Que valent E (X) et var (X) ?

(a) Par définition E (X) = 23 et σ = 1.5. On a donc var (X) = σ2 = 2.25.(b) Passant à la variable réduite, X = 25 équivaut à Z = 23−23

1.5 = 1.333. On lit sur la tablePr (Z < 1.333) = 0.9088. Passant au complément, il vient Pr (25 < X) = 0.0912, soit 9chances sur 100.

2. Calculez Pr (Y > 2) si Y est une v.a. Poiss (2). Que valent E (Y ) et var (Y ) ?

(a) Par définition E (Y ) = limn p = λ = 2. Et l’on a var (Y ) = limn p q = λ = 2.(b) Les valeurs possibles pour Y sont les nombres entiers. L’événement 2 < Y est donc le

complémentaire de Y ∈ {0, 1, 2}, dont la probabilité est(λ0

0! + λ1

1! + λ2

2!

)exp (−λ) ≈

(1 + 2 + 2) exp (−2) ≈ 0.6767, soit deux chances sur trois. L’événement voulu a donc uneprobabilité d’une chance sur trois.

(c) Un calcul rapide montre que les chances respectives des y ∈ N sont proportionnelles à1, 2, 2, 4

3 ,23 ,

415 ,

445 , · · · . Les chances de l’événement favorable sont donc de 7

3 et quelqueslorsque les chances de l’événement défavorable sont de 5. Un rapport de 1 contre 2 cor-respond bien à une probabilité de une chance sur trois.

3. Calculez Pr (V ≤ 1) si V est une v.a. Bin (6 ; 0.2). Que valent E (V ) et var (V ) ?

(a) On a n = 6, p = 0.2. D’où E (V ) = n p = 1.2 et var (V ) = n p q) = 6× .2× .8 = 0.96.(b) La probabilité de V ≤ 1 est la somme des probabilités de V = 0 et de V = 1 (événements

incompatibles). On a donc Pr (V ≤ 1) =(60

)p0q6 +

(61

)p1q5 ≈ .2622 + .3932 ≈ .6553 soit

deux chances sur trois.

2.2 Loi normale

1. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (41, 8), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 53 ans ; (b) au moins 35 ans ;(c) entre 25 et 49 ans ?

(a) X = 53 correspond à Z = 53−418 = 1.5. On lit dans la table que Pr (Z ≤ 1.5) = .9332.

Donc 93%.(b) X = 35 correspond à Z = 35−41

8 = −0.75. On lit dans la table que Pr (Z ≤ +0.75) vaut.7734. Et par symétrie, Pr (−0.75 ≤ Z) = 0.7734, soit 77%.

(c) Les événements X ≤ 25 et 25 < X ≤ 49 sont incompatibles, et leur réunion est X < 49.On a donc Pr (25 < X ≤ 49) = Pr (X ≤ 49) − Pr (X ≤ 25). Passant en Z, on a Z2 =49−41

8 = 1 et Z1 = 25−418 = −2. La table donne directement les probabilités en Z et l’on

a donc Pr (25 < X ≤ 49) = .8413− .0227 = .8186.

13

Page 14: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№2.projet E1-01 (02, corrigé) 14

2. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.35 et Pr (15 < X) =0.16. Déterminer µ et σ.

(a) On détermine a tel que Pr (Z < a) = 0.35 et b tel que Pr (Z < b) = 1− 0.16. On trouvea = −.3853 et b = +.9945.

(b) On a donc 8 = µ+ a σ et 16 = µ+ b σ, ce qui se résout en µ ≈ 9.955 et σ ≈ 5.073.

3. Les âges d’un groupe d’étudiants sont répartis suivant la loi Norm (22, 2). Quel est l’âgemoyen du tiers le plus jeune ?

(a) Le tiers le plus jeune correspond à Pr (Z < a) = 0.3333. La table donne a ≈ −0.4307.La valeur correspondante pour X est 22 + 2a ≈ 21.14.

(b) La question posée est de calculer la moyenne µ des Z conditionnés par l’événement Z < a.On a donc µ =

∫ a−∞

t f(t)∫ a−∞ f(x) dx

dt =∫ a−∞ t f (t) dt÷ 1

3 avec f (t) = 1√2π

exp(− t2

2

).

(c) Le changement de variable u = −12 t

2 conduit à∫ t=a

−∞exp

(− t

2

2

)t dt =

∫ u=∞

12a2− exp (−u) du = − exp

(−1

2a2)≈ −0.9114

soit µ = −0.9114 ÷(3√

2π)≈ −1.0908. La valeur correspondante pour les âges est

X = 22− 2× 1.0908 ≈ 19.82 années.

2.3 Approximations

1. La variable X suit une loi binomiale de paramètres n = 7, p = 0.3. Quelle est la probabilité desévénements E1 : X ∈ {0, 1}, E2 : X ∈ {2, 3}, E3 : X ∈ {4, 5} et enfin E4 : X ∈ {6, 7}.

(a) On a, par définition, Pr (X = k) =(nk

)pk (1− p)n−k. On en déduit les probabilités voulues

: .3294, .5446, .1222, .0038...

(b) La somme vaut 1 (on a fait basculer "le plus gros arrondi" pour obtenir exactement 1, etpas .9999)

2. Décrire le procédé d’approximation par la loi de Gauss, et en donner les résultats.

(a) Le procédé commence par remplacer X = k par k− 12 < X < k+ 1

2 (donnant l’épaisseurvoulue aux barres de l’histogramme).

(b) On passe ensuite à la variable réduite Z = X−n p√n p q . Les seuils −0.5, 1.5, 3.5, 5.5, 7.5 de-

viennent −2.1444, −0.4949, 1.1547, 2.8043, 4.4538.

(c) On conclut en calculant les différences −Pr (Z < −2.1444) + Pr (Z < −0.4949) etc., quidonnent : .2943, .5655, .1259, .0026

3. L’approximation obtenue est-elle convenable ? Commenter.

(a) L’approximation de Gauss est liée au passage à la limite n p q →∞... et ici n p q = 1.47 !On est donc bien loin du domaine de validité.

(b) Ce qui est donc remarquable est que les ordres de grandeur soient quand même corrects(phénomène lié au fait que p ≈ 0.5).

Page 15: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 3

DS2 E1-01 (03, corrigé)

– durée : 1h –

3.1 Calculs élémentaires

1. Calculez Pr (23 < X) si X est une v.a. Norm (20 ; 2.5). Que valent E (X) et var (X) ?

(a) Par définition E (X) = 20 et σ = 2.5. On a donc var (X) = σ2 = 6.25.

(b) Passant à la variable réduite, X = 23 équivaut à Z = 23−202.5 = 1.2. On lit sur la table

Pr (Z < 1.2) = .8849. Passant au complément, il vient Pr (23 < X) = .1151, soit unechance sur 9.

2. Calculez Pr (Y > 2) si Y est une v.a. Poiss (3). Que valent E (Y ) et var (Y ) ?

(a) Par définition E (Y ) = limn p = λ = 3. Et l’on a var (Y ) = limn p q = λ = 3.

(b) Les valeurs possibles pour Y sont les nombres entiers. L’événement 2 < Y est donc lecomplémentaire de l’événement Y ∈ {0, 1, 2}, dont la probabilité est(

λ0

0!+λ1

1!+λ2

2!

)exp (−λ) ≈

(1 + 3 +

9

2

)exp (−3) ≈ .4232

La probabilité du complémentaire est donc .5768, soit 4 chances sur 7.

3. On mélange une population de N1 = 25 individus, ayant une moyenne µ1 = 13 et un écart-type σ1 = 3 avec une population de N2 = 35 individus, ayant une moyenne µ2 = 11 et unécart-type σ2 = 4. Déterminer la moyenne et l’écart-type de la population totale.

(a) Indexons par 0 ce qui concerne la population totale. Par définition, on a∑

j x = nj µj et,

par la formule de Koenig, on obtient∑

j x2 = nj

(σ2j + µ2j

). Ces formules sont valables

pour j = 0, 1, 2.

(b) Il est clair que∑

0 =∑

1 +∑

2. On obtient donc n0 = n1 + n2 = 60. Puis∑

0 x =13× 25 + 11× 35, conduisant à µ0 = 71/6 ≈ 11.83. Et enfin

∑0 x

2 =(132 + 32

)× 25 +(

112 + 42)× 35 = 9245, qui conduit à σ20 = 506/36.

(c) On pouvait aussi utiliser directement les formules :

µ =n1µ1 + n2µ2n1 + n2

, σ2 =n1σ

21 + n2σ

22

n1 + n2+n1 (µ1 − µ)2 + n2 (µ2 − µ)2

n1 + n2

15

Page 16: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№3.DS2 E1-01 (03, corrigé) 16

3.2 Loi normale

1. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (39, 7), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; (b) au moins 35 ans ;(c) entre 26 et 49 ans ?

(a) X = 51 correspond à Z = 51−397 ≈ 1.714. La table donne Pr (Z ≤ 1.714) = .9568. Soit

un pourcentage de 96%.(b) X = 35 correspond à Z = 35−39

7 ≈ −0.571. La table montre que Pr (Z ≤ +.571) vaut.7161. Et par symétrie, Pr (−.571 ≤ Z) = 0.7161, soit 72%.

(c) Les événements X ≤ 26 et 26 < X ≤ 49 sont incompatibles, et leur réunion est X < 49.On a donc Pr (26 < X ≤ 49) = Pr (X ≤ 49) − Pr (X ≤ 26). Passant en Z, on a Z2 =49−39

7 = +10/7 et Z1 = 25−418 = −13/7. La table donne directement les probabilités en

Z et l’on a donc Pr (25 < X ≤ 49) = .9234− .0316 = .8918.

2. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.17 et Pr (15 < X) =0.34. Déterminer µ et σ.

(a) On détermine a tel que Pr (Z < a) = 0.17 et b tel que Pr (Z < b) = 1− 0.34. On trouvea = −.6745 et b = +.4125.

(b) On a donc 9 = µ+ a σ et 15 = µ+ b σ, ce qui se résout en µ ≈ 12.723 et σ ≈ 5.520.

3. Les âges X d’un groupe d’étudiants sont répartis suivant la loi Norm (22, 3).(a) Déterminer les nombres a, b, c tels que Pr (X < a) = 0.25, Pr (a < X < b) = 0.25,Pr (b < X < c) = 0.25 et Pr (c < X) = 0.25.(b) Déterminer l’âge moyen µ1 du quart le plus jeune, i.e. les étudiants vérifiant a < X.(c) On donne l’âge moyen µ2 = 21.03 ans des étudiants du deuxième quart, c’est à dire telsque a < X < b. En déduire µ3 et µ4, les âges moyens des deux derniers quarts.(d) Quelle est la variance des quatre nombres µ1, µ2, µ3, µ4 ? A quoi la comparer ?

(a) Les nombres α, β, γ tels que Pr (Z < α) = 1/4, Pr (α < Z < β) = 1/4, Pr (β < Z < γ) =1/4 et Pr (γ < Z) = 1/4 vérifient également Pr (Z < β) = 2/4 et Pr (Z < γ) = 3/4. Latable donne α ≈ −0.6749 et l’on a β = 0 et γ = −α. Les valeurs correspondantes pour Xs’obtiennent par X = 22 + 3Z (et s’appellent les quartiles de la distribution). On obtient:

a = 19.977, b = 22, c = 24.023 (ans)

(b) La question posée est de calculer la moyenne µ̂ des Z conditionnés par l’événement Z < α.On a donc µ̂ =

∫ α−∞

t f(t)∫ α−∞ f(x) dx

dt =∫ α−∞ t f (t) dt ÷ 1

4 , f étant la densité de probabilité

de la loi normale. Le changement de variable u = −12 t

2 conduit à∫ t=α

−∞exp

(− t

2

2

)tdt =

∫ u=∞

12α2

− exp (−u) du = − exp

(−1

2α2

)≈ −0.7965

soit µ̂ = −0.7965 ÷(4√

2π)≈ −1.2711. La valeur correspondante pour les âges est

µ1 = 22− 3× 1.2711 ≈ 18.19 années.(c) On donne µ2 = 21.03. Par symétrie, on a µ3 = 2E (X)−µ2 = 22.97 et µ4 = 2E (X)−µ1 =

25.81.(d) La variance de ces quatre nombres est 1

4

∑µ2j −µ2 ≈ 7.75. Le fait que ces nombres soient

également pondérés vient de ce que les quatre intervalles interquartiles ont la mêmeprobabilité d’être atteints.

(e) On obtient une variance inférieure à la variance de la population, car le calcul précédentrevient à annuler la variabilité existant à l’intérieur de chaque quartile. Quelques calculssupplémentaires montre que la variance interne au premier quartile est 2.174 et celleinterne au deuxième quartile est 0.037. La moyenne des variances est donc ≈ 1.25. Ajoutéeà la variance des moyennes, on retrouve bien la variance totale.

Page 17: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

17 №3.DS2 E1-01 (03, corrigé)

3.3 Approximations

1. La variable X suit une loi binomiale de paramètres n = 8, p = 0.4. Quelle est la probabilité desévénements E1 : X ∈ {0, 1}, E2 : X ∈ {2, 3}, E3 : X ∈ {4, 5} et enfin E4 : X ∈ {6, 7, 8}.

(a) On a, par définition, Pr (X = k) =(nk

)pk (1− p)n−k. On en déduit les probabilités voulues

: .1064, .4877, .3561, .0498. On vérifie que∑p = 1.

2. Décrire le procédé d’approximation par la loi de Gauss, et en donner les résultats.

(a) Le procédé commence par remplacer X = k par k− 12 < X < k+ 1

2 (donnant l’épaisseurvoulue aux barres de l’histogramme).

(b) On passe ensuite à la variable réduite Z = X−n p√n p q . Les seuils −0.5, 1.5, 3.5, 5.5, 8.5 de-

viennent −2.6702, −1.2269, .2165, 1.6599, 3.8249.

(c) On conclut en calculant les différences −Pr (Z < −2.6702) + Pr (Z < −1.2269) etc., quidonnent : .1061, .4758, .3658, .0484.

3. L’approximation obtenue est-elle convenable ? Commenter.

(a) L’approximation de Gauss est liée au passage à la limite n p q → ∞... et ici n p q = 1.92! On est donc bien loin du domaine de validité.

(b) Néanmoins, les ordres de grandeur soient quand même corrects (phénomène lié au faitque p ≈ 0.5).

(c) Pour quantifier les écarts entre la loi et son approximation, il est naturel de considérerles écarts relatifs, et d’en prendre la moyenne quadratique. Notant β la loi binomiale et α

son approximation, la quantité à examiner est ε2 =∑β (j)

(β(j)−α(j)

β(j)

)2=∑ (β(j)−α(j))2

β(j) .Pour le problème considéré, on trouve ε2 ≈ 0.0005974 soit ε ≈ 0.024 = 2.4%.

(d) On obtient une approximation légèrement meilleure en renormalisant les probabilitésobtenues à la question précédente, pour tenir compte de ce que X /∈ [0..8] est non pasimprobable, mais impossible.

Page 18: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№3.DS2 E1-01 (03, corrigé) 18

Page 19: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 4

A1-02 entraînement (04, sujet)

4.1 Statistiques univariées

Le tableau suivant donne le relevé des temps nécessaires au piqûrage de carpettes dans un atelierde fabrication de tapis.

durée (mn) effectif0. .. 3.5 13.5 .. 7.0 97.0 .. 10.5 3710.5 .. 14.0 5914.0 .. 17.5 4017.5 .. 21.0 1121.0 .. 24.5 3

1. Diagramme des effectifs cumulés croissants et décroissants. Détermination de la médiane etdes quartiles.

2. Histogramme. Moyenne, écart-type, visualisation.

4.2 Corrélation (données simples)

On considère la série de points :[4.11, 12.6], [5.73, 12.8], [5.47, 11.2], [5.16, 11.9], [2.44, 9.58][6.98, 16.9], [2.94, 7.59], [4.34, 12.5], [2.47, 8.14], [6.16, 16.8]

1. Calculer les paramètres de dispersion de cette série de points.2. Représentation graphique des points. Visualisation des paramètres de dispersion.3. Droite de régression. Visualisation.

4.3 Corrélation (données groupées)

On a 50 points (x, y) avec x = 1, 2, 3, 4 et y = 1, 2, 3, 4. Sur une même ligne du tableau, x estconstant. Sur une même colonne, y est constant :

↓ x y → 1 2 3 4

1 7 3 1 1

2 3 7 3 1

3 2 2 6 3

4 1 3 3 4

19

Page 20: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№4.A1-02 entraînement (04, sujet) 20

1. Dresser le tableau permettant le calcul des diverses sommes utiles.

2. Calcul des paramètres de dispersion de cette série de points.

3. Représentation graphique des points. Visualisation des paramètres de dispersion.

4. Droite de régression. Visualisation.

Page 21: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 5

DS A1-02 2002-12-10 (05, corrigé)

5.1 Statistiques univariées

Le tableau suivant donne le relevé des temps nécessaires au piqûrage de carpettes dans un atelierde fabrication de tapis.

durée (mn) effectif0 .. 3 23 ..6 66 .. 9 329 .. 12 5712 .. 15 4215 .. 18 918 .. 21 2

1. Diagramme des effectifs cumulés croissants et décroissants. Détermination de la médiane etdes quartiles.

(a) Le diagramme des effectifs cumulés croissants porte en abscisse les centres de classe et enordonnée les effectifs des classes inférieures ou égales à la classe considérée. Le diagrammedes effectifs cumulés décroissants part de la plus grande classe vers la plus petite.

(b) On obtient les diagrammes de la Figure 5.1 (à gauche).

0

40

80

120

8.77 13.1 210

19

7.64 14

Figure 5.1 – Diagrammes des effectifs cumulés versus histogramme.

(c) La médiane correspond à la valeur occupant la place (1 + 150) /2 = 75.5. On atteintl’effectif 40 en totalisant les quatre premières classes. Il reste à placer un effectif valant

21

Page 22: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№5.DS A1-02 2002-12-10 (05, corrigé) 22

35.5, soit la fraction 35.5/57 de la classe en cours. Cela donne une amplitude (35.5/57)×3à ajouter au plancher de la classe, soit :

mediane = 9 +35.5

57× 3 ≈ 10.868

(d) De la même façon, on détermine les quartiles inférieur (8.77) et supérieur (13.11).

2. Histogramme. Moyenne, écart-type, visualisation.

(a) Comme il est bien connu, la grandeur en ordonnée n’est pas l’effectif, mais est déterminéede façon à obtenir la bonne surface pour la barre considérée.

(b) Des calculs élémentaires donnent :

n = 150, m = E (x) = 10.82, σ =√

var (x) ≈ 3.1777

(c) Pour visualiser ces deux paramètres, on trace les verticales x = m et x = m± σ (facteurde couverture k = 1). On aboutit à l’histogramme de la Figure 5.1 (à droite).

5.2 Corrélation (données simples)

On considère la série de points [x, y] :[5.97, 14.4], [2.63, 10.0], [5.53, 16.1], [3.36, 8.34], [2.26, 9.38][2.48, 6.28], [4.30, 8.68], [2.60, 5.58], [4.21, 12.2], [2.33, 5.40]

1. Calculer les paramètres de dispersion de cette série de points.

(a) On constate que 2.26 ≤ x ≤ 5.97 et 5.40 ≤ y ≤ 16.10.

(b) On trouve calcule les sommes usuelles :∑1 = 10,

∑x = 35.67,

∑y = 96.36

∑x2 = 144.0893,

∑y2 = 381.8726,

∑x y = 1048.0272

(c) On en déduit les paramètres de dispersion :

n = 10, x = 3.567, y = 9.636, var (x) = 1.685, var (y) = 11.950, cov = 3.816

2. Représentation graphique des points. Visualisation des paramètres de dispersion.Pour chacune des deux variables, on trace les droites correspondant à la moyenne plus oumoins l’écart-type (facteur de couverture k = 1). On obtient la Figure 5.2 (gauche).

3. Droite de régression. Visualisation.

(a) On trouve a = cov(x, y)var(x) ≈ 2.264, et il est connu que la droite de régression passe par le

point moyen.

(b) La qualité de ce résultat est mesurée par le facteur de réduction de variance frv =1/(1− r2

)≈ 3.608. Grosso-modo, les trois quarts de la variance de y sont explicables

par la variabilité de x, tandis qu’un quart reste inexpliqué.

(c) L’écart-type réduit est donc σred =√

var (y) /frv ≈ 1.9183, que l’on reporte de part etd’autre de la droite de régression (facteur de couverture k = 1). On obtient la Figure 5.2(droite).

Page 23: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

23 №5.DS A1-02 2002-12-10 (05, corrigé)

6.18

13.1

2.27 4.87

7.82

11.5

2.27 4.87

Figure 5.2 – Données brutes (à gauche) et corrélation (à droite).

5.3 Corrélation (données groupées)

On a 70 points (x, y) avec x = 1, 2, 3, 4 et y = 2, 3, 4, 5. Sur une même ligne du tableau, y estconstant. Sur une même colonne, x est constant :

↓ y x→ 1 2 3 4

5 8 5 2 2

4 7 7 8 1

3 3 2 9 3

2 2 1 3 7

1. Dresser le tableau permettant le calcul des diverses sommes utiles. cf Figure 5.3.

1 2 3 4 nj nx∑k y x

∑k y x2

5 8 5 2 2 17 85 32 160 4254 7 7 8 1 23 92 49 196 3683 3 2 9 3 17 51 46 138 1532 2 1 3 7 13 26 41 82 52nk 20 15 22 13 70 998n y 20 30 66 52 168∑j x 81 61 75 37 254

y∑j x 81 122 225 148 576

y2 20 60 198 208 486

Figure 5.3 – tableau de calcul.

2. Calcul des paramètres de dispersion de cette série de points.

(a) On trouve E (x) = 25470 ≈ 3.6286, var (x) = 998

70 −(25470

)2 ≈ 1.0906.

(b) De même E (y) = 16870 ≈ 2.4, var (y) = 486

70 −(16870

)2 ≈ 1.1829.(c) Enfin la covariance vaut 576

70 −25470

16870 = −0.48.

3. Représentation graphique des points. Visualisation des paramètres de dispersion.

(a) La meilleure représentation graphique consiste à donner une "épaisseur" aux points enproportion de l’effectif.

(b) On trace les horizontales et les verticales indiquant la dispersion de x et de y.

Page 24: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№5.DS A1-02 2002-12-10 (05, corrigé) 24

4. Droite de régression. Visualisation.

(a) La pente de la droite de régression est donnée par a := cov/var (x) ≈ .4401, et le coeffi-cient de corrélation vaut : r = cov/

√var (x) var (y) ≈ .4226.

(b) Le facteur de réduction de variance vaut frv = 1.2174 : les deux variables sont dont àpeu près indépendantes.

2.4

3.63

Page 25: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 6

E1-02 entraînement (06, sujet)

Tous documents autorisés, ainsi que les calculettes conformes aux règlements usuels.Chaque résultat doit recevoir une illustration graphique

6.1 Calculs élémentaires (30 mn)

1. X est une v.a. Norm (20 ; 2.5). Que valent E (X) , var (X) et σX ? Calculez Pr (X > 23).

2. Y est une v.a. Poiss (3). Que valent E (Y ), var (Y ) et σY ? Calculez Pr (Y > 2).

3. On mélange une population de N1 = 25 individus, ayant une moyenne µ1 = 13 et un écart-type σ1 = 3 avec une population de N2 = 35 individus, ayant une moyenne µ2 = 11 et unécart-type σ2 = 4. Déterminer la moyenne et l’écart-type de la population totale.

4. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (39, 7), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; ( b) au moins 35 ans ;(c) entre 26 et 49 ans ?

5. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.17 et Pr (15 < X) =0.34. Déterminer µ et σ.

6.2 Loi binomiale et loi de Poisson (30 mn)

On considère n = 8 variables de Bernoulli indépendantes X1, X2, · · · , X7, X8 chacune d’ellesayant une probabilité de succès p .

= Pr (Xj = 1) = 0.3. On sait que la variable X = X1 +X2 + · · ·+X7 +X8 suit une loi binomiale.

1. Donner la formule de µ (k).= Pr (X = k).

2. Donner les valeurs à trois décimales de µ (k) pour k = 0, 1, · · · , 8. On donnera les détailsdes calculs pour Pr (X = 4) et on négligera les valeurs inférieures à 10−3.

1. Rappeler les formules de calcul de l’espérance et de la variance d’une variable aléatoire dis-crète.

2. Utiliser les formules de Q3 et les valeurs de Q2 pour calculer des valeurs approchées E (X) etvar (X). Comparer avec les valeurs exactes (rappeler les formules valables pour une variablesuivant la loi binomiale). Un histogramme est demandé.

3. Donner les valeurs à trois décimales de ϕ (k).= Pr (Y = k) pour une variable de Poisson Y

ayant pour paramètre λ = 2. Vérifier les résultats obtenus en calculant E (Y ) de deux façonsdifférentes.

4. Le calcul numérique de ε =√

19

∑8k=0 (µ (k)− ϕ (k))2 donne ε ≈ 0.021. Est-ce beaucoup

ou pas beaucoup ? Autrement dit, à quelle quantité peut-on comparer ε pour se faire uneopinion ?

25

Page 26: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№6.E1-02 entraînement (06, sujet) 26

6.3 Corrélation (40 mn)

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 3) = 0.05.

↓ y x→ 1 3 4 51 .05 .05 .05 .05

3 .1 .05 .05 .05

4 .1 .1 .1

1. Déterminer Pr (X = 1, Y = 4).

2. Que valent Pr (X = 5 | Y = 1) et Pr (X = 5 | Y = 2) ?

3. Les variables X et Y sont-elles indépendantes ?

4. Donner la distribution marginale de X, son espérance et sa variance.

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un dessin.

8. Obtient-on une réduction de variance significative ?

6.4 Probabilités (20 mn)

1. On utilise un jeu de 32 cartes et on en sélectionne 5. Quelle est la probabilité d’avoir aumoins une paire, c’est à dire au moins deux cartes de même valeur ?

2. On répète m fois le tirage décrit ci-dessus. Que doit valoir m pour que la probabilité d’unéchec total (c’est à dire ne jamais obtenir deux cartes de même valeur) soit inférieure à10−4 ?

Page 27: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 7

DS E1-02 2003-01-27 (07, corrigé)

7.1 Calculs élémentaires (30 mn)

1. X est une v.a. Norm (18 ; 2.4). Que valent E (X) , var (X) et σX ? Calculez Pr (X > 20).

(a) Par définition E (X) = 18 et σ = 2.4. On a donc var (X) = σ2 = 5.76.

(b) Passant à la variable réduite, X = 20 équivaut à Z = 20−182.4 = 0.833. En utilisant la table,

on trouve Pr (Z < 0.833) = .7977. Passant au complément, il vient Pr (20 < X) = .2023,soit une chance sur 5.

2. Y est une v.a. Poiss (4). Que valent E (Y ), var (Y ) et σY ? Calculez Pr (Y > 2).

(a) Par définition E (Y ) = limn p = λ = 4. Et l’on a var (Y ) = limn p q = λ = 4.

(b) Les valeurs possibles pour Y sont les nombres entiers. L’événement 2 < Y est donc le com-plémentaire de l’événement Y ∈ {0, 1, 2}, dont la probabilité est

(λ0

0! + λ1

1! + λ2

2!

)exp (−λ) ≈

(1 + 4 + 8) exp (−4) ≈ .2381. La probabilité du complémentaire est donc .7619, soit 3chances sur 4.

3. On mélange une population de N1 = 22 individus, ayant une moyenne µ1 = 14 et un écart-type σ1 = 4 avec une population de N2 = 38 individus, ayant une moyenne µ2 = 11 et unécart-type σ2 = 5. Déterminer la moyenne et l’écart-type de la population totale.

(a) Indexons par 0 ce qui concerne la population totale. Par définition, on a∑

j x = nj µj et,

par la formule de Koenig, on obtient∑

j x2 = nj

(σ2j + µ2j

). Ces formules sont valables

pour j = 0, 1, 2.

(b) Il est clair que∑

0 =∑

1 +∑

2. On obtient donc n0 = n1 + n2 = 60. Puis∑

0 x =14× 22 + 11× 38, conduisant à µ0 = 726/60 = 12.1. Et enfin

∑0 x

2 =(142 + 42

)× 22 +(

112 + 52)× 38 = 10212, qui conduit à σ20 = 23.79 ≈ (4.877)2.

(c) On pouvait aussi utiliser directement les formules :

µ =n1µ1 + n2µ2n1 + n2

, σ2 =n1σ

21 + n2σ

22

n1 + n2+n1 (µ1 − µ)2 + n2 (µ2 − µ)2

n1 + n2

4. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (33, 8), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; ( b) au moins 37 ans ;(c) entre 20 et 40 ans ?

(a) La variable réduite est (51− 33) /8 = 2.25. On trouve directement Pr (X < 51) =Pr (z < 2.25) = 0.9878.

(b) La variable réduite est (37− 33) /8 = 0.5. On trouve Pr (X < 37) = Pr (z < 0.5) =0.6915, et donc Pr (37 < X) = 0.3085.

27

Page 28: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№7.DS E1-02 2003-01-27 (07, corrigé) 28

(c) On a z1 = (20− 33) /8 = −1.625 et z2 = (40− 33) /8 = 0.875. Par interpolation à partirdes tables, Pr (z < z1) = 1−.9479 et Pr (z < z2) = 0.8092. On a donc Pr (20 ≤ X < 40) =.7571.

(d) L’expression "entre 20 et 40" est floue. Il est donc nécessaire que vous en donniez uneinterprétation avant de commencer les calculs. En effet Pr (20 ≤ X < 41) répond toutautant à la question...

5. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.19 et Pr (17 < X) =0.44. Déterminer µ et σ.

(a) Par interpolation, les tables donnent : −.878 = (8−m) /s et −.151 = (17−m) /s.(b) En résolvant ce système, on trouve m = 18.869 et s = 12.381.

7.2 Loi binomiale et loi de Poisson (30 mn)

On considère n = 7 variables de Bernoulli indépendantes X1, X2, · · · , X7 chacune d’elles ayantune probabilité de succès p .

= Pr (Xj = 1) = 0.2. On sait que la variable X = X1 + X2 + · · · + X7

suit une loi binomiale.1. Donner la formule de µ (k)

.= Pr (X = k).

On a Pr (X = k) =(7k

)(0.2)k (0.8)7−k

2. Donner les valeurs à trois décimales de µ (k) pour k = 0, 1, · · · , 7. On donnera les détailsdes calculs pour Pr (X = 3) et on négligera les valeurs inférieures à 10−3.

1. Pour X = 4, on a Pr (X = 3) = 7.6.51.2.3 × (0.2)3 × (0.8)4 ≈ .115

(a) On trouve successivement

0 1 2 3 4 5 6 7.210 .367 .275 .115 .029 .004 .001 .000

On constate que les arrondis se compensent et que le total de ces nombres vaut exactement1.

2. Rappeler les formules de calcul de l’espérance et de la variance d’une variable aléatoire dis-crète.On a m2 = E (X) =

∑k Pr (X = k) et σ2 = E

(X2)−m2

3. Utiliser les formules de Q3 et les valeurs de Q2 pour calculer des valeurs approchées E (X) etvar (X). Comparer avec les valeurs exactes (rappeler les formules valables pour une variablesuivant la loi binomiale). Un histogramme est demandé.

(a) On a donc m = (0× .210 + 1× .367 + 2× .275 + · · · ) = 1.398.(b) De même σ2 =

(02 × .210 + 12 × .367 + 22 × .275 + · · ·

)−m2 = 1.112.

(c) Ces valeurs sont à comparer avec les valeurs exactes, qui sont m = n p = 1.4 et σ2 =n p q = 1.12. La deuxième série de calculs, qui est plus longue, engendre des erreursd’arrondi plus importantes.

4. Donner les valeurs à trois décimales de ϕ (k).= Pr (Y = k) pour une variable de Poisson

Y ayant pour paramètre λ = 1.4. Vérifier les résultats obtenus en calculant E (Y ) de deuxfaçons différentes.

(a) Pour la loi de Poisson, a Pr (X = k) = 1.4k

k ! exp (−1.4).(b) On trouve successivement

0 1 2 3 4 5 6 7+.246 .345 .242 .113 .039 .011 .003 .001

Page 29: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

29 №7.DS E1-02 2003-01-27 (07, corrigé)

(c) On obtient E (X)ϕ ≈ 1.404 et var (X)ϕ ≈ 1.415. Ces valeurs sont à comparer avec lesvaleurs théoriques E (X)ϕ) = var (X)ϕ = λ = 1.4.

5. Que donne le calcul numérique de ε =√

18

∑7k=0 (µ (k)− ϕ (k))2 ? Est-ce beaucoup ou pas

beaucoup ? Autrement dit, à quelle quantité peut-on comparer ε pour se faire une opinion ?

(a) On trouve ε ≈ 0.021.(b) Cette quantité est très petite par rapport à l’écart-type de µ qui vaut 1.05 : la loi de Pois-

son constitue effectivement un modèle approché pour la loi binomiale dans les conditionsutilisées.

7.3 Corrélation (40 mn)

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 2) = 0.06.

↓ y x→ 1 2 3 51 .06 .06 .06

2 .1 .06 .06 .06

4 .1 .1 .1 .1

1. Déterminer Pr (X = 5, Y = 1)

(a) La somme des probabilités valant 1, la probabilité manquante vaut 1 moins la somme detoutes les autres, soit 0.14.

(b) L’ensemble des questions suivantes se traite en complétant le tableau des distributionsgroupées. Il vient :

↓ y x→ 1 2 3 5 pj pj yj∑pjkxk yj

∑pjkxk pj y

2j

1 .06 .06 .06 .14 .32 .32 1.06 1.06 .322 .1 .06 .06 .06 .28 .56 .70 1.40 1.124 .1 .1 .1 .1 .4 1.6 1.1 4.4 6.4pk .26 .22 .22 .30 1.00 7.84pk xk .26 .44 .66 1.50 2.86∑pjkyj .66 .58 .58 .66 2.48

xk∑pjkyj .66 1.16 1.74 3.30 6.86

pk x2k .26 .88 1.98 7.50 10.62

2. Que valent Pr (X = 5 | Y = 2) et Pr (X = 5 | Y = 4) ?

(a) Par définition, Pr (X = 5 | Y = 2) = Pr (X = 5 et Y = 2)÷ Pr (Y = 2).On a donc Pr (X = 5 | Y = 2) = .06/.28 ≈ 0.2143.

(b) Par définition, Pr (X = 5 | Y = 4) = Pr (X = 5 et Y = 4)÷ Pr (Y = 4).On a donc Pr (X = 5 | Y = 4) = .1/.4 = 0.25.

3. Les variables X et Y sont-elles indépendantes ?Si les deux variables étaient indépendantes, les probabilités conditionnelles de la questionprécédente seraient égales.

4. Donner la distribution marginale de X, son espérance et sa variance.

(a) On voit directement sur le tableau que les probabilités marginales de X sont :

x 1 2 3 5p .26 .22 .22 .30

Page 30: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№7.DS E1-02 2003-01-27 (07, corrigé) 30

(b) On a en outre E (X) = 2.86 et var (X) = 10.62− 2.862 ≈ 2.44

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

(a) On voit directement sur le tableau que les probabilités marginales de Y sont :

y 1 2 4p .32 .28 .40

(b) On a en outre E (Y ) = 2.48 et var (Y ) = 7.84− 2.482 ≈ 1.69

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

(a) On a cov (X, Y ) = E (X Y )− E (X) E (Y ) = 6.86− 2.86× 2.48 ≈ −0.2328.

(b) Et donc r = (−.2328) /√

2.44× 1.69 = −0.1146 (très légère corrélation).

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un dessin.

(a) La pente de la droite de tendance est cov (X, Y ) /var (X) ≈ −0.1378.

(b) Et la droite de tendance passe par le point moyen.

8. Obtient-on une réduction de variance significative ?La variance est réduite d’environ 1%.

7.4 Probabilités (20 mn)

1. On utilise un jeu de 52 cartes et on en sélectionne 5. Quelle est la probabilité d’avoir aumoins une paire, c’est à dire au moins deux cartes de même valeur ?

(a) Il est bien plus efficace de commencer par calculer la probabilité de l’événement "ne pasavoir une paire", désigné ci-dessous par ζ, et de prendre le complément. Plus précisément,désignons par ζk l’événement "ne pas avoir de paire une fois la k-ième carte tirée". Laquestion posée revient à déterminer ζ5.

(b) De toute évidence, Pr (ζ1) = 1. On a en outre :

Pr (ζ5) = Pr (ζ5 | ζ4)× Pr (ζ4 | ζ3)× · · · × Pr (ζ2 | ζ1)Pr (ζ1)

(c) L’événement (ζ2 | ζ1) consiste à tirer une carte n’ayant pas la valeur X1 sachant qu’il reste51 cartes, dont 3 ont la valeur X1. On a donc Pr (ζ2 | ζ1) = 48

51 . De même Pr (ζ3 | ζ2) = 4450 .

Finalement,

Pr (ζ5) =48

51× 44

50× 40

49× 36

48× 32

47≈ 0.5071

(d) La probabilité demandée est donc p = 1− 0.5071 = 0.4929

2. On répète m fois le tirage décrit ci-dessus. Que doit valoir m pour que la probabilité d’unéchec total (c’est à dire ne jamais obtenir deux cartes de même valeur) soit inférieure à 10−3

?

(a) La probabilité d’un échec total est Pr (ζ5)m, fonction décroissante de m.

(b) La valeur seuil est déterminée par m lnPr (ζ5) = −3 ln 10, conduisant à m > 10.17, ouencore m ≥ 11.

3. Quelle est la probabilité d’obtenir au moins trois cartes de même valeur (brelan) en un seultirage d’une main de 5 cartes ?

Page 31: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 8

DS E1-02s 2003-09-08 (08, sujet)

Tous documents autorisés, ainsi que les calculettes conformes aux règlements usuels.Chaque résultat doit recevoir une illustration graphique

8.1 Calculs élémentaires (30 mn)

1. X est une v.a. Norm (16 ; 2.6). Que valent E (X) , var (X) et σX ? Calculez Pr (X > 15).

2. Y est une v.a. Poiss (5). Que valent E (Y ), var (Y ) et σY ? Calculez Pr (Y > 2).

3. On mélange une population de N1 = 21 individus, ayant une moyenne µ1 = 15 et un écart-type σ1 = 6 avec une population de N2 = 37 individus, ayant une moyenne µ2 = 12 et unécart-type σ2 = 5. Déterminer la moyenne et l’écart-type de la population totale.

4. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (35, 9), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; ( b) au moins 37 ans ;(c) entre 20 et 40 ans ?

5. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.29 et Pr (17 < X) =0.34. Déterminer µ et σ.

8.2 Loi binomiale et loi de Poisson (30 mn)

On considère n = 7 variables de Bernoulli indépendantes X1, X2, · · · , X7 chacune d’elles ayantune probabilité de succès p .

= Pr (Xj = 1) = 0.3. On sait que la variable X = X1 + X2 + · · · + X7

suit une loi binomiale.

1. Donner la formule de µ (k).= Pr (X = k).

2. Donner les valeurs à trois décimales de µ (k) pour k = 0, 1, · · · , 7. On donnera les détailsdes calculs pour Pr (X = 3) et on négligera les valeurs inférieures à 10−3.

1. Rappeler les formules de calcul de l’espérance et de la variance d’une variable aléatoire dis-crète.

2. Utiliser les formules de Q3 et les valeurs de Q2 pour calculer des valeurs approchées E (X) etvar (X). Comparer avec les valeurs exactes (rappeler les formules valables pour une variablesuivant la loi binomiale). Un histogramme est demandé.

.../...

31

Page 32: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№8.DS E1-02s 2003-09-08 (08, sujet) 32

3. Quel est la valeur du paramètre de la variable de Poisson Y présentant la meilleure ressem-blance avec la variable binomiale étudiée ci-dessus ? Donner les valeurs à trois décimales deϕ (k)

.= Pr (Y = k) pour cette variable de Poisson. Vérifier les résultats obtenus en calculant

E (Y ) de deux façons différentes.

4. Que donne le calcul numérique de ε =√

18

∑7k=0 (µ (k)− ϕ (k))2 ? Est-ce beaucoup ou pas

beaucoup ? Autrement dit, à quelle quantité peut-on comparer ε pour se faire une opinion ?

8.3 Corrélation (40 mn)

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 2) = 0.06.

↓ y x→ 1 2 3 51 .05 .06 .06

2 .1 .05 .05 .06

4 .1 .1 .1 .1

1. Déterminer Pr (X = 5, Y = 1).

2. Que valent Pr (X = 5 | Y = 2) et Pr (X = 5 | Y = 4) ?

3. Les variables X et Y sont-elles indépendantes ?

4. Donner la distribution marginale de X, son espérance et sa variance.

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un dessin.

8. Obtient-on une réduction de variance significative ?

8.4 Probabilités (20 mn)

1. On utilise un jeu de 32 cartes et on en sélectionne 4. Quelle est la probabilité d’avoir aumoins une paire, c’est à dire au moins deux cartes de même valeur ?

2. On répète m fois le tirage décrit ci-dessus. Que doit valoir m pour que la probabilité d’unéchec total (c’est à dire ne jamais obtenir deux cartes de même valeur) soit inférieure à 10−3

?

3. Quelle est la probabilité d’obtenir au moins trois cartes de même valeur (brelan) en un seultirage d’une main de 4 cartes ?

Page 33: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 9

DS A1-02s 2003-09-19 (09, sujet)

Tous documents autorisés, ainsi que les calculettes conformes aux règlements usuels.Chaque résultat doit recevoir une illustration graphique

9.1 Statistiques univariées

Le tableau suivant donne un relevé de temps dans un atelier.

durée (mn) effectif0 .. 6 86 .. 9 309 .. 12 4712 .. 15 4115 .. 18 1918 .. 24 5

1. Diagramme des effectifs cumulés croissants et décroissants. Détermination de la médiane etdes quartiles.

2. Histogramme. Moyenne, écart-type, visualisation.

9.2 Corrélation (données simples)

On considère la série de points :[5.47, 14.3], [2.83, 10.2], [5.83, 15.8], [3.76, 8.7], [2.86, 9.8][3.38, 6.8], [5.30, 8.7], [3.70, 5.1], [5.41, 12.2], [3.73, 5.0]

1. Calculer les paramètres de dispersion de cette série de points.

2. Représentation graphique des points. Visualisation des paramètres de dispersion.

3. Droite de régression. Visualisation.

../..

33

Page 34: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№9.DS A1-02s 2003-09-19 (09, sujet) 34

9.3 Corrélation (données groupées)

On a 70 points (x, y) avec x = 1, 2, 3, 4 et y = 2, 3, 4, 6. Sur une même ligne du tableau, y estconstant. Sur une même colonne, x est constant :

↓ y x→ 1 2 3 4

6 7 6 2 2

4 7 9 8 1

3 3 2 9 12 0 1 5 7

1. Dresser le tableau permettant le calcul des diverses sommes utiles.

2. Calcul des paramètres de dispersion de cette série de points.

3. Représentation graphique des points. Visualisation des paramètres de dispersion.

4. Droite de régression. Visualisation.

Page 35: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 10

DS A1-03 2004-03-03 (10, sujet)

Libre accès aux documents personnels et aux cours en ligne."La bonne rédaction des solutions fait partie des compétences évaluées."

10.1 Calculs élémentaires

1. On mélange une population de N1 = 21 individus, ayant une moyenne µ1 = 15 et un écart-type σ1 = 6 avec une population de N2 = 37 individus, ayant une moyenne µ2 = 12 et unécart-type σ2 = 5. Déterminer la moyenne et l’écart-type de la population totale.

2. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (35, 9), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 51 ans ; ( b) au moins 37 ans ;(c) entre 20 et 40 ans ?

3. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.29 et Pr (17 < X) =0.34. Déterminer µ et σ.

10.2 Loi binomiale et loi de Poisson

On considère n = 7 variables de Bernoulli indépendantes X1, X2, · · · , X7 chacune d’elles ayantune probabilité de succès p .

= Pr (Xj = 1) = 0.3. On sait que la variable X = X1 + X2 + · · · + X7

suit une loi binomiale.

1. Donner la formule de µ (k).= Pr (X = k), ainsi que les valeurs de µ (k) pour k = 0, 1, · · · , 7.

2. Rappeler les formules de calcul de l’espérance et de la variance d’une variable aléatoire dis-crète.

3. Utiliser les formules de Q2 et les valeurs de Q1 pour calculer des valeurs approchées E (X) etvar (X). Comparer avec les valeurs exactes (rappeler les formules valables pour une variablesuivant la loi binomiale). Un histogramme est demandé.

4. Quel est la valeur du paramètre de la variable de Poisson Y présentant la meilleure ressem-blance avec la variable binomiale étudiée ci-dessus ? Donner les valeurs à trois décimales deϕ (k)

.= Pr (Y = k) pour cette variable de Poisson. Vérifier les résultats obtenus en calculant

E (Y ) de deux façons différentes.

.../...

35

Page 36: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№10.DS A1-03 2004-03-03 (10, sujet) 36

10.3 Corrélation (40 mn)

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 2) = 0.06.

↓ y x→ 1 2 3 51 .05 .06 .06

2 .1 .05 .05 .06

4 .1 .1 .1 .1

1. Déterminer Pr (X = 5, Y = 1).

2. Que valent Pr (X = 5 | Y = 2) et Pr (X = 5 | Y = 4) ?

3. Les variables X et Y sont-elles indépendantes ?

4. Donner la distribution marginale de X, son espérance et sa variance.

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un dessin.

8. Obtient-on une réduction de variance significative ?

10.4 Probabilités (20 mn)

1. On utilise un jeu de 32 cartes et on en sélectionne 4. Quelle est la probabilité d’avoir aumoins une paire, c’est à dire au moins deux cartes de même valeur ?

2. On répète m fois le tirage décrit ci-dessus. Que doit valoir m pour que la probabilité d’unéchec total (c’est à dire ne jamais obtenir deux cartes de même valeur) soit inférieure à 10−3

?

3. Quelle est la probabilité d’obtenir au moins trois cartes de même valeur (brelan) en un seultirage d’une main de 4 cartes ?

Page 37: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 11

DS E1-03 2004-05-04 (12, sujet)

Libre accès aux documents personnels et aux calculatrices."La bonne rédaction des solutions fait partie des compétences évaluées."

11.1 Calculs élémentaires

1. On mélange une population de N1 = 30 individus, ayant une moyenne µ1 = 16 et un écart-type σ1 = 6 avec une population de N2 = 50 individus, ayant une moyenne µ2 = 14 et unécart-type σ2 = 10. Déterminer la moyenne et l’écart-type de la population totale.

2. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (23, 5), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 26 ans ; ( b) au moins 20 ans ;(c) entre 21 et 30 ans ?

3. On sait que la variable X suit une loi normale et que Pr (X < 10) = 0.19 et Pr (19 < X) =0.37. Déterminer µ et σ.

11.2 Loi binomiale et loi de Gauss

On considère n = 7 variables de Bernoulli indépendantes X1, X2, · · · , X8 chacune d’elles ayantune probabilité de succès p .

= Pr (Xj = 1) = 0.4. On sait que la variable X = X1 + X2 + · · · + X8

suit une loi binomiale.

1. Rappeler la formule de ϕ (k).= Pr (X = k). Donner, à 0.001 près, les valeurs de ϕ (k) pour

0 ≤ k ≤ 8. Agglomérer les cas ayant une probabilité inférieure à 0.003.

2. Rappeler les formules de calcul de l’espérance et de la variance.

3. Utiliser les formules de Q2 et les valeurs de Q1 pour calculer des valeurs approchées deE (X) et var (X). Comparer avec les valeurs exactes (rappeler les formules correspondantes).Reporter tout cela sur un histogramme.

4. Quels sont les paramètres de la variable normale Y présentant la meilleure ressemblance avecla variable binomiale étudiée ci-dessus ? Indiquer comment utiliser les tables de la loi normalepour obtenir une estimation des ϕ (k). Faire effectivement les calculs et comparer.

.../...

37

Page 38: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№11.DS E1-03 2004-05-04 (12, sujet) 38

11.3 Corrélation

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 3, Y = 4) = 0.06.

↓ y x→ 1 2 4 54 .03 .06 .06

2 .1 .03 .03 .06

1 .02 .1 .1 .1

1. Déterminer Pr (X = 5, Y = 4).

2. Que valent Pr (X = 5 | Y = 2) et Pr (X = 5 | Y = 1) ?

3. Les variables X et Y sont-elles indépendantes ?

4. Donner la distribution marginale de X, son espérance et sa variance.

5. Donner de même la distribution marginale de Y , son espérance et sa variance.

6. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

7. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un diagramme.

8. Obtient-on une réduction de variance significative ?

11.4 Probabilités conditionnelles

Une urne contient trois boules blanches et cinq noires. On tire successivement deux boules.

1. Quelle est la probabilité de tirer deux boules de la même couleur ?

2. On a tiré deux boules de la même couleur. Quelle est la probabilité pour que cette couleur soitle noir ?

Page 39: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 12

DS AE1-03s 2004-09-07 (13, sujet)

Libre accès aux documents personnels et aux calculatrices."La bonne rédaction des solutions fait partie des compétences évaluées."

12.1 Calculs élémentaires

1. On mélange une population de N1 = 33 individus, ayant une moyenne µ1 = 16 et un écart-type σ1 = 4 avec une population de N2 = 57 individus, ayant une moyenne µ2 = 14 et unécart-type σ2 = 8. Déterminer la moyenne et l’écart-type de la population totale.

2. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (39, 11), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 50 ans ; ( b) au moins 45 ans ;(c) entre 25 et 40 ans ?

3. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.29 et Pr (20 < X) =0.25. Déterminer µ et σ.

12.2 Loi binomiale et loi de Gauss

On considère n = 9 variables de Bernoulli indépendantes X1, X2, · · · , X9 chacune d’elles ayantune probabilité de succès p .

= Pr (Xj = 1) = 0.2. On sait que la variable X = X1 + X2 + · · · + X9

suit une loi binomiale.

1. Rappeler la formule de ϕ (k).= Pr (X = k). Donner, à 0.001 près, les valeurs de ϕ (k) pour

0 ≤ k ≤ 9. Agglomérer les cas ayant une probabilité inférieure à 0.001.

2. Rappeler les formules de calcul de l’espérance et de la variance.

3. Utiliser les formules de Q2 et les valeurs de Q1 pour calculer des valeurs approchées deE (X) et var (X). Comparer avec les valeurs exactes (rappeler les formules correspondantes).Reporter tout cela sur un histogramme.

4. Quels sont les paramètres de la variable normale Y présentant la meilleure ressemblance avecla variable binomiale étudiée ci-dessus ? Indiquer comment utiliser les tables de la loi normalepour obtenir une estimation des ϕ (k). Faire effectivement les calculs et comparer.

.../...

39

Page 40: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№12.DS AE1-03s 2004-09-07 (13, sujet) 40

12.3 Corrélation

On considère un couple de variables aléatoires discrètes (X, Y ) dont la distribution de probabilitésest donnée par le tableau ci-dessous. Ainsi Pr (X = 5, Y = 4) = 0.09.

↓ y x→ 1 2 4 54 .06 .06 .09

2 .1 .03 .03 .06

1 .02 .05 .09 .09

1. Déterminer Pr (X = 1, Y = 4).

2. Donner la distribution marginale de X, son espérance et sa variance.

3. Donner de même la distribution marginale de Y , son espérance et sa variance.

4. Calculer la covariance de X et Y et le coefficient de corrélation linéaire de ces deux variables.

5. Déterminer la droite de tendance X 7→ Yprev. Reporter tout cela sur un diagramme.

6. Obtient-on une réduction de variance significative ?

12.4 Probabilités conditionnelles

Une urne contient six boules blanches et sept noires. On tire successivement trois boules (la loide chaque tirage est supposée être la loi uniforme sur les boules présentes dans l’urne).

1. Quelle est la probabilité de tirer trois boules de la même couleur ?

2. On a tiré trois boules de la même couleur. Quelle est la probabilité pour que cette couleur soitle noir ?

Page 41: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 13

DS E1-04 2005-05-04 (15, corrigé)

Description du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents).

2. Vérifier que la bibliothèque simul installée est bien simul v6-17. Sinon, exécuter le fichierhttp://www.douillet.info/~douillet/mathapp/maple/simul09.mws

3. Le compte-rendu se composera de :

(a) Un compte-rendu expérimental, sous forme d’un listing imprimé et paginé, contenant lesprocédures, les graphes et les calculs.

(b) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultatsobtenus et les méthodes utilisées.

(c) Le document complet sera agrafé et paginé. Vu les lenteurs des imprimantes mises àdisposition, imprimer une page par feuille.

4. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessairepour les impressions. Faire un essai d’impression dès la première heure. Ne pas oublier lessauvegardes en cours de travail.

5. La ressemblance entre ce sujet et le projet mis à disposition depuis le 29/03 n’échappera àpersonne... Il est recommandé d’être attentif aux différences entre les deux sujets.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordi-nateur est susceptible d’être enregistré pendant la durée de l’évaluation.

13.1 Calculs élémentaires

1. On mélange une population de N1 = 27 individus, ayant une moyenne µ1 = 15 et un écart-type σ1 = 4 avec une population de N2 = 43 individus, ayant une moyenne µ2 = 12 et unécart-type σ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

(a) D’après les définitions, on a les relations :

n0 = n1 + n2

n0m0 = n1m1 + n2m2(s20 +m2

0

)n0 =

(s21 +m2

1

)n1 +

(s22 +m2

2

)n2

(b) On en déduit que :

n0 = 70, m0 =921

70≈ 13.157, s0 =

3

70

√16561 ≈ 5.515

41

Page 42: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№13.DS E1-04 2005-05-04 (15, corrigé) 42

2. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (36, 12), quel est lepourcentage des membres de ce groupe ayant : (a) plus de 20 ans ; ( b) moins de 50 ans ; (c)entre 30 et 40 ans ? Déterminer en outre a, b placés symétriquement autour de la moyennetels que Pr (x ∈ [a, b]) = 50%.

(a) On peut calculer la variable réduite z = (x− 36) /12, puis utiliser Gauss(z), ou bienutiliser directementF:= unapply(Norlaw(36,12,x), x);

(b) Les calculs donnent : 1− F (20) = 0.9088, F (50) = 0.8783, F (40)− F (30) = .3220

(c) Cela revient à dire Pr (x < a) = 0.25 et Pr (x < b) = 0.75. On a donc :

a = INorlaw (36, 12, 0.25) = 27.9061 ; b = INorlaw (36, 12, 0.75) = 44.0939

3. On sait que la variable X suit une loi normale et que Pr (X < 7) = 0.15 et Pr (17 < X) =0.22. Déterminer µ et σ.

(a) On a donc (7− µ) /σ = IGauss (0.15) et (17− µ) /σ = IGauss (1− 0.22).

(b) On en déduit µ ≈ 12.730, σ ≈ 5.529.

13.2 Loi de la somme de deux variables

1. On considère la variable x dont la densité de probabilité est donnée par :

f (x) = (H (x+ 3)−H (x− 1)) /4

En donner la moyenne et l’écart-type. Tracer son histogramme.

Variable uniforme sur l’intervalle [−3, 1]. Donc µ1 = −1 et σ21 = 16/12 = 4/3.

2. Même question avec la variable y ayant pour densité de probabilité :

g (y) = (H (y + 1)−H (y − 5)) /6

Variable uniforme sur l’intervalle [−1, 5]. Donc µ1 = +2 et σ21 = 36/12 = 3.

3. On suppose que les variables x et y sont indépendantes. Décrire comment calculer la loi dela variable z = x+ y (il n’est pas demandé d’effectuer ce calcul).

On utilise une convolution : h (z) =∫ x=+∞x=−∞ f (x) g (z − x) dx

4. Il se trouve que la densité de probabilité de z est donnée par :

h (z) = Cte ∗ ((x+ 4)H (x+ 4)− (x)H (x)− (x− 2)H (x− 2) + (x− 6)H (x− 6))

Déterminer la constante Cte. Calculer directement la moyenne et l’écart-type de z. Compareravec les valeurs obtenues précédemment.

Page 43: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

43 №13.DS E1-04 2005-05-04 (15, corrigé)

0

1

2

3

4

–4 –2 2 4 6 8x

Figure 13.1 – La convolution donne un trapèze isocèle.

(a) Le graphe est un trapèze isocèle (cf. Fig. 13.1). La constante vaut 1/24. Elle est déter-minée en écrivant que la surface totale vaut 1. Soit :

1

2(10 + 2)× (4Cte) = 1

(b) La moyenne vaut µ = 1 (axe de symétrie). C’est aussi la moyenne de µ1 et µ2.

(c) La variance s’obtient par σ2 =∫z2 h (z) dz − µ2. Elle est égale à σ21 + σ22 à cause de

l’indépendance. Elle vaut 13/3.

13.3 Loi binomiale et loi de Gauss

1. Soit x le nombre de succès obtenus en n = 12 essais indépendants, ayant chacun une pro-babilité de réussite égale à p = 0.4. Tracer l’histogramme de la variable x. Déterminer etreprésenter la moyenne et l’écart-type de cette variable.

(a) La loi binomiale n = 12, p = 0.4 s’écrit bin := k →(12k

).4k .6(12−k). On obtient l’histo-

gramme en insérant chaque valeur dans un intervalle de largeur 1. Cela donne :

dat_bin :=Weight (−.5..0.5, .00218) , Weight (.5..1.5, .01741) , Weight (1.5..2.5, .06385) ,Weight (2.5..3.5, .14189) , Weight (3.5..4.5, .21284) , Weight (4.5..5.5, .22703) ,Weight (5.5..6.5, .17658) , Weight (6.5..7.5, .10090) , Weight (7.5..8.5, .04204) ,

Weight (8.5..9.5, .01246) , Weight (9.5..10.5, .00249) ,Weight (10.5..11.5, .00030) , Weight (11.5..12.5, .00002)

(b) Les macros moy et var permettent de vérifier les formules µ = n p = 4.8 et σ2 = n p q =

2.88 = (1.6970)2.

(c) Un dessin est demandé.

2. On souhaite approximer cette distribution en utilisant la loi normale. Décrire comment faire.Tracer l’histogramme correspondant. Superposer ces deux histogrammes.

(a) On approxime par la loi normale ayant les mêmes paramètres. On pose doncF:= unapply(Norlaw(mu, sigma,x), x) ;

(b) Pour tracer l’histogramme demandé, on utilise les mêmes classes. On a doncdat_nor:= [Weight(-0.5 .. 0.5, F(0.5)-F(-0.5)), ... ] ;

Page 44: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№13.DS E1-04 2005-05-04 (15, corrigé) 44

(c) Et on superpose, obtenant la Figure 13.2.

0

0.05

0.1

0.15

0.2

2 4 6 8 10 12x

Figure 13.2 – Loi binomiale et loi de Gauss.

13.4 Corrélation

La suite de commandes Maple :

N:=50: tmp:= stats[random, normald](2*N):lix:= [seq(tmp[2*j ]*3+tmp[2*j-1]*2, j=1..N)]:liy:= [seq(tmp[2*j-1] +tmp[2*j ] , j=1..N)]:

fournit deux listes de 50 nombres. Considérer qu’il s’agit respectivement des abscisses et des ordon-nées de 50 couples (x, y).

–3

–2

–1

0

1

2

3

y

–6 –4 –2 0 2 4 6x

Figure 13.3 – Corrélation.

1. Donner une représentation "sunflower" de cette population.On obtient la Figure 13.3.

2. Déterminer la meilleure prévision pour y connaissant x.

(a) Pour l’exemple choisi,mx,vx:= moy(lix), var(lix) ; my,vy:= moy(liy), var(liy) ;

mx, vx := −.1859775688, 11.65795282

Page 45: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

45 №13.DS E1-04 2005-05-04 (15, corrigé)

my, vy := −.09182458354, 1.671713455

vxy:= cov(lix,liy) ; frv:= 1/(1-vxy^2/vx/vy) ;

vxy := 4.299136360 ; frv := 19.36899521

(b) On en déduit :drco:= my+(x-mx)*vxy/vx ;drdn, drup:= drco-sqrt(vy/frv), drco+sqrt(vy/frv) ;

drco := .3687728391x− .02324110748

drdn, drup := .3687728391x− .3170245890, .3687728391x+ .2705423740

3. Déterminer la meilleure prévision pour x connaissant y.Cette droite passe aussi par le point moyen. Par contre, sa pente (dans le repère yOx) vautvxy/vy. Exprimée dans le repère xOy, cela donne vy/vxy et les deux droites sont voisinesl’une de l’autre. En effet, le quotient des deux pentes (exprimées toutes deux dans le repèrexOy) vaut

v2xyvx2 vy2

= r2 = 1− 1

frv

4. Tracer les deux bandes de confiance correspondantes.Ces deux bandes sont parallèles, mais n’ont pas la même épaisseur.

13.5 Probabilités conditionnelles

Une urne contient cinq boules blanches et sept noires. On tire successivement trois boules (la loide chaque tirage est supposée être la loi uniforme sur les boules présentes dans l’urne).

1. Quelle est la probabilité de tirer trois boules de la même couleur ?

(a) Il y a(123

)= 12×11×10

6 = 220 tirages possibles, dont(53

)+(73

)= 5×4×3

6 + 7×6×56 = 10+35 =

45 sont favorables.

(b) La probabilité de succès (tirage uniforme) est donc 45220 = 9

44 ≈15 .

2. On a tiré trois boules de la même couleur. Quelle est la probabilité pour que cette couleur soitle noir ?

(a) On se trouve dans l’un des 45 cas favorables de la question précédente.

(b) La probabilité du noir est donc 1045 ≈

29 .

Page 46: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№13.DS E1-04 2005-05-04 (15, corrigé) 46

Page 47: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 14

DS A1-04 2005-06-20 (16, sujet)

Description du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents).

2. Vérifier que la bibliothèque simul installée est bien simul v6-17. Sinon, exécuter le fichierhttp://www.douillet.info/~douillet/mathapp/maple/simul09.mws.

3. Le compte-rendu se composera de :

(a) Un compte-rendu expérimental, sous forme d’un listing imprimé et paginé, contenant lesprocédures, les graphes et les calculs.

(b) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultatsobtenus et les méthodes utilisées.

(c) Le document complet sera agrafé et paginé. Vu les lenteurs des imprimantes mises àdisposition, imprimer une page par feuille.

4. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessairepour les impressions. Faire un essai d’impression dès la première heure. Ne pas oublier lessauvegardes en cours de travail.

5. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordi-nateur est susceptible d’être enregistré pendant la durée de l’évaluation.

14.1 Calculs élémentaires

1. On mélange une population de N1 = 37 individus, ayant une moyenne µ1 = 21 et un écart-type σ1 = 4 avec une population de N2 = 53 individus, ayant une moyenne µ2 = 25 et unécart-type σ2 = 7. Déterminer la moyenne et l’écart-type de la population totale.

2. Si le titre du fil d’un ensemble de bobines est distribués suivant la loi Norm (100, 12), quelest le pourcentage de bobines dont le titre est : (a) plus de 90 ; ( b) moins de 120 ; (c) entre80 et 115 ? Déterminer en outre a, b placés symétriquement autour de la moyenne tels quePr (x ∈ [a, b]) = 50%.

3. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.25 et Pr (17 < X) =0.12. Déterminer µ et σ.

.../...

47

Page 48: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№14.DS A1-04 2005-06-20 (16, sujet) 48

14.2 Loi binomiale et loi de Gauss

1. Soit x le nombre de succès obtenus en n = 10 essais indépendants, ayant chacun une pro-babilité de réussite égale à p = 0.3. Tracer l’histogramme de la variable x. Déterminer etreprésenter la moyenne et l’écart-type de cette variable.

2. On souhaite approximer cette distribution en utilisant la loi normale. Décrire comment faire.Tracer l’histogramme correspondant. Superposer ces deux histogrammes.

14.3 Corrélation

Exécuter dans la même cellule la suite de commandes Maple :nom:= "votre_nom"; _randseed:= ‘+‘(disassemble(addressof(nom)));N:=50: tmp:= stats[random, normald](2*N):... en remplaçant "votre_nom"... . Les commandeslix:= [seq(tmp[2*j ]*3+tmp[2*j-1]*2, j=1..N)]:liy:= [seq(tmp[2*j-1] +tmp[2*j ] , j=1..N)]:fournissent alors deux listes de 50 nombres. Considérer qu’il s’agit respectivement des abscisses etdes ordonnées de 50 couples (x, y).

1. Donner une représentation "sunflower" de cette population.

2. Déterminer la meilleure prévision pour y connaissant x.

3. Déterminer la meilleure prévision pour x connaissant y.

4. Tracer les deux bandes de confiance correspondantes.

14.4 Probabilités conditionnelles

Une urne contient 8 boules blanches et 10 noires. On tire successivement quatre boules (la loi dechaque tirage est supposée être la loi uniforme sur les boules présentes dans l’urne).

1. Quelle est la probabilité de tirer quatre boules de la même couleur ?

2. On a tiré quatre boules de la même couleur. Quelle est la probabilité pour que cette couleursoit le noir ?

Page 49: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 15

DS AE1-04s 2005-09-06 (17, sujet)

Ensait -E1 - Stats/Probas – Évaluation du 06/09/2005 - durée 2 h

Description du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents).

2. Vérifier que la bibliothèque simul installée est bien simul v6-18. Sinon, exécuter le fichierhttp://www.douillet.info/~douillet/mathapp/maple/simul09.mws.

3. Le compte-rendu se composera de :

(a) Un compte-rendu expérimental, sous forme d’un listing imprimé et paginé, contenant lesprocédures, les graphes et les calculs.

(b) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultatsobtenus et les méthodes utilisées.

(c) Le document complet sera agrafé et paginé. Vu les lenteurs des imprimantes mises àdisposition, imprimer une page par feuille.

4. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessairepour les impressions. Faire un essai d’impression dès la première heure. Ne pas oublier lessauvegardes en cours de travail.

5. La ressemblance entre ce sujet et le projet mis à disposition depuis le 29/03 n’échappera àpersonne... Il est recommandé d’être attentif aux différences entre les deux sujets.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordi-nateur est susceptible d’être enregistré pendant la durée de l’évaluation.

15.1 Calculs élémentaires

1. On mélange une population de N1 = 17 individus, ayant une moyenne µ1 = 16 et un écart-type σ1 = 4 avec une population de N2 = 23 individus, ayant une moyenne µ2 = 19 et unécart-type σ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

2. Si les longueurs (en mm) des fibres d’un échantillon sont distribués selon la loi Norm (40, 10),quel est le pourcentage des fibres de cet échantillon ayant : (a) plus de 30mm ; ( b) moinsde 54mm ; (c) entre 30 et 70mm ? Déterminer en outre a, b placés symétriquement autourde la moyenne tels que Pr (x ∈ [a, b]) = 50%.

.../...

49

Page 50: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№15.DS AE1-04s 2005-09-06 (17, sujet) 50

15.2 Loi de la somme de deux variables

1. On considère la variable x dont la densité de probabilité est donnée par :

f (x) = (H (x+ 4)−H (x− 2)) /6

En donner la moyenne et l’écart-type. Tracer son histogramme.

2. Même question avec la variable y ayant pour densité de probabilité :

g (y) = (H (y + 3)−H (y − 5)) /8

3. On suppose que les variables x et y sont indépendantes. Décrire comment calculer la loi dela variable z = x+ y (il n’est pas demandé d’effectuer ce calcul).

4. Il se trouve que la densité de probabilité de z est donnée par :

h (z) = Cte ∗ ((x+ 7)H (x+ 7)− (x+ 1)H (x+ 1)− (x− 1)H (x− 1) + (x− 7)H (x− 7))

Déterminer la constante Cte. Calculer directement la moyenne et l’écart-type de z. Compareravec les valeurs obtenues précédemment.

5. Expliquer l’origine des valeurs −7, −1, +1, +7 apparaissant dans l’expression de h (z).

15.3 Loi binomiale et loi de Gauss

1. Soit x le nombre de succès obtenus en n = 15 essais indépendants, ayant chacun une pro-babilité de réussite égale à p = 0.3. Tracer l’histogramme de la variable x. Déterminer etreprésenter la moyenne et l’écart-type de cette variable.

2. On souhaite approximer cette distribution en utilisant la loi normale. Décrire comment faire.Tracer l’histogramme correspondant. Superposer ces deux histogrammes.

15.4 Corrélation

Dans ce qui suit, yyyymmdd est à remplacer par votre date de naissance. Soit 19840327 pour le27 mars 1984. On remarquera que _seed commence par le caractère "souligné".La suite de commandes Maple :_seed:= yyyymmdd;N:=50: tmp:= stats[random, normald](2*N):lix:= [seq(tmp[2*j ]*3+tmp[2*j-1]*2, j=1..N)]:liy:= [seq(tmp[2*j-1] +tmp[2*j ] , j=1..N)]:fournit deux listes de 50 nombres. Considérer qu’il s’agit respectivement des abscisses et des ordon-nées de 50 couples (x, y).

1. Donner une représentation "sunflower" de cette population.

2. Déterminer la meilleure prévision pour y connaissant x.

3. Déterminer la meilleure prévision pour x connaissant y.

4. Tracer les deux bandes de confiance correspondantes.

Page 51: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 16

DS E1-05 2006-05-29 (19, sujet)

Ensait-E1-Stats/Probas--Évaluationdu29/05/2006à14h00

durée 2 heures – tous documents autorisés

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2005-2006 continuent d’être valables. Elles sontconsultables à l’adresse :http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

16.1 Série temporelle

Les valeurs prises par la quantité x en fonction du temps sont données dans le fichier http://www.douillet.info/~douillet/mathapp/dazzle/stats/dat_stats_ds19ax.txt. Étudier cettesérie temporelle.

1. Étude non temporelle : effectif, intervalle, moyenne, écart type. Histogramme avec représen-tation des paramètres de dispersion.

2. Étude temporelle. Les données présentent une pseudo-périodicité. Déterminer la période aumoyen d’une transformation de Fourier.

3. Représenter graphiquement la tendance à long terme à l’aide d’une moyenne mobile.

4. Déterminer les variations saisonnières. Quelle est leur amplitude ?

5. Déterminer les variations résiduelles après correction des variations saisonnières et de latendance à long terme. Graphe. Quelle est la variance résiduelle ?

16.2 Régression affine

Les valeurs prises par la quantité y en fonction du temps sont données dans le fichier http://www.douillet.info/~douillet/mathapp/dazzle/stats/dat_stats_ds19ay.txt (les xi et yi demême numéro ont été mesurés à la même date). Étudier la corrélation entre les deux séries dedonnées. Sont attendus :

1. FRV, interprétation.

2. Équation de la droite de prévision de y quand x est connu. De même, prévision de xquandy est connu.

3. Représentation graphique de tout cela (diagramme en marguerite).

51

Page 52: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№16.DS E1-05 2006-05-29 (19, sujet) 52

Page 53: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 17

DS A1-05 2005-06-16 (20, sujet)

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2005-2006 continuent d’être valables. Elles sontconsultables à l’adresse :http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

17.1 Calculs élémentaires

1. On mélange une population de N1 = 34 individus, ayant une moyenne µ1 = 40 et un écart-type σ1 = 8 avec une population de N2 = 66 individus, ayant une moyenne µ2 = 35 et unécart-type σ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

2. Si le titre du fil d’un ensemble de bobines est distribués suivant la loi Norm (110, 12), quelest le pourcentage de bobines dont le titre est : (a) plus de 100 ; ( b) moins de 130 ; (c) entre90 et 120 ? Déterminer en outre a, b placés symétriquement autour de la moyenne tels quePr (x ∈ [a, b]) = 50%.

3. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.35 et Pr (17 < X) =0.27. Déterminer µ et σ.

17.2 Probabilités conditionnelles

Une urne contient 4 boules blanches et 6 noires. On tire successivement trois boules (la loi dechaque tirage est supposée être la loi uniforme sur les boules présentes dans l’urne).

1. Quelle est la probabilité de tirer trois boules de la même couleur ?

2. On a tiré trois boules de la même couleur. Quelle est la probabilité pour que cette couleur soitle noir ?

3. Initialiser le générateur aléatoire par la commande_seed:=yyyymmjj;où yyyy est votre année de naissance, mm le mois et jj le jour. Éviter les fautes d’orthographedans cette commande, cela fait tout planter (mais vous aviez sauvegardé...). On rappelle quela procédure ra() fournit des nombres ’aléatoires’ compris entre 0 et 1.

.../...

53

Page 54: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№17.DS A1-05 2005-06-16 (20, sujet) 54

4. Décrire dans le détail ce que font les procédures :tire_1:= proc() global a,b:if ra() < a/(a+b) then a:=a-1: return 0 else b:=b-1; return 1 fi;end;tire:= proc() global a,b: local u,v,w;a,b:=4,6; u,v,w:= ’tire_1()’$3; return u+v+w;end:

5. Réinitialiser le générateur et obtenir une liste de N = 1000 valeurs avec_seed:=yyyymmjj;li:= [ ’tire()’$N];Moyenne, variance, histogramme. Faire apparaître les paramètres de dispersion sur l’histo-gramme. Comparer les fréquences expérimentales avec les probabilités obtenues en 1 et 2.

17.3 Transformée de Fourier

1. Réinitialiser le générateur et engendrer une série temporelle de 500 valeurs avec_seed:=yyyymmjj;genere:= proc(k) 50+100*exp(-k/200)+15*cos(Pi*k/7)+3*ra(); evalf(%) end;data:= [seq(genere(k), k=1..n)]:

2. Moyenne, variance, représentation graphique.

3. Ces données présentent une pseudo-période. Donner les détails des calculs permettant deretrouver cette période par une transformation de Fourier. Tracer les graphes correspondants.Que remarque-t-on ?

4. Détermination de la tendance à long terme par une moyenne mobile. Graphe. Que remarque-t-on ?

Page 55: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 18

DS AE1-05 2006-09-06 (21, sujet)

durée 2 heures – tous documents autorisés

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2005-2006 continuent d’être valables. Elles sontconsultables à l’adresse : http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

18.1 Série temporelle

Le fichier http://www.douillet.info/~douillet/mathapp/dazzle/stats/dat_stats_ds21x.txt contient les valeurs successives prises par la quantité x en fonction du temps.

1. Étude non temporelle : effectif, intervalle, moyenne, écart type. Histogramme avec représen-tation des paramètres de dispersion.

2. Étude temporelle. Les données présentent une pseudo-périodicité. Déterminer la période aumoyen d’une transformation de Fourier.

3. Représenter graphiquement la tendance à long terme à l’aide d’une moyenne mobile.

4. Déterminer les variations saisonnières. Quelle est leur amplitude ?

5. Déterminer les variations résiduelles après correction des variations saisonnières et de latendance à long terme. Graphe. Quelle est la variance résiduelle ?

18.2 Régression affine

Le fichier http://www.douillet.info/~douillet/mathapp/dazzle/stats/dat_stats_ds21y.txt contient les valeurs prises par la quantité y en fonction du temps (les xi et yi de même nu-méro ont été mesurés à la même date). Étudier la corrélation entre les deux séries de données. Sontattendus :

1. FRV, interprétation.

2. Équation de la droite de prévision de y quand x est connu. De même, prévision de xquandy est connu.

3. Représentation graphique de tout cela (diagramme en marguerite).

55

Page 56: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№18.DS AE1-05 2006-09-06 (21, sujet) 56

Page 57: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 19

DS E1-06 2007-05-07 (22, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2006-2007 continuent d’être valables. Elles sontconsultables à l’adresse : http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

19.1 Regroupement de deux populations

On mélange une population de N1 = 20 individus, ayant une moyenne µ1 = 15 et un écart-typeσ1 = 4 avec une population de N2 = 30 individus, ayant une moyenne µ2 = 12 et un écart-typeσ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

19.2 Usage des tables de la loi normale

1. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (39, 11), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 50 ans ; ( b) au moins 45 ans ;(c) entre 25 et 40 ans ?

2. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.29 et Pr (20 < X) =0.25. Déterminer µ et σ.

19.3 Somme de variables

On rappelle qu’il existe des méthodes efficaces pour traiter les problèmes répétitifs.

1. On considère la variable aléatoireX définie par Pr (1) = 0.35, Pr (2) = 0.43 et Pr (3) = 0.22.Moyenne, variance. Histogramme de la variable réduite associée.

2. On considère en outre la variable Y , de même loi que X et on suppose que X, Y sontindépendantes. Déterminer les valeurs et les probabilités de la variable X + Y . Moyenne,variance. Histogramme de la variable réduite associée.

3. On considère en outre la variable Z, de même loi que X et on suppose que X, Y, Z sontindépendantes deux à deux. Déterminer les valeurs et les probabilités de la variableX+Y +Z.Moyenne, variance. Histogramme de la variable réduite associée.

57

Page 58: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№19.DS E1-06 2007-05-07 (22, sujet) 58

4. On considère en outre la variable T , de même loi que X et on suppose que X, Y, Z, Tsont indépendantes deux à deux. Déterminer les valeurs et les probabilités de la variableS = X + Y + Z + T . Moyenne, variance. Histogramme de la variable réduite associée.

5. Constater que ces histogrammes ressemblent de mieux en mieux à une certaine loi limite.Préciser laquelle. En tracer la courbe sur l’histogramme de S.

19.4 Droite de régression affine

Le nombre yyyymmdd est à personnaliser, de sorte que dd/mm/yyyy soit votre date de naissance.La suite de commandes Maple :

_seed:= yyyymmdd;N:=100: tmp:= stats[random, normald](2*N):lix:= [seq(tmp[2*j ]*3+2*tmp[2*j-1], j=1..N)]:liy:= [seq(tmp[2*j-1]*3+2*tmp[2*j ], j=1..N)]:

fournit deux listes de 100 nombres. Considérer qu’il s’agit respectivement des abscisses et des or-données de 100 couples (x, y).

1. Donner une représentation "sunflower" de cette population.

2. Déterminer la meilleure prévision pour y connaissant x.

3. Déterminer la meilleure prévision pour x connaissant y.

4. Tracer les deux bandes de confiance correspondantes.

Page 59: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 20

DS A1-06 2007-06-27 (23, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2006-2007 continuent d’être valables. Elles sontconsultables à l’adresse : http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

20.1 Regroupement de deux populations

On mélange une population de N1 = 47 individus, ayant une moyenne µ1 = 60 et un écart-typeσ1 = 8 avec une population de N2 = 63 individus, ayant une moyenne µ2 = 35 et un écart-typeσ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

20.2 Usage des tables de la loi normale

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (110, 14). Quel est le pourcentage de processus ayant une durée : (a) supérieure à 100; ( b) inférieure à 130 ; (c) comprise entre 90 et 120 ?

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

3. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.39 et Pr (17 < X) =0.35. Déterminer µ et σ.

20.3 Somme de variables

On suppose que les variables indépendantes X et Y sont uniformément distribuées sur, respec-tivement, [1, 3] et [2, 5].

1. Exprimer les densités de probabilité des variablesX et Y en utilisant la fonction de Heaviside.

2. Déterminer la distribution de la variable Z = X + Y .

20.4 Droite de régression affine

Le nombre yyyymmdd est à personnaliser, de sorte que dd/mm/yyyy soit votre date de naissance.La suite de commandes Maple :

59

Page 60: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№20.DS A1-06 2007-06-27 (23, sujet) 60

_seed:= yyyymmdd;N:=100: tmp:= stats[random, normald](2*N):lix:= [seq(tmp[2*j ]*3+2*tmp[2*j-1], j=1..N)]:liy:= [seq(tmp[2*j-1]*3+2*tmp[2*j ], j=1..N)]:

fournit deux listes de 100 nombres. Considérer qu’il s’agit respectivement des abscisses et des or-données de 100 couples (x, y).

1. Donner une représentation "sunflower" de cette population.

2. Déterminer la meilleure prévision pour y connaissant x.

3. Déterminer la meilleure prévision pour x connaissant y.

4. Tracer les deux bandes de confiance correspondantes.

Page 61: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 21

DS AE1-06s 2007-09-04 (25, sujet)

tous documents autorisésle sujet comporte deux pages

Rappel des consignes

Les consignes données lors de l’évaluation MAO 2006-2007 continuent d’être valables. Elles sontconsultables à l’adresse : http://www.douillet.info/~douillet/mathapp/Ensait-consignes.pdf.

En particulier, l’attention des étudiants est attirée sur le fait que le trafic réseau deleur ordinateur est susceptible d’être enregistré pendant la durée de l’évaluation.

21.1 Regroupement de deux populations

On mélange une population de N1 = 25 individus, ayant une moyenne µ1 = 14 et un écart-typeσ1 = 6 avec une population de N2 = 35 individus, ayant une moyenne µ2 = 17 et un écart-typeσ2 = 4. Déterminer la moyenne et l’écart-type de la population totale.

21.2 Usage des tables de la loi normale

1. Si les âges d’un groupe de personnes sont distribués suivant la loi Norm (35, 11), quel est lepourcentage des membres de ce groupe ayant : (a) moins de 45 ans ; ( b) au moins 50 ans ;(c) entre 25 et 40 ans ?

2. On sait que la variable X suit une loi normale et que Pr (X < 7) = 0.24 et Pr (20 < X) =0.19. Déterminer µ et σ.

21.3 Somme de variables

On rappelle qu’il existe des méthodes efficaces pour traiter les problèmes répétitifs.

1. On considère la variable aléatoireX définie par Pr (1) = 0.33, Pr (2) = 0.28 et Pr (3) = 0.39.Moyenne, variance. Histogramme de la variable réduite associée.

2. On considère en outre la variable Y , de même loi que X et on suppose que X, Y sontindépendantes. Déterminer les valeurs et les probabilités de la variable X + Y . Moyenne,variance. Histogramme de la variable réduite associée.

3. On considère en outre la variable Z, de même loi que X et on suppose que X, Y, Z sontindépendantes deux à deux. Déterminer les valeurs et les probabilités de la variableX+Y +Z.Moyenne, variance. Histogramme de la variable réduite associée.

61

Page 62: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№21.DS AE1-06s 2007-09-04 (25, sujet) 62

4. On considère en outre la variable T , de même loi que X et on suppose que X, Y, Z, Tsont indépendantes deux à deux. Déterminer les valeurs et les probabilités de la variableS = X + Y + Z + T . Moyenne, variance. Histogramme de la variable réduite associée.

5. Constater que ces histogrammes ressemblent de mieux en mieux à une certaine loi limite.Préciser laquelle. En tracer la courbe sur l’histogramme de S.

21.4 Droite de régression affine

Le nombre yyyymmdd est à personnaliser, de sorte que dd/mm/yyyy soit votre date de naissance.La suite de commandes Maple :

_seed:= yyyymmdd;N:=100: tmp:= stats[random, normald](2*N):lix:= [seq(tmp[2*j ]*3.1+1.9*tmp[2*j-1], j=1..N)]:liy:= [seq(tmp[2*j-1]*3.1+1.9*tmp[2*j ], j=1..N)]:

fournit deux listes de 100 nombres. Considérer qu’il s’agit respectivement des abscisses et des or-données de 100 couples (x, y).

1. Donner une représentation "sunflower" de cette population.

2. Déterminer la meilleure prévision pour y connaissant x.

3. Déterminer la meilleure prévision pour x connaissant y.

4. Tracer les deux bandes de confiance correspondantes.

Page 63: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 22

A1-07 entraînement (26, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Descriptif du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents). Les feuillesde calcul qui auraient été réalisées en binôme lors d’une séance de TP devront avoir été dupliquéesdans les répertoires personnels des étudiants concernés.

2. Le compte-rendu se composera de :

(a) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultats obtenuset les méthodes utilisées.

(b) Ce compte rendu sera appuyé par un ensemble de documents imprimés : graphes, listing (scipad),exécutions (scilex). Sur chacun de ces documents, le nom de l’apprenti doit être imprimé.

(c) Le document complet sera agrafé et paginé.

3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autresproblèmes) devront avoir été résolus largement avant l’évaluation.

5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas deproblèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sousforme électronique.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateurest susceptible d’être enregistré pendant la durée de l’évaluation.

22.1 Regroupement de deux populations

On mélange une population de N1 = 47 individus, ayant une moyenne µ1 = 60 et un écart-typeσ1 = 8 avec une population de N2 = 63 individus, ayant une moyenne µ2 = 35 et un écart-typeσ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

22.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié oubien comment utiliser la fonction cdfnor.

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (110, 14). Quel est le pourcentage de processus ayant une durée : (a) supérieure à 100; ( b) inférieure à 130 ; (c) comprise entre 90 et 120 ?

63

Page 64: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№22.A1-07 entraînement (26, sujet) 64

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

3. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.39 et Pr (17 < X) =0.35. Déterminer µ et σ.

22.3 Somme de variables

Le nombre yyyymmdd ci-dessous est à personnaliser, de sorte que dd/mm/yyyy soit votre date denaissance. On considère deux variables aléatoires indépendantes X et Y distribuées respectivementselon les lois Γ (a = 2.5 ; b = 1) et Γ (a = 3.7 ; b = 1). On s’intéresse à la distribution de la variableZ = X + Y .

1. Au cas où Z serait une variable Γ, déterminer les paramètres a et b correspondants (utilisermoyenne et écart-type).

2. Personnaliser le générateur aléatoire par la commandegrand(’setsd’, yyyymmdd)Puis engendrer N = 1000 instanciations de X et de Y (consulter l’aide en ligne de grandpour les détails de syntaxe).

3. Pour chacune des variables X, Y, Z, tracer l’histogramme des valeurs obtenues (utiliser unerépartition en 10 classes). Représenter la moyenne et l’écart-type de ces valeurs.

4. Sur chacun des graphes, représenter la densité de probabilité de la loi Γ correspondante.

5. Déterminer les nombres z0 = 0, z1, · · · , z9, z10 = ∞ tels que Pr (Z ∈ [zi, zi+1]) = 1/10,avec ∀i : zi < zi+1. Sur un nouveau graphique : tracer l’histogramme théorique de la loi Γzcorrespondant aux classes [zi, zi+1]. Sur ce graphique, superposer l’histogramme des donnéesexpérimentales (pour les mêmes classes).

22.4 Droite de régression affine

1. Télécharger le fichier http://www.douillet.info/~douillet/mathapp/dazzle/exper.txtet lire les lignes de ce fichier sous Scilab.

2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe") etobtenir une colonne de x et une colonne de y. En cas de "drame non résolu", il est toujourspossible de retravailler le fichier de données avec un traitement de texte.

3. Calculer les 6 paramètres de dispersion de la distribution (x, y). Représenter ces points,représenter les moyennes et les écarts-type.

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

Page 65: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 23

DS A1-07 2007-12-12 (27, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Descriptif du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents). Les feuillesde calcul qui auraient été réalisées en binôme lors d’une séance de TP devront avoir été dupliquéesdans les répertoires personnels des étudiants concernés.

2. Le compte-rendu se composera de :

(a) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultats obtenuset les méthodes utilisées.

(b) Ce compte rendu sera appuyé par un ensemble de documents imprimés : graphes, listing (scipad),exécutions (scilex). Sur chacun de ces documents, le nom de l’apprenti doit être imprimé.

(c) Le document complet sera agrafé et paginé.

3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autresproblèmes) devront avoir été résolus largement avant l’évaluation.

5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas deproblèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sousforme électronique.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateurest susceptible d’être enregistré pendant la durée de l’évaluation.

23.1 Regroupement de deux populations

On mélange une population disjointes de N1 = 43 individus, ayant une moyenne µ1 = 55 et unécart-type σ1 = 7 avec une population de N2 = 57 individus, ayant une moyenne µ2 = 40 et unécart-type σ2 = 6. Déterminer la moyenne et l’écart-type de la population totale.

23.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié oubien comment utiliser la fonction cdfnor.

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (100, 14). Quel est le pourcentage de processus ayant une durée : (a) supérieure à 90 ;( b) inférieure à 120 ; (c) comprise entre 90 et 115 ?

65

Page 66: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№23.DS A1-07 2007-12-12 (27, sujet) 66

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

3. On sait que la variable X suit une loi normale et que Pr (X < 8) = 0.44 et Pr (15 < X) =0.37. Déterminer µ et σ.

23.3 Somme de variables

Le nombre yyyymmdd ci-dessous est à personnaliser, de sorte que dd/mm/yyyy soit votre date denaissance. On considère deux variables aléatoires indépendantes X et Y distribuées respectivementselon les lois normales Norm (µ = 2.4 ; σ = 1.2) et Norm (µ = 2.7 ; b = 1.6). On s’intéresse à ladistribution de la variable Z = X + Y .

1. Au cas où Z serait une variable normale Norm (µ, σ), déterminer les paramètres correspon-dants.

2. Personnaliser le générateur aléatoire par la commandegrand(’setsd’, yyyymmdd)Puis engendrer N = 1000 instanciations de X, puis N instanciations de Y (consulter l’aideen ligne de grand pour les détails de syntaxe).

3. Pour chacune des variables X, Y, Z, tracer l’histogramme des valeurs obtenues (utiliser unerépartition en 10 classes). Représenter la moyenne et l’écart-type de ces valeurs.

4. Sur chacun des graphes, représenter la densité de probabilité de la loi Norm (µ, σ) corres-pondante c’est à dire :

x 7→ 1

σ√

2πexp

(−(x− µ)2

2σ2

)5. Utiliser cdfnor (cf. l’aide en ligne) pour déterminer les nombres z0 = −∞, z1, · · · , z9, z10 =

+∞ tels que Pr (Z ∈ [zi, zi+1]) = 1/10, avec ∀i : zi < zi+1. Sur un nouveau graphique :tracer l’histogramme théorique de la loi Γz correspondant aux classes [zi, zi+1] (remplacerz0 et z10 par des nombres "raisonnables"). Sur ce graphique, superposer l’histogramme desdonnées expérimentales (pour les mêmes classes).

23.4 Droite de régression affine

1. Télécharger le fichier http://www.douillet.info/~douillet/mathapp/dazzle/football.txt et lire les lignes de ce fichier sous Scilab.

2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe").Sélectionner les colonnes ht (height=taille) et wt (weight=poids). En cas de "drame nonrésolu", il est toujours possible de retravailler le fichier de données avec un traitement detexte.

3. Calculer les 6 paramètres de dispersion de la distribution (ht, wt). Représenter ces points,représenter les moyennes et les écarts-type.

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

Page 67: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 24

DS E1-07 2008-01-23 (28abc, corrigé)

durée : deux heures – tous documents autorisésle sujet comporte deux pages

Descriptif du travail demandé

1. Le document remis se composera de :

(a) Un compte-rendu mathématique, manuscrit, mettant en valeur les résultats obtenus et indiquantles méthodes utilisées.

(b) Ce compte-rendu sera appuyé par des documents imprimés : graphes, listing (scipad), exécutions(scilex). Sur chacun de ces documents, le nom de l’étudiant sera imprimé.

(c) Le document complet sera agrafé et paginé.

2. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents). Les feuillesde calcul qui auraient été réalisées en binôme lors d’une séance de TP devront avoir été dupliquéesdans les répertoires personnels des étudiants concernés.

3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autresproblèmes) devront avoir été résolus largement avant l’évaluation.

5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas de pro-blèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sous formeélectronique.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateurest susceptible d’être enregistré pendant la durée de l’évaluation.

Remarques du correcteur

1. Un compte-rendu mathématique manuscrit était demandé. Il semble qu’un certain nombred’étudiants ont rencontré un problème pour configurer leur stylo à bille.

2. Un document est destiné à être lu. Si vous pensez que vos résultats ne valent pas la peined’être rédigés, attendez vous à ce que votre lecteur vous fasse confiance à ce sujet.

3. Trier les documents remis par question et paginer le tout, améliore le confort du lecteur. Il estbien possible que cela améliore aussi la note attribuée. Ne pas hésiter à faire des couper-colleravec des ciseaux et de la colle.

4. Utilisez le format Nom Prénom pour identifier votre copie. Imprimez votre nom sur chaquesortie d’ordinateur, en particulier les graphiques.

5. Ceux qui intitulent leur manuscrit "DS de Scilab" au lieu de "DS de Statistiques" sont assezsouvent ceux qui ne savent pas se servir de l’outil scilab (ou d’un autre) pour traiter lesquestions posées.

67

Page 68: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№24.DS E1-07 2008-01-23 (28abc, corrigé) 68

6. Trouvé sur une copie : "Je n’ai pas de calculatrice". Signalons que les boites métalliquesposées sur les tables et qui font des bruits de ventilateur ne sont pas seulement des appareilsde chauffage.

7. Enfin, il est anormal d’obtenir un écart-type négatif ou une variance négative et ne pas s’enétonner.

Les notes attribuées vont de 3 à 20, avec une moyenne de 12.5 et un écart-type de 4.

24.1 Regroupement de deux populations

1. Copier/coller et exécuter sous scilab les commandes suivantes, en remplaçant ddmmaa parles valeurs telles que dd/mm/19aa soit votre date de naissance :grand(’setsd’, ddmmaa)N1= grand(1,’uin’,30,40), N2= grand(1,’uin’,40,50)m1= grand(1,’uin’,20,24), m2= grand(1,’uin’,15,19)s1= grand(1,’uin’,10,14), s2= grand(1,’uin’,5,9)Ces valeurs sont à utiliser dans la question suivante.

(a) ddmmaa=123456; grand(’setsd’, ddmmaa); ...printf(’N1= %d, m1= %d, s1= %d; N2= %d, m2= %d, s2= %d\n’,... N1,m1,s1,N2,m2,s2);donne :N1= 36, m1= 20, s1= 13; N2= 44, m2= 18, s2= 7

(b) Les étudiants utilisant (par exemple) ddmmaa=10041987 sont-ils réellement nés au 192ème millénaire (de l’Empire Galactique ?).

2. On mélange deux populations disjointes. L’une se compose de N1 individus, ayant une moyennem1 et un écart-type s1 et l’autre se compose de N2 individus, ayant une moyenne m2 et unécart-type s2. Déterminer la moyenne et l’écart-type de la population totale.

(a) On passe par l’intermédiaire des grandeurs∑x et

∑x2 qui sont associatives.

N=N1+N2;m=(N1*m1+N2*m2)/N;tmp=N1*(m1^2+s1^2)+N2*(m2^2+s2^2); s=sqrt(tmp/N-m^2);printf(’\n N= %d, m= %f, s= %f\n’,N,m,s);donne :N= 80, m= 18.900000, s= 10.197549

24.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié ou biencomment utiliser la fonction cdfnor .

1. Pour un ensemble de processus, on constate que les durées sont approximativement distribuéssuivant la loi Norm (90, 12). Quel est le pourcentage de processus ayant une durée : (a)supérieure à 95 ; ( b) inférieure à 100 ; (c) comprise entre 80 et 110 ?

(a) On décrit la loi utilisée[m,s]=(90,12)

(b) Puis on utilise cdfnor pour obtenir les Pr (X < x)x=95; printf(’la proportion des x >%3d est: %f\n’,... x, 1-cdfnor(’PQ’,x,m,s))x=100; printf(’la proportion des x <%3d est: %f\n’,... x, cdfnor(’PQ’,x,m,s))x=80; y=110; printf(’la prop. des %3d< x <%3d est: %f\n’,... x, y, cdfnor(’PQ’,y,m,s)-cdfnor(’PQ’,x,m,s)).

Page 69: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

69 №24.DS E1-07 2008-01-23 (28abc, corrigé)

(c) On obtient :la proportion des x > 95 est: 0.338461la proportion des x <100 est: 0.797672la prop. des 80 < x <110 est: 0.749881

(d) D’où les réponses 34%, 80%, 75%.(e) Imprimer [p,q]=cdfnor(qsp) ne va pas, sauf à indiquer lequel des deux nombres donne

la réponse voulue.

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

(a) Cela revient à dire que Pr (X < b) = 0.75

(b) a= 81.906123, b= 98.093877

3. On sait que la variable X suit une loi normale et que Pr (X < 9) = 0.34 et Pr (16 < X) =0.47. Déterminer µ et σ.

(a) On en déduit les valeurs réduitesz1 = IGauss(0.34) ≈ −0.4124631 et z2 = IGauss (0.53) ≈ 0.0752699.

(b) On résout {9 = µ− 0.4125σ, 16 = µ+ 0.0753σ}(c) Il vient σ ≈ 14.35 et µ ≈ 14.92

(d) Pour ceux qui ont voulu utiliser des matrices :prob= [0.34; 1-0.47], mb=[10; 17]z=cdfnor(’X’, zeros(prob), ones(prob), prob, 1-prob);ma=[z; ones(z)]; tmp=inv(ma)*mbprintf(’z= [%f, %f], mea= %f, sig=%f\n\n’, z(1), z(2), tmp(2), tmp(1))

24.3 Somme de variables

Le nombre ddmmaa ci-dessous est à personnaliser, de sorte que dd/mm/19yy soit votre datede naissance. On considère deux variables aléatoires indépendantes X et Y distribuées respective-ment selon les lois gamma réduites : Gamma (a1 = 2.2, b1 = 1) et Gamma (a2 = 2.8, b2 = 1).On s’intéresse à la distribution de la variable Z = X + Y .

1. Rappeler quels sont les paramètres de dispersion d’une variable distribuée selon une loiGamma (a, b).

(a) Les paramètres de dispersion d’une distribution sont la moyenne (espérance) et l’écart-type.

(b) On a E (X) = a b et var (X) = a b2

2. Au cas où Z serait une variable Gamma (a, b), déterminer les paramètres correspondants.

(a) On a E (Z) = E (X) + E (Y ) = 5.0 (toujours)et var (Z) = var (X) + var (Y ) = 5.0 (indépendance)

(b) Au cas où Z serait une variable gamma, on a nécessairement a = 5.0 et b = 1.(c) D’ailleurs, le cours montre que la somme de deux variables gamma réduites est une

variable gamma réduite.

3. Initialiser à nouveau le générateur aléatoire par la commandegrand(’setsd’, ddmmaa)Engendrer N = 1200 instanciations de X, puis N instanciations de Y (consulter l’aide enligne de grand pour les détails de syntaxe, et utiliser ’gam’ avec : shape=a, scale=1/b).L’aide en ligne indique :Y= grand(m,n,’gam’,shape,scale) generates random variates from the gammadistribution with parameters shape (real > 0) and scale (real > 0)

Page 70: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№24.DS E1-07 2008-01-23 (28abc, corrigé) 70

4. Pour chacune des variables X, Y, Z, tracer l’histogramme des valeurs obtenues (utiliser unerépartition en 10 classes). Représenter la moyenne et l’écart-type de ces valeurs.

(a) On réutilise le programme contenu dans stats.sce :curfig=scf(1); clf(); histplot(10, lesx);xtitle(sprintf(’X : %d instanciations, loi gamma (%4.2f,1)’, N,aa))curax=gca(); curax.title.font_size=4; curax.sub_ticks=[0,0];

(b) De même pour Y et Z.

5. Sur chacun des graphes, représenter la densité de probabilité de la loi Gamma (a, 1) corres-pondante.

(a) Ne pas utiliser la distribution normale (l’exercice a changé...).(b) deff(’y=gax(x)’, sprintf(’y=x^%f .* exp(-x)*%f’, aa-1, 1/gamma(aa) ));

xxx=0:0.1:max(lesx); plot2d(xxx, gax(xxx), 5);

(c) On obtient la Figure 24.1.

0 1 2 3 4 5 6 7 8 9 10

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

X : 1000 instanciations selon une loi gamma (2.20,1)

0 1 2 3 4 5 6 7 8 9 10

0.00

0.05

0.10

0.15

0.20

0.25

0.30

Y : 1000 instanciations selon une loi gamma (2.80,1)

Figure 24.1 – Les X et les Y

6. Utiliser cdfgam (cf. l’aide en ligne) pour déterminer les nombres z0 = 0, z1, · · · , z9, z10 =+∞ tels que Pr (Z ∈ [zi, zi+1]) = 1/10, avec ∀i : zi < zi+1. Sur un nouveau graphique,tracer l’histogramme théorique de la loi de Gamma (a, b) correspondant aux classes [zi, zi+1](remplacer z10 par une valeur "raisonnable"). Sur ce graphique, superposer l’histogrammedes données expérimentales (pour les mêmes classes).

24.4 Droite de régression affine

1. Télécharger le fichier http: // www. douillet. info/ ~douillet/ mathapp/ dazzle/ football.txt et lire les lignes de ce fichier sous Scilab.

(a) Il faut commencer par indiquer où se trouve le fichier :repert=’~/docs/Ensait/stats/datas/’fich=repert+"football.txt"

(b) Puis on lit tout en bloc. Ne pas mélanger lecture et interprétation :hndl=mopen(fich,’r’); brut=mgetl(hndl); mclose(hndl);

2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe").Sélectionner les colonnes ht (height=taille) et wt (weight=poids). En cas de "drame nonrésolu", il est toujours possible de retravailler le fichier de données avec un traitement detexte.

Page 71: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

71 №24.DS E1-07 2008-01-23 (28abc, corrigé)

(a) Stratégie générale : remplacer les virgules par des séparateurs.tmp=strsubst(brut,’,’,’ ’);datas=msscanf(-1, brut(2:$), "%d%s%d%d%s")

(b) Stratégie de repli : procéder aux remplacements dans un traitement de texte avant lecturesous scilab.

(c) Stratégie "glorieuse" : en lisant la doc, on trouvait :datas=msscanf(-1, brut(2:$), "%d,%[A-Za-z\-],%d,%d,%[A-Z]")

(d) Autre statégie possible : lire ligne par ligne, en faisant une boucle.

(e) Sélection des bonnes colonnes :ht=datas(:,3); wt=datas(:,4);

3. Calculer les 6 paramètres de dispersion de la distribution (ht, wt). Représenter ces points,représenter les moyennes et les écarts-type.

(a) Version élémentaire (celle demandée) :N=size(ht,’*’); mht=mean(ht); vht=mean(ht .^2)-mht^2;mwt=mean(wt); vwt=mean(wt .^2)-mwt^2;cov=mean(ht .* wt) - mwt*mht;printf(’N=%d, mht=%f, vht=%f, mwt=%f, vwt=%f, cov=%f\n\n’,. N,mht,vht,mwt,vwt,cov);

(b) Version matricielle :ma=datas(:,[3,4]); mc=center(ma, ’r’); mc’*mc/Nmw=wcenter(ma, ’r’); mw’*mw/(N-1)

(c) On trouve :N=92, mht=74.206522, vht=7.229088, mwt=231.195652, vwt=1785.657372cov=76.307420

(d) On représente tout cela :scf(0); clf(); plot2d(ht,wt,-8) curax=gca();lesx=curax.data_bounds(:,1);plot2d(lesx,[mwt-sqrt(vwt)*[1;1], mwt+sqrt(vwt)*[1;1]], [2,2])plot2d((mht-sqrt(vht))*[1,1], curax.data_bounds(:,2), 2)plot2d((mht+sqrt(vht))*[1,1], curax.data_bounds(:,2), 2)curax.sub_ticks=[0,0];

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

(a) La formule est :yprev = E (y) + (x− E (x))× cov

var (x)

(b) D’où les commandes :deff(’y=fun(x)’, sprintf(’y=%f+(x-%f)*%f’,mwt,mht,cov/vht))frv=1/(1-cov^2/vht/vwt)plot2d(lesx, feval(lesx, fun)+sqrt(vwt/frv), 5)plot2d(lesx, feval(lesx, fun)-sqrt(vwt/frv), 5)xtitle(sprintf(’wt versus ht, frv=%f’, frv))

(c) On obtient la Figure 24.2

Page 72: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№24.DS E1-07 2008-01-23 (28abc, corrigé) 72

66 68 70 72 74 76 78 80 82

100

150

200

250

300

350

wt versus ht, frv=1.821753

Figure 24.2 – Football et régression

Page 73: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 25

DS AE1-07s 2008-09-03 (29, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Descriptif du travail demandé

1. Chaque étudiant travaillera de façon isolée (avec le libre accès à ses propres documents).

2. Le compte-rendu se composera de :

(a) Un compte-rendu mathématique, manuscrit ou imprimé, mettant en valeur les résultats obtenuset les méthodes utilisées.

(b) Ce compte rendu sera appuyé par un ensemble de documents imprimés : graphes, listing (scipad),exécutions (scilex). Sur chacun de ces documents, le nom de l’apprenti doit être imprimé.

(c) Le document complet sera agrafé et paginé.

3. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

4. Il va de soi que tous les problèmes de compte informatique (mots de passe, comptes périmés ou autresproblèmes) devront avoir été résolus largement avant l’évaluation.

5. Mention spéciale pour les étudiants utilisant leur portable personnel pour composer : en cas deproblèmes réseau spécifiques aux portables, ces étudiants pourront remettre leurs documents sousforme électronique.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateurest susceptible d’être enregistré pendant la durée de l’évaluation.

25.1 Regroupement de deux populations

1. Copier/coller et exécuter sous scilab les commandes suivantes, en remplaçant ddmmaa parles valeurs telles que dd/mm/19aa soit votre date de naissance :grand(’setsd’, ddmmaa)N1= grand(1,’uin’,35,45), N2= grand(1,’uin’,40,60)m1= grand(1,’uin’,21,27), m2= grand(1,’uin’,16,22)s1= grand(1,’uin’,10,15), s2= grand(1,’uin’,09,12)Ces valeurs sont à utiliser dans la question suivante.

2. On mélange deux populations disjointes. L’une se compose de N1 individus, ayant unemoyenne m1 et un écart-type s1 et l’autre se compose de N2 individus, ayant une moyennem2 et un écart-type s2. Déterminer la moyenne et l’écart-type de la population totale.

73

Page 74: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№25.DS AE1-07s 2008-09-03 (29, sujet) 74

25.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié oubien comment utiliser la fonction cdfnor.

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (105, 14). Quel est le pourcentage de processus ayant une durée : (a) inférieure à 100; ( b) supérieure à 130 ; (c) comprise entre 90 et 120 ?

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 0.6.

3. On sait que la variable X suit une loi normale et que Pr (X < 19) = 0.29 et Pr (27 < X) =0.35. Déterminer µ et σ.

25.3 Somme de variables

Le nombre ddmmaa ci-dessous est à personnaliser, de sorte que dd/mm/19aa soit votre datede naissance. On considère deux variables aléatoires indépendantes X et Y distribuées respective-ment selon les lois gamma réduites : Gamma (a1 = 2.4, b1 = 1) et Gamma (a2 = 3.5, b2 = 1). Ons’intéresse à la distribution de la variable Z = X + 2Y .

1. Rappeler quels sont les paramètres de dispersion d’une variable distribuée selon une loiGamma (a, b).

2. Au cas où Z serait une variable Gamma (a, b), déterminer les paramètres correspondants.

3. Initialiser à nouveau le générateur aléatoire par la commandegrand(’setsd’, ddmmaa)Puis engendrer N = 1200 instanciations de X, puis N instanciations de Y (consulter l’aideen ligne de grand pour les détails de syntaxe, et utiliser ’gam’ avec : shape=a, scale=1/b).

4. Pour chacune des variables X, Y, Z, tracer l’histogramme des valeurs obtenues (utiliser unerépartition en 10 classes). Représenter la moyenne et l’écart-type de ces valeurs.

5. Sur chacun des graphes, représenter la densité de probabilité de la loi Γ correspondante. Queconstate-t-on ?

25.4 Droite de régression affine

1. Télécharger le fichier http://www.douillet.info/~douillet/mathapp/dazzle/exper.txtet lire les lignes de ce fichier sous Scilab.

2. Récupérer les valeurs numériques (attention aux virgules et autres "drames de syntaxe") etobtenir une colonne de x et une colonne de y. En cas de "drame non résolu", il est toujourspossible de retravailler le fichier de données avec un traitement de texte.

3. Calculer les 6 paramètres de dispersion de la distribution (x, y). Représenter cette distribu-tion, représenter les moyennes et les écarts-type.

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

Page 75: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 26

DS A1-08 2008-12-10 (30, sujet)

durée 2 heures

Rappel des consignes

1. Les résultats doivent être justifiés et présentés de manière claire et cohérente. Les sortiesd’imprimante doivent être commentées.

2. Il est demandé de rendre une copie dans laquelle les exercices sont présentés dans l’ordre del’énoncé et dans laquelle les sorties d’imprimante sont collées ou recopiées.

3. On attire l’attention de chaque étudiant que le trafic réseau de leur ordinateur peut êtreenregistré pendant la durée de l’évaluation.

26.1 Lois de probabilités

Dans l’ensemble d’un pays, on trouve que le taux moyen des accidents du travail est de 2 parsemaine pour 100000 habitants. On cherche à évaluer le risque que font courir les accidents dutravail à une ville de 250000 habitants situées dans ce pays.

1. Décrire un modèle probabiliste correspondant à cette situation.2. Donner une approximation de la loi de probabilité indiquée à la question 1. Vérifier les

conditions d’approximation.3. Quelle est la probabilité pour que l’on observe 4 accidents du travail par semaine dans la

ville ? moins de 4 accidents ?4. Quelle est le nombre moyen d’accident du travail par semaine. Donner aussi la variance.5. Calculer k tel que la probabilité pour que la probabilité d’avoir un nombre d’accidents du

travail supérieur à k est supérieure à 0,95

26.2 Loi des grands nombres

1. Que fait le programme suivant ?

grand(’setsd’,1)grand(1,100,’uin’,1,6)

2. Calculer la moyenne m des nombre obtenus. Comparer avec la loi des grands nombres.3. Tracer l’histogramme des valeurs obtenues.4. Montrer que l’on peut approximer la loi de la moyenne m par une loi de Laplace-Gauss dont

on précisera les paramètres.5. En utilisant la question précédente, déterminer un réel k tel que

Pr (m ∈ [3.5–k; 3.5 + k]) = 0.95

75

Page 76: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№26.DS A1-08 2008-12-10 (30, sujet) 76

26.3 Régression linéaire

Le fichier SalairesInflation.txt contient en fonction de l’année deux séries statistiques : l’indicedes prix à la consommation et l’indice du coût du travail (salaires et charges) en France pour lesannées 1998 à 2007. Les données sont séparées par des points-virgules.

1. Lire les données du fichiers. En cas d’échec à cette question, on pourra utiliser le tableauindiquée en fin de sujet.

2. Calculer les paramètres statistiques des deux séries : moyennes, variances, covariance, corré-lation.

3. Effectuer une régression linéaire de l’inflation sur les salaires puis des salaires sur l’inflation.Calculer le FRV. Commenter.

Année Inflation Salaires1998 100,00 95,01999 100,50 98,72000 102,20 102,62001 103,90 105,52002 105,90 109,42003 108,10 113,32004 110,40 119,52005 112,40 123,22006 114,23 126,92007 115,92 131,2

Page 77: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 27

DS E1-08 2009-01-21 (31abcd, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Descriptif du travail demandé

1. La première qualité que l’on attend d’un ingénieur est de savoir présenter ses conclusions. Les listings,les calculs, les graphiques et autres "sorties d’ordinateur" ne peuvent en aucun cas remplacer un relevéde conclusions, rédigé de façon précise et scientifique. Ces différents types de matériaux doivent êtreordonnés de façon à produire un document organisé, fournissant une liste de réponses argumentéesà la liste des questions de l’énoncé.

2. La méthode recommandée est de rédiger les réponses à la main et de faire des couper-coller avecdes ciseaux et de la colle pour insérer les "sorties d’ordinateur" sur votre copie. L’expérience confirmeque cette méthode est à la fois la plus rapide et la plus robuste. C’est aussi celle qui permet de seconcentrer sur les compétences évaluées et non sur les compétences/incompétences en dactylographie.

3. Un minimum de rigueur orthographique et grammaticale est attendu. Il sera considéré qu’un étudiantincapable de comprendre la grammaire élémentaire n’est probablement pas capable de comprendredes notions d’un niveau ingénieur.

4. Les copies sont évaluées en proportion de leur contenu et pas en fonction de leur poids. Dans cetordre d’idées, il est demandé d’imprimer les procédures que vous avez modifiées (i.e dont vous êtesco-auteur) et pas la totalité des bibliothèques mises à votre disposition.

5. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

6. L’attention des étudiants est attirée sur le fait que le trafic réseau de leur ordinateurest susceptible d’être enregistré pendant la durée de l’évaluation.

Dans tout ce qui suit, le nombre ddmmyy ci-dessous est à personnaliser, de sorte que dd/mm/19yysoit votre date de naissance.

27.1 Regroupement de deux populations

1. Copier/coller et exécuter sous scilab les commandes suivantes (rappel : ddmmyy doit êtrepersonnalisé) :grand(’setsd’, ddmmyy)N1= grand(1,’uin’,40,50), N2= grand(1,’uin’,50,60)m1= grand(1,’uin’,22,26), m2= grand(1,’uin’,16,21)s1= grand(1,’uin’,10,14), s2= grand(1,’uin’, 5, 9)Ces valeurs sont à utiliser dans la question suivante.

2. On mélange deux populations disjointes. L’une se compose de N1 individus, ayant unemoyenne m1 et un écart-type s1 et l’autre se compose de N2 individus, ayant une moyennem2 et un écart-type s2. Déterminer la moyenne et l’écart-type de la population totale.

77

Page 78: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№27.DS E1-08 2009-01-21 (31abcd, sujet) 78

27.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié oubien comment utiliser la fonction cdfnor.

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (95, 13). Quel est le pourcentage de processus ayant une durée : (a) supérieure à 85 ;( b) inférieure à 100 ; (c) comprise entre 80 et 110 ?

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

3. On sait que la variable X suit une loi normale et que Pr (X < 11) = 0.37 et Pr (17 < X) =0.48. Déterminer µ et σ.

27.3 Loi binomiale

1. Utiliser les commandesN=4000 ; grand(setsd, ddmmyy) ; xxx=grand(N,1,’bin’,50,0.4) ;pour engendrer une liste X de N = 4000 nombres. Calculer la moyenne et la variance de X.Que remarque-t-on ?

2. Rappeler ce qu’est "la variable réduite". Tracer son histogramme.

3. Recommencer avec N=5000 ; grand(setsd, ddmmyy) ; yyy=grand(N,1,’bin’,70,0.2) ;Comparer les deux histogrammes.

4. On pose zzz=diff(xxx). Que fait cette commande ? Moyenne et variance de Z. Compareravec X.

27.4 Loi de Poisson

1. Les commandespr=binomial(0.37, 10); plot(pr(1:12))permettent de tracer une courbe.

2. Déterminer les x et y nécessaires danspr=binomial(x, 20); plot(pr(1:12))pr=binomial(y, 40); plot(pr(1:12))pour que la superposition des trois courbes illustre le passage à la limite vers une loi dePoisson, dont on rappellera les caractéristiques.

27.5 Droite de régression affine

1. Télécharger le fichier http://www.douillet.info/~douillet/mathapp/dazzle/football.txt et lire les lignes de ce fichier sous Scilab.

2. Récupérer les valeurs numériques. Sélectionner les colonnes ht (height=taille) et wt (weight=poids).En cas de "drame non résolu", il est toujours possible de retravailler le fichier de donnéesavec un traitement de texte.

3. Calculer les 6 paramètres de dispersion de la distribution (ht, wt). Représenter ces points,représenter les moyennes et les écarts-type.

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

Page 79: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 28

DS AE1-08s 2009-09-03 (32, sujet)

durée 2 heures – tous documents autorisésle sujet comporte deux pages

Dans tout ce qui suit, le nombre ddmmyy ci-dessous est à personnaliser, de sorte que dd/mm/19yysoit votre date de naissance.

28.1 Regroupement de deux populations

1. Copier/coller et exécuter sous scilab les commandes suivantes (rappel : ddmmyy doit êtrepersonnalisé) :grand(’setsd’, ddmmyy)N1= grand(1,’uin’,43,52), N2= grand(1,’uin’,50,60)m1= grand(1,’uin’,22,26), m2= grand(1,’uin’,17,22)s1= grand(1,’uin’,10,15), s2= grand(1,’uin’, 7, 12)Ces valeurs sont à utiliser dans la question suivante.

2. On mélange deux populations disjointes. L’une se compose de N1 individus, ayant unemoyenne m1 et un écart-type s1 et l’autre se compose de N2 individus, ayant une moyennem2 et un écart-type s2. Déterminer la moyenne et l’écart-type de la population totale.

28.2 Usage des tables de la loi normale

Selon la méthode choisie, on indiquera comment utiliser les tables données dans le polycopié oubien comment utiliser la fonction cdfnor.

1. Les durées d’un ensemble de processus sont approximativement distribués suivant la loiNorm (80, 11). Quel est le pourcentage de processus ayant une durée : (a) supérieure à 70 ;( b) inférieure à 95 ; (c) comprise entre 72 et 90 ?

2. Pour la distribution précédente, trouver a, b, placés symétriquement autour de la moyenne,tels que Pr (x ∈ [a, b]) = 1/2.

3. On sait que la variable X suit une loi normale et que Pr (X < 12) = 0.37 et Pr (16 < X) =0.48. Déterminer µ et σ.

28.3 Loi binomiale

1. Utiliser les commandesN=4000 ; grand(setsd, ddmmyy) ; xxx=grand(N,1,’bin’,60,0.35) ;pour engendrer une liste X de N = 4000 nombres. Calculer la moyenne et la variance de X.Que remarque-t-on ?

2. Rappeler ce qu’est "la variable réduite". Tracer son histogramme.

79

Page 80: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№28.DS AE1-08s 2009-09-03 (32, sujet) 80

3. Recommencer avecN=5000 ; grand(setsd, ddmmyy) ; yyy=grand(N,1,’bin’,70,0.2) ;Comparer les deux histogrammes.

4. On pose zzz=diff(xxx). Que fait cette commande ? Moyenne et variance de Z. Compareravec X.

28.4 Loi de Poisson

1. Les commandespr=binomial(0.41, 10); plot(pr(1:12))permettent de tracer une courbe.

2. Déterminer les x et y nécessaires danspr=binomial(x, 20); plot(pr(1:12))pr=binomial(y, 40); plot(pr(1:12))pr=binomial(y, 60); plot(pr(1:12))pour que la superposition des trois courbes illustre le passage à la limite vers une loi dePoisson, dont on rappellera les caractéristiques.

3. Bien entendu, tracer ces quatre courbes sur un même graphe.

28.5 Droite de régression affine

1. Télécharger le fichier http://www.douillet.info/~douillet/mathapp/dazzle/football.txt (celui déjà utilisé en cours) et lire les lignes de ce fichier sous Scilab.

2. Récupérer les valeurs numériques. Sélectionner les colonnes jnum et wt (weight=poids). Encas de "drame non résolu", il est toujours possible de retravailler le fichier de données avecun traitement de texte.

3. Calculer les 6 paramètres de dispersion de la distribution (jnum, wt). Représenter ces points,représenter les moyennes et les écarts-type.

4. Calculer la droite de régression et le FRV correspondant. Reporter le tout sur le dessin.

5. Commenter le graphe et les résultats obtenus.

Page 81: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 29

DS E1-09 2010-01-19 (33abc, corrigé)

durée 2 heures - tous documents autorisés

Descriptif du travail demandé

1. La première qualité que l’on attend d’un ingénieur est de savoir présenter ses conclusions. Les listings,les calculs, les graphiques et autres "sorties d’ordinateur" ne peuvent en aucun cas remplacer un relevéde conclusions, rédigé de façon précise et scientifique. Ces différents types de matériaux doivent êtreordonnés de façon à produire un document organisé, fournissant une liste de réponses argumentéesà la liste des questions de l’énoncé.

2. La méthode recommandée est de rédiger les réponses à la main et de faire des couper-coller avecdes ciseaux et de la colle pour insérer les "sorties d’ordinateur" sur votre copie. L’expérience confirmeque cette méthode est à la fois la plus rapide et la plus robuste. C’est aussi celle qui permet de seconcentrer sur les compétences évaluées et non sur les compétences/incompétences en dactylographie.

3. Un minimum de rigueur orthographique et grammaticale est attendu. Il sera considéré qu’un étudiantincapable de comprendre la grammaire élémentaire n’est probablement pas capable de comprendredes notions d’un niveau ingénieur.

4. Les copies sont évaluées en proportion de leur contenu et pas en fonction de leur poids. Dans cetordre d’idées, il est demandé d’imprimer les procédures que vous avez modifiées (i.e dont vous êtesco-auteur) et pas la totalité des bibliothèques mises à votre disposition.

5. Une bonne gestion du temps fait partie des compétences évaluées. Prévoir le temps nécessaire pourles impressions. Imprimer les graphiques au fur et à mesure. Ne pas oublier les sauvegardes en coursde travail.

Dans tout ce qui suit, le nombre mmddyy ci-dessous est à personnaliser, de sorte que dd/mm/19yysoit votre date de naissance (indiquer cette date sur votre copie).

.../...

81

Page 82: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№29.DS E1-09 2010-01-19 (33abc, corrigé) 82

29.1 Regroupement de deux populations

1. Copier/coller et exécuter sous Scilab les commandes suivantes (rappel : mmddyy doit êtrepersonnalisé) :grand(’setsd’, mmddyy)N1= grand(1,’uin’,45,56), N2= grand(1,’uin’,50,60)m1= grand(1,’uin’,23,31), m2= grand(1,’uin’,18,25)s1= grand(1,’uin’, 8,13), s2= grand(1,’uin’, 6,10)Ces valeurs sont à utiliser dans la question suivante.

(a) Pour le correcteur, cela génère un méta-problème qui se programme par:

global ddnddn=[100489 111789 011187 061088 033089 042589052789 191088 031089 101188 070688 131288100888 211189 071890 280389 150488 250588050589 170989 310588 160884 122288 180889230288 280589 180587 220488 140490 160889111187 070288 000000 240788 070389 603198];ddn= matrix(ddn,1,-1) ; ddn=gsort(ddn,’c’,’i’)

2. On mélange deux populations disjointes. L’une se compose de N1 individus, ayant une moyennem1 et un écart-type s1 et l’autre se compose de N2 individus, ayant une moyenne m2 et unécart-type s2. Déterminer la moyenne et l’écart-type de la population totale.

(a) Il a été indiqué répétitivement que la méthode conceptuelle pour résoudre cet exerciceconsiste à reconstituer les valeurs de

∑1,∑x,∑x2 pour chacune des deux sous-

populations, puis à additionner les valeurs obtenues.

(b) Mais cela n’empêche pas de vouloir programmer le tout.

function q1(ddmmaa)grand(’setsd’, ddmmaa)N1=grand(1,’uin’,45,56), N2=grand(1,’uin’,50,60)m1=grand(1,’uin’,23,31), m2=grand(1,’uin’,18,25)s1=grand(1,’uin’,08,13), s2=grand(1,’uin’,06,10)N=N1+N2m=(N1*m1+N2*m2)/Ntmp=N1*(m1^2+s1^2)+N2*(m2^2+s2^2)s=sqrt(tmp/N-m^2)printf("clef=%06d, ", ddmmaa)printf("1=%2d, %2d, %2d, ", N1,m1,s1)printf("2=%2d, %2d, %2d, ", N2,m2,s2)printf("N=%3d, ",N) ; printf("m=%7.4f, ",m) ; printf("s=%7.4f\n",s)

endfunction

(c) Et alors, le méta-problème se programme par:

function listq1()printf("\n%s\n", "Question 1.")for j=ddn do q1(j), end

endfunction

Page 83: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

83 №29.DS E1-09 2010-01-19 (33abc, corrigé)

29.2 Lecture d’un histogramme

1. Calculer les valeurs de µ, σ pour l’histogramme ci-dessous. Exposer la méthode utilisée.

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

1 2 3 4 5 6 7 8

(a) On lit directement les bornes des classes, et les densités de chances. Et on en fait part aulogiciel

xxx0=[1,2,4,5,8]dens=[0.18,0.28,0.20,0.34]

(b) On en déduit les centres de classe et les chances elles-mêmes.

xxx=(xxx0(1:$-1)+xxx0(2:$))/2cha=dens .*(xxx0(2:$) - xxx0(1:$-1) )

(c) Les probabilités s’obtiennent par normalisation. Et l’on conclut en calculant E (x) , E(x2)

et var (x) = E(x2)− (E (x))2.

printf("\n%s\n", "Question 2.")printf("\n xxx=") ; mprintf("%6.2f", xxx’)printf("\n cha=") ; mprintf("%6.2f", cha’)moy= sum(xxx .* cha)/sum(cha);var= sum((xxx .^2).* cha)/sum(cha)-moy^2;printf("\n\n moy=%6.4f, var=%6.4f\n", moy, var)-----> Question 2.xxx= 1.50 3.00 4.50 6.50cha= 0.18 0.56 0.20 1.02moy=4.8367, var=3.4376

29.3 Écriture d’un histogramme

On considère une variable aléatoire X prenant ses valeurs xi dans l’ensemble E = 1, 2, 5, 8, 9. Cesvaleurs sont affectées de probabilités pi.

1. Obtenir les pi en utilisant le programme suivant :grand(’setsd’, mmddyy)pr= grand(1,5,’uin’,8,16); pr=pr/sum(pr)

(a) On ajoute :

xx=[1 2 5 8 9]

2. Calculer la moyenne et l’écart-type de la variable X.

Page 84: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№29.DS E1-09 2010-01-19 (33abc, corrigé) 84

(a) La méthode élémentaire donne

mm=sum(xx .* pr)vv=sum((xx .^2) .* pr)-mm^2printf("clef=%06d, ", ddmmaa)mprintf("%5.3f, ", pr’)printf("mm=%6.4f, ss=%6.4f, ", mm, sqrt(vv))

(b) Mais rien n’empêche d’utiliser dès maintenant les séries génératrices. On a les formules

S (x) =∑k∈N

Pr (X = k) xk ; m1 =

(∂S (x)

∂x

)x=1

; m2 =

(∂2S (x)

∂x2

)x=1

Et l’on conclut en utilisant E (X) = m1, var (X) = m2 +m1 −m21.

(c) On crée une variable polynomiale, puis le polynôme lui-même

pp=poly(0,"x");sg1=sum((pp .^ xx) .* pr)

(d) On évalue en x = 1 et on en déduit les valeurs cherchées

m1=horner(derivat(sg1),1)m2=horner(derivat(derivat(sg1)),1)

3. Tracer l’histogramme correspondant. Représenter la moyenne et l’écart-type.

(a) On procède comme d’habitude. Les détails sont dans la feuille de calcul du poly.

29.4 Série génératrice

On continue à travailler avec la variable définie à la question précédente.

1. On considère Y = X1 +X2, avec X1, X2 variables indépendantes, distribuée selon la loi défi-nie à la question précédente. Déterminer moyenne et écart-type de Y . Quelle est la probabilitépour que Y > 7.5 ?

(a) Comme de juste, les moyennes et les variances s’ajoutent (indépendance). Pas besoin deséries génératrices pour cela... sauf pour vérifier (une vérification ne nuit jamais)

(b) Pour Pr (Y > 7.5), on a besoin de la liste des probabilités. Ce sont les coefficients deSY = Sx × Sx. Il est plus facile d’ajouter les 8 premiers (de x0 à x7) et de les retrancherde 1.

2. On considère Z =∑i=5

i=1 Xi somme de cinq exemplaires indépendants de la variable X.Déterminer moyenne et variance de Z. Expliquer comment retrouver ces résultats en utilisantla série génératrice de X... et le faire.

(a) Comme de juste, les moyennes et les variances s’ajoutent (indépendance). Pas besoin deséries génératrices pour cela.

(b) Mais il est demandé explicitement de vérifier ... et il faut donc le faire.

3. Histogramme de Z (on utilisera des regroupements bien choisis). Illustrer le passage à la loinormale.

(a) La série génératrice de z est S5 (z) = (S1 (z))5. On récupère les probabilités en prenantles coefficients de S5. Comme les largeurs des classes sont 1, il n’y a pas lieu de distinguerla densité de probabilité de la probabilité de la classe [n− 0.5, n+ 0.5]. Par contre, il y abesoin de lisser la courbe: on fait des moyennes deux par deux.

(b) Et on programme le dessin

Page 85: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

85 №29.DS E1-09 2010-01-19 (33abc, corrigé)

function q4(ddmmaa)sg1... (cf supra)m10=horner(sg1,1); m11=horner(derivat(sg1),1)m12=horner(derivat(derivat(sg1)),1)vv1=m12+m11-m11^2

printf("m0=%f ; m1=%5.3f ; m2=%7.3f ; vv=%5.3f\n’,m10,m11,m12,vv1)sg5=sg1^5m50=horner(sg5,1)m51=horner(derivat(sg5),1)m52=horner(derivat(derivat(sg5)),1)vv5=m52+m51-m51^2

printf("m0=%f ; m1=%5.3f ; m2=%7.3f ; vv=%5.3f\n’,m50,m51,m52,vv5)pr5=coeff(sg5)xx5=sum(matrix(0:45,2,-1),’r’)/2yy5=sum(matrix(pr5,2,-1),’r’)/2curfig=scf(0); clf()curfig.axes_size=[550,400] // taille de l’image à sauvegarderfunction y=norr(x)

y=exp(-(x-m51)^2/vv5/2) / sqrt(2*%pi*vv5)endfunctionplot(xx5,yy5)plot(xxx5, feval(xxx5,norr), color="red")

xs2eps(0, myfig+sprintf("ds33a-%d", ddmmaa))endfunction

0 20 4010 30 505 15 25 35 45

0

0.02

0.04

0.06

0.01

0.03

0.05

0.07

ddmmaa=123456 ; m= 4.88 ; v=10.39

Figure 29.1 – Somme de 5 événements (courbe lissée et loi normale)

(c) On peut, si on a le temps, ajouter quelques détails cosmétiques. Un titre. Allonger unpeu le domaine de traçage de la loi normale (jusqu’à x = 48). Remarque: myfig est lerépertoire où les graphiques sont sauvegardés (nécessite les droits d’écriture...)

(d) Commentaire: si l’on voulait avoir une plus belle approximation de la loi normale, ilfaudrait augmenter n. En effet n = 5, ce n’est pas encore n→∞ !

29.5 Droite de régression affine

1. On se donne pour x les entiers de 1 à 12 et pour y les nombres obtenus par y1 = 4xi+6+4.5 ri,la variable ri étant une variable aléatoire uniforme sur [0, 1]. Utiliser ce qui a été fait en T.D.

Page 86: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№29.DS E1-09 2010-01-19 (33abc, corrigé) 86

pour écrire un programme permettant d’obtenir une série de valeurs pour y (réinitialiser legénérateur aléatoire).

2. Calculer les différents paramètres de dispersion de la distribution (x, y). Représenter cespoints, représenter les moyennes et les écarts-type.

3. Calculer la droite de régression, et évaluer la confiance correspondante. Représenter tout celasur le dessin.

(a) On s’attend à trouver une droite qui ne diffère pas trop de y = 4x+ 8.25

Page 87: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

Évaluation № 30

DS AE1-09s 2010-09-03 (34, sujet)

durée 2 heures - tous documents autorisés

30.1 Regroupement de deux populations

1. On mélange deux populations disjointes. L’une se compose de N1 = 47 individus, ayant unemoyenne m1 = 25 et un écart-type s1 = 12 et l’autre se compose de N2 = 53 individus,ayant une moyenne m2 = 19 et un écart-type s2 = 7. Déterminer la moyenne et l’écart-typede la population totale.

30.2 Lecture d’un histogramme

1. Calculer les valeurs de µ, σ pour l’histogramme ci-dessous. Exposer la méthode utilisée.

0.00

0.05

0.10

0.15

0.20

0.25

1 2 3 4 5 6 7 8

.../...

87

Page 88: Statistiques et Probabilités 2001/2010douillet/mathapp/Ensait-stats-eval.pdf · 2016-12-07 · Cesévaluationsontétédonnéesen2001-20XXpourlemodule stats tantenpromotionA1qu’enpromotionE1

№30.DS AE1-09s 2010-09-03 (34, sujet) 88

30.3 Écriture d’un histogramme

On considère une variable aléatoire X prenant ses valeurs xi dans l’ensemble E = 1, 3, 7, 8, 9.Ces valeurs sont affectées de probabilités pi.

1. Obtenir les pi en utilisant le programme suivant :grand(’setsd’, mmddyy)pr= grand(1,5,’uin’,9,16); pr=pr/sum(pr)

2. Calculer la moyenne et l’écart-type de la variable X.

3. Tracer l’histogramme correspondant. Représenter la moyenne et l’écart-type.

30.4 Série génératrice

On continue à travailler avec la variable définie à la question précédente.

1. On considère Y = X1+X2, avecX1, X2 variables indépendantes, distribuée selon la loi définieà la question précédente. Déterminer moyenne et écart-type de Y . Quelle est la probabilitépour que Y > 7.5 ?

2. On considère Z =∑i=5

i=1 Xi somme de cinq exemplaires indépendants de la variable X.Déterminer moyenne et variance de Z. Expliquer comment retrouver ces résultats en utilisantla série génératrice de X... et le faire.

3. Histogramme de Z (on utilisera des regroupements bien choisis). Illustrer le passage à la loinormale.

30.5 Droite de régression affine

1. On se donne pour x les entiers de 1 à 12 et pour y les nombres obtenus par y1 = 3xi+7+5.5 ri,la variable ri étant une variable aléatoire uniforme sur [0, 1]. Obtenir une série de valeurspour y (réinitialiser le générateur aléatoire).

2. Calculer les différents paramètres de dispersion de la distribution (x, y). Représenter cespoints, représenter les moyennes et les écarts-type.

3. Calculer la droite de régression, et évaluer la confiance correspondante. Représenter tout celasur le dessin.