31
une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe pascale BoulAis, Marie DiuMEnGE, Martine VERGnAc, claudine VERGnE irem de Montpellier reperes - irem. N° 98 - janvier 2015 le programme précise que les capacités atten- dues sont : Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier une série statistique. Passer des effectifs aux fréquences, calculer les caractéristiques d’une série définie par effectifs ou fréquences. Calculer des effectifs cumulés, des fré- quences cumulées. Représenter une série statistique graphi- quement (nuage de points, histogramme, courbe des fréquences cumulées). on constate que la plupart des notions de statistique descriptive ont été abordées en classe de troisième. le programme de seconde propo se un enrichissement des techniques. 1. 2. Pour l’échantillonnage L’objectif est d’amener les élèves à un ques- tionnement lors des activités suivantes : les programmes de mathématiques à par- tir de 2009 donnent une place importante à l’initiation à la statistique inférentielle. quelles sont les raisons d’être d’un tel choix ? quels éclai- rages l’histoire peut-elle nous apporter sur la construction des notions de statistique et pro- babilité et sur le lien qu’elles entretiennent ? com- ment permettre aux élèves de s’approprier une pensée statistique ? c’est dans cette analyse réflexi- ve que nous invitons le lecteur à nous suivre avant de découvrir une proposition d’enseignement pour la seconde. 1. — Les objectifs du programme de Seconde observons ce que propose le programme de seconde (2009) pour l’enseignement de la statistique et des probabilités. 1. 1. Pour la statistique descriptive L’objectif est de faire réfléchir les élèves sur des données réelles, riches et variées, pour synthétiser l’information et proposer des représentations pertinentes. 21

une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

une iniTiATiOn A

LA STATiSTique en

cLASSe De SecOnDe

pascale BoulAis, Marie DiuMEnGE, Martine VERGnAc, claudine VERGnE

irem de Montpellier

reperes - irem. N° 98 - janvier 2015

le programme précise que les capacités atten-dues sont :

— Utiliser un logiciel (par exemple, un tableur)ou une calculatrice pour étudier une sériestatistique.

— Passer des effectifs aux fréquences, calculerles caractéristiques d’une série définie pareffectifs ou fréquences.

— Calculer des effectifs cumulés, des fré-quences cumulées.

— Représenter une série statistique graphi-quement (nuage de points, histogramme,courbe des fréquences cumulées).

on constate que la plupart des notionsde statistique descriptive ont été abordéesen classe de troisième. le programme deseconde propose un enrichissement destechniques.

1. 2. Pour l’échantillonnage

L’objectif est d’amener les élèves à un ques-tionnement lors des activités suivantes :

les programmes de mathématiques à par-tir de 2009 donnent une place importante àl’initiation à la statistique inférentielle. quellessont les raisons d’être d’un tel choix ? quels éclai-rages l’histoire peut-elle nous apporter sur laconstruction des notions de statistique et pro-babilité et sur le lien qu’elles entretiennent ? com-ment permettre aux élèves de s’approprier unepensée statistique ? c’est dans cette analyse réflexi-ve que nous invitons le lecteur à nous suivre avantde découvrir une proposition d’enseignementpour la seconde.

1. — Les objectifsdu programme de Seconde

observons ce que propose le programmede seconde (2009) pour l’enseignement de lastatistique et des probabilités.

1. 1. Pour la statistique descriptive

L’objectif est de faire réfléchir les élèves surdes données réelles, riches et variées, poursynthétiser l’information et proposer desreprésentations pertinentes.

21

Page 2: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

22

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

— l’estimation d’une proportion inconnue àpartir d’un échantillon ;

— la prise de décision à partir d’un échan-tillon.

et les capacités attendues

— Concevoir, mettre en œuvre et exploiterdes simulations de situations concrètes àl’aide du tableur ou d’une calculatrice.

— Exploiter et faire une analyse critique d’unrésultat d’échantillonnage.

1. 3. Pour les probabilités

les capacités attendues sont :

— Déterminer la probabilité d’événementsdans des situations d’équiprobabilité.

— Utiliser des modèles définis à partir defréquences observées.

le plus important restant l’objectif géné-ral défini par le programme (2009) :

L’objectif de ce programme est de former lesélèves à la démarche scientifique sous toutesses formes pour les rendre capables de :

— modéliser et s’engager dans une activitéde recherche ;

— conduire un raisonnement, une démons-tration ;

— pratiquer une activité expérimentale ou algo-rithmique ;

— faire une analyse critique d’un résultat, d’unedémarche ;

— pratiquer une lecture active de l’infor-mation (critique, traitement), en privilégiantles changements de registre (graphique,numérique, algébrique, géométrique) ;

— utiliser les outils logiciels (ordinateur ou

calculatrice) adaptés à la résolution d’unproblème ;

— communiquer à l’écrit et à l’oral.

Dans la mesure du possible, les problèmesposés s’inspirent de situations liées à la viecourante ou à d’autres disciplines. Ils doiventpouvoir s’exprimer de façon simple et conci-se et laisser dans leur résolution une placeà l’autonomie et à l’initiative des élèves. Auniveau d’une classe de seconde de détermi-nation, les solutions attendues sont aussi engénéral simples et courtes.

l’enseignement de la statistique et desprobabilités occupent une place importante ausein de ce programme, les objectifs sont ambi-tieux. En comparant avec les programmes desannées antérieures, on constate que la place deces enseignements augmente et l’analyse des pro-grammes de premières et terminales montre quel’initiation à la statistique inférentielle absen-te jusqu’en 2000 semble prendre une placeimportante dans l’ensemble des cursus au lycée,y compris en série scientifique. il est doncnécessaire que le travail fait en classe de secon-de construise des bases solides dans ce domai-ne ; en l’absence d’un travail approfondi en clas-se de seconde, les enseignements de premièreset terminales sont compromis.

2. — Les raisons d’être de l’initiation à la statistique inférentielle.

pourquoi donner une telle place à cet ensei-gnement, pourquoi aborder aujourd’hui en lycéela statistique inférentielle ? les réponses à cesquestions se situent à deux niveaux  : d’unepart dans les pratiques sociales modernes etd’autre part dans l’épistémologie du concept quel’on peut dégager d’une approche historique.

Aujourd’hui, la façon d’appréhender lemonde n’est plus exclusivement déterministe.

Page 3: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

23

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

les statistiques produites sont presque tou-jours le résultat d’inférences à partir d’échan-tillons et ne sont que très exceptionnellementla description exhaustive d’une population. cetétat de fait légitime l’introduction de l’ensei-gnement de l’échantillonnage et de la statistiqueinférentielle. cherchons un peu plus finementà pointer des raisons d’être de cet enseignementau niveau secondaire relativement à la forma-tion du citoyen, aux besoins des techniciens etenfin celles légitimées par les besoins des scien-tifiques de demain.

2. 1. 1 Les besoins du citoyen

Dans les médias foisonnent des informa-tions exprimées dans un registre relevant de lastatistique ; il semble clair que tous les citoyensont besoin de décrypter ces informations. Maisles besoins dépassent ce simple cadre. En effet,tout citoyen a besoin :

— de com-prendre unequelconqueinformationrésultantd’une étudestatistique ;

— de comprendre l’information statistiqueissue d’un sondage 2;

— de savoir interpréter les plages de nor-malité sur les analyses médicales, les car-nets de santé, ... ;

1 Avantages n°238 juillet 2008 ; page 962 le nouvel observateur société – hors-série : être ensei-gnant aujourd’hui – janvier 2013 ; page 4

Page 4: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

24

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

— d’être capa-ble d’évaluerles probabili-tés et les espé-rances de gaindans les jeuxde hasard ;(cf. annexe 2)

— de relativiser l’exploitation médiatique decertains événements exceptionnels ;

— de comprendre pourquoi le recensement estmaintenant pratiqué par sondage, et pour-quoi le recensement exhaustif peut êtremoins efficace.

cette liste, loin d’être exhaustive, illustrel’importance des besoins dans ce domaine pourtout citoyen.

2. 2. Les besoins des professionnels des médias

l’information est relayée, traduite et inter-prétée par les journalistes de la presse spécia-lisée ou de la presse grand public. tout jour-naliste se doit de maîtriser l’information statistiquepour en rendre compte. sur ce point la cultureanglo-saxonne est très en avance sur la Fran-ce, comme le montre Floriane Wozniak (2005)dans sa thèse.

2. 3. Les besoins des techniciens

l’enseignement de la statistique répondaussi à des besoins plus spécifiques de certainstechniciens

— Utilisations de cartes de contrôle dansl’industrie ;

— Prise en compte des incertitudes de mesu-re ;

— Etude de risque dans l’industrie, l’écono-mie, la finance...

— ...

2. 4. Les besoins des chercheurs du 21ème siècle

Des connaissances en statistique sont néces-saires dans bien des métiers des sciences humaines,où la plupart des études reposent sur des don-nées statistiques de type sondage, comme lapsychologie, la sociologie et la démographie, entreautres. Elles sont aussi nécessaires aux biologistespour l’estimation de populations animales, bac-tériennes, etc. De même, les études relativesaux effets des médicaments reposent en gran-de partie sur l’analyse de données statistiques.

la science du 20ème siècle a quitté pro-gressivement sa quête d’un déterminisme exclu-sif et introduit de l’aléatoire dans ses modéli-sations avec notamment la naissance de deuxgrandes théories  : la théorie du chaos et lamécanique quantique. Des phénomènes traitésjusqu’ici de façon déterministe, sont interpré-tés en termes d’aléatoire ; cette modélisation per-met de réduire les quantités de calculs néces-saires et limite les erreurs induites par cescalculs automatisés.

3. — Eclairage historique

concernant la notion de probabilité, deuxapproches se juxtaposent  : l’approche clas-

Page 5: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

25

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

sique initiée par pascal et Fermat en 1694 etl’approche fréquentiste proposée par J. Bernoullien 1713. De ces deux approches, émergentdeux tentatives de définition.

3. 1. L’approche classique

l’approche classique s’intéresse essen-tiellement aux jeux de hasard, qui ont été« conçus pour garantir l’équité » entre lesjoueurs. Elle s’exprime dans le langage deschances, le terme de « probabilité » reste long-temps absent. une définition émerge de cestravaux : la définition, dite classique, que lapla-ce adopte comme premier principe dans son essaiphilosophique sur les probabilités en 1812.« La probabilité est le rapport du nombre descas favorables à celui de tous les cas pos-sibles » et qu’il complète dans son second prin-cipe « mais cela suppose tous les divers cas éga-lement possibles… »

cette définition pose plusieurs problèmes

— Le sens du nombre calculé est absent. Danscette approche syntaxique, on dispose d’unetechnique de calcul qui ne construit pas desens, si ce n’est une notion de proportion.

— Elle repose sur un postulat d’équiproba-bilité, assumé par Laplace qui propose dechoisir l’équiprobabilité en l’absenced’informations suffisantes. Cette défini-tion est donc circulaire puisqu’elle repo-se sur la reconnaissance de l’équiproba-bilité qui n’est autre qu’une probabilité, ceque l’on se proposait de définir.

3. 2. L’approche fréquentiste

l’approche précédente, dite classique, nes’applique guère que pour l’étude des jeux dehasard qui ont été conçus pour garantir l’équi-té entre les joueurs, c’est ce que souligne Ber-noulli (1713, p.40), qui affirme que l’on ne

pourra pas déterminer de cette façon l’évolu-tion d’une épidémie ou les prévisions météo-rologiques. puisqu’on ne peut l’obtenir par uncalcul a priori, on l’estimera a posteriori. il éta-blit un théorème, maintenant appelé théorèmede Bernoulli, qui n’est autre que la loi faible desgrands nombres, dans le cas particulier devariables de Bernoulli.

cette approche suggère une définition, ditefréquentiste, que Renyi (1966) cité par henry(2001, p.81) énonce ainsi  : « Nous appelle-rons probabilité d’un événement le nombreautour duquel oscille la fréquence relative del’événement considéré. »

si cette définition permet une meilleureapproche sémantique, elle pose cependant denouvelles difficultés :

— La première est une confusion entre réali-té et théorie. En effet la convergence presquesûre des fréquences est établie à l’intérieurd’un modèle, mais on ne peut pas dire,comme on l’entend souvent, que les fré-quences expérimentales convergent verscette valeur idéale produite par le modèle.

— La seconde tient à la formalisation de cetteapproche. Elle ne peut être donnée quepar le théorème de Bernoulli : on obtientà nouveau une définition circulaire puisquece théorème repose sur une convergenceen probabilité.

la synthèse de ce double visage de la pro-babilité est réalisée par Kolmogorov en 1933. leconcept de probabilité est défini par une axio-matique où la probabilité apparait comme unemesure positive de masse totale 1. Mais Kol-mogorov, cité par Bordier(1991), dit aussi : « Lavaleur épistémologique de la théorie des probabilitésest basée sur ceci : dans leur action collectiveles phénomènes aléatoires, à large échelle créentdes régularités strictes et non aléatoires. Le

Page 6: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

26

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

concept même de la probabilité mathématiqueserait sans utilité, s’il ne trouvait sa concrétisationdans la fréquence d’arrivée d’événements, suiteà des expériences nombreuses réalisées dans desconditions uniformes ».

cette définition est trop abstraite et trop com-plexe pour être envisagée dans le secondaire.comment permettre aux élèves du secondairede faire la synthèse entre ces deux conceptionsde la probabilité ? Michel henry (2001) proposepour l’enseignement secondaire d’utiliser lamodélisation comme outil didactique pour réa-liser cette unification. c’est le point de vueque nous adopterons.

3. 3. La modélisation

comment permettre une synthèse entre lavision de la probabilité comme rapport dunombre des cas favorables sur le nombre de caspossibles (l’équiprobabilité étant postulée) et lavaleur limite des fréquences ? Michel henry pro-pose la modélisation pour réaliser la synthèseentre ces deux conceptions de la probabilité :ainsi, dans la conception laplacienne, l’équi-probabilité ne sera plus un postulat mais une hypo-thèse de modèle et dans l’approche fréquentiste,la fréquence observée sur un échantillon, sipossible de grande taille, pourra servir d’hypo-thèse de modèle.

pour Michel henry (2001, p.149 à 159), lamodélisation est un processus qui permet un pas-sage progressif d’une réalité complexe, chan-geante que l’on souhaite étudier, à un universmathématique théorique stable qui permet d’enétudier certains aspects.

un objet ne possède pas en soi une pro-babilité, la probabilité est liée à une expé-rience, dont on dira qu’elle est aléatoire,parce qu’on ne peut pas établir de manièredéterministe le résultat qu’elle va produire.

l’étude repose donc sur la caractérisation decette expérience.

cette caractérisation doit assurer la repro-ductibilité de l’expérience, c’est pourquoi le pro-cessus de modélisation commence par l’expli-citation d’un protocole expérimental qui décritles conditions de réalisation de l’expérience. Elleexplicite aussi ce que l’on va retenir ou pas d’obser-ver : les issues observables (pour le lancer d’undé, cela conduit à exclure le dé « cassé » desobservations..). c’est une première simplifi-cation de la réalité.

Des hypothèses de travail sont expriméesdans le langage de l’expérience (qui, pour le déamèneront à considérer que le dé est équilibré).cette description qui idéalise l’objet, transfor-me le dé réel en un objet mathématique possé-dant des propriétés propres qui seront traduitesen langage mathématique par l’explicitationdu modèle mathématique retenu (pour le dé, laloi uniforme discrète sur l’ensemble des issuespossibles).

le travail dans le modèle choisi produirades résultats qu’il conviendra d’interpréter dansla situation réelle, cette interprétation pouvantconduire à rejeter le choix du modèle et à en défi-nir un meilleur.

ce travail sur la modélisation n’est passpécifique à l’étude des probabilités, mais le champdes probabilités est un lieu privilégié pour fairevivre un processus de modélisation. cette modé-lisation va permettre à l’élève de percevoir lecaractère théorique d’une probabilité. cetteétape, difficile pour les élèves et délicate pourl’enseignant, est fondamentale.

plus généralement, le travail sur la modé-lisation est étroitement lié au travail sur unproblème concret. le caractère concret du pro-blème nécessite une phase de modélisation. ce

Page 7: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

27

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

travail rarement pris en charge dans les classesde mathématiques est pourtant un attendu desprogrammes, comme le précisent les objectifsgénéraux du programme de seconde :

L’objectif de ce programme est de former lesélèves à la démarche scientifique sous toutesses formes pour les rendre capables de :

— Modéliser et s’engager dans une acti-vité de recherche ; [...]

Dans la mesure du possible, les problèmesposés s’inspirent de situations liées à la viecourante ou à d’autres disciplines.

quelles conclusions tirer de cette approchehistorique ?

— Les jeux de hasard motivent l’étude de lanotion de probabilité.

— L’estimation statistique ne nécessite pas deconnaître la théorie des probabilités, ni mêmela définition d’une probabilité, une approchede la notion de probabilité est suffisante.

— La statistique inférentielle est intrinsè-quement liée à la notion de probabilitédont elle éclaire le sens, ces deux thèmesgagneront à être menés conjointement.

— La modélisation doit apparaître commeprocessus dans les études proposées.

4. — Réflexion sur les programmes de Seconde

que retiennent les programmes commecapacités attendues sur le thème de la statistiqueinférentielle ?

4. 1. Types de tâches visés et techniques

Remarquons qu’un genre de tâches, lamodélisation (au sens où nous venons de la

définir) traverse ce travail sans lui être spéci-fique, mais revêt une importance didactiqueque nous avons soulignée.

on peut identifier certains types de tâchesfondamentaux :

— comparer des statistiques issues de diverséchantillons aléatoires

• par un résumé statistique pertinent• par une représentation graphique

adaptée

— produire des échantillons aléatoires parsimulation

ce type de tâche de la classe de secondea vocation à devenir une technique pourl’étude de modèles probabilistes et pour larésolution de problèmes relevant de l’aléa-toire dans les classes ultérieures.

— prendre une décision en situation de risque

on observe la fréquence f du caractère étu-dié sur un échantillon de taille n d’unepopulation. l’affirmation : « la proportiondu caractère dans la population est p »doit-elle être rejetée ou pas ?

on note iF un intervalle de fluctuation desfréquences au seuil de 95%. une règle dedécision est énoncée : si la fréquence obser-vée f, sur l’échantillon de taille n n’appar-tient pas à iF, alors on rejette l’affirmation.sinon, n’ayant pas d’argument suffisantpour la rejeter, on garde p comme hypothèsede modèle.

l’iF prendra des formes différentes selonque l’on est en seconde, première ou ter-minale. on utilisera en seconde uniquementun seuil de 95%, cette valeur sera privilé-giée au lycée, sans être exclusive.

— interpréter des informations statistiques

la lecture de données statistiques n’estpertinente que si elle est éclairée par une

Page 8: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

28

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

pensée statistique où la fluctuation d’échan-tillonnage est mobilisée. En particulier, ilconvient d’être vigilant sur la taille deséchantillons et sur les protocoles expéri-mentaux.

un dernier type de tâche doit être envisa-gé tout en n’étant pas exigible en classe deseconde :

— Réaliser une estimation de p

• par l’observation d’une fréquence : toute valeur de f est une estimation de p, plus la taille de l’échantillon est grande, plus l’estimation est pertinente.

• par la donnée d’un intervalle de confian-ce, ce qui permet d’associer une pré-cision à cette mesure : F la variable aléa-toire qui associe à chaque échantillon de taille n, la fréquence du caractère étudié, alors au niveau de confiance de 95 % :

p ∈

De façon plus réaliste pour la classe de seconde par l’observation d’un inter-valle de confiance (fourchette de sonda-ge) : une valeur f de F étant observée sur échantillon de taille n, alors au niveau de confiance de 95 % on peut affirmer que

p ∈ .

ce type de tâche n’est pas exigible en clas-se de seconde mais le sera en terminale. on remar-quera que les théories mathématiques qui justi-fient des savoir-faire visés par ces études ne

cF 2 1

"n; F 1

1

"nd

c f 2 1

"n; f 1

1

"nd

peuvent être abordées à ce niveau d’enseigne-ment. il s’agit de proposer aux élèves uneapproche heuristique, leur permettant de se fami-liariser avec l’aléatoire, notamment par des simu-lations informatiques, et de se construire desreprésentations efficaces pour traiter des problèmesrelevant de la statistique inférentielle.

4. 2. Difficultés et obstacles

4. 2. 1. la définition de l’iF proposée par le programme de seconde

le programme de seconde (2009, page 8)propose la définition suivante :

L’intervalle de fluctuation au seuil de 95 %relatif aux échantillons de taille n est l’inter-valle centré autour de p, proportion ducaractère dans la population, où se situe, avecune probabilité égale à 0,95, la fréquenceobservée dans un échantillon de taille n.Cet intervalle peut être obtenu, de façonapprochée, par simulation.

cet énoncé n’a de sens que si la fréquen-ce évoquée est une variable aléatoire qui peutprendre aléatoirement, à l’issue de la réalisationd’un échantillon de taille n, une des valeurs

0, , , , …, , 1.

il ne s’agit donc pas de la fréquence observée,dont la valeur est connue. sans parler de variablealéatoire 3, avant de réaliser un échantillon detaille, on peut suggérer que l’on ne peut pas savoirquelle fréquence du caractère on observeradans l’échantillon en parlant par exemple de fré-quence observable plutôt que de fréquenceobservée. Dans le programme de terminale, lavariable aléatoire fréquence du caractère dans

1

n

n 2 1

n

2

n

3

n

3 la notion de variable aléatoire n’est pas au programmede seconde

Page 9: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

29

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

un échantillon de taille n est notée Fn et fndésigne la fréquence observée.

il est énoncé que « la fréquence […], sesitue, avec une probabilité égale à 0,95,dans un intervalle centré en p ». Mais dansquel espace probabilisé cette probabilitéégale à 0,95 est-elle calculée ? si l’on consi-dère que l’univers est l’ensemble des échan-tillons de taille n, qui sont au nombre de 2 n, à chaque échantillon est attachée la pro-babilité p k (1 – p) n – k, où k désigne le nombred’occurrences de la modalité dans l’échan-tillon et p désigne à la fois la proportion dela modalité dans la population et la proba-bilité qu’il apparaisse lors d’un tirage.

l’évènement « dans l’échantillon, la fré-

quence du caractère est » a pour probabili-

té la somme des probabilités des évènementsélémentaires qui le constituent c’est-à-dire

p k (1 – p) n – k.

ces justifications ne sont accessibles qu’enclasse de première, dans le cadre de la loi bino-miale. En seconde, il n’est pas raisonnabled’énoncer une définition dans laquelle se che-vauchent implicitement deux probabilités défi-nies dans deux espaces différents, probabilitéd’apparition du caractère dans la réalisationd’un tirage, et probabilité que la fréquenceprenne des valeurs appartenant à un certainintervalle, alors que l’un des objectifs essentiel estde construire la notion de probabilité.

la définition appelle plusieurs questions :cet intervalle existe-t-il ? comment le déterminer ?pour une variable aléatoire discrète, un inter-valle i, centré en p tel que la probabilité que ƒappartienne à i soit strictement égale à 0,95, n’exis-te généralement pas. Mais le programme sug-gère de travailler avec des « intervalles appro-

k

n

a nkb

chés », ce qui nous amène à deux autres ques-tions : qu’est-ce qu’un intervalle de fluctua-tion approché ? comment le déterminer ?

le programme envisage deux possibilités.la première est d’obtenir un intervalle appro-ché par simulation. on proposera des situa-tions où la simulation ne pose pas de difficul-tés excessives. le programme offre une deuxièmepossibilité :

Le professeur peut indiquer aux élèves lerésultat suivant, utilisable dans la pratiquepour des échantillons de taille n ≥ 25 et desproportions p du caractère comprises entre0,2 et 0,8 :Si ƒ désigne la fréquence du caractère dansl’échantillon, ƒ appartient à l’intervalle

avec une probabili-

té d’au moins 0,95.

Le professeur peut faire percevoir expéri-mentalement la validité de cette propriétémais elle n’est pas exigible.

ce résultat n’est pas exigible mais aucuntravail de l’organisation mathématique relati-ve aux intervalles de fluctuation et à la prise dedécision n’est possible sans l’énoncé de cettepropriété. Dans non exigible, sans doute faut-il comprendre qu’elle n’a pas à être connuepar cœur et qu’elle doit être rappelée dans touttravail qui s’y rapporte.

De plus la propriété n’est pas toujours véri-fiée : on trouve dans le document ressource dela classe de terminale (2011, p. 27) des préci-sions à ce sujet ; lorsque p = 0,5, la variance est

maximale et p(0,5 – ≤ ƒ < 0,5 + ) est

réalisé pour tout n ≥ 529.

cp 2 1

"n; p 1

1

"nd

1

"n

1

"n

Page 10: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

30

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

la « définition » de l’intervalle de fluctuationreposant sur l’unicité suggérée (L’intervallede fluctuation…) et l’égalité (avec une proba-bilité égale à 0,95) est une définition valide dansle cadre d’une loi continue. En classe de secon-de le travail repose sur des lois discrètes etdonc sur un intervalle de fluctuation approché.une formulation évoquant une probabilité voi-sine de 0,95 serait préférable.

on peut comparer (encadré ci-desous)les présentations envisagées dans les différentesclasses pour la notion d’intervalle de fluc-tuation au seuil 95 % en seconde, première,terminale.

Remarque : seul le programme de terminales (2011) envisage des seuils autres que 95 %.

l’intervalle de fluctuation est une créa-tion didactique des nouveaux programmes delycée (à compter de 2009). lui donner un nompermet de l’identifier et de le distinguer del’intervalle de confiance, avec lequel il ne doitpas être confondu. les définitions successives,les incohérences (dont certaines sont évoquéesdans les documents ressources de première(2010) et de terminale(2011)), risquent d’en faire,pour les professeurs, un objet difficile à ensei-

gner et pour les élèves, un objet difficile àappréhender.

4. 2. 2. proportion ou probabilité

on remarquera que l’intervalle de fluc-tuation dans le programme de seconde faitréférence à une proportion et non à une proba-bilité. ce choix révèle une référence impliciteà la théorie des sondages. on peut regretter cechoix :

— ce choix est limitatif puisqu’il exclut la pos-sibilité d’établir un lien entre l’observationdes fréquences dans le cadre de jeux de hasardsimples (dés, pile ou face, ...) et les probabilitésdes éventualités observées. ce lien estpourtant essentiel dans la construction dela notion de probabilité.

— ce choix crée des difficultés, puisqu’il vafalloir admettre que les tirages sont toujoursassimilables à des tirages avec remise.Bien sûr nous dirons que la taille de l’échan-tillon étant très petite par rapport à la popu-lation, la probabilité de chaque tirage restesensiblement la même, mais nous savonsque ce type » de discours, lorsqu’il n’estpas produit par l’élève lui-même a peu dechance d’être réellement assimilé. Des

Page 11: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

31

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

activités permettant cela sont possibles enclasse de seconde mais le l’horaire demathématique en seconde ne le permetpas, sans compromettre des apprentissagesplus essentiels.

— ce choix risque de renforcer un obstacledidactique : l’assimilation entre probabili-té et proportion ou fréquence.

c’est pourquoi nous proposerons commedéfinition de l’intervalle de fluctuation enseconde :

Dans une population, la proportion ducaractère étudié est p comprise entre 0,2 et0,8. on réalise un échantillon aléatoire de taillen ≥ 25 de la population, la fréquence ducaractère observée dans l’échantillon est f. sil’on considère tous les échantillons de taillen possibles, pour environ 95 % d’entre eux,la fréquence f appartient à l’intervalle

.

cet intervalle est appelé intervalle de fluctuationde la fréquence observée au seuil de 95 %.

4. 2. 3. l’absence des diagrammes en boîtes

les paramètres permettant la réalisation d’undiagramme en boîte sont connus dès le collè-ge. un diagramme en boîte permet de repré-senter très simplement, en situant quelquesvaleurs sur un axe, le résumé d’une série parle couple (médiane, écart interquartile). cediagramme focalise l’attention sur les valeursles plus centrales de la série, en proportiond’au moins 50 %. il fait apparaître un paramètrede position (la médiane) et deux paramètres dedispersion (l’étendue avec les moustaches etl’écart interquartile).

cp 2 1

"n; p 1

1

"nd

l’utilisation d’un seul axe permet de repré-senter plusieurs diagrammes en boîtes au des-sus les uns des autres et facilite considérable-ment la comparaison de différentes séries. onpeut regretter que l’introduction du diagrammeen boîte n’apparaisse explicitement dans lesprogrammes qu’en classe de première.

4. 3. Le vocabulaire : « seuil et niveau »

Auparavant, ces notions étaient abordéespour la première fois en Bts et il était d’usaged’appeler seuil ce que l’on ne peut pas dépas-ser, et niveau ce que l’on veut au moins atteindre.c’est cette convention qui est la plus usitéedans l’enseignement supérieur.

pour un intervalle I, si P(F ∈ I) ≥ 0,95, Iest un intervalle de fluctuation au niveau 0,95ou 95 %. Dans ce cas, P(F ∉ I) ≤ 0,05, le risqueque F n’appartienne pas à l’intervalle ne dépas-se pas le seuil de 0,05 ou de 5 % .

plus généralement, soit α un réel de ]0, 1[.P(F ∉ I) < α exprime que le risque quen’appartienne pas à l’intervalle ne dépassepas le seuil α et P(F ∈ I) ≥ 1 – α exprimeque la probabilité que F appartienne à I atteintle niveau 1 – α. De même, on veut pouvoir déter-miner un intervalle de confiance avec un niveaude confiance au moins égal à, par exemple, 95 %.

Dans les textes du programme, un autre choixsemble avoir été fait : celui de réserver le motseuil à intervalle de fluctuation et le mot niveauà intervalle de confiance. Dans tout ce qui suitnous respecterons ce choix.

4. 4. Prise de décision à l’aide d’un test bilatéral

l’intervalle de fluctuation utilisé en secon-de étant centré sur p, le rejet se fera sur l’obser-vation d’une valeur de f trop petite ou trop

Page 12: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

32

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

grande pour appartenir à iF. certains problèmesde prise de décision ne peuvent donc pas êtretraités. on peut regretter l’exemple fourni dansle document ressources de seconde Statistiqueset Probabilités (2009, page 17) où l’on s’inter-roge  : «  ... sur les cas de leucémie chez lesgarçons de moins de quinze ans dans une peti-te ville des Etats-Unis  ». la question réelleétant doit-on s’inquiéter, il n’est d’aucune per-tinence de rejeter une fréquence qui n’appar-tiendrait pas à iF parce qu’elle serait trop peti-te. le document ressource de première (2010)reprend cet exemple pour en montrer un trai-tement raisonnable basé sur une prise de déci-sion à l’aide d’un intervalle unilatéral. on pour-ra approfondir cette question en se référantaussi à l’article de Ducel(2011).

4. 5. Le hasard

pour les élèves du secondaire, le calculdes probabilités est intrinsèquement lié à l’étudede situations aléatoires, donc d’un point de vuepurement didactique, à ce niveau d’enseigne-ment : « il n’y a pas de probabilité sans hasard »comme le dit souvent Michel henry. le hasardest un concept qui n’est pas propre au champmathématique. l’usage commun ne risque-t-ilpas de se constituer en obstacle ? c’est ce queBrigitte chaput et claudine Vergne (2010, p.6) précisent :

La notion de probabilité est indissociablede celle de hasard, car elle a pour objet dequantifier l’attente d’un évènement dont laréalisation est considérée comme dépen-dante du hasard. À leur arrivée en Troisiè-me, les élèves ont déjà été confrontés à plu-sieurs conceptions du hasard dans leur viequotidienne. Il convient, pour cette premiè-re rencontre avec les phénomènes aléatoiresdans le cadre des mathématiques, de clari-fier ceux qui, en mathématiques, permettrontd’introduire des probabilités. […]

L’élève arrive avec des conceptions per-sonnelles relatives au hasard et au tirageau sort, qu’il s’est forgées au quotidien dansson entourage, sous l’influence des médias,etc. Il est important de faire émerger cesconceptions de façon à lever les ambiguïtés,les malentendus qui pourraient faire obs-tacle à la compréhension de l’approchemathématique de la notion de probabilité.

Dans la vie courante, le mot hasard estassocié à la chance, à l’intervention divine, audestin, mais aussi aux coïncidences fortuites, leplus souvent le hasard est évoqué dans l’obser-vation d’événements exceptionnels.

En classe de mathématique, le hasard étu-dié est un hasard construit, inhérent à un modè-le mathématique. l’écart est important entre cesconceptions du hasard et la rationalité que lesprogrammes proposent d’étudier. ces concep-tions culturellement répandues peuvent consti-tuer des obstacles pour les apprentissages envi-sagés par les programmes.

il semble nécessaire de clarifier dans nosclasses, quel est le hasard dont l’étude est viséeau lycée.

cileda couthiño (1999), propose d’amenerles élèves à distinguer le hasard de contingen-ce du hasard relevant de «  situations poten-tiellement reproductibles  », c’est-à-dire desituations modélisables. sur le recensement desituations comportant « du hasard », les élèvesévoqueront des situations de jeux de hasard, loto,machines à sous... ces situations sont reconnuespour être reproductibles. Des situations issuesde la vie quotidienne apparaitront aussi : sexed’un bébé à la naissance, prévisions météoro-logiques, générateurs de musiques aléatoires,désignation de l’élève que le professeur vainterroger... le sexe des bébés est assez faci-lement classé dans les situations reproductibles

Page 13: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

33

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

par la référence à la quasi équiprobabilité desgenres à la naissance, la désignation d’un élèvesera rejetée des situations relevant du hasard,le professeur fait son choix en fonction de laconnaissance des élèves et de ceux qu’il sait avoirdéjà interrogés. les phénomènes météorologiquessont étudiés comme des phénomènes aléatoireset modélisés, mais les modèles utilisés sontencore peu fiables. D’autres situations serontévoquées relevant de la coïncidence commepar exemple « je rencontre un copain dans larue », cette dernière situation relève clairementde la contingence, en particulier parce que l’uti-lisation du pronom « je » singularise la situa-tion. cette première phase permet de distinguerle hasard modélisable du hasard contingent.

nous proposerons en seconde de classer dessituations qui évoquent le hasard, afin de bienidentifier celui qui sera l’objet de l’étude au lycée.

4. 6. Générateurs aléatoires

la génération de nombres aléatoires peutêtre réalisée avec deux fonctions, quel que soitle support utilisé, calculatrice, tableur, langa-ge de programmation... pour le tableur de Excel,cela sera soit avec la fonction AlEA, soit avecla fonction AlEA.EntRE.BoRnEs ; la fonc-tion AlEA fournit un nombre aléatoire del’intervalle [0 ; 1[, elle modélise une loi conti-nue, la loi uniforme, même si elle reste en touterigueur une loi discrète portant sur les 10 n

décimaux (comportant n décimales comprisdans [0 ; 1[, 10 14 pour le tableur Excel). la fonc-tion AlEA.EntRE.BoRnEs(n ; p) fournitun nombre «  aléatoire  » entier N, tel quen ≤ N ≤ p ; elle modélise une loi discrète, la loiéquirépartie sur {n ; n + 1 ; ... ; p}.

comparons les techniques et leurs justifi-cations à mettre en œuvre pour ces deux fonc-tions sur deux exemples classiques : le lancerd’un dé, puis le tirage dans une urne contenant

une boule rouge et quatre boules blanches.pour le dé :

=ENT(ALEA()*6+1) AlEA() nécessitel’utilisation de la partie entière qui est au pro-gramme de terminale et un travail sur desinégalités pour obtenir un nombre entier del’intervalle [1 ; 7[.

=ALEA.ENTRE.BORNES(6;1) est plussimple.

Regardons pour le tirage dans une urne conte-nant 1 boule rouge et 4 boules blanches

=SI(ALEA()<0,2;1;0 AlEA nécessitede se référer à la probabilité d’un intervalledans le cadre de la loi uniforme : c’est le pro-gramme de terminale s ou Es. Elle nécessitele recours à un test avec la fonction si. oninterprètera le 1 comme le tirage d’une boulerouge et le 0 comme celui d’une boule blanche.

=ALEA.ENTRE.BORNES(1;5) on inter-prétera le 1 comme le tirage d’une boule rougeet les autres chiffres comme celui d’une bouleblanche.

Dans le cadre de la fonction AlEA(), la jus-tification repose toujours sur la loi uniforme, pourAlEA.EntRE.BoRnEs, la justification repo-se sur une loi discrète équirépartie. nous utili-serons pour les classes de secondesAlEA.EntRE.BoRnEs.

les nombres produits par cette fonction sontdes nombres pseudo-aléatoires, produits pardes algorithmes ayant des périodes extrêmementlongues et indécelables à notre échelle. Bienqu’issues d’un processus déterministe, cessuites de nombres sont compatibles avec lesmodèles probabilistes qu’elles sont censéesreprésenter. la première utilisation d’un géné-rateur aléatoire sur des calculatrices neuves ouréinitialisées et du même modèle fournit des résul-tats identiques ! le caractère pseudo-aléatoirene peut être occulté au risque de créer des mal-

Page 14: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

34

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

entendus préjudiciables aux apprentissagesvisés. nous pensons qu’il est important d’expli-citer le caractère pseudo-aléatoire des nombresobtenus par de tels générateurs.

sur tableur, l’utilisation de la touche de recal-cul des formules F9 permet d’obtenir une nou-velle valeur aléatoire indépendante de la pré-cédente. la fonction

AlEA.EntRE.BoRnEs(n;p)

peut être représentée par le tirage dans une urneopaque contenant des boules indiscernables au tou-cher numérotées de n à p. l’utilisation de latouche F9 correspond alors à un tirage avec remi-se. cette urne constitue un registre de représen-tation sémiotique qui favorise une constructionsémantique de la fonction AlEA.EntRE.BoRnEs.cette urne constitue aussi un modèle pseudo-concret pour l’expérience aléatoire que l’on simu-le. il semble donc important de permettre d’accé-der à cette représentation.

5. — Parcours d’enseignement pour la classe de Seconde

l’étude que nous proposons en classe deseconde se déroule en quatre temps. le premiertemps permet d’identifier et de caractériser lehasard dont l’étude est visée, puis elle s’articuleautour de trois activités d’étude et de recherche :« le problème d’Adrien » qui permet de com-prendre le caractère de modèle d’une probabi-lité et d’établir le lien entre fréquences et pro-babilités ; « la parité » qui permettent d’aborderla prise de décision avec un intervalle de fluc-tuation ; « les anniversaires » qui permet d’abor-der l’estimation par intervalle de confiance.

5. 1. Quel hasard étudions-nous ?

il s’agit dans ce premier temps de laissers’exprimer la diversité des conceptions des

élèves et d’établir une classification des situa-tions selon qu’elles sont modélisables ou non.cela permet de définir le hasard qui sera l’objetd’étude en cours de mathématiques.

Voici (encadré ci-contre) quelques exemplesde productions, illustrant la diversité des concep-tions que mobilisent spontanément des élèves.

on pourra institutionnaliser que :

— certaines situations mettant en jeu descoïncidences fortuites ne seront pas étudiées.

— Dans d’autres situations, le hasard en jeupeut être modélisé. ce sont de tels modèlesque nous étudierons.

5. 2. Comment choisir un modèle ? Le problème d’Adrien

5. 2. 1. l’énoncé

il s’agit d’une situation classique reposantsur la somme de deux dés en référence au pro-blème du grand duc de toscane.

5. 2. 2. types de tâches mis en jeu

— Choisir un modèle : sur quel univers faireporter l’équiprobabilité ?

Adrien est à la foire de la saint Martin, uneloterie lui propose de parier sur la somme dedeux dés que le forain va lancer. les deux déssont dans un gobelet et vont être lancés dansun plateau de jeu. si le nombre annoncé parAdrien correspond à la somme des deux facesdes dés qui apparaissent alors il gagne ungros lot. Adrien doit payer pour participer àce jeu, il souhaite faire un choix qui lui donnele plus de chance de gagner. que conseillerais-tu à Adrien ?

Page 15: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

35

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

— Simuler une situation aléatoire.

— Estimer une probabilité par la fréquenceobservée sur un échantillon de grande taille.

5. 2. 3. Analyse de la situation

une première phase de travail indivi-duel permet l’expression des réponses spon-tanées. cette phase permet d’amorcer le pro-cessus de dévolution et permet à l’élève deformuler ses conceptions du hasard. la diver-sité des conceptions initiales motive l’étude.Dans les conceptions se mêlent croyancespopulaires et argumentations scien-tifiques correctes ou erro-nées.

trois modéli-sations doivent appa-raître au cours dece travail :

— une faisant porter l’équiprobabilité sur les11 sommes observables,

— une autre faisant porter l’équiprobabilitésur 21 façons d’obtenir ces sommes en nedifférenciant pas les deux dés,

— la dernière faisant porter sur les 36 couplesconstituant l’univers.

la situation proposée relate sur une expé-rience réalisée en classe et des simulations surtableur. Elle va permettre d’articuler des rai-sonnements probabilistes et une approche fré-quentiste des probabilités.

Elle doit permettre de mettre en jeu desregistres de représentations sémiotiques variés :

— distributions de fréquences sous formesde tableaux ou de graphiques statiques etdynamiques,

— tableaux à double entrée,

— liste de dénombrements,

— arbre de dénombrement

— langage naturel oral et écrit

— langage mathématique.

Page 16: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

36

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

une large place au langage naturel est pré-vue : oral dans les différents travaux de groupeset écrit au travers des différents comptes-ren-dus à fournir.

ce travail met en débat différents « can-didats-modèles  » selon les termes de par-zyzs (2007). il doit permettre aux élèves depercevoir le caractère de modèle d’une loi deprobabilité.

le lien entre statistique et probabilités neva pas de soi comme en témoigne la produc-tion ci-dessus d’une « bonne élève » au coursde ce travail :

Des entretiens menés en fin de parcours mon-trent que les avancées sur ce point sont signi-ficatives :

élève 1 : « La probabilité c’est pour uneinfinité de choses c’est une formule préci-se, tandis que la fréquence c’est sur unexemple précis. »

élève 2 : « La probabilité c’est un calculqui appartient à un monde idéal un mondequi n’existe pas, ce n’est pas la réalité,[…] alors que la fréquence c’est sur unnombre fini, c’est la réalité, c’est ce qui sepasse en vrai. »

5. 2. 4. indications sur l’organisation de l’activité d’étude et de recherche

pour le déroulement de l’activité, des déssont à disposition des élèves. ils peuvent venirles chercher à tout moment du travail.

la première phase doit permettre à chaqueélève de s’approprier la situation et d’exprimerses représentations.

une phase d’action en travail de groupeamène les élèves à confronter ces conceptionset à développer une argumentation pour enrejeter certaines et/ou en légitimer d’autres. lamise en commun fait apparaître des argumen-tations de type statistique obtenues par le lan-cer de dés, des argumentations probabilistes repo-sant sur le dénombrement des issues possibles.Deux modèles émergent à ce stade du travail :un modèle reposant sur 21 issues équipro-bables, un autre sur 36 issues équiprobables. Maisles arguments ne permettent pas à la classe dedécider entre ces deux modèles. les élèvespensent que l’expérience doit permettre dedécider.

le protocole expérimental est décrit, les déssont considérés comme équilibrés.

lors de la seconde phase, les élèves recueillentdes données statistiques par la réalisation de l’expé-rience et les résument. le nombre de répétitionsde l’expérience est de la responsabilité dechaque groupe, les nombres choisis sont sou-vent corrélés au nombre d’issues 11, 21 et 36et ce choix témoigne de l’absence de percep-tion de la fluctuation des fréquences.

la comparaison des résultats statistiques por-tant sur des effectifs différents conduit au cal-cul des fréquences. la comparaison de fré-quences portant sur un même nombred’observations est privilégiée par les élèves.

Page 17: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

37

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

l’observation des fréquences expérimentalesconduit beaucoup d’élèves à abandonner lemodèle relatif aux 36 issues. certains affir-ment que comme l’expérience relève du hasard,elle ne sert à rien. certains élèves s’opposentà cette vision et affirment que si l’on en faisaitbeaucoup plus, on pourrait savoir. un débat nait ;certains pensent : « même si l’on en fait beau-coup, comme c’est du hasard, on ne pourra passavoir ». ce débat témoigne d’une dévolutionréussie et fait émerger une nouvelle question :« Beaucoup de lancers peuvent-ils permettre dedécider du modèle pertinent ? ».

la troisième phase est une phase de simu-lation. En effet, la nécessité de faire beaucoupde lancers légitime le recours à la simulation surtableur, même si le terme de « beaucoup »reste à préciser à ce stade du travail. cettesimulation est précédée d’une simulation avecun sac opaque contenant des papiers numéro-tés. cela permet une bonne compréhension dela fonction AlEA.EntRE.BoRnEs et de latouche F9 : tirage avec remise dans une urne.

le nombre de répétitions réalisées est lais-sé à la responsabilité des élèves. les choix faitssont variés. En fin d’activité, les élèves compa-rent les graphiques obtenus sur leurs écrans res-pectifs, observent que ceux qui ont utilisé des plusgrands nombres ont des graphiques qui « bou-gent moins » quand ils utilisent le recalcul (F9)ils observent pour ceux qui ont dépassé 1 000 quela fréquence du 7 reste supérieure à celle du 6et du 8. cela permet que la stabilisation des fré-quences simulées soit perçue et que le modèleà 36 issues soit retenu par tous. la démonstra-tion est réalisée sans peine, puisque certainsgroupes l’ont effectuée lors de la première phase.les rétroactions du milieu, données de l’expé-rience, modèles candidats pluriels, conceptionsvariées des élèves, données simulées avec lesac puis avec l’ordinateur, représentations gra-phiques ont permis que les élèves conservent la

responsabilité de la résolution du problème. laplupart des changements de phases sont marquéspar une évolution de la question étudiée.

5. 2. 5. Bilan et institutionnalisation

l’institutionnalisation se fera en deuxtemps : un bilan contextualisé sur la situationétudiée, puis une synthèse mathématiquedécontextualisée. ces deux bilans prendrontappui sur des propositions des élèves quiseront discutées. le professeur apportera le voca-bulaire spécifique correspondant à ces for-mulations des élèves.

5. 2. 5. 1. Bilan de l’activité

la synthèse de l’activité réalisée avec lesélèves pourrait prendre la forme suivante :

— pour des échantillons de taille 2 000, la fré-quence du 7 reste toujours supérieure àcelle du 6 et du 8, nous pensons donc que6, 7 et 8 ne sont pas équiprobables. ilsemble qu’Adrien aura plus de chance degagner en jouant le 7.

— la probabilité qu’Adrien gagne est estiméepar 0,16 (fréquence observée sur un échan-tillon de taille 1 000).

En travail à la maison, on demandera de cher-cher toutes les façons d’obtenir 6, 7 et 8 etéventuellement d’établir la probabilité de cha-cune des sommes

— le modèle retenu sera explicité, il s’agit dela loi portant sur 36 issues équiprobables.

— la probabilité qu’Adrien gagne en jouantle 7 est calculée et simplifiée, on obtient 1/6.

5. 2. 5. 2. Institutionnalisation

— la notion d’échantillon sera définie confor-mément au programme (2009) :

Page 18: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

38

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

« Un échantillon de taille n est constitué desrésultats de n répétitions indépendantes dela même expérience aléatoire. »

— Fluctuation d’échantillonnage :

fn désigne la fréquence de la valeur du carac-tère étudié au cours de l’observation d’un échan-tillon de taille n. on constate sur différentesobservations d’échantillons de taille n, queles valeurs de fn varient, on dit qu’il y a fluc-tuation des fréquences. on peut observerque l’amplitude des fluctuations est d’autantplus petite que n est grand (sauf dans des casextrêmement rares).

— stabilisation des fréquences :

une probabilité est un nombre théorique rele-vant d’une expérience aléatoire simplifiéeet idéalisée. Elle permet de décrire, d’anti-ciper les résultats de l’expérience réellequ’elle modélise et de faire des prévisions.

la probabilité d’un événement A peut êtreestimée par la fréquence de la réalisationde A, observée sur un échantillon, avecd’autant plus de pertinence que la taille del’échantillon est grande.

— calcul de la probabilité d’un événement Ade l’univers U :

quand l’hypothèse de modèle repose sur l’équi-probabilité des issues, on a :

P(A) = .

quand les différentes éventualités ne sontpas équiprobables, on déterminera d’abordleurs probabilités respectives. Alors la pro-babilité de A sera la somme des probabili-tés des événements élémentaires qui leconstituent.

— simulation

pour étudier certaines expériences aléa-toires pour lesquelles un modèle a été choisi,

nombre d'éléments de Anombre d'éléments de U

on peut produire des échantillons par simula-tion de ce modèle. une simulation peut être réa-lisée avec des objets (dés, pièces, …) ou desmoyens informatiques.

pour générer aléatoirement un nombreentier dans l’intervalle [n ; p] :

— avec le tableur, on utilise le plus souventla fonction AlEA.EntRE.BoRnEs(n;p)

— avec la calculatrice, on utilise EntAleat(n,p)qui se trouve dans MAth pRB 4.

— avec Algobox, on utilise AlGoBoX_AlEA_Ent(n,p)

5. 2. 6. Exercices de travail sur la technique

— comment simuler le lancer de trois piècesde monnaie pour déterminer la combinai-son de pile et Face la plus probable ?

— comment simuler le tirage avec remisedans une urne contenant 50 boules  : 30blanches et 20 rouges afin de déterminer s’ilest rare de n’obtenir aucune boule rougequand on réalise 4 tirages d’une boule ?

— comment peut-on simuler un sondage dansune population où il y a 40% de jeunes ?

— pierre et Aline jouent : pierre lance une pièceet s’il obtient « Face » il a gagné la partie ;sinon il relance la pièce et, s’il obtient« Face » il a gagné, tandis que s’il obtient« pile » il a perdu et Aline a gagné. qui ale plus de chances de gagner ? commentsimuler ce jeu ?

5. 3. Comment prendre une décision dans une situation où le hasard intervient : la parité

Avec la première activité d’étude et derecherche, les élèves ont découvert la notion de

4 les calculatrices utilisées dans nos classes sont des ti.

Page 19: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

39

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

modèle et celle de fluctuation des fréquences.la seconde activité a pour but de permettreaux élèves de percevoir un enjeu social impor-tant de la statistique : celui de la prise de déci-sion dans une situation aléatoire. il s’agit ici defaire comprendre aux élèves que dans une telleprise de décision, quelle que soit la décision prise,il y a un risque de se tromper.

5. 3. 1. l’énoncé.

5. 3. 2. types de tâches mis en jeu 

— Modéliser une situation en termes d’aléa-toire pour l’étudier.

— produire des échantillons par simulation.

— quantifier la fluctuation des fréquences.

— prendre une décision dans le cadre d’unesituation aléatoire.

5. 3. 3. Analyse de la situation

quelle que soit la classe dans laquelle onpose cette question, la réaction des participantsest toujours la même : ils se comptent, déterminentle nombre de filles, le nombre de garçons, lescomparent et si ces nombres ne sont pas égaux,rejettent l’idée que la parité est respectée.

ce comportement rend compte d’uneconception arithmétique de la parité des sexesmais celle-ci n’est pas opérationnelle dès quel’effectif de la classe est impair (on peut alorsl’aménager en disant qu’il y a parité des sexessi le nombre de filles et le nombre de garçonsdiffèrent d’une unité).

toutefois, cette conception n’est pas laseule possible, on peut en envisager une autre,

de type probabiliste : si pour constituer uneclasse, le sexe des individus n’est pas pris encompte et si la population dans laquelle lesindividus sont sélectionnés est composée d’à peuprès autant de garçons que de filles, la classepeut être considérée comme un échantillon(aléatoire) d’une population où la proportion defilles est 0,5.

cette valeur p = 0,5 est ici notre hypothè-se de modèle. c’est avec ce nouveau point devue que la question va être étudiée. on consi-dère que le sexe des élèves n’a pas été pris encompte pour la composition des classes et quel’hypothèse de travail « il y a autant de fillesque de garçons à l’entrée en seconde » est rai-sonnable. on choisit donc de modéliser la situa-tion étudiée par une loi équirépartie.

Remarquons que dans un autre cas, suivantla composition de la population, on aurait puchoisir p = 0,51 ou une autre valeur. les élèvesdoivent être associés à la réflexion sur ce choix.

le travail proposé amène à introduirel’intervalle de fluctuation au seuil de 95 % afinde prendre une décision quant au respect de laparité des sexes dans la classe.

cette question d’actualité interpelle lesélèves. quand cette activité d’étude et derecherche est bien menée, on voit les élèvesaller vérifier d’eux même s’il y a parité dansle gouvernement, à l’assemblée nationale,au sénat, etc.

comme dans la précédente activité, ladiversité des représentations graphiques et la simu-lation sur tableur jouent un rôle fondamental.ils constituent une diversité de registres dereprésentations sémiotiques, cette diversité deregistres graphiques articulés aux registresnumériques dynamiques du tableur et au lan-gage naturel des élèves sollicités contribuent à

Dans votre classe, la parité des sexes est-ellerespectée ?

Page 20: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

40

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

une construction efficace de la notion d’inter-valle de fluctuation.

5. 3. 4. indications sur l’organisation de l’activité d’étude et de recherche

Dans la première phase, la réponse spontanéedes élèves est suivie d’échanges destinés à fairechanger le point de vue sur la conception de laparité homme-femme dans une assemblée.

lors de la deuxième phase, chaque élèveécrit individuellement ce qu’il prévoit de fairepour répondre à la question en adoptant laconception aléatoire de la parité. cette phased’écriture permet aux élèves d’entrer dans latâche proposée. une mise en commun permetde faire apparaitre qu’avec une telle définition,on ne peut pas connaître à l’avance la compo-sition d’une assemblée de 34 personnes (34 estle nombre d’élèves de la classe dans laquellese déroule l’activité) ; on ne dispose pas de tellesassemblées déjà constituées ; on peut en pro-duire par simulation pour ensuite observer leurcomposition.

lors de la troisième phase, les élèves tra-vaillent en groupe de deux et élaborent unestratégie pour simuler une assemblée de 34personnes. cela peut-être à la main en tirant àpile ou Face et codant, par exemple : Face-Fille,pile-Garçon ; ou en lançant un dé et codant pair-Fille, impair-Garçon ; ou à la calculatrice en uti-lisant la fonction EntAlea(0,1).

En travail à la maison, chaque élève effec-tue la simulation d’un échantillon de taille 34et calcule la fréquence de filles dans l’échan-tillon. les résultats sont mis en commun et lasérie obtenue est étudiée. cette phase permetde réactiver les connaissances de statistiquedescriptive étudiées en troisième (moyenne,médiane, quartiles) et de construire puis obser-ver plusieurs graphiques représentant la série

(diagramme en bâtons, diagramme en boite,nuage de points). cela permet de mettre enévidence et visualiser la fluctuation des fré-quences (certains élèves risquent de proposerune fréquence qui leur paraît plausible sansavoir réalisé l’expérience ; il sera intéressant deconfronter cette série aux résultats établis ulté-rieurement au cours de l’AER). les élèves nes’attendaient pas à de telles différences dans lesfréquences obtenues, s’étonnent lorsque lamoyenne ou la médiane n’est pas 0,5.

la question initiale est reposée : perplexi-té des élèves. Au vu de la variabilité des résul-tats obtenus, ils ont du mal à émettre une opi-

Page 21: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

41

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

nion et certains se disent que tout est possible(une élève déclare « on pourrait avoir 99 % degarçons ! »)

le professeur propose de poursuivre l’obser-vation en produisant davantage d’échantillonsde taille 34 par une simulation sur tableur. Enutilisant la fonction AlEA.EntRE.BoRnEs(n;p), chaque élève produit une sériede 100 fréquences de filles dans une assembléede taille 34, détermine les caractéristiques dela série et fournit un nuage de points.

la simulation sur tableur est un moyenfiable et rapide d’obtenir des échantillons.l’utilisation de la touche F9 permet tout à lafois de produire de nouvelles séries d’échan-tillons mais aussi d’observer que d’une sérieà l’autre, certaines caractéristiques sont ana-logues (on notera qu’il est utile de bloquer l’axedes ordonnées du graphique entre 0 et 1 afinqu’il ne change pas à chaque production d’unenouvelle série).

Devant la variabilité des fréquences, il estdifficile de voir apparaître une propriété. tou-tefois la première activité d’étude et de recherchea permis de voir que la fluctuation diminuelorsque la taille des échantillons augmente. leprofesseur relance alors l’activité en proposantd’observer cette fois des assemblées de plus gran-de taille. chaque élève produit une série de

100 fréquences de filles dans une assemblée detaille 100, puis de taille 1000 ainsi que lesnuages de points correspondants.

l’observation simultanée des trois gra-phiques est assez suggestive pour permettre auxélèves d’énoncer des conjectures qu’ils sontinvités à rédiger. Dans ces conjectures, les élèvesdécrivent souvent, pour chaque graphique, l’inter-valle dans lequel se situent les fréquences. le pro-fesseur amorce la construction des éléments àinstitutionnaliser : pour 95 % environ de tousles échantillons de taille n possibles, la fré-quence f appartient à l’intervalle

, appelé intervalle de

fluctuation au seuil 95 %.

cp 2 1

"n; p 1

1

"nd

Page 22: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

42

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

une feuille comportant trois graphiquesde ce type est distribuée aux élèves. ils sont invi-tés à écrire les intervalles de fluctuation et à tra-cer sur chacun des trois graphiques les droites

d’équation y = p – et y = p + pour

donner sens à cette propriété.

En se basant sur l’intervalle de fluctua-

tion , le profes-

1

"n

1

"n

c0,5 21

"34; 0,5 1

1

"34d

seur énonce la règle permettant de décidersi, dans la classe, la parité homme-femme estrespectée.

5. 3. 5. Bilan et institutionnalisation

5. 3. 5. 1. Bilan de l’activité

si l’on considère que le caractère homme-femme est aléatoire, la composition d’une clas-se de 34 élèves peut être très variable. Dans envi-ron 95 % des cas, la fréquence de filles appartient

à l’intervalle .

pour décider si dans une classe donnée, laparité homme-femme est respectée, on adoptela règle suivante :

— Si la fréquence de filles dans la classe n’appar-

tient pas à , on

considère que la parité n’est pas respectée,

— Si la fréquence de filles dans la classe

appartient à on

n’a pas de raison de considérer que la paritén’est pas respectée.

5. 3. 5. 2. Institutionnalisation

Intervalle de fluctuation

Dans une population, la proportion ducaractère étudié est p comprise entre 0,2 et 0,8.on réalise un échantillon de taille n ≥ 25 de cettepopulation, la fréquence du caractère dansl’échantillon est f. si l’on considère tous les échan-tillons de taille n possibles, pour environ 95 %

c0,5 21

"34; 0,5 1

1

"34d

c0,5 21

"34; 0,5 1

1

"34d

c0,5 21

"34; 0,5 1

1

"34d

Page 23: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

43

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

d’entre eux, la fréquence f appartient à l’inter-

valle , appelé interval-

le de fluctuation au seuil de 95 %. il est sou-vent noté iF.

Prise de décision

soit un échantillon de taille n dans lequel lafréquence observée est f. l’affirmation « l’échan-tillon provient d’une population où la proportionest p » doit-elle être rejetée ou pas ?

— Si la fréquence f n’appartient pas à IF,alors, au seuil de 95 %, on rejette l’affir-mation.

— Si la fréquence f appartient à IF, alors, auseuil de 95 %, on n’a aucune raison de reje-ter l’affirmation.

5. 3. 6. Exercices de travail de la technique

1. Deux entreprises recrutent leur personnelparmi des candidats comportant autant d’hommesque de femmes. la répartition entre hommes etfemmes est la suivante :

hommes Femmes

Entreprise A 57 43

Entreprise B 570 430

peut-on penser que, dans l’une de ces entreprises,la parité homme-femme à l’embauche n’estpas respectée ? 5

2. contrôle qualité. un grossiste en fourniturede bureau revend des rouleaux de ruban adhé-sif transparent et affirme que seulement 0,8 %des rouleaux présente un défaut de jaunissementdu papier. un client achète 500 rouleaux etconstate que 6 rouleaux, soit 1,2% des rou-leaux, présentent un jaunissement du papier.

cp 2 1

"n; p 1

1

"nd

le client peut-il faire une réclamation auprèsdu grossiste ?

3. on considère que la proportion de femmesdans la population française est 1;2. A l’Assem-blée nationale, il y a 577 députés, dont 108femmes. peut-on considérer que cette répar-tition est un effet de la fluctuation d’échan-tillonnage ou bien dire que la parité des sexesn’est pas respectée à l’Assemblée nationale?(on assimilera l’ensemble des députés à unéchantillon de taille 577 de la populationfrançaise). 6

4. où l’on retrouve la parité des sexes (Ressourcespour faire la classe en mathématiques pour lavoie professionnelle, mise à jour 2010).Dans la réserve indienne d’Aamjiwnaag (cana-da) on recense, parmi les 132 enfants de moinsde 3 ans, 46 garçons. ces observations sont-ellesle fruit du hasard ?

5. 4. Comment estimer une probabilité : Le problème des anniversaires

les élèves savent maintenant quantifier lafluctuation des fréquences en fonction de lataille d’un échantillon.

la situation proposée doit les amener às’interroger sur le problème réciproque : com-ment estimer la probabilité d’un évènement ?peut-on le faire à partir des fréquences obser-vées dans une expérimentation ou une simula-tion ? Et si oui, comment ? l’objectif est d’intro-duire l’estimation par intervalle de confiance.

la situation retenue est une adaptation duparadoxe des anniversaires énoncé par VonMises au début du 20ème siècle.

5 D’après le document ressource de seconde, 2008, page 176 Maths 2de, collection pixel, édition Bordas 2010, page 277

Page 24: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

44

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

5. 4. 1. l’énoncé

5. 4. 2. types de tâches mis en jeu

la situation permet d’aborder les types detâches suivants :

— interpréter des informations statistiques.

— Modéliser une situation aléatoire.

— simuler une expérience aléatoire sur tableur.

— Réaliser une estimation par intervalle deconfiance.

Et éventuellement, si le niveau de la clas-se le permet :

— calculer la probabilité par l’utilisation del’évènement contraire et si A désigne l’évé-nement étudié et u l’univers, p(A) =

. ici, si chaque jour est repéré par

son rang dans l’année (année non bissex-tile) et si le nombre d’élèves de la classeest 35, alors les 35-uplets constitués des entiersde 1 à 365 forment l’univers u.

5. 4. 3. Analyse de la situation

la situation choisie s’appuie sur un thèmefamilier aux élèves, l’organisation doit per-mettre l’expression de conceptions initiales etleur éventuelle remise en cause.

En particulier il est probable que certains pen-seront naturellement qu’il faut environ 365

Card1A 2Card1U 2

personnes pour avoir beaucoup de chances quedeux personnes aient la même date anniversaire.

on peut également s’attendre à ce que cer-tains pensent que c’est très rare et d’autres non.

De façon très spontanée, l’élève peut par-tir de sa propre expérience et déclarer : « Dansles classes que j’ai fréquentées, j’ai sou-vent/rarement observé que deux élèves au moinsfêtaient leur anniversaire le même jour ».

la nécessité de modéliser la situation appa-raît déjà :

la diversité des réponses permet la mise enplace d’un débat scientifique et motive la pour-suite de l’étude. la subjectivité des réponses etla diversité des vécus aiguisent la curiosité desélèves qui expriment leur souhait de consulterde vraies données. la nécessité de recueillir desdonnées objectives permet d’évoquer les pro-blèmes fondamentaux dans la société, de fai-

« Est-il rare que dans une classe deux élèvesau moins aient la même date anniversaire ? »

Page 25: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

45

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

sabilité d’une enquête, de coûts. l’impossibi-lité d’un recensement exhaustif sur toute laFrance par exemple amène les élèves à mettreen œuvre une démarche statistique.

En proposant un fichier constitué del’ensemble des classes du lycée, cette situa-tion permet d’aborder un objectif du program-me : faire travailler les élèves de seconde surdes données réelles à partir de gros fichiersinformatiques. ce sera l’occasion de mobiliserune partie des statistiques descriptives.

les résultats obtenus sur l’étude des classesdans nos lycées paraissent surprenants auxélèves, en effet on obtient une fréquence d’envi-ron 75%. Beaucoup d’élèves pensent que leurlycée est exceptionnel ; cela relance la motivationde cette étude. un travail de simulation sera pro-posé pour observer davantage de données.

ce travail de simulation nécessite uneréflexion riche du point de vue de la modéli-sation :

— on fixe le nombre d’élève par classe ;

— on décide qu’il y a 365 dates possiblesd’anniversaires (on omet le 29 février) ;

— on décide qu’il y a autant de naissancechaque jour de l’année (cette hypothèsede travail est raisonnable au vu des donnéesdisponibles sur l’insEE) et donc le modè-le mathématique reposant sur l’équirépar-tition des issues peut permettre d’étudier cetteexpérience.

l’observation des données simulées amèneles élèves à proposer une estimation de la pro-babilité cherchée. le professeur invitera à fairele lien avec l’intervalle de fluctuation et proposerala mise en place de l’intervalle de confiance. Dansdes classes à profil scientifique, on pourra envi-sager le calcul probabiliste pour clore l’étudemathématique du problème.

5. 4. 4 indications sur l’organisation

lors de la première phase de travail indi-viduel, chaque élève exprime son point de vuepuis travaille sur les listes photocopiées desdates anniversaires de deux classes. ce travail« à la main » est fastidieux. il ne permet pas deconclure quant à la question posée. les élèvessuggèrent qu’il faudrait étudier davantage declasses.

le professeur propose d’étudier l’ensembledes classes du lycée : le fichier permettant cetteétude a été obtenu à partir d’une extraction dela base de données du lycée, seuls les noms desclasses et les dates anniversaires des élèves dechaque classe ont été conservées, les années denaissance ont été remplacées par 2000, puiscachées, afin que seuls le jour et le mois de l’anni-versaire apparaissent. les dates anniversairesdes élèves de chaque classe ont été disposéesen colonne, par classe, la première ligne conte-nant le nom de la classe.

pour la seconde phase, les élèves ont en char-ge l’étude sur l’un des niveaux du lycée  :secondes, premières, terminales ou post-bac.chaque élève doit, à l’aide de la fonctionMoDE, déterminer pour les classes du niveauétudié, si oui ou non deux élèves au moins ontla même date anniversaire. cette fonctionMoDE renvoie la valeur la plus fréquente dela série s’il y en a une, l’une d’elles s’il y en a

plusieurs ou l’indication sichaque date n’apparaît qu’une fois.

l’élève doit calculer la fréquence, parmi lesclasses qu’il observe, de celles dans lesquellesdeux élèves au moins ont la même date anni-versaire. ce travail peut être fait « à la main »,en comptant les résultats obtenus avec la fonc-tion MoDE ou en utilisant la fonction nB qui

Page 26: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

46

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

compte combien de cellules d’une plage contien-nent un nombre, ce qui n’est pas le cas descellules contenant #n/A.

la mise en commun des résultats conduità un calcul de moyenne pondérée pour établirla fréquence de l’événement étudié sur le lycée.le résultat obtenu sur le lycée, voisin de 0,8,parait exceptionnel. le fait que les effectifssont très différents d’une classe à l’autre amè-nent les élèves à interroger la pertinence del’étude réalisée. ils expriment le souhait dedisposer de données plus nombreuses et plushomogènes.

la troisième phase consiste à simuler desclasses d’effectif constant. le professeur relan-ce : « comment modéliser et simuler l’expériencealéatoire qui consiste à étudier si, dans uneclasse, deux élèves au moins ont la même dateanniversaire ? ». les différents éléments de lamodélisation sont discutés et notés. pour lasimulation, on peut s’attendre à ce que lesélèves proposent de mettre toutes les dates pos-sibles de l’année dans un sac et de tirer auhasard avec remise une trentaine de fois (ntirages au sort successifs avec remise dans uneurne contenant une fois chaque date anniver-saire). les différentes propositions font l’objetd’un débat qui aboutit à l’utilisation la fonctionAlEA.EntRE.BoRnE(1;365).

les élèves simulent alors sur tableur ungrand nombre de classes. ce nombre de classessimulées est laissé à la responsabilité de l’élève,il permet de remettre en débat la notion de grandnombre pour une étude statistique, certainschoisissent 10 ! l’étude des fréquences obser-vées sur ces échantillons obtenus par simula-tion (et l’utilisation de la fonction F9) permetalors aux élèves d’émettre une hypothèse surla probabilité de l’évènement étudié. laconfrontation avec les résultats de leurs voi-sins amènent les élèves à augmenter la taille

de l’échantillon pour gagner en précision dansl’estimation.

lors de la mise en commun des résultats,la fluctuation d’échantillonnage est évoquéepour expliquer les variations des résultats obte-nus. pour obtenir la précision de l’estimationobtenue, le professeur propose d’établir l’équi-valence entre l’intervalle de fluctuation et la four-chette de sondage. c’est l’élaboration d’undébut de justification.

pour un seuil de 95 %, on sait que

ƒ ∈ .

or ƒ ∈ si, et seu-

lement si p ∈ . on dira

que, au niveau de confiance de 95 %,

p ∈ .

5. 4. 5. Bilan de l’activité et institutionnalisation

5. 4. 5. 1. Bilan de l’activité d’étude et de recherche

Des informations statistiques obtenues à par-tir de données simulées ont permis d’émettreune conjecture sur une probabilité non connue,pour une classe de 36 élèves, p ≈ 0,8 avecd’autant plus de précision que la taille del’échantillon simulé est grande. par exemple,si on a obtenu f = 0,8 sur un échantillon de taille100, pour un niveau de confiance de 95 %,

on aura  : p ∈

cp 2 1

"n; p 1

1

"nd

cp 2 1

"n; p 1

1

"nd

c f 2 1

"n; f 1

1

"nd

c f 2 1

"n; f 1

1

"nd

c0,8 21

"100; 0,8 1

1

"100d

Page 27: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

47

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

c’est-à dire p = 0,8 avec une précision de 1/10.

si l’on a obtenu f = 0,8 sur un échantillonde taille 10 000, on aura :

p ∈ , c’est-

à dire p = 0,8 avec une précision de 1/100.

5. 4. 5. 2. Institutionnalisation

toute fréquence observée sur un échantillonpermet d’estimer la probabilité cherchée. cetteestimation est d’autant plus précise que la taillede l’échantillon est grande. pour un niveau de

confiance de 95 %, la précision est de .

Autrement dit : si f est la fréquence obser-vée sur un échantillon de taille n, alors pour unniveau de confiance de 95 %,

p ∈ .

c0,8 21

"10 000; 0,8 1

1

"10 000d

1

"n

c f 2 1

"n; f 1

1

"nd

5. 4. 6. Exercices de travail de la technique 

1. une personne est chargée de contrôler laqualité des pièces produites par une machine.sur 1 500 pièces prises au hasard dans la pro-duction, elle en trouve 60 défectueuses. Elle doitfournir une estimation de la proportion depièces défectueuses dans la production parintervalle de confiance pour un niveau deconfiance de 95%. quelle réponse communi-quera-t-elle ?

2. lors d’un referendum, un sondage aléatoi-re simple pratiqué sur 1 000 personnes a donné55 % pour le oui et 45 % pour le non. peut-on prévoir le résultat du referendum ?

3. une enquête préliminaire à l’implantation d’unsupermarché dans une petite ville a montréque, sur 820 familles interrogées au hasard,270 envisageraient d’y aller le samedi après-midi.sachant que la ville compte 2 000 familles,quel est le nombre de places de parking à pré-voir pour que dans 95 % des cas il ne soit pascomplet le samedi après-midi ?

Page 28: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

48

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

Références bibliographiquesBernoulli, Jakob (1713). Ars Conjectandi. traduit du latin par norbert Meusnier, Jacques Ber-noulli et l’Ars Conjectandi, 4ème partie, iREM de Rouen, 1986. Bordier, J. (1991). Un modèle didactique utilisant la simulation sur ordinateur pour l’enseigne-ment de la probabilité, thèse de doctorat, paris, université paris 7.chaput, B. & Vergne, c. (2010). A propos de l’introduction aux probabilités en troisième. com-mission inter-iREM statistiques et probabilités. http://www.univ-irem.fr/iMG/pdf/A_pro-pos_de_l_introduction_aux_probabilites-2.pdfcorpart, A. lassalle, n. (2012) un biberon comme outil de simulation au lycée, Bulletin vert n°500de l’APMEP, 477-493.courtebras, B. (2001). « sur quelques conceptions du hasard », Autour de la modélisation en pro-babilités, 95-132. Besançon : presses universitaires de Franche-comté.couthiño, c. (2001). Introduction aux situations aléatoires dès le Collège : de la modélisationà la simulation d’expériences de Bernoulli dans l’environnement informatique Cabri-géomètreII. thèse université Joseph Fourier, Grenoble i. Fichier pdf en ligne : http://www-diam.imag.fr/the-sesequipe.htmDucel, y. & saussereau, B. (2011). « la prise de décision de la seconde à la première ». Repères-IREM 85, 31-49.henry, M. (1994). « Enseignement du calcul des probabilités dans le second degré, perspectiveshistoriques, épistémologiques et didactiques ». Repères-IREM 14, 69-104.henry, M. (2001). « notion de modèle et modélisation dans l’enseignement », Autour de la modé-lisation en probabilités, 149-160. Besançon : presses universitaires de Franche-comté.henry, M. (2009). « émergence de la probabilité et enseignement ». Repères-IREM 74, 67-89.laplace, p. s. (1825). Essai philosophique sur les probabilités. Réed. de la 5e édition, paris : Bour-gois, 1986. première éd. dans Traité analytique sur les probabilités, 1812.parzysz, B. (2007). « Expériences aléatoires et simulation, le jeu de croix ou pile ». Repères-IREM66, 27-44.Renyi, A.(1966). calcul des probabilités, Rééd. J. Gabay, sceaux, 1992.Wozniak, F.(2005). Conditions et contraintes de l’enseignement de la statistique en classe deSeconde générale et technologique. thèse, pdf en ligne :

et les documents officiels disponibles en ligne sur Éduscol :Ressources pour la classe de seconde, juin 2009, Probabilités et Statistiques, éduscol.Ressource pour la classe de première, juin 2011, Statistiques et probabilités, éduscol.Ressource pour la classe de terminale, février 2012, Probabilités et statistique, éduscol.Ressources pour faire la classe en mathématiques pour la voie professionnelle, mise à journovembre 2010, éduscol.B.o. n°30 du 23 juillet 2009, Programme de Seconde, éduscol.B.o. n°9 du 30 septembre 2010, Programme de Première S, éduscol.B.o. n°8 du 13 octobre 2011, Programme de Terminale S, éduscol.

Page 29: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

49

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

le travail que nous avons présenté est issu d’une recherche proposée par l’institut Françaisde l’Education (iFE), dans le réseau pERMEs (parcours d’Etude et de Recherche en Mathé-matiques dans l’Enseignement secondaire). cette recherche menée de 2010 à 2013 a pourobjectif de produire des exemples de séquences d’enseignement des mathématiques illustrantle concept de « parcours d’Etude et de Recherche » (pER) introduit par yves chevallard 7. nousavons choisi de travailler sur l’enseignement des statistiques et probabilité en lycée.

Explicitons les caractéristiques d’un pER que nous avons retenues pour cette étude.

Des questions porteuses de sens

un constat établi par plusieurs institutions, telles que l’inspection générale des mathéma-tiques, atteste de la perte de sens de l’enseignement des mathématiques. D’après chevallard « lesobjets enseignés condensent des réponses à des questions que nous avons perdues » (2005). l’étudeépistémologique et les usages sociaux doivent nous permettre de retrouver la raison d’être desenseignements mathématiques. c’est en donnant aux élèves des questions problématiques et authen-tiques que l’élève « rencontre en acte les raisons d’être » (2005) de ce qu’il apprend. ces ques-tions peuvent se poser en dehors mais aussi depuis l’intérieur des mathématiques. un pER doitpermettre de faire revivre aux élèves une activité mathématique riche permettant la construc-tion d’un sens mathématiquement authentique.

un pER doit s’appuyer sur une question à Fort pouvoir Générateur d’étude (qFpG). cettequestion permet de mettre en évidence l’intérêt du thème à étudier. Elle motive les apprentis-sages visés par les programmes. cette question doit permettre à l’enseignant de concevoir desactivités pertinentes à tous les niveaux d’enseignement. nous pensons que, le plus souvent, cettequestion n’a pas à être transmise aux élèves sous sa forme générale. Enoncée dans le contex-te de la situation à étudier, elle motive l’activité des élèves et favorise la dévolution du pro-blème. par exemple, une qFpG d’étude pour la géométrie pourrait être « comment mesurerune distance inatteignable », pour les élèves d’une classe de quatrième, cela pourrait devenir « commentmesurer la distance entre le bureau du professeur et l’arbre de la cour, sans sortir de la clas-se ? »

pour un niveau scolaire donné, pour un thème donné, un pER permet d’aborder la plupartdes apprentissages visés par le programme. il amène souvent à un décloisonnement des chapitresdu programme.

un pER intègre tous les moments de l’apprentissage, au sens de l’organisation didactiquede chevallard, Activité d’Etude et de Recherche (AER), institutionnalisation, travail sur l’orga-nisation Mathématique (travail sur la technique, étude de la portée de la technique,…) et éva-luation. un parcours d’Etude et de Recherche est un enchainement cohérent de ces différentstemps d’apprentissage répartis sur l’ensemble d’une année scolaire.

ANNeXe 1Cadre de l’étude

7 chevallard, y., 2005, onisep, les sciences aujourd’hui. la recherche, les métiers, les formations, « Étudier et apprendreen mathématiques : vers un renouveau », p.55-56.

Page 30: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

50

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

Un professeur directeur d’études :

selon chevallard (2008) « Le travail engagé pour l’étude d’une question engendre d’autresquestions et c’est ce qui fait la dynamique de l’étude. Pendant la recherche, à l’aide d’ un jeude questions cruciales formulées par la classe sous l’impulsion du professeur qui dirige l’étude,on avance vers les connaissances visées ce qui sous-entend une analyse a priori bien fouilléepour pouvoir orienter le travail de façon pertinente et disqualifier les techniques non souhai-tées qui apparaissent. »

les Activités d’Etude et de Recherche (AER) doivent permettre une dévolution des ques-tions mathématiques aux élèves, afin que l’activité mathématique soit menée par l’élève. lesélèves au cours de ce travail développent des compétences fondamentales en mathématique :prendre des initiatives, communiquer à l’écrit et à l’oral, poser un regard critique sur une pro-duction, dégager et étudier un cas particulier, établir une conjecture, argumenter... le profes-seur joue un rôle de directeur de l’étude.

notre étude a porté sur l’enseignement de la statistique inférentielle et du calcul des pro-babilités au lycée. cet article présente nos propositions pour la classe de seconde. nous avonschoisi de poursuivre le travail réalisé par un autre groupe de l’iREM de Montpellier sur le mêmethème pour la classe de troisième 8. nous avons repris la même question a fort pouvoir Géné-rateur d’Etude : « Comment prendre une décision dans une situation où le hasard intervient ? ».

8 irem de Montpellier – Michel Roche- publication à venir.

Page 31: une iniTiATiOn A LA STATiSTique en cLASSe De SecOnDe

reperes - irem. N° 98 - janvier 2015

51

uNe iNiTiATiON A LA sTATisTique

eN cLAsse De secONDe

ANNeXe 2... le loto