APMEP, régionale de Franche-Comté 19 mars 2008, Michel Henry

APMEP, régionale de Franche-Comté19 mars 2008, Michel Henry

Une introduction au concept de probabilité II

Questions posées par son enseignement dès le collège

La liaison statistique-probabilités

– Le programme de seconde est centré sur la sensibilisation aux fluctuations d'échantillonnage. – Quelles connaissances du collège vous semblent devoir être installées pour favoriser cet enseignement ?– Quels liens voyez-vous entre l'enseignement des outils de la description statistique et l'introduction de la notion de probabilité ?

Si un élève de troisième vous demande ce qu'est la loi des grands nombres, que répondez-vous ? Même question pour un élève de première. Même question pour un collègue, professeur de mathématiques en collège ou lycée, ayant été autrefois excellent élève en TC, mais n'ayant pas reçu l'enseignement universitaire de base en probabilités.

II - L’approche fréquentistedite « objectiviste », liée aux notions de « fréquence », « tendance »,

« loi des grands nombres »

La définition d’Alfred Renyi (calcul des probabilités, Dunod, 1966)

« Nous appellerons probabilité d'un événement le nombre autour duquel oscille la fréquence relative de l'événement considéré… »

Ce nombre existe-t-il ? Est-il donné de manière unique ? Peut-on toujours le déterminer ?

« … la théorie mathématique des probabilités ne s'occupe pas de jugements subjectifs ; elle concerne les probabilités objectives, qui peuvent être mesurées comme des grandeurs physiques ».

Ceci en vertu du théorème de Bernoulli:A la seule condition de répéter un nombre de fois suffisamment grand une même expérience aléatoire, la probabilité que la fréquence F des issues réalisant un événement soit plus proche que tout > 0 donné de la probabilité p de cet événement, est aussi voisine de 1 que l’on veut:

P(F – < p < F + ) > 1– Cette fréquence observée F peut donc être prise comme « mesure » pour estimer la probabilité p de l’événement par l’encadrement de confiance indiqué, avec un risque inférieur à de se tromper.

Problèmes didactiques posés par cet énoncéDans la formule P(|F – p| < ) > 1– , il y a deux sortes de probabilités:

- p qui est introduite à partir d’un modèle d’urne par la définition « classique ».

- P qui traduit un risque (celui de se tromper en disant que p est dans l’intervalle de confiance). Cette probabilité n’est pas de même nature que la probabilité « objective » p.

- Combien faut-il faire d’expériences réellement pour garantir cette mesure ?

- P relève-t-elle aussi d’une approche fréquentiste ?

- Comment faire fonctionner cette définition fréquentiste dans un problème ?

La définition « fréquentiste » confond deux domaines qu’il faut bien séparer :

- le domaine de la réalité où l’on observe les fréquences F de réalisations d’un événement au cours de la répétition d’une même expérience aléatoire,

- le domaine théorique (mathématique) où les objets sont définis abstraitement.

Renyi explique: La «définition» de la probabilité comme valeur autour de laquelle oscille la fréquence relative n'est pas une définition mathématique mais une description du substrat concret du concept de probabilité.

Alors, quelle est la « définition mathématique » ?On verra plus loin !

L’évolution des programmes

La loi des grands nombres joue donc un rôle essentiel pour relier la définition élémentaire a priori de la probabilité (nb cas favorables / nb cas possibles) à l’observation de la stabilisation des fréquences qui, justifiant expérimentalement les inférences, permet les applications à la statistique.

Le programme de première de 1990 proposait d’introduire la notion de probabilité sur cette observation. La probabilité d’un événement est alors définie comme la somme des probabilités des événements élémentaires qui le constituent.

Le programme de première de 2001 propose d’introduire le concept de (loi) de probabilité par ses propriétés théoriques, calquées sur les propriétés des (distributions) de fréquences: famille de nombres compris entre 0 et 1, de somme 1.

On se rapproche ainsi de la « définition mathématique », dans le cas discret fini et on relie ce concept à l’observation expérimentale (les fluctuations d’échantillonnage) par un énoncé « vulgarisé » de la loi des grands nombres :

« Pour une expérience aléatoire donnée, dans le modèle défini par une loi de probabilité P, les distributions des fréquences obtenues sur des séries de taille n sont proches de P quand n est grand ».

La loi des grands nombresL’énoncé vulgarisé donné dans le programme de première peut sembler insuffisant. Les termes « sont proches de » et « quand n est grand » sont trop vagues pour permettre une utilisation opératoire.

Le théorème de Bernoulli, forme élémentaire de la loi « faible » des grands nombres pose des problèmes de statut des probabilités considérées et il introduit une notion nouvelle de convergence en probabilité.

Quitte à admettre un théorème en classe de première, pourquoi ne pas admettre un énoncé s’appuyant sur la loi « forte » ?

Si (Xn)nIN est une suite de v.a. définies sur Ω, indépendantes, d’espérances m et de mêmes variances finies, alors la suite Mn des moyennes arithmétiques des Xi (i de 1 à n) converge presque sûrement vers m. (i.e. P(Mn() —> m) = 1 ).Autrement dit : sous ces hypothèses, on n’a aucune chance de tomber sur une série d’observations dont la suite des moyennes arithmétiques ne converge pas vers m.

D’où un autre énoncé « vulgarisé » qui me semble préférable :Si A est un événement de probabilité p issue possible d’une expérience aléatoire E, et si l’on reproduit dans les mêmes conditions un grand nombre de fois cette expérience E, alors on peut considérer que la suite observée des fréquences Fn des réalisations de A au cours des n premières expériences converge vers p quand n tend vers l’infini, car il n’y a aucune chance d’observer le contraire.

Gestion didactique du point de vue fréquentiste

Avec Hélène Ventsel (1971), on peut souligner l’intérêt didactique d’introduire la notion de probabilité par l’équiprobabilité. Le concept peut ensuite être étendu à toutes les situations aléatoires dans lesquelles l’équiprobabilité n’a pas de sens, moyennant un postulat d’existence :

« Si la pratique montre que, au fur et à mesure de l'augmentation du nombre d'expériences, la fréquence de l'événement a tendance à se stabiliser, s'approchant rigoureusement d'un nombre constant, il est naturel d'admettre que ce nombre est la probabilité de cet événement.

Il est clair que l'on peut vérifier cette hypothèse seulement pour des événements dont les probabilités sont susceptibles d'être calculées directement, c'est à dire pour les événements se réduisant à un système de cas, car ce n'est qu'alors qu'il existe une méthode permettant de calculer la probabilité mathématique.

De nombreuses expériences réalisées depuis la naissance du calcul des probabilités confirment effectivement cette hypothèse. Il est tout naturel d'admettre que pour les événements ne se réduisant pas à un système de cas, la même loi reste vraie et que le nombre constant vers lequel tend la fréquence d'un événement, lorsque le nombre d'expériences augmente, n'est rien d'autre que la probabilité de l'événement.

On peut alors prendre la fréquence d'un événement, calculée pour un nombre suffisamment grand d'expériences, pour la valeur approchée de la probabilité. »

Dualité de la notion de probabilitéCette notion a donc deux visages :

- Une valeur a priori correspondant à l’idée de « chance », calculable quand il y a de l’équiprobabilité quelque part,

- Une mesure expérimentale obtenue par l’observation d’une fréquence stabilisée.

Ces deux visages sont inséparables si l’on veut maîtriser cette notion au niveau de ses applications concrètes.

S’en tenir à la première approche conduit au biais cardinaliste et à l’abus de la combinatoire (échec massif de cet enseignement).

La seconde, par sa nature empirique, est, à elle seule, impropre pour développer une théorie scientifique (tentative avortée d’axiomatisation de Von Mises).

Que faire ?De Finetti : « La probabilité n’existe pas ! »« L'abandon de croyances superstitieuses sur l'existence du phlogistique, de l'éther, de l'espace et du temps absolu... ou des fées, a été une étape essentielle dans la pensée scientifique. La probabilité, considérée comme quelque chose ayant une existence objective est également une conception erronée et dangereuse, une tentative d'extérioriser ou de matérialiser nos véritables conceptions probabilistes! »

Le point de vue de la modélisationProcédant d’une démarche scientifique, le point de vue de la modélisation renvoie le débat entre subjectivistes et objectivistes au niveau du choix du modèle probabiliste le plus adéquat possible. La probabilité y est axiomatiquement définie comme un objet théorique, quantifiant idéalement la possibilité d’un événement estimée a priori ou mesurée expérimentalement.

Tout en proposant une approche fréquentiste, le projet de programme de première L de 1993 plaçait la modélisation comme objectif, anticipant sur la réforme des années 2000 :« Il s'agit, comme dans les autres programmes, d'aborder la notion de probabilité à partir de la fréquence, mais on a choisi dans cette série d'affiner l'explicitation du processus de modélisation. L'objet de cette partie de la formation est donc de faire découvrir, en s'appuyant sur l'expérimentation numérique, quelques notions qualitatives et quantitatives liées à la modélisation mathématique des phénomènes aléatoires…. On abordera ensuite une analyse plus quantitative permettant de dégager à partir de l'étude des fréquences et en relation avec les travaux effectués en statistique, la notion de probabilité ».

Les programmes actuels ont donc adopté le point de vue de la modélisation, comme le souligne le GEPS dans le document d’accompagnement des programmes de première en 2001.

Extraits du document du GEPS« Modéliser une expérience aléatoire, c'est lui associer une loi de probabilité. Une fréquence est empirique : elle est calculée à partir de données expérimentales, alors que la probabilité d'un événement est un “nombre théorique“. Les distributions de fréquences issues de la répétition d'expériences identiques et indépendantes varient (fluctuent), alors que la loi de probabilité est un invariant associé à l'expérience.L'objectif est que les élèves comprennent à l'aide d'exemples que modéliser, c'est ici choisir une loi de probabilité… Ce choix est en général délicat, sauf dans certains cas où des considérations propres au protocole expérimental conduisent à proposer a priori un modèle. Il en est ainsi des lancers de pièces ou de dés, pour lesquels des considérations de symétrie conduisent au choix d'un modèle où la loi de probabilité est équirépartie. Sans faire une liste de conventions terminologiques, on indiquera clairement que les termes “ équilibré” et “ hasard” indiquent un choix du modèle de l'expérience où intervient “quelque part” une probabilité équirépartie… On se contentera, pour certains exercices, de fournir un modèle en indiquant dans un premier temps que des techniques statistiques ont permis de le déterminer et de le valider à partir de nombreuses données expérimentales. Pour déterminer et/ou valider un modèle probabiliste, le premier outil dont on dispose est un théorème de mathématiques appelé « loi des grands nombres ».

Notion de modèle

Définition donnée par John Von Neumann, précurseur en la matière :« Les sciences n’essayent pas d'expliquer, c'est tout juste si elles tentent d'interpréter, elles font essentiellement des modèles. Par modèle, on entend une construction mathématique qui, à l'aide de certaines interprétations verbales, décrit les phénomènes observés. La justification d'une telle construction mathématique réside uniquement et précisément dans le fait qu’elle est censée fonctionner ».

Citons aussi David Ruelle : « Un modèle consiste à coller une théorie mathématique sur un morceau de réalité ».

Retenons qu’un modèle est une représentation simplifiée et idéalisée de la réalité. Un modèle peut être présenté dans un vocabulaire courant renvoyant à des objets réels, mais qui dans le modèle sont doués de propriétés caractéristiques idéales et abstraites (modèle pseudo-concret).

Ainsi une urne de Bernoulli est une abstraction d’une urne réelle, dans laquelle les boules sont de deux couleurs, mais pour le reste parfaitement identiques. Elles sont supposées rigoureusement équiprobables (hypothèse de modèle) dans un tirage “ au hasard ”.

Simulation. On trouve une définition de la simulation dans l’Encyclopédie Universalis :

« La simulation est l'expérimentation sur un modèle. C'est une procédure de recherche scientifique qui consiste à réaliser une reproduction artificielle (modèle) du phénomène que l'on désire étudier, à observer le comportement de cette reproduction lorsque l'on fait varier expérimentalement les actions que l'on peut exercer sur celle-ci, et à en induire ce qui se passerait dans la réalité sous l'influence d'actions analogues ».

Le document d’accompagnement des programmes de première précise pour sa part :« Modéliser consiste à associer un modèle à des données expérimentales, alors que simuler consiste à produire des données à partir d'un modèle prédéfini. Pour simuler une expérience, on associe d'abord un modèle à l'expérience en cours, puis on simule la loi du modèle ».

Il convient donc de faire d’abord le choix d’un modèle. Les situations aléatoires considérées en classe sont en principe toutes à base d’équiprobabilité. Les modèles utilisés pour les simulations proposées sont donc souvent implicites quand ils se réduisent à la loi uniforme discrète, produite par le générateur aléatoire de l’ordinateur ou de la calculette qui fournissent des chiffres pseudo-aléatoires équirépartis.

Définition moderne de la probabilitéLa probabilité est un concept mathématique dont la définition a du sens au sein d’un modèle théorique.

Le modèle contemporain est le modèle de Kolmogorov (1933):

E est une ensemble représentant l’ensemble des issues possibles d’une expérience aléatoire.

Les parties de E représentent les événements associés à cette expérience

On distingue une famille B de parties de E représentant les événements susceptibles d’une description, fermée pour les opérations ensemblistes de base (tribu).

Une probabilité P est une mesure (au sens de Borel) sur B comprise entre 0 et 1, vérifiant : P(E) = 1, P() = 0, P(E \ A) = 1 – P(A) pour tout A de B, et pour toute famille dénombrable d’événements Ai incompatibles deux à deux (Ai Aj = ), P(Ai) = ∑ P(Ai).

Cette définition suppose une bonne dose de théorie de la mesure…

Alors, comment on fait dans le secondaire ?

Documents

APMEP, régionale de Franche-Comté 19 mars 2008, Michel Henry