Download pdf - Analyse statistique des données expérimentales

5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com

http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 1/150





ANALYSE STATISTIQUE

DES DONNEES EXPERIMENTALES



Grenoble Sciences

Grenoble Sciences poursuit un triple objectif :

• realiser des ouvrages correspondant a un projet clairement defini, sans contrainte

de mode ou de programme,

• garantir les qualites scientifiqueet pedagogique des ouvrages retenus,

• proposer des ouvrages a un prix accessible au public le plus large possible.

Chaque projet est selectionne au niveau de Grenoble Sciences avec le concours de

referees anonymes. Puis les auteurs travaillent pendant une annee (en moyenne)

avec les membres d'un comite de lecture interactif, dont les noms apparaissent au

debut de 1'ouvrage. Celui-ci est ensuite publie chez 1'editeur le plus adapte.

(Contact: Tel.: (33)476 51 46 95 - E-mail: [email protected])

Deux collections existent chez EDP Sciences :

• la Collection Grenoble Sciences,connue pour son originalite de projets et sa qualite• Grenoble Sciences - Rencontres Scientificjues, collection presentant des themes de

recherche d'actualite, traites par des scientifiques de premier plan issus de

disciplines differentes.

Directeur scientifique de GrenobleSciences

Jean BORNAREL, Professeur a 1'Universite Joseph Fourier, Grenoble 1

Comite de lecture pour"Analyse statistique des donnees experimentales"

J.P. BERTRANDIAS, Professeur a 1'Universite Joseph Fourier, Grenoble 1

C. FURGET, Maitre de conferences a 1'Universite Joseph Fourier, Grenoble 1

B . HOUCHMANDZADEH, Directeur de recherches au CNRS, Grenoble

M . LESIEUR, Professeur a 1'Institut National Polytechnique, Grenoble

C. MlSBAH, Directeur de recherches au CNRS, Grenoble

J.L. PORTESEIL, Professeur a 1'Universite Joseph Fourier, Grenoble 1P. VlLLEMAIN, Maitre de conferences a I'Universite Joseph Fourier, Grenoble1

Grenoble Sciences rec.oit le soutien

du Ministere de 1'Education nationals, du Ministere de la Recherche,

de la Region Rhone-Alpes, du Conseil general de 1'Isere

et de la Ville de Grenoble.

I S B N 2-86883-590-2

© EDP Sciences, 2002

ISBN 2-86883-456-6

http://[email protected]/

http://[email protected]/



ANALYSESTATISTIQUE

DESDONNEES EXP ERIMENT ALES

Konstantin PROTASSOV

SCIENCES

17,avenue du Hoggar

Pare d'Activite de Courtabceuf, BP 112

91944 Les Ulis Cedex A, France



Ouvrages Grenoble Sciences edites par EDP Sciences

Collection Grenoble SciencesChimie. Le minimum vital a savoir (/. Le Coarer) - Electrochimie des solides

(C . Deportes et al.) - Thermodynamique chimique CM . Oturan & M . Robert) - Chimie

organometallique CD .Astruc)

Introduction a la mecanique statistique (E. Belorizky & W . Gorecki) - Mecanique

statistique. Exercices et problemes corriges (E. Belorizky & W . Gorecki) - La symetrie

en mathematiques, physique et chimie (J. Sivardiere) - La cavitation. Mecanismes

physiques et aspects industriels (J.P. Franc et al.) - La turbulence (M . Lesieur) -

Magnetisme : I Fondements, II Materiaux et applications (sous la direction d'E. du

Tremolet de Lacheisserie) - Du Soleil a la Terre. Aeronomie et meteorologie de 1'espace

( J . Lilensten & P.L.Blelly) - Sous les feux du Soleil. Vers une meteorologie de 1'espace

( J . Lilensten & J. Bornarel) - Mecanique. De la formulation lagrangienne au chaos

hamiltonien (C. Gignoux & B. Silvestre-Brac) - La mecanique quantique. Problemes

resolus, Tomes 1 et 2 (V.M. Galitsky, B.M. Karnakov & V.I. Kogan)

Exercices corriges d'analyse, Tomes 1 et 2 CD. Alibert) - Introduction aux varietes

differentielles (J. Lafontaine) - Analyse numerique et equations di f feren t i e l les

(J.P. Demailly) - Mathematiques pour les sciences de la vie, de la nature et de la

sante (F. & J.P. Bertrandias) - Approximation hilbertienne. Splines, ondelettes,

fracta les (M. Atteia & J. Caches) - Mathematiques pour 1'etudiant scientifique,

Tomes 1 et 2 (Ph.]. Haug)

Bacteries et environnement. Adaptations physiologiques (/. Pelmont) - Enzymes.

Catalyseurs du monde vivant ( J . Pelmont) - La plongee sous-marine a 1'air.

L'adaptation de 1'organisme et ses limites (Ph. Foster) - L'ergomotricite. Le corps, le

travail et la sante (M. Gendrier) - Endocrinologie et communications cellulaires

(S . Idelman & J. Verdetti)

L'Asie, source de sciences et de techniques (M. Soutif) - La biologie, des origines a

nos jours (P . Vignais) - Naissance de la physique. De la Sicile a la Chine CM . Soutif)

Minimum Competence in Scientific English (J. Upjohn, S. Blattes & V. Jans) -

Listening Comprehension for Scientific English (J. Upjohn) - Speaking Skills in

Scientific English (J. Upjohn, M.H. Fries & D . Amadis)

Grenoble Sciences - Rencontres Scientifiques

Radiopharmaceutiques. Chimie des radiotraceurs et applications biologiques (sous

la direction de M. Comet & M. Vidal) - Turbulence et determinisme (sous la direction

de M . Lesieur) - Methodes et techniques de la chimie organique (sous la direction de

D . Astruc)



P R E F A C E

Le but de ce peti t ouvrage est de repondre aux questions les plus frequentes que

se pose un exper imen ta teu r et de pe rme t t r e a un e tud ian t d'analyser , d 'une fagon

autonome, ses resul ta ts et leurs precisions. C'est cet esprit assez "uti l i taire" qui ade te rmine le style de presentat ion.

Dans 1'analyse des donnees experiment ales, il existe plusieurs niveaux qui sont condi-

t ionnes par notre desir d 'ob tenir une inform at ion p lus ou moins riche, mais aussi par le

temps que nous somm es prets a y consacrer . F r e q u e mme n t , nous vo ulons just e o btenir

la valeur d 'une grandeur physique sans nous preoccuper de verifier les hypotheses a

la base de notre demarche . Parfois , cependant, le s resultats obtenus nous paraissent

etre en co ntradic tion avec nos estimatio ns prel iminaries et ainsi nous sommes obliges

d'effectuer un travail plus scrupuleux. Ce l ivre est ecrit pour permettre au lecteur dechoisir le niveau d'analyse necessaire.

La par t ie "indispensable" du texte correspondant au premier niveau est composee

avec une police de caracteres norm ale. Les questions qui correspondent a une analyse

plus approfondie et qui necessitent un appareil m athem a t ique plus complexe sont

composees avec une police de caracteres speciale. Cette part ie du livre peut etre sautee

lors d 'une prem iere lec ture .

A la base de tou te analyse des donnees experimentales, on trouve une approche

statis t ique qui exige des considerations m athem a t iques rigoureuses et parfois com-

plexes. Neanmoins, Pexper imen ta teu r n'a pas toujours besoin de connaitre le s detailset les subt i l i tes m athem a t iques . De plus, rares sont les situations ou les conditions

experimentales correspondent exactement aux condit ions d'appl icat ion de te l ou te l

t heoreme . C'est pourquoi 1'accent est mis non pas sur la demonstration des resultatsm athem a t iques mais sur leur signification et leur in terpreta t ion physique. Parfois ,

pour alleger la presentat ion, la r igueur m a t h e m a t i q u e es t volontairement sacrifice et

remplacee par une argumenta t ion "physiquement evidente".

Le plan du livre est simple. Dans 1' introduction, on presente le s causes d 'erreurs et

on definit le langage utilise. Le premier chapitre rappelle le s pr inc ipaux resul ta ts

de statistique essentiels a 1'analyse des donne es. Le deuxieme chapi t re presente des

notions plus complexes de statis t ique, i l est consacre aux fonctions de varables alea-toires. Dans le troisieme chapitre qui est la part ie la plus importante, on s'efforce de

repondre aux questions les plus frequentes qui se posent dans 1'analyse des donnees

experimentales. Le dernier chapitre est consacre aux m ethodes les plus frequemment

utilisees pour 1 'ajustement de parametres .



A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S

Bien que ce livre soit particulierernent adapte au t ravail d 'e tud ian t s de second cycle,

il pourra etre egalement uti le aux jeunes chercheurs , aux ingenieurs et a tons ceux

qui sont amenes a realiser des mesures.

J 'a i rnerais remercier m es collegues enseignants et chercheurs qui ont lu le manuscr i t

et qui m ' o n t fait des proposi t ions pour arneliorer son contenu. J e voudrais exprimer

m a profonde grat i tude a M . Elie Belor i zky qui m'a encourage a ecrire ce l ivre et avec

qui j ' a i eu des discussions tres f ructueuses .

6



P O U R Q U O I L ES IN C E R T IT U D E S

E X I S T E N T - E L L E S ?

Le but de la m ajori te des experiences en physique consiste a com prendre un ph enom ene

et a le modeliser correc tement . Nous effectuons des m esures et nou s avons sou vent

a nous poser la question : "quelle est la valeur de telle ou telle grandeur ?", parfois

sans nous demander prealablement si cette formulation est correcte et si nous serons

capables de t rouve r une reponse.

La necessite de cette interrogation prealable devient evidente des qu 'on rnesure la

meme grandeur plusieurs fois. L'exper imenta teur qui le fait est f requemment con-

fronte a une situation assez interessante : s'il utilise des appareils suffisamment pre-

cis, il s 'apergoit que des mesures repetees de la mem e grand eur do nnent parfois des

resul ta ts qui sont un peu differents de celui de la premiere m esure. Ce phe nom ene est

general,que les m esures soient simples ou sophist iquees. Meme les mesures repetees dela longu eur d 'un e t ige metal l ique peuven t donner des valeurs differentes. La repe t i t ion

de 1'experience m ontre que , d 'une part le s resul ta ts sont toujours un peu differents e t

d 'autre par t ce t te difference n'est en general pas tres grande. Dans la plupar t des cas,

on reste proche d 'une certaine valeur moyenne, mais de t emps en temps on t rouve

des valeurs qui sont differentes de celle-ci. Plus les resultats sont eloignes de cette

moyenne , plus ils sont rares.

Pourquoi cette dispersion existe-t-elle ? D'ou vient cette variation ? Une raison de cet

effet est evidente : les condi t ions de deroulement d 'une experience var ient toujours

l egerement , ce qui modifie la grandeur mesurable. Par exemple, quand on determineplusieurs fois la longu eur d 'une t ige metall ique, c 'est la t em pe ra tu r e ambiante qui peut

varier et ainsi faire varier la longueur. Cette variat ion des conditions exterieures (et la

variation correspondante de la valeur physique) peut etre plus ou moins importante,

mais elle est inevitable et, dans les conditions reelles d 'une experience phy sique , on

ne peut pas s'en affranchir.

N ous sommes "condamnes" a effectuer des mesures de grandeurs qui ne sont presque

j ama i s constantes. C'est pourquoi meme la question de savoir quelle est la valeur

d 'un parametre peu t ne pas etre absolument correcte. II faut poser cette question

de maniere per t inente e t t rouver des moyens adequats pour decrire les grandeursphysiques. II faut t rouver une definition qui puisse exprimer cette part icular i ty

phys ique . Cette definition doit refleter le fait que la valeur physique varie tou jours ,

mais que ses variations se regroupent autour d 'une valeur moyenne.

La solution est de caracteriser une grandeur physique non pas par une valeur, mais

p lu to t par la probabil i te de trouver dans une experience telle ou telle valeur. Pour

cela on in t rodu i t une fonct ion appelee distribution de probabilite de detection d 'une

valeur physique, ou plus simplement la distribution d'une valeur physique, qui m ontre



8 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S

quelles sont les valeurs les plus frequentes ou les plus rares. II fau t souligner une fois

encore que, dans cette approche, il ne s'agit pas te l lement de la valeur concrete d 'une

grandeur phys ique , mais sur tout de la probabilite de t rouve r differentes valeurs.

On verra par la suite que cette fonct ion — la dis t r ibut ion d 'un e valeur phys ique — est

heureusement suffisamment simple (en tout cas, dans la major i te des experiences).

Elle a deux caracteristiques. La premiere est sa valeur moyenne qui est aussi la

valeur la plus probable. La deuxieme caracteris t ique de cette fonction de dis t r ibut ion

indique, grosso m odo , la region au tour de ce t te moyenne dans laquelle se regroupe lamajor i te des resul ta ts des mesures. Elle caracterise la largeur de cette dis t r ibut ion et

est appelee 1'incertitude. C o m m e nous pourrons le voir par la suite , cette largeur a

une interpretatio n r igo ureuse en t e rm e de probabili tes. Pour des raisons de simplicite

nous appellerons cette incert i tude "1'incertitude naturelle" ou "initiale" de la grandeur

physique elle-meme. Ce n 'est pas tout a fait vrai , puisque cette erreur ou incert i tude

est souvent due aux condi t ions exper imentales . B ien que cette definition ne soit pas

parfai tement r igoureuse , elle est tres uti le pour la comprehens ion.

Le fait que, dans la plupart des experiences, le resul tat puisse etre caracterise par

seulement deux valeurs, permet de revenir sur la question avec laquelle nous avons

com mence no tre discussion : "Peut-on se demander quelle est la valeur d 'un param etre

physique ?" II se trouve que dans le cas ou deux parametres sont necessaires et

suffisants p ou r caracteriser une grandeur phy s ique , on peu t reconcilier notre envie

de poser cette question et la r igueur de 1 ' interpretation d 'un resultat en termes deprobabili tes. La solution existe : on appellera valeur physique la valeur moyenne de la

dis t r ibut ion e t incertitude ou erreur de la valeur phy sique la largeur de la distr ib utio n1.

C'est une convention admise de dire que "la grandeur phys ique a une valeur donnee

avec une incer t i tude donnee". Cela signifie que 1'on presente la valeur moyenne et la

largeur d'une distr ibution et que cette reponse a une in terpre tat ion precise en te rmes

de probabil i tes .

Le but des mesures physiques est la determination de cette fonct ion de d is t r ibu t ion

ou, au moins, de ses deux paramet res m ajeu rs : la m oye nne et la largeu r. Po ur

determiner une distr ibution on doit repeter plusieurs fois une m esure pour connai t rela frequence d 'appar i t ion des valeurs. Pour obtenir 1'ensemble des valeurs possibles

ainsi que leurs probabil i tes d 'apparit ion, on devrai t en fait effectuer un n ombr e infini

de m esures. C'est tres long, trop cher, et personne n 'en a besoin.

On se l imi te done a un n ombr e fmi de mesures . B ien sur , cela in t r od u i t une erreur

Pou r des raisons histo riques, les deux terme s "incertitude" et "erreur" sont uti l ises en physiquepour decrire la largeur d'une distribution. Depuis quelques annees, les organismes scientifiques

internation aux essaient d'introd uire des normes pour util iser correctement ces deux termes (de la

m e m e fagon que 1'on a introdui t le systeme international d'uni tes ) . Aujourd'hui , on appelle uneerreur la difference entre le resultat d'une mesure et la vraie valeur de la grandeur mesuree . Tandisque 1' incertitude de mesure est un parametre, associe au resultat d'une m esure, qui caracterise la

dispersion des valeurs qui peuvent raisonnablement etre attr ibutes a la grandeur mesuree. Dans

ce l ivre, nous tacherons de suivre ces normes, mais parfois nous uti l iserons des expressions plus

habituel les pour un physicien. P ar exernple, une formule tres connue dans 1'analyse des donneesexp erim enatle s porte le nom de "la form ule de propa gation des erreurs". Nous u ti l iserons toujoursce nom bien connu bien que, selon le s normes actuelles, nous aurions du 1'appeller "la formule

de propagation des incertitudes". Le lecteur interesse trouvera dans la bib liogra phie toutes les

references sur les normes actuelles.



P O U R Q U O I L E S I N C E R T I T U D E S E X I S T E N T - E L L E S ?

( incer t i tude) supplementaire . Cet te incer t i tude , due a 1'imp ossibilite de m esurer avec

une precision absolue la distribution initiale (naturelle), s'appelle 1'erreur statistique

ou rerreur accidentelle. II est assez facile, du moms en theorie , de diminuer cette

erreur : il suffit d 'augmente r le nombre de mesures . En pr inc ipe , on peut la rendrenegligeable devant I ' ince rt i tud e init iale de la grand eur physiqu e. Ce pendant un a utre

probleme plus delicat apparait.

II est lie au fait que, dans chaque experience physique existe un appareil , plus ou

moins complique, entre 1 'experimentateur et 1'objet mesurable . Get appareil apporte

inevitab lem ent des m odifications de la distr ibutio n init iale : i l la deforme. Dan s le cas

le plus simple, ces changements peuvent etre de deux types : I'appareil peut "decaler"

la valeur moyenne et il peut elargir la distribution.

Le decalage de la valeur moyenne est un exemple de ce qu 'on appelle les "erreurssystematiques". Ce nom expr ime que ces erreurs apparaissent dans chaque mesure .

L'apparei l donne systematiquement une valeur qui est differente (plus grande ou pluspet i te ) de la valeur "reelle". Mesurer avec un appareil dont le zero est mal regie est

1'exemple le plus frequent de ce genre d 'e r reurs . M alheureusem ent , i l es t tres difficile

de com battre ce typ e d 'erreurs : il est a la fois difficile de les deceler et de les corrige r.

Pour cela, il n'y a pas de methodes generates et il faut etudier chaque cas.

Par contre, i l est plus facile de maitr iser 1'elargissement de la distr ibution introduit

par I 'appareil . On verra que cette incert i tude ayant la m e m e origine que les incert i-

tudes init iales (naturel les) s 'a joute "simplement" a celles-ci. Dans un grand nombred'experiences, 1'elargissement du a I'appareil permet de simplifier les mesures : sup-

posons que nous commissions I ' incer t i tude ( la largeur) in t rodui te par un appare i l

et que celle-ci soit nettement plus grande que I ' incert i tude init iale . II est possible

de negliger I ' incer t i tude nature l le par rappor t a I ' incer t i tude d 'appare i l lage . II suf-

fit done de faire une seule mesure et de prendre I ' incer t i tude de I 'appare i l comme

i ncer t i tude de la mesure . Evidemment , dans ce genre d 'experience, i l faut etre sur

que I ' incer t i tude de I 'appare i l domine I ' incer t i tude nature l le , mais on peu t tou jours

le verifier en faisant des mesures repeti t ives. L 'appareil peu precis ne permettra pas

d 'ob ten i r les variatio ns dues a la largeur init iale .

II fau t r emarquer que la separat ion entre incer t i tude d 'appare i l lage et incer t i tude

nature l le reste assez conventionnelle : on peut toujours d ire que la variation descondi t ions d'experience fait partie de I ' incer t i tud e d 'appare i l lage . Dans ce livre, on ne

parle pas des mesures en mecanique quantique, ou existe une incert i tude de la valeur

phys ique a cause de la re lat ion d ' incer t i tude de H eisenberg . En m ecanique quant iq ue ,

1'interference appare i l—obje t devient plus compliquee et interessante. Cependant nos

conclusions generales ne sont p as modifiees puisque , en m ecanique quan tiqu e, la notion

de probabili te est non seulement uti le et nature l le , mais elle est indispensable.

Nous avons compris que pour determiner exper imentalement une valeur phy sique i l est

necessaire (mais pas tou jours suffisant) de tro uv er la mo yenne (la valeur) et la largeur

(I ' incer t i tude) . Sans la determinat ion de I ' incer t i tude , 1'experience n'est pas com-

plete : on ne peu t la comparer ni avec une theorie ni avec une autre experience. N o u s

avons egalement vu que cette incert i tude contient trois contr ibutions possibles. L apremiere est I ' incert i tude naturelle liee aux changements des condit ions d 'experience

ou a la nature-meme des grandeurs (e n statis t ique ou en mecanique quant ique) . La

9



1 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S

deuxieme est 1'incertitude statistique due a 1'impossibilite de mesurer precisement la

distr ibution init iale . La troisieme est 1' incert i tude d'appareillage due a 1'irnperfection

des outils de travail de Pexper imentateur .

Un exper imentateur se pose toujours deux questions. Premie remen t , comment peut-

on mesurer une grandeur physique, c'est-a-dire les caracteris t iques de sa distr ibutio n :

la moyenne et la largeur ? Deuxiemement , comment et jusqu'ou faut-il diminuer

cette incert i tude (largeur) de 1'experience ? C'est pourquoi 1 'exper imentateur doit

comprendre les relations entre les trois composantes de 1'incertitude et trouver com-

m ent les minimiser : on peut dim inuer 1 ' incert i tude naturelle en changeant les condi-

t ions de 1'experience, 1'incert i tude statis t ique en augmentant le nombre de mesures ,

1'incertitude d'appareillage en utilisant des appareils plus precis.

Cependant, on ne peut pas reduire les incert i tudes in f in iment . II existe une limiteraisonnab le de 1' incert i tude. L 'evaluatio n de cette l imite est non seulement une ques-

t ion de t emps et d 'argent depenses, mais c'est aussi une question de physique . II ne

faut pas oublier que, quelle que soit la grandeur a mesurer , nous ne pourrons jamais

tenir com pte de tous les facteurs physiques qui peuvent influencer sa valeur. D e plus,

tous nos raisonnements et discussions sont effectues dans le cadre d 'un modele ou,

plus generalement , de notre vision du monde. Ce cadre peut ne pas etre exact .

C'es t pourquoi notre probleme est de choisir des methodes experimentales et des

m e thodes d 'est imat ion des incert i tudes en adequation avec la precision souhai table e t

possible.

Diverses si tuat ions existent selon la precision desiree. Dans la premiere nous voulons

seulement obtenir 1'ordre de grandeur de la valeur mesuree ; dans ce cas, 1'incertitud e

doit aussi etre evaluee grossiere m ent. Dans la seconde nous desirous ob tenir une

precision de 1'ordre de un a dix pour cent ; il faut alors faire at tent ion en determinant

le s incert i tudes, car les m ethodes choisies doivent evoluer en fonction de la precision

requise. Plus on cherche de precision, plus la m ethode doit etre elaboree, mais le prix

a payer est la lenteur des calculs et leur volume . Dans la troisieme nous cherchons a

obtenir une precision du meme ordre de grandeur que celle de Petalon correspondant

au parametre physique mesure ; le probleme de 1'incertitude peut alors etre plusimpor tan t que celui de la valeur.

Dans ce t ouvrage , nous considerons seulement les methodes d 'es t imat ion d 'e r reurs

dans la seconde si tuation. L a plupar t des paragraphes apporte reponse a une ques-

tion concrete : c omme n t calcule-t-on le s incer t i tudes pour une experience avec un

peti t nombre de mesures ? comment peut-on ajuster les parametres d 'une courbe ?

comment compare-t-on une experience et une theorie ? quel est le nombre de chiffres

significatifs ? etc . Le lecteur qui conn ait les bases de la s tat is t ique peut omettre

sans probleme le s premiers paragraphes et chercher la reponse a sa question. Dans

le cas contraire , 1'ouvrage lu i appor te 1'information necessaire sur les parties de la

statistique utiles au t r a i t emen t des incer t i tudes .



C H A P I T R E 1

RAPPELS S U R L A T H E O R I E

D E S P R O B A B I L I T E S

Dans ce chapitre , nous avons reuni des not ions de base de la theor ie des probabil i tes :

la definition d 'une probabili ty et ses proprietes elementaires ainsi que 1'introduction

des distr ibutions les plus frequemment ut i l isees dans 1'analyse des donnees experi-

mentales. Parmi ces distributions, celle de Gauss joue un role tres particulier, c'est

pourquoi la pa rtie e sssentielle de ce ch apitre (parag raph es 1.2 et 1.4) lu i est consacreecar elle et est indispensable a la comprehension du reste du livre.

1.1 P R O B A B I L I T E S

Pour pouvoir decrire une grandeur physique en termes de probabili ty il faut rappeler

le s definitions et les proprietes le s plus simples. Po ur le s mesures le s plus frequentes

faites en laboratoire nous n'avons pas besoin de toute la panoplie des methodes de la

statis t ique mathemat i que et notre experience du mon d e est largement sumsante pourcomprendre et assimiler les proprietes fondamentales des probabilites. Logiquement ,

chaque lecteur de ce livre a deja eu 1'occasion dans sa vie de jou e r , au moins aux

cartes et ainsi la notion de probabilite ne lui est pas etrangere.

1.1.1 D E F I N I T I O N S ET P R O P R I E T E S

Supposons que 1'on observe un evenement E repete N e fois (on dit que 1'on prend unechantil lon de N

eevenements) . Dans n cas, cet evenement est caracterise par une

marque d is t inc t ive a (appelee aussi caractere ) . Si les resul tats des evenements dans

cette suite sont independants, alors la probabil i te P(a) que la marque a se manifeste

est definie com m e

On voi t tou te de suite que la probabili te varie de 0 a 1




et que la somme sur tous les caracteres (de meme nature) possibles {/}, i = a,b,c,...est egale a 1

Un exemple d'evenement est le tirage d'une carte du jeu . La marque distinctive serait

la categoric de couleur (pique, coeur, carreau ou trefle). Pour un jeu de 52 cartes, la

probabilite d 'une categoric de couleur est egale a 1/4. On notera par A 1'ensemble

d 'evenements ou ce signe s'est manifested

Introduisons deux operations tres simples avec les probabilites. Definissons par A +B

1'ensemble des evenements dans lesquels la marque a ou la marque 6, ou les deux, sont

presentes (ici a et 6 peuvent etre de natu re differente). Par exemple , a est une categoricde cou leur, 6 est la valeur de la carte (le roi, la dam e, etc .) De plus, defmissons par AB

1'ensemb le des evenements dans lesquels ces deux signes se ma nife sten t s imul tanement .

Alors,

C'est-a-dire, pour trouver la probabilite qu'un evenement possede au moins une des

marques nous devons, d 'abord, ajouter deux probabili tes P(A) et P(B) . Cependan t ,

certains evenements peuvent avoir le s deux signes en mem e temps et on les a comptesdeux fois. C'est pourquoi il faut soustraire la probabil i te P(AB}.

Preno ns un jeu de 52 cartes avec 13 cartes dans ch aque co uleur (le roi, la dam e, le

valet et 10 cartes numerotees de 1 a 10). Pour une carte tiree au hasard , la probabil i te

d'etre soit le roi soit une carte de cceur (a e tan t le roi, 6 une carte de coeur) est egale a

P("soit le roi, soit une carte de coeur")

= P("roi") + 7>("cceur") - P("roi de cceur")

Introduison s une notion un peu plus com pliquee. S upposons que 1'evenement A puisse

se produire de na manieres differentes, 1'evenement B de n^ manieres et 1'evenement

AB de nab manieres . Si le nombre total de realisations possibles est egal a N (ne pas

confondre avec le nombre N e d'evenements introduit au debut du paragraphe ) , alors

On peut reecrire P(AB') com m e

Pa r m i le s na cas ou 1'evenement A se p r od u i t , il y a une propor t ion

1'evenement B s'est egalement produi t . On peut introduire la probabil i te correspon-

dante qui s'appelle la probabilite conditionnelle P(A/B) de 1'evenement B, c'est-a-dire

la probabilite d'observer B sous reserve que A se soit produit.



I - R A P P E L S SUR L A T H E O R I E D B S P R O B A B I L I T E S 13

Ainsi , la derniere formule prend la forme

Si 1'evenement A n'a pas d' influence sur la probabi l i te d 'evenement B, on dit alors

que les deux evenements sont independents et

Dans ces conditions, on obtient pour la probabili te d'apparition de deux evenements

a la fois P(AB) une relat ion tres importante :

ce qui mon t re que les probabili tes des evenements independants se mult ip l i en t . On

utilisera cette propriete plusieurs fois dans ce livre.

Considerons 1'exemple de no tre jeu de 52 cartes. Soit A "un roi", B "une carte de

coeur". Done na = 4, 7 7 . 5 = 13, N = 52 et les probabilites correspondantes :

V u que P(AB) = "P("roi de cceur") = 1/52, on conclut que

et ainsi, dans le jeu de 52 cartes, ces deux evenements sont independants.

Ajou tons jus t e une carte a notre jeu — un j oker qui n 'appart ient a aucune categoric

de couleur. na, a nouveau, est egal a 4, n^ a 13, mais N est egal a 53. Done,

On s'apergoit faci lement que

et ainsi ces deux evenements ne sont plus independants dans le jeu de 53 cartes !

L'explication de cette difference est relativement simple : si nous savons qu 'une carteest un roi alors elle ne peu t pas etre le j oker , et ainsi nous avons deja obtenu unecertaine information pour determiner sa categoric de couleur.

1.1.2 G R A N D E U R S D I S C R E T E S ET C O N T I N U E S ,F O N C T I O N S D E D I S T R I B U T I O N

Une grandeur physique peut avoir une valeur numerique discrete ou continue. Dansle premier cas, on 1'appellera grandeur "discrete", dans le deuxieme, "continue". Les

exemples de grandeurs discretes sont la categoric de couleur, la valeur de la carte, si



14 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S

Figure 1.1 : Histogramme de la premiere serie de mesures de la longueur / : sont portees sur 1'axe

des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition

Ton reprend n otre exemple, ou le comptage d 'un detecteur, si 1'on considere des exem-

ples plus phy siques. M ais plus f requemment en physique, on mesure des grandeurscontinues, c o m m e la long ueur, la duree, le courant, etc.

Cette distinction des valeurs (ou des grande urs) discretes et cont inues est tou t a fait

justifiee. Neanmoins , en physique, on decrit assez souvent une grandeur continue

par une v aleur discrete et vice versa. De ce poin t de vu e, cette separat ion est,en

partie, conv entionnelle et les proprietes (ou m em e Pecriture) valables pour les valeurs

discretes seront utilisees pour les valeurs continues et inversement. On franchira cette

front iere regulierement, meme parfois sans se rendre compte de ce que Ton fait . Cette

attitude correspond a un parti pris de presentation. Le lecteur ne doit pas en deduire

que le passage a la limite s 'effectue dans tous les cas sans difficulte.

Pour illustrer le caractere conventionnel de cette distinction, considerons un exem-

ple de mesure de la longueur d 'une chambre (i l est evident que la longueur est

une grandeur cont inue) a 1'aide d'un decimetre qui possede aussi des divisions cen-

t imetr iques . Le fait meme que nous disposions d'un decimetre avec des divisions nous

oblige a decrire une grandeur continue a 1'aide de valeurs entieres done discretes (onaura un certain nombre de decimetres ou de cent imetres) . On peut aller plus loin et

dire que la representation d'une longueur par un nombre fini de chiffres est un passage

oblige d'une valeur continue a une valeur discrete.

Bien sur, il existe des situations ou une valeur discrete ne peut pas etre remplacee par

une valeur continue, par exemple dans le jeu de cartes. Cependant, ces situations sont

rares dans le s experiences de physique. Nous observerons par la suite des passages des

valeurs d'untype a 1'autre. Les proprietes de p robabil i te resteront les memes dans



I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T I E S 15

le s deux cas. C'est pourquoi nous donnerons les demonstrations generales p ou r les

variables continues et considererons que les resultats s'appliquent aussi aux variables

discretes.

Cont inuons notre experience mentale . Supposons qu'apres avoir fait une dizaine de

mesures rapides, nous ayons t rouve une fois la longueur de la chambre egale a 323cent imetres , cinq fois — 324 cm et quatre fois — 325 cm. Les resultats sont presentes

su r la figure 1.1 qui s'appelle un "histogramme". Sur 1'axe des abscisses, on montre la

valeur mesuree et, sur 1'axe des ordonnees, le nom bre re lati f ( H I mesures

de la valeur / par rappor t au nombre total N de mesures) c'est-a-dire la frequence

d 'appar i t ion de chaque valeur . Le sol n 'e ta i t pas plat , notre dec imetre n 'e ta i t pas

toujours droi t , la longueur etait, la plupart du temps, comprise entre 324 et 325 cm

et nous ne savions pas dans quel sens il fallait Tarrondir. D'ou la dispersion de nos

resul tats .

Pour clarifler la si tuation nous avons pris un ins t rumen t de mesure gradue en mil-

l imetres et en augmentant sensiblement le nombre de mesures nous avons obtenu le snouveaux resul ta ts representes sur la figure 1.2. Avec une au t re echelle on r e t rouve

les memes tendances : les resultats sont legerement differents et se regroupent autour

d 'une cer taine valeur .

Figure 1.2 : Histogramme de la deuxieme serie de mesures de la longueur / : sont portees sur 1'axe

des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition

On peut continuer ainsi notre experience en d imin u an t 1'echelle et en au g me n tan t le

nom bre de m esures dans chaque serie . La forme des h is togrammes tendra vers une

forme en cloche qui, lorsque le nombre de mesures tend vers I ' infmi, peu t etre decrite

par une fonct ion cont inue f(x) (figure 1.3).

Chaque histogramme donne le nombre relatif de resultats se trouvant dans un inter-




Figure 1.3 : Fonc t ion de la dens i te de probabi l i t e

valle donne. Ainsi, dans le cas d'u n grand nombre de mesures et selon notre definition( 1 ) , le produi t f(x}dx donne la probabili te que la grandeur mesuree se trouve dans1'intervalle La fonction f(x) represente la densite de probabilite.

On 1'appellera aussi la fonction de distribution de probabilite. x varie au hasard et

s'appelle variable aleatoire.

D'apres notre definition, la probab ili te P de trouv er la valeur dans 1'intervalle co m pris

entre xi et x < i est egale a

qui est la somme (1'integrale) de f(x] pour toutes les valeurs de x entre x\ et x^.

Selon (2), f(x) obeit a la con dit ion

ce qui signifie que la probabi l i te de t rouver une valeur de x quelconque est egale a 1.

Par commodi te mathemat i que , nou s avons pris ici des limites infmies pour 1'integrale.

Mais une grandeur physique, par exemple la longueur, peut ne pas varier dans ceslimites (elle ne peut pas et re negat ive) . Cela signifie que la fonction /(a?) utiliseepour decrire cette grandeur doit devenir tres peti te en dehors des limites que nous

choisissons effectivement.

Pour une grandeur discrete qui prend les valeurs numeriques X { = {x\, x % , . . . } nous



I — R A P P E L S S U E L A T H E O R I E D B S P R O B A B I L I T E S 1 7

avons exactement la m e m e relation de normalisation :

ou 'P(xi) est la probabilite de t rouver la valeur Xi.

On peu t souligner que le passage d'u n h i s togramme a une fonc tion con tinue est ana-

logue a la notion d'integrale comme l imite de la somme des aires de rectangles ele-

ment aires sous la courbe representant une fonction quan d le nomb re de divisions tend

vers 1'infini.

1.1.3 PROPRIETES DE LA F O N C T I O N DE D I S T R I B U T I O N

Com me nt pouv ons-nous caracteriser la fonction de distr ibution de probabili te f(x] ?

Theor iquement , il faut la connaitre a chaque point x mais il est evident que ceci n'est

pas realisable experimentalement : nous ne pouvons pas mesurer la probabili te pour

chaque valeur x.

A priori , cette fonction f(x] doit etre positive, vu sa relation avec la probabilite,

tendre vers zero a plus l ' infini et a moins 1'infini assez rapidement pour que 1'integrale

(5) existe, et avoir la forme de la courbe presentee sur la figure 1.3. II est logiqued ' introduire au moins deux parametres qui decrivent la. position de la cou rbe (c'est-a-dire celle de son maximum) sur 1'axe et son etalement.

Ainsi la premiere caracteristique de la dis tr ibut ion de probabili te f(x) est la valeur

moyenne de x

Ch aque valeur possible de x est multipliee par la probabilite de son apparition f(x)dxet la som me (1'integrale) est effectuee sur toutes les valeurs possibles.

Pour une variable discrete

L a barre sur x est la notat ion standard indiquant la valeur moyenne ar i thmetique.

B ien evidemment , nous supposons que cette integrate (cette somme) ainsi que lesintegrates (les somm es) que no us allons definir existent. C'est une hypoth ese physique

naturelle mais nous discuterons aussi d 'exemples ou elle n'est pas valable.

L'etalement de la distr ibution peut etre decri t par la variance ou le carre de I'ecart-

type et defini par




pour une variable continue, et par

pour une variable discrete.

Pour chaque valeur de a ? , on considere 1'ecart par rappor t a la valeur moyenne a f

et on calcule la valeur moyenne du carre de cet ecar t . Pourquoi avoir choisi cette

caracteristique p lu to t qu 'une autre ? Parce que la s imple valeur moyenne de 1'ecart

mais nous verronsst nulle. No us aur ions pu prendre com m e caracteris t ique \x — x

a la fin de ce paragraphe que, sous cette forme, la variance ne presente pas certaines

proprietes remarquables et for t utiles .

II est facile de demontre r qu 'avec la definition (7) le carre de 1'ecart-type s 'ecrit

Prenons 1'exemple le plus simple : une distribution de probabi l i ty constante (voir

figure 1.4) d 'une grandeur x qui peut varier de a a &

La valeur de cette constante est definie par la condit ion de normalisation (5).

Figure 1.4 : Distribution constante

La valeur moyenne de x pour cette fonct ion de distr ibution est

et sa variance :




Le s deux seu les ca rac t e r i s t i qu e s , peuven t ne pas et re su f f i san tes pour dec r i re

la fonction f(x). On peut a lors de fmi r le s va l eu r s moyennes du cube , de l a qua t r i eme

puissance de I 'ec ar t e tc . De cet te fa con , on obtient un moment central d'ordre n :

Le m ot "cent ra l " soul igne le fait que le moment e s t ca lcu le par rappor t a la v a l e u r moyenne

~ x . Notons q u e , par def in i t ion ,

Parfois, il e s t utile d ' in t rodu i re des moments sans rappor t avec la va leur moyenne

Les m o m e n t s (ou les momen t s cen t r aux ) , a i ns i de fmis , de te rm inen t la distribution f(x)

d 'une facon un ique . O n demon t re fac i l ement que s i deux densi tes de probabi l i tes fi(x) e t

/2(x) ont les m e m e s m o m e n ts , e l les sont ident iques La issons au lec teurinteresse le soin d 'e f fec tuer cette demonstration.

La c o n n a i s s a n c e de tous le s momen t s {fi'n} (o u {pn}} donne une information comp le t e

sur la fonction de distribution de probabi l i te f(x). C e p e n d a n t , i l es t p lus ra t ionne l de

t r a va i l l e r avec une seule fonction c o n t e n a n t tous l e s momen t s dans son express ion . Ce t te

fonction s 'appe l l e la fonction generatrice des moments de fmie par :

La fonction exponent i e l l e peu t e t re deve loppee en ser ie

O n voit que [i 'n es t l e coe f f ic i en t peu t ega l emen t e t re de te rminee a pa r t i r

des der ivees de la fonction M'x(t} :




Done pou r t = 0, on obt ien t

D ' u n e facon a na logue , on i n t r o d u i t la fonction generatrice des moments centraux :

La re la t ion en t re ce s deux f onc t ions es t done :

C o n f o r me me n t au theoreme que T on v ien t d ' e n o n ce r , on peut a f f i rme r que I ' ega l i te des

deux fonc tions g e n e r a t r i c e s , i m p l i q u e I 'e g a l i te d e s deux fonc t ions d e

distribution de probabi l i te :

Pour un lec teur in te resse par le s aspec t s m a t h e m a t i q u e s du prob leme, notons que cet te

definition de la fonction gene ratr ice n 'est pas la seule utilisee dans la litterature. On peut

r e mp l ace r la fonction exponen t i e l l e d 'un a rgumen t reel e^par la f onc t ion d 'un a rgument

pu remen t complexe etxt. Dans le premie r cas , la def in i t ion e s t etroitement l iee a la

t r ans fo rma t ion de Lap lace , a l o rs que dans le deux ieme el le e s t l iee a la t rans format ion

de Four ie r . L e s d e u x t r a n s f o r ma t i o n s in tegrates sont t res proches I 'une de I ' au t re : une

ro ta t ion de 7T /2 dans le p lan comp lexe de t p e r m e t de passer d 'une t rans fo rma t ion a

I ' au t r e .

L ' i n t roduc t i on de la fonction gen e ra t r i c e peut etre cons ideree c o m m e une as tuce p e r me t -

tant de fac i l i ter le s diverses d e mo n s t r a t i o n s (ce que nous verrons p lus ta rd) . Ma is on peut

lui donner une i n te rpre ta t ion phys ique plus profonde qui sort du cadre de ce l iv re .

1.1.4 F O N C T I O N DE D I S T R I B U T I O N DE P L U S I E U R S V A R I A B L E S

Examinons maintenant la si tuat ion un peu plus complexe ou nous avons affaire a

deux grandeurs (variables) x\ et x^. Par exemple , nous mesurons la longueur et

la largeur d 'un e piece. Ou enco re, nous faisons deux m esures inde pe nda ntes de la

rneme grandeur : dans ce cas nous pouvons aussi dire que nous travail lons avec deux

grandeurs .

L a const ruct ion et les definit ions sont absolument analogues au cas d'une seule varia-ble . Pour deux grandeurs cont inues, on doi t in t roduire la densi te de probabil i te qui

depend de deux variables / ( a ? i , x ^ } . Ainsi la probabi l i te de t r ouve r la premiere valeur

dans Pinterval le com pris ent re x\ et x\ + dx\ et la deuxiem e valeur dans 1'intervalle

compris ent re

avec la condit ion de normalisat ion :



I - R A P P E L S S U R L A T H E O R I E D B S P R O B A B I L I T E S 21

La generalisation de ces defin itions au cas de N variables est evidente.

Parmi t outes les fonctions il existe un cas particulierement important et

interessant en physique. C'est celui ou deux variables x\ etx - 2

sont independantes.Alors, selon la formule (3) , la fonct ion f ( x \ , X 2 ) se separe en un produit de deux

fonctions :

ou ch aque fonction represente la densite de probabi l i te de la variable correspondante.

Etudions le s proprietes remarquables des valeurs moyennes et des variances dans

un cas particulier mais tres frequent en physique : la somme de deux grandeurs

independantes x\ - + - x^. Ces deux grandeurs x\ et x^ peuvent etre deux resultats demesure de la meme grandeur x. Leur somme nous sera utile pour calculer la valeur

moyenne sur deux experiences.

L 'hypothese de leur independance nous permet d'utiliser la propriete (16) et, par

definition, la valeur moyenne de la somme est egale a

la somme des deux valeurs moyennes.

Pour calculer la variance on procede aussi par definition :




On separe cette expression en trois integrates et on utilise la propriete (16)

On obt ient finalement une relation simple

qui montre que la variance de la s omme de deux grandeurs independantes es t egale ala somme de leur variance. Cette formule est la base du traitement des incertitudes

et elle est uti l isee continuellement en physique.

On voit d'ailleurs 1'avantage d 'une telle definition de la variance. N ous avons dit

qu'i l etait "a priori" possible de caracteriser 1'etalement d'une distr ibution f(x) par

par exemple. Mais, avec cette definition, on ne peut ob tenir une relationaussi simple que celle donnee par la form ule (17).

Par analogic, pou r T V grandeurs independantes x±, x % , . . . , XN, on a

On introduit la somme

de ces grandeurs. La moyenne de la somme X est egale a

c'est-a-dire a la somme des moyennes et la variance de X est donnee par

soit la somme des variances.

Pour la fonction genera t r i ce des moments



I — RAPPELS S U R LA THEORIE D B S P R O B A B I L I T I E S 23

on obtient faci lement d 'apres (18)

Cela signifie que la fonction generatr ice des moments d 'une somme de grandeurs indepen-

dan tes e s t ega le au produ i t de s fonctions generat r i ces ind iv idue l les .

D e p lus , s i tou tes le s grandeurs dans ce t te s o m m e ont la m e m e fonction de distribution

on a la meme fonction generat r i ce de mo me n t s pour tou tes l e s g randeurs

e t pour la so mme X on obtient une express ion encore p lus s imple

1.1.5 C O R R E L A T I O N S

J us q u ' a present , nous n 'avons cons idere que des exemp les de grandeurs phys iques (var i a -

bles a lea to i res ) i ndependan tes . Ma i s on rencon tre auss i des var i ab les co r re lees (c 'es t -a -d i re

non i ndependan tes ) . A la fin du paragraphe 1.1.1 (voi r (4)), nous avons vu un tel exemp le

avec une car te ajoutee a un jeu normal de 52 ca r tes , ce qu i ent ra fne que la probabi l i te de

deux evenements A e t B s imu l tanes P(AB) n 'es t pa s egale au produit de s probabi l i tes

Cette inegal i te es t le signe de deux evenements co r re l es .

On peu t penser que de te ls exemp les son t re la t i vemen t ra res en phys ique. En ef fe t , dans

la p lupar t des s i tuat ions ree l les , nous avons af fa i re a des var i ab les a l ea to i res i ndepen-

dan tes c o mme l e s me su re s d ' u n e me me grandeur {x,}. Bien ev idemmen t , il existe de s

s i tuat ions ou une mesure peut in fluencer la su iva nte , c o m m e l a mesure d 'un couran t avec

un ampe reme t r e e l ec t r omecan i que ( d e mau v a i se qua l i t e ) dont l e ressor t es t usage e t se

de fo rme f ac i lem en t . Dans ce ca s , chaq ue mesure r isque de dependre des preceden tes . La

s ta t i s t ique n ' e s t d ' au cu n secours dans ce type de s i tua t i ons . C 'es t un e x e mp l e d ' e r r e u r

sys tema t i que qu'il e s t assez difficile de de tec te r et de corr iger . En physique expe r imen-

t a l e , il ex is te beaucoup de s i tuat ions ou, pour une exper ience prec ise , on doit ut i l iser un

unique apparei l dont on ne connatt pas tres bien le s proprietes. Ce manque de connais-

sance de I ' ap p a re i l l ag e condu i t parfois a des e r reu rs sy s t e ma t i qu e s e t m e m e a de f au sse s

decouver tes .



2 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S

Neanmoins, en statistique, il existe "un mecanisme" tout a fait n a t u r e ! et frequent d'appa-

rition de s correlations. Meme s i le s va r i a b l e s { a ? ? - } sont independantes, l eu r s fonctions

peuvent etre cor re lees .

Nous caracteriserons la dependance entre deux variables X { e t Xj (avec de s valeurs

moyennes et des v a r i an c e s par le coefficient de correlation q^ j defmi

par :

Le s ecar t s quadratiques moyens c r z e t < T J sont introduits d an s la definition par commodite.

Nous utiliserons auss i la covariance de deux variables :

En particulier, pour i =j

Si les variables X{ e t Xj sont independantes, le coefficient de correlation e st nul : q^ j — 0.

S i Xi e s t proportionnelle a X j , c'est-a-dire ce coefficient es t ega l a ±1 ;

D an s un cas general,

Prenons un exemple, presque trivial, q u i donne une illustration de ce mecanisme d'appa-

rition des correlations. Soient x\ et x deux g r a ndeu r s physiques independantes avec la

meme moyenne / j, et la meme v a r i an c e a2. Introduisons deux grandeurs y{ e t y^ qu i l eu r

sont liees par une relation lineaire :

C a l c u l ons l a covariance c o v ( 2 / 1 , 7 / 2 ) (23).

Tout d'abord, determinons le s moyennes de 7/1 et de 7 /2 :

y T = auxi + 0 1 2 ^ 2 = aiiÎ+ 012^2"= (an + 012)^ ,

y2 = azixi + 022^2 = ( < * 2 i + ^22)^ -




Autrement dit, d a n s le cas genera l les deux var iab les y\ et yi

ne sont pas i nd epend an tes mais sont correlees.

Get exemple donne une i l lustrat ion de la notion de corre la t ion .

Neanmoins , la notion d ' independance de deux variables n'est pas toujours ev idente . Con-

siderons I 'exemple s imple de la correlat ion des deux var iab les x et y = x2. A priori , nous

pouvons penser qu'el les sont correlees.

D'apres la defini t ion (23), la cov arianc e est donn ee par

Dans le cas genera l , cette expression est di f ferente de z e r o , c 'es t -a -d i re que x et x2

sont

effectivement correlees. Mais il suffit que Ton prenne le cas particulier d ' u n e fonction de

distr ibution f(x) pai re , par exemple la distr ibution de G a u s s (vo i r paragraphe su ivant )

avec f j , =0, pour que et pour que la correlation disparaisse ! Get exemple

n'est pas tres exotique : d a n s le cas d ' u n gaz dont les vitesses des molecules obeissent a

la distribution de Maxwell (voir paragraphe 3.1.3), les composantes de la vitesse (vx, vy

et vz) et I 'energ ie ne sont pas corre lees . A posteriori , on peut

comprendre qualitativement ce resultat : la valeur de x est caracterisee par son module

et son signe tandis que x2 n 'es t caracter ise que par le module de x. Les signes + et —

sont equiprobables en vertu de la symetrie de f(x), c 'est pourquoi x et x2

se trouvent

decorrelees.

1.2 D I S T R I B U T I O N DE G A U S S

La premiere d is t r ibut ion cont inue que Ton etudie ic i est la distr ibution de Gauss.

Cet te d is t r ibut ion est la plus frequente en physique , c'est pou rquo i , dans la l i t te rature ,

on Tappelle aussi la dis t r ibut ion norm ale . Dans cet ouvrage, nous uti l iserons le s

deux denom inatio ns. N ous verro ns, dans le paragraphe suivant consacre au the orem e

central l imi te , pou rquo i cette distr ibutio n jo ue un role s i part iculier . Pou r 1'instant

nous e tudions sur tou t ses propr ie tes .

O n a alors :




Figure 1.5 : Les dis tr ibut ions de Gauss po ur plusieurs je ux de parametres / j , et < r

Supposons qu 'une valeur physique var ie d 'une fagon continue dans un interval le de

moins 1'infmi jusqu'a plus I 'mfini1. L a densite de probabi l i te f(x] de t rouver la valeur

physique aleatoire x pour une dis t r ibut ion normale est donnee par

La dis t r ibut ion normale est caracterisee par deux parametres ^ et a. Leur sens est

clairement visible sur la figure 1.5 ou nous avons presente plusieurs dis t r ibut ions

correspondant a des / j . et a differents : ^ donne la position de la distribution, < r so n

etalement .

Notons que le facteu r devant la fonction exponentielle est choisi pour que la probabilite

totale soit normee :

Nous avons deja di t , au paragraphe precedent, que la plupart des valeurs physiques varient dans

des limites finies, mais, dans les s i tuat ions exper im entales concre tes, les valeurs reelles ne sontjamais proches des l imites et ainsi 1 'hypothese d'infini te de 1'intervalle de variation n 'a aucuneconsequence sur 1'applicabilite des resultats obtenus.



I — RAPPELS SUR LA THEORIE D B S P R O B A B I L I T I E S 27

Rappe lons au lecteur que le ca lcu l de I ' in tegra le

qu i se ren con t re souvent en physique est s imp le.

II suffit de considerer 72

(integrale sur tout le plan xy) et de passer en coordonnees polaires

dans T in teg ra le double :

Calculons la mo yenne et la variance de cette distr ib ution . Par definition, la valeur

moyenne de x est egale a

Ainsi, le parametre p peut etre interprete comme la valeur moyenne de x. Notons

aussi que x = ^ est le maximum de la fonct ion f(x] et que cet te dis tr ibut ion est

symetrique par rappor t a ce point.

De la m e m e fagon, on calcule la variance de la distribution normale :

(La derniere integrale peut etre calculee, par integration par parties.) N ous voyons

pourquoi, des le debut, nous avons designe par a le deuxieme paramet re de cette

dis tr ibut ion.

II est relativement facile de calculer des moments d'ordre plus eleve de la distribution de

Ga us s . II faut in t roduire la fonction genera t r i ce des mom ents c en t raux qu i , pa r definition,

est ega le a



28 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S

Pour la ca lcu le r il su f f i t de fa i r e le changemen t de va r iab l e

comple ter ( ' a rgument de la fonction expone nt ie l l e en fa i san t appara t t re

Ces changemen t s de va r i ab l e nous permet ten t de r e t r o u v e r I ' in tegra le ( 2 5 ) .

A ins i , pour la fonction generat r ice des momen t s cen t r aux on obtient I ' express ion

O n voit que tous les moments impa i r s son t nuls ce qu i e s t ev iden t en ver tu

de la symet r ie de la distribution no rma l e pa r rappor t a x = / / . L e s moments pa i r s son t

Pour voir I'utilite des fonc t ions gen era t r i ces , p renons un exem ple qu i i n te rv iendra au

paragraphe su ivan t . Considerons la distribution d'un e grandeur physique y — ax + b qu i

est une fonction l inea i re d ' u n e a u t r e g r a n d e u r x distribute selon la loi no rma l e avec une

moyenne /^ et une var iance < r2.

La fonction gene ra t r i c e de s momen t s est egale a

done

Selon notre hypothese, la distribution de x est une d is t r ibut ion de Gau ss (26 ) . D ' o u

Cette expression prouve que la grandeur y a aussi une distribution normale de va leur

moyenne a / j , + b et de va r i ance a2< r

2. Les deux resu l ta t s son t presque evidents : la t r ans -

lation change juste la va leur moyenne et le changement d 'echel le multiplie la moyenne par

a e t l a va r iance pa r a2

( l e resu l ta t etait prev is ib le vu l es d imens ions de ces g randeurs) .

Comme la d is t r ibu t ion de Gauss est ent ie rement de terminee par les deux valeurs // , < r

et que la plupart des grandeurs physiques peuvent etre decrites par cette distr ibution,

le s resulta ts expe rim entau x peuv ent etre caracterises par deu x valeurs seulem ent. Par

convent ion, on presente ces derniers sous la forme

II faut expliquer ce que cette ecri ture symbolique signifie. Premierement , en presen-

tant un resultat de cette maniere, on suppose que la distr ibution de la grandeur

2 Les normes ISO proposent d'utiliser la notation ux plutot que Ao\ Cependant, dans ce livre,

nous garderons 1'ecriture Ao: plus habituelle pour les physiciens.



I - R A P P E L S S U R L A T H E O R I E D B S P R O B A B I L I T E S 2 9

physique mesuree est gaussienne. Deuxiemement , on prend la valeur rnoyenne de la

dis t r ibut ion pour la valeur "reelle" de la grandeur x et sa largeur a pour 1'erreur. Cette

forme d'ecriture est une convention generate que tout le rnonde accepte en gardant

bien en tete ces hy poth eses. On ne pe ut pas dire que la valeur "reelle" de x varie dela valeur minimale xmin = [ i — a a une valeur maximale C'est faux !

Sous cette ecriture se cache une interpretation en termes de probabili te.

Rappelons que la probabil i te de t rouver une valeur physique dans un intervalle de x\a X2 est egale a 1'integrale de la densite de probabili te dans ces limites. Pour une dis-

t r ibu t ion donnee, on peut calculer les integrales qui nous interessent numer iquement .

En particulier, pour la distr ibution de Gauss (figure 1.6), la probabili te de t rouv er la

valeur x dans 1'intervalle

dans 1'intervalle

dans 1'intervalle

Ces resultats montrent encore une fois a quel point 1' interpretationcomm e valeurs maximale et rninim ale possibles de x est approximative .

Pour une distr ibution de Gauss, la probabili te de retrouver x en dehors de cet in-

tervalle est egale a 1/3, c'est-a-dire tres impor tan te ! Aut r em en t dit, si Ton mesure

Figure 1.6 : La distribution de Gauss




une grandeur x plusieurs fois, environ un tiers des resultats se t rouve en dehors de

j U ± < T et seulement deux tiers dans I ' intervalle. De ce point de v u e , il n'y a rien de

dramat ique s i le resultat sort de cet intervalle. Par centre, si le resultat se trouve

aussi en deho rs de I ' interva lle la s i tuation devient beauco up pluspreoccupante . La probabil i te d 'u n tel evenement pour la distr ibution de Gauss est

seulement de 0,3 %, c'est-a-dire qu'elle est negligeable, vu le nombre d 'experiences

realisees habituellement au laboratoire (de quelques unites j u squ ' a quelques dizaines).

L'apparit ion du resultat en dehors de I'intervalle de 3er signifie, la plupart du temps,

qu ' i l existe une erreur soit dans le deroulement de 1'experience, soit dans les calculs

de // et de a.

Dans le paragraphe 3.1, nous rev iendro ns sur la definition de f i et de a a partir d 'un

nombre limite de mesures ainsi que sur la precision d 'une telle determination. Si 1'on

ne peut obtenir la valeur de a exper imentale qu'a un facteur 2 pres, on ne doit pas

prendre a la le t tre le s valeurs des probabili tes obtenues avec un a theor ique .

Pour 1 ' instant, que retenir sur la distr ibu tion de Gauss (ou norm ale) ? D'ab ord, le fait

qu 'une tres grande major i te de grandeurs physiques se decri t , au moins en premiere

approx imat ion , par cette distr ibution. Cette circonstance explique son impor tance en

physique. Cette distr ibution est caracterisee par deux paramet res : la valeur m oye nne

H associee a l a 'V ra ie " valeur de la grandeur physique et la largeur a associee a 1'erreur

experimentale. C'est la raison pour laquelle le resul ta t d 'une experience s 'ecrit sous

la forme/ L *

± a ; 1'interpretation d'une telle ecriture est que la probabi l i te pour que lavaleur physique mesuree se tro uv e dans cet inte rvalle est egale a 2/3. Si le resu ltat

sort de I ' intervalle f j , ± 3u, alors il est tres probable qu 'une erreur se soit glissee dans

nos mesures ou dans les calculs de / J ou de a.

1.3 AUTRES D I S T R I B U T I O N S E L E M E N T A I R E S

A u paragraphe precedent , nous avons souligne que la distr ibution de Gauss est la

plus frequente dans la nature . Cependant , elle n'est pas la seule possible. D 'aut resdis t r ibut ions de probabil i te in te rv iennen t f requemment dans la vie courante ; men-

tionno ns en particulier les distribution s de Stu den t, de Poisson, de Lo ren tz, ainsi que

la dis t r ibut ion binomiale et celle du x2.

Les distr ibutions de Student et du x2 son

^ indispensables en physique, mais elles

sont relativem ent complexes. N ous leur consacrerons les paragraphes speciaux dans

le t roixeme chapitre du livre ou nous aborderons des problemes plus avances.

La distr ibution binomiale sera la premiere etudiee parmi celles qui decrivent des

grandeurs discretes. II faut dire qu'elle n'est pas f requemment rencontree dans le sexperiences mais elle est s imple et instructive.

N ous obt iendrons la dis t r ibut ion de Poisson comme une certaine l imite de la distri-

bution binomiale. Cette "transformation" sera le premier exemple du passage d'une

distribution vers une autre. Plus tard, nous verrons que ces distributions se trans-

forment en une distr ibution normale dans la l imite d 'un grand nombre de mesures.

La formulation plus r igoureuse de cette propriete sera donnee au paragraphe suivant

ou nous dem ontrero ns qu' i l s 'agit d 'un resul ta t general valable po ur presque toutes les



I - RAPPELS SUR L A T H E O R I E D B S P R O B A B I L I T E S 31

dis tr ibut ions. La seule exception (physiquement interessante) a cette regie est donnee

par la distribution de Lorentz .

Ici, il faut noter que la "transformation" d'une distr ibution en une autre n'est pas

d 'un interet purement academique ou pedagogique. C'est un probleme pratique car

une telle operat ion peut nous permettre de remplacer , au moins dans une premiere

approche, plusieurs distr ibutions de probabili te complexes par des distributions plus

simples et plus generales et trouver ainsi un langage commun pour une description

uniforme de grandeurs physiques tres diverses.

1.3.1 DISTRIBUTION B I N O M I A L E

Cette distribution decrit des grandeurs discretes qui peuvent prendre seulement deuxvaleurs. Supposons qu'un evenement ait deux realisations possibles ^ 4 et B. Soient p

la probability de la realisation A, q = I — p la probabilite de la realisation B. Si cet

evenement se repete N fois, on peut determiner la probabil i te PN(H) que la realisation

A se produise n fois. La probabili te d'obtenir successivement n fois la realisation Apuis N — n fois la realisation B es t egale . Vu que 1'ordre

de realisations .4 et B est sans importance, il faut multiplier cette probabilite par le

nom bre de possibi li tes d'extraire n objets parmi N objets, c'est-a-dire par

Finalement , la probabilite P^(n) que la realisation A se produise n fois est egale a :

Cette densite de probab ili te est celle de la distr ib ution binom iale. Elle est caracterisee

par deux parametres N et p. Plusieurs exemples de cette distribution sont donnes

sur la figure 1.7.C o m m e exemple ph ysique simp le, considerons N particules d'un gaz sans interaction

dist r ibutes uni fo rmement dans un volume V. Chaque particule a une position alea-toire dans ce vo lum e et a une probabili te p = v/V de se manifester dans une partie v

du volume V. Dans ces conditions la probabili te P/v(n) de t rouver n particules dans

v est donnee par (30) .

II est facile de verifier que la densite de probabilite (30) est normee conformement a

1'equation (2) :

Dete rminons la moyenne du nombre n. Par definition (voir (6')) , elle est egale a




Figure 1.7 : La distribution binomiale pour trois valeurs du parametre p, N etant fixe : N = 10

Nous avons utilise le fait que le terme avec n — 0 est nul ; changeons la variable de

sommation en posant k =n — 1 :

Nous aurions pu prevoir ce resultat directement car si la probabilite de realisation Aest egale a p, a la suite de A f evenements , le nombre moyen de realisations A doit etre

egale a Np.

Pour calculer 1'ecart-type, prenons la definition (7') et utilisons 1'expression (8) :



I - RAPPELS SUR L A THEORIE D B S P R O B A B I L I T I E S 33

Pour calculer la premiere somme, nous util isons la mem e astuce que pour le calcul den dans (32) :

Autrement dit , 1 'ecart-type est egal a :

La fonction gene rat r ice des mom ents (14) de la distribution b inomia le es t

La p rem ie re et la deux i eme der ivees de cet te fonction e n t = 0 defmissent le s moments

Ains i la moyenne et la var i ance de la distribution binomia le sont donnees par :

con fo rmemen t a (32 ) e t (33).

Les resul ta ts (32) et (33) peu ven t paraitre t r iv iau x mais ils sont fondamentaux pour

tou te la statis t ique : la valeur moyenne n est proportionnelle au nombre de mesures




tandis que 1'ecart-type es t proportionn el a la racine de N

Pour comprendre 1'importance de ces resultats , rappelons que la valeur moyenne est

associee a la valeur d 'un e grandeur ph ysique xexp et 1'ecart-type a son incert i tude (voir

la discussion suivant la formule (29)) . Si Ton definit 1'erreur (1'incertitude) relative 6

com m e le rappor t

on voit que cette valeur est inversement proportionnelle au nombre de mesures T V

Cela signifie que, plus 1'on fait de mesures, plus la precision est gra nde : une conclusion

evidente , presque triviale. Ce qui est beaucoup moins evident, c 'est la dependance

fonctionnelle de 8 avec N. La formule (35) montre que la precision relative decroit

seulement comme la racine de N. Pour augmenter la precision par un fac teur de 10,

il faut multipl ier le nombre d 'experiences, et ainsi le cou t , par 100 ! Une experience

precise peut couter tres cher et, ic i , on en com prend la raison. V u qu 'une bonne

precision est chere, il faut savoir de quelle precision on a vraiment besoin. C'est une

question non triviale et nous y reviendrons a la fin du l ivre.

N ous avons obtenu la formule (35) a part ir de la distr ibution binomiale mais elle

restera valable quelle que soit la situation experimental. No us reviendrons sur cette

question au paragraphe 2.1.

1 . 3 . 2 DISTRIBUTION DE POISSON

Etudions maintenant un autre phenomene par t icul ie rement interessant : la trans-

formation d'une distribution dans une autre. Prenons comme point de depart la

distr ibution binomiale dans laquelle nous augmentons le nombre de mesures N. Nou s

considerons la l imite quand N est tres grand mais en imposant que le

produi t Np reste constant Np = const = // (c'est-a-dire p — > • 0).

Nous voulons trouver la probabili te P/^(n) que la realisation A se produise n fois au

cours de toutes les mesures :

et du fait que




Rappelons que n restant fini, il est toujours pet i t par rappor t a N. Done,

F inalemen t , pour la probabil i ty P ^ ( n ) , on obtient

. , 1

C'est la dis t r ibut ion de Poisson.

On peut verifier aisement qu'elle est normee :

Nous aur ions pu prevoir ces resul tats a par t i r des expressions relatives a la dis t r ibu-

tion binomiale (32—33).

La fonction genera t r i ce des m o m en t s (14) de la distribution de Poisson est

lorsque T V tend vers Pinfini.

On peut reecrire (1 — p)N~

nc o m m e

L'expression dans le denomina teur tend vers 1 quand N — > oo, par centre

que sa moyenne est egale a // :

et que sa variance est p, (soit un ecar t- type




Le lec teur in teresse r e t rouve ra a i semen t la moyenne et la var i ance de cette distribution a

I 'a ide des deux p remie res der ivees de la fonction M^{t] prises en t = 0.

Notons que la distribution de Poisson ne depend que d'un seul parametre // = Np. La

forme de cette distr ibution pour plusieurs valeurs de p est presentee sur la figure 1.8.

Figure 1.8 : La distribution de Poisson pour plusieurs valeurs du parametre p,

Cette distr ibution de probabil i ty est souvent rencontree en physique atomique ou en

phys ique nucleaire, car le nombre de particules comptees par un detecteur est dis t r ibue

selon cette lo i a condi t ion que le flux de particules reste constant.Prenons un exemple. Supposons qu'a I 'aide d'undetec teur on compte des particules

et que 1'on enregistre leur nombre pendan t une certaine duree, disons 1 seconde. Ces

mesures seront decrites par la distr ibution de Poisson.

Pour le verifier, divisons notre intervalle de t emps (de 1 s) en A * " pet i ts sous-intervalles,

disons de 1 nanoseconde (1 ns = 10~9

s). Supposons que le nombre moyen de par-

ticules enregistrees pendan t 1 s soit egal a // = 8. Alors la probabil i te de detec t ion

d 'une par t icule dans un sous-intervalle est egale a p = II est impor tan t

que cette valeur soit faible pour que Ton puisse negliger la probabil i te de detect ion de

deux particules dans un sous-intervalle de temps.

En pr inc ipe , c'est une distr ibution binomiale ou la realisation A est 1'apparition d 'une

particule dans le detec teur et la realisation B est son absence. Les condi t ions de la

lim ite con st) sont satisfaites

et la dis t r ibut ion devient une dis t r ibut ion de Poisson avec une moyenne J J L = 8



I - R A P P E L S SUR L A T H E O R I E D E S P R O B A B I L I T E S 37

(figure 1.8). n est le nombre de particules detectees pendant 1 seconde. Get exemple

mont re un "passage" entre differentes dis tr ibut ions. On a remplace une distribution

a deux parametres (b inomiale) par une autre beaucoup plus simple (de Poisson) qui

ne contient qu 'un seul paramet re .

1.3 .3 DISTRIBUTION DE LORENTZ

La dis tr ibut ion de Lorentz , qui por te parfois aussi le nom de Cauchy, a une place

particuliere en statistique.

D'u n e par t , la fonct ion de Lorentz (37) est t res importante en physique car elle decrit

des systemes qui se t rouvent dans un etat dit de resonance. Ce phenomene se carac-

terise par une grande am plification des parame tres du systeme. II est connu et utiliseen mecanique (pour mettre en marche une balangoire, un enfant doit effectuer ses

mouvements periodiques avec une certaine frequence) ou en elect romagnet isme ( tous

les postes de radio ou de television util isent le phenomene de resonance pour choisirune stat ion) . En ph ysique microscopiqu e, une resonance decrit , entre autres, la duree

de vie d'une particule ou d'un systeme de particules.

D 'au t re par t , la fonct ion de Lorentz apparai t comme une dis tr ibut ion de proba-bilite sur tout en mecanique quant ique, c'est-a-dire en physique microscopique. C'estpourquoi ce t te dis tr ibut ion de probabili te se manifeste relativement rarement dans

le s problemes macroscopiques et, en particu lier, dans les experiences en trav aux p ra-

tiques.

Neanmoins , elle donne un exemple de distr ibution pour laquelle le s definitions stan-

dards de la statistique ne sont pas toujours valables. Cette raison a elle seule estsuffisante pour que 1'on etudie cet te dis tr ibut ion de maniere plus approfondie.

La distribution de Lorentz est donnee par la fonctio n

qui depend de deux parameteres X Q et a (figure 1.9).

Le coefficient devant la fonction est choisi pour que la probabili te totale de trouverune valeur quelconqu e de x soit egale a 1.

Le calcul de cette integrate ne represente aucune difficulte car la primit ive de cet te

fonction est bien connue (arc tangente) .

On peut voir facilement que cette distr ibution est symetr ique par rapport a XQ qui

est aussi le m axim um de cette fonction. En ce qui concerne le coefficient a, son

in terpreta t ion est aussi claire : il represente la moit ie de la largeur a mi-hauteur etcaracterise ainsi 1'etalement de cette fonction.

Cependant, on rencontre de vrais problemes quand on veut trouver la moyenne et la

variance en utilisant nos definitions habituelles.




Figure 1.9 : La distribution de Lorentz

Le deuxieme terme est egal a X Q en ver tu de la normalisation de la distr ibution. Onpeut dire que la premiere integrale est nulle car la fonction que Ton integre est impaire

par rappor t a £ — 0. F ormel lement , cec i est faux. Du point de vue m athem a t ique ,

cette integrale est divergente. Elle n'es t egale a zero que si 1'on considere ce que

Ton appelle sa valeur pr inc ipale . Autrement d i t , si Ton prend d 'abord un intervalle

d' integrat ion f ini e t symetrique ( — R, R) et si Ton calcule ensuite la limite lorsque

R — > • oo. Done, la valeur moyenne peut etre consideree egale a X Q mais 1'on constate

que le calcul de 1'integrale est un peu delicat.

Le vrai p robleme appara i t quand on veut etablir la variance, car 1'integrale correspo n-

dante

diverge. Cela signifie que Pecart-type, qui etai t pour nous la caracteristique de la

largeur d 'une distribution, n'existe pas au sens de la definition (7). Neanmoins,

1'etalement de la fonct ion de Lorentz peut etre decri t par le parametre a.

D'apres la definition (6) , la valeur moy enne de x est egale a

Pour calculer cette integrale, faisons le changement de variable



I - R A P P E L S SUR L A T H E O R I E D E S P R O B A B I L I T I E S 39

La fonction genera t r i ce (14) ou (15) de la distribution de Loren tz n 'ex is te pas non plus

a cause de la d ivergence de I ' in tegra le co r r espondan te . C ependan t , il es t poss ib le de

remedie r a ce probleme. Au lieu de la definition issue de la transformation de Lap l ace , on

peut choisi r pour fonction generat r ice une def in i t ion issue de la t ransfo rma t ion de Four ier(voir la d iscuss ion a la fin du pa rag raphe 1.1.3) :

ou la fonction exponent i e l l e d 'un a rgument ree l a e te remplacee par la fonction e x-

ponent i e l l e d 'un a rgument purement complexe (pour s imp l i f i e r l a d i scuss ion , on prend

Avec cette definition, la fonction genera t r i ce ex i s te e t el le e s t ega le a :

Ce t te i n teg ra le , r e l a t i vemen t comp l i quee , peu t etre ca l cu l ee d i rec tem ent en u t i li san t l a

theor ie de s fonct ions des va r i ab l es comp lexes . C ep endan t , on peut obten i r ce resu l t a t

ind i rec tement e n utilisant le fait qu ' en p r enan t la t rans fo rmat ion de Fourie r d 'un e fonction

puis la t rans form at ion de Four ier inve rse de la fonction obtenue , on re t rouve la fonction

in i t ia le . A ins i s i F(t) est la t rans fo rmat ion de Fourier de f(x)

a lors

Dans not re cas , e n p renan t

on obtient

ou nous avons uti l ise le fait que a > 0 . Ains i ( 'express ion de la t r ans fo rma t i on de Four ier

d i rec te (40) nous donne la fo rmu le (39) .

Nous sommes en presence d 'une distr ibution pour laquelle les def in i t ions generates

des valeurs m oyennes ne sont pas valables. Ce tte part icular i ty de la d is t r ibut ion de

Lorentz a des consequences tres im po rtantes. N ous verrons au paragraph e suivant

que c'est la seule distr ibution qui ne se transforme pas en une distr ibution de Gauss

lorsque le nombre de mesures devient grand.




1 . 3 . 4 D I S T R I B U T I O N G A M M A

Cet te distribution heri te son nom d 'une fonction spec ia le dite fonction F ou in tegrate

d 'Eu l e r de deux ieme espece. L a fonction F es t de fmie par I ' in tegra le

En principe, x dans ce t te expres s ion peut e t re complexe. Nous n 'e tud ie rons pas toutes

les proprietes de cette fonction, mais nous nous bornerons a la plus in teressante :

qu i se demon t re t res s imp lement : il su f f i t d' in tegrer (41) une fois par par t ies .

Pour x en t ie r , x = n, nous obtenons

ca r

Au t remen t dit, la fonction F est une genera l isat ion de la fonction factor ie l le n\ au cas

d 'un argument non en t ie r , ou mem e comp lexe (dans la l i t t e ra tu re , on rencon t re parfois

I 'ecr i ture x\ qui signif ie T(x + 1)).

Notons que pour le s va leu rs demi -en t i e res x — n + 1/2 , la fonction F peut auss i etre

ecr i te sous une forme r e l a t i vemen t s imple

car I ' integrale

L e changemen t de va r iab l e la rame n e a I ' in tegra le ( 25 ) .

La distribution de probabi l i te liee a la fonction F est decr i te par la fonction

pour x > 0 . Ce t te fonction contient deux pa rame t r es3. Notons que (3 e s t s imp lemen t un

param et re d 'eche l l e . L e choix de la cons tan te devan t la fonction de x e s t dicte, c o m m e

d 'hab i t ude , par la normal isat ion de la probabi l i te totale, ce qu i s e ver i f ie f ac i l emen t a I 'a ide



I — RAPPELS S U R L A T H E O R I E D E S P R O B A B I L I T E S 41

Figure 1.10 : La distribution gamma pour plusieurs valeurs du parametre a, / 3 etant fixe

de (41). Que lques exemples de la distribution gamma (pour (3 = 1) sont representes sur

la figure 1.10.

Calcu lons la moyenne et la var i ance de cette distribution. Par definition,

Nous avons utilise la definition de la fonction F et sa propriete (42).

Pour ca l cu le r l a var i ance , utilisons ( 'express ion (8) :

Le c a l c u l de es t relativement simple :

A ins i la va r iance de cette distribution e s t donnee par

3 Notons la ressemblance formelle entre la dist ribution gamma et celle de Poisson : si Ton remplace

n par a et j j, par x/j3. Cependant, il ne faut pas oublier que les roles des variables et des

parametres sont inverses dans ces distributions.




Comp le tons I'etude de la distribution gamma pa r sa fonction genera t r i ce .

Par definition (14),

Ecr ivons /3a+1

sous la forme

e t i n t rodu isons une nouve l l e va r iab l e L 'express ion pour M'(t] dev ien t

L ' i n t eg ra l e dans cet te express ion est egale a F(a + l)pa+l

et f m a l e m e n t M'(t] s ' e c r i t

Nous ve r rons un exemple phys ique de la distribution g a m m a l ie a la distribution de Maxwe l l

de s v i tesses au paragraphe 2 . 2 .3 consac re a la distribution %2

.

1.4 THEOREME ENTRAL L I M I T EConsiderons maintenant un des aspects les plus impor tants de la statistique qui con-

cerne le theoreme central l imi te . Ce theoreme represente non seulernent un resul ta t

mathemat i que puissant niais il est par t icul ierement impor tant pour ses appl icat ions

physiques. II affirme que, dans presque toutes les experiences, on peut travailler avec

une dis t r ibut ion de Gauss .

La form ulat ion exacte de ce t heoreme est la suivante :

Soit x une grandeur physique aleatoire avec une moyenne ^ et une variance < r2

.

Si < 72

est fini, alors la distribution de la valeur moyenne sur un grand nombre

n de mesures

tend vers une distribution de Gauss avec une moyenne // et une variance

Avant de demont re r ce t heo reme , soul ignons un fait tres impor tan t : on ne fait aucune

hypothese sur la forme de la distr ibution de la grandeur aleatoire x ! Elle p e u t me me

avoir une dis t r ibut ion discrete. II faut seulernent que la variance soit finie. Cette

condit ion est presque tou jours satisfaite dans la plupart des experiences, mais nous

citerons un peu plus tard un exemple physique ou cette l imitation est violee et ou la



I - R A P P E L S S U E L A T H E O R I E D B S P R O B A B I L I T E S 43

dis tr ibut ion ne tend pas vers une distributio n norm ale, Ne anmoins, cette situation

reste rare et quand les conditions du theoreme sont remplies, celui-ci nous garanti t

que, pour obtenir un resultat precis et fiable, il faut mesurer plusieurs fois la valeur

de x et calculer sa moyenne .

V u 1'importance du theoreme central l imite, nous donnons ici sa demonstrat ion qui

peu t , cependant , etre oubliee lors d 'une premiere lecture.

Considerons la fonction generat r ice de s moments cent raux pour / — > • 0 :

Ic i , nous avons fait le developpement limite de la fonction exponent ie l le e t nous avonsut i l ise le fait que la v a l e u r moyenne de x es t ega le a ^ et que le car re de I ' eca r t - t ype es t

fmi e t egal a a2

(13). Introduisons d 'abo rd une va leur auxiliaire

dont la fonction generat r ice des moments est donnee par

Pour t fixe, tend vers 0 lorsque n tend vers I'infmi. Nous pouvons a ins i utiliser le

deve loppement (47 ) par rappor t au pa rame t r e t/^/n :

Introduisons maintenant une nouvel le var iable z liee a la valeur moyenne introduite dans

I 'enonce du theoreme

par une re lat ion l ineaire

Toute le s va l eu r s W i appara i ssant dans la derniere express ion ont la meme distribution carle s di f fe rents x^ ont des dist r ibut ions equ iva lentes. Nous pouvons alors ut i l iser la propr ie te

(21) de la fonction genera t r i ce des moments , se lon laquel le la fonction genera t r i ce des

m o m e n t s d 'une s o m m e de n g r a n d e u r s a lea to i res ayan t la meme distribution e s t ega le a

la n-ieme pu issance de leur fonction genera t r i ce :




Lorsque n tend vers I ' i n f m i , cette expression tend vers

On reconnaf t ici la fonction genera t r i ce ( 26 ) de s moments d 'une dist r ibut ion de G a us s

avec une moyenne nulle et une va r i ance a2

= 1 . Aut rement d i t , dans la limite ou n e s t

g rand , la g randeu r z a une distribution normale avec une moyenne nu l le et une va r i ance

uni te . La va leu r moyenne X est liee a z par

Nous avons deja demont re qu 'une fonction l ineaire (ici X) d 'une g randeu r a lea to i re z

avec une distribution normale a auss i une dis t r ibu t ion normale (voir ( 2 8 ) ) . Ains i la va le urX, dans la limite ou n e s t grand , a une dist r ibut ion de G a us s avec une moyenne p et une

var iance a2/n.

Nous pouvons encore rem arque r que I ' e r reur re la t ive Sx sur la va le u r moyenne X, i n t ro-

duite dans la fo rmule (34) , es t inversement propor t ionne l le a la rac ine carree de n.

Soul ignons que, dans la demonstrat ion, aucune hypothese n'a e te faite sur la forme de la

fonction de distribution de x e t qu 'a ins i ce resu l ta t es t t res genera l .

Le theoreme que nous venons de demont rer est particulierement important pour lesexperiences physiques car il nous donne la garantie que, si le nombre de mesures

est suffisant, nous obtiendrons tot ou tard une valeur physique ayant une distr ibution

bien connue. Cependant, i l s'agit d'un theo reme l imite , c'est-a-dire que le passage vers

une distribution de Gauss ne se realise que si n est suffisamment gran d. Dans une

situation concrete, il faut savoir a quel point la distribution de la grandeur mesuree

est proche de la dis tr ibut ion de Gauss et quand le nombre de mesures est suffisant.

Pour 1'instant, la conclusion physique principale du theoreme central l imite est que

toutes le s grandeurs physiques, ou presque, ont une distribution de Gauss ; de plus

nous savons ce qu'il faut faire pour que la distribution devienne une distributionnormale. Pour eclaircir cet aspect du theoreme, donnons-en une autre formulat ion,

plus "physique", que 1'on peut aussi renc ont rer dans les livres sous le nom du th eo rem ecentral limite :

Si une grandeur physique subit Vinfiuence d'un nombre important de facteurs

independants et si Vinfiuence de chaque facteur pris separement es t petite, alors

la distribution de cette grandeur est une distribution de Gauss.

Les points importants dans cette formulation du theoreme sont la presence d'un

grand nombre de facteurs exterieurs, leur independance et leur faible influence surla grandeur physique.

Les deux formulat ions du theoreme sont re la t iveme nt proc hes I 'une de I 'aut re . Dans la

deux ieme, n joue le role du nombre de fac teu r s i ndependan t s ; a r t - peut e t re consideree

comme la va leu r de la g randeur x in f luencee par un seul f ac t eu r i. Ains i on re t rouve

presque la meme demons t ra t ion du theorem e. Pour n mesures independantes on peut

a f f i rmer que les X { ont la meme d is t r ibut ion e t ainsi la meme va leu r de <r2, mais pour n

fac teu rs independan ts , on ne peut p lus d i re qu ' i l s von t donner la meme d is t r ibu t ion a Xi



I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T E S 45

avec le s memes va leu rs de // et de cr2. Toutefois cela n'est pas un obstac le au theoreme .

Pour le d e mo n t r e r , il faut remplacer une s imple va leur moyenne a r i thme t i que X par une

express ion p lus complexe . Le l ec teu r , ama teu r de rna themat iques , pou r r a mene r l u i -meme

cette etude.

Donnons maintenant le contre-exemple annonce au debut du paragraphe. Dans ce cas

les conditions du theoreme ne sont pas satisfaites et les calculs de la valeur moyenne

ne peu vent sauve r la si tuat ion, la distribution n 'e tan t pas gaussienne. C'est celui de ladistribution de Lorentz discutee au pa ragr ap he 1.3.3 pour laquelle 1'ecart-type dive rge.

I I est fac i le de voir que, pour la distribution de Lo ren t z , le t heo reme cen t r a l limite ne

s ' ap p l i qu e pas . A u t r e m e n t dit, la condition d'ex is tence d ' u n ecar t - type fmi e s t essent i e l l ea ce theoreme e t n'est pas simplement une condition pour faciliter la demonstration.

Si x e s t dist r ibue se lon une loi lo rentz ienne, la va l e u r moyenne

a auss i la distribution de L o r e n t z .

La fonction genera t r i ce de Xi/n defmie par (38) est egale a :

(a compa re r avec (39)). Done la fonction gene ra t r i c e de X es t , e n vertu de (21),

il s 'ag i t d 'une l o ren t z i enne e t non d ' une gaus s i enne !

En physique, cet te distribution est caracteristique de la forme d'une raie dans lestransi t ions electromagnet iques . Get exemple ne signifie pas, cependant , que toutesle s raies mesurees experimentalement ont une forme lorentz ienne . No us verrons plustard que 1'appareil avec lequel on efFectue le s mesures modifie aussi la forme de la

dist r ibut ion et que, pour une dist r ibut ion de Lo rentz ini t iale, on peut mesurer une

distribution de Gauss. N otre exemple de la distribution de Lorentz, bien qu'il soittres impor tan t en physique, reste neanmoins une exception.

Pour illustrer le theorem e central l im ite, considerons quelques exernples. Commengons

par un exemple numer ique simple. Nous pouvons faire cette experience elementaire

a la maison : dans 1'annuaire te lephonique , choisissons 200 numeros au hasard et

calculons pour chaque numero la somme s4 des quatre derniers chiffres. Une telleexperience a ete effectuee avec "Les Pages B lanches" du depar t ement de 1'Isere de

1'annee 1999 ou nou s avons pris les 200 premiers numeros de la page 365. Les resultats

sont presenters sur la figure 1.11 sous la forme d 'h i s togramm e : nous avons repor te ,

pour chaque valeur de 8 4 calculee, sur ces 200 numeros, le nombre de realisations NS4.




II faut comparer ce resultat avec la distr ibution de Gauss representee par une ligne

discontinue :

avec les paramet res p,S4 = 18 et aS4 w 5, 2. Les valeurs de ces parametres ont ete

calculees selon (19) et (20) en supposant que chaque chiffre dans un numero tele-

phonique est distr ibue selon une distr ibution discrete constante avec une moyenne

(9 + 0) /2 = 4, 5 et une variance (9 - 0)2/12 = 6, 75 (a comparer avec (10) et (11)).

La coincidence entre la courbe et 1'histogramme est impress ionnante ! Notons que le

theoreme central l imite suppose que les dis t r ibut ions de Xi doivent etre le s memes et

independantes (ce qui semble etre credible dans notre experience). Alors la s omme sn,pour n termes dans la somme, aura une dis t r ibut ion proche de celle de Gauss lorsque

n — > • oo. Dans notre cas, n = 4, mais nous voyons que la distr ibution de Gauss est

deja une tres bonne approximat ion de la d is t ribut ion de §4.

Figure 1.11 : La dis tr ibut ion de la somme 5 4 des quatre derniers chiffres

dans un numero de telephone

Un autre exemple classique nous montre comment 1 'augmentation de // t ransform e la

distr ibution de Poisson en une distr ibution de Gauss4.

4 A cause de la ressemblance form elle entre les dis trib utio ns gamma et de Poisson, on peut util iser

exactement la m e m e approche pour demon trer que, dans la l imite a — > • oo , la dis tr ibut ion gamma

donne une distribu tion de G auss. Nous laissons cet exercice au lecteur.




Rappelons que, pour la distribution de Poisson (36), la probabil i te de t rouver n evene-

rnents dans un interv alle donne e st egale a

Augmentons la valeur du paramet re //. Les nombres d 'evenements H Q po ur lesquels

les probabili tes P^(UQ} sont sensiblement differentes de zero doivent etre proches de la

valeur // ; ainsi nous considerons la l imi te n»1 pou r laquelle nous pouvo ns util iser

la fo rmule de Stir l ing donnant n\

et ecrire la probabili te P ^ (n ) sous la fo rm e

Pour simplifier cette expression dans la l imite p,n»1, utilisons une approche

assez connue dite "methode du col". N ot re fon ctio n P ( j , ( n ) contient deux facteurs, le

premier , I / A / T I , qui varie lentem ent avec n et le deuxieme, e~n\ qui a une var ia t ion

tres rapide avec n du fait de la fonctio n exponentielle ; ici

On peut voir aisement que la fonct ion f^(n) possede un seul m in im um pour n — p , et

qu'elle peut etre developpee en serie de Taylor au voisinage de ce point :

Nous avons utilise ici le fait que /M (/ /) = 0 et f'n(^) = 0, car n — p , est un m in im um

de la fonction, et nous n 'avons garde que le premier t e rme non nul . C o m m e nous

1'avons deja remarque, la probabili te P^(n] ne sera sensiblement differente de zeroqu'au voisinage de n — / j , . Au-dela de cette region, elle est tres petite a cause de lafonction expone ntielle decroissante. A u voisinage de ce poin t , on peut ecrire que

Dans cette expression, nous avons remplace la fonction qui varie lentement avec n par

sa valeur au point n = p. La distribution ainsi obtenue est une dis tr ibut ion de Gauss

avec une moyenne p , et un ecar t- type ^/Ji. D'ailleurs, il est tou t a fait normal que la

moyenne et la variance restent le s memes que pour la dis tr ibut ion de Poisson. Surla figure 1.8, nous avons donne quelques exemples de la distribution de Poisson avecplusieurs valeurs de / j , . Plus la valeur de p est grande, plus la dis tr ibut ion devient

symetr ique par rap po rt au maxim um q ui est aussi la valeur m oyen ne.

Nous avons deja vu au paragraphe 1.3.2 que la distribution de Poisson peut etre

obtenue a partir de la distr ibution binomiale lorsque le nombre de mesures N est

grand et que p est petit , le produit p = Np restant constant. Cela signifie egalement

q u e , dans le cas d'un grand nombre de mesures, la distr ibution binomiale tend vers




la distr ibution de Gauss. Cependant, il faut interpreter ces l imites avec precaution.

On ne peu t pas dire que la distr ibution de Gauss est un cas par t icul ie r de celle de

Poisson lorsque f j , — > • oo. La dis t r ibut ion de Gauss generale est caracterisee par deux

paramet res independants : la valeur moy enne et 1'ecart-type. La distr ibutio n de Gaussobtenue de la dis t r ibut ion de Poisson dans la limite // — » oo ne depend que d'un seul

pararnetre .

Sur la figure 1.12, nous recapitulons les relations entre ces trois distr ibutions.

Un autre exemple d 'une distr ibution qui tend vers la distr ibution de Gauss quand le

nombre de mesures augmente sera donne plus loin lorsque nous etudierons la distri-

butio n de Stude nt (en 4.3) .

Pour 1'instant, considerons un exemple physique instructif issu d 'une experience reelle

ou nous verrons le fonct ionnement du theoreme central l imi te dans sa deuxieme for-mulation ainsi que ses condit ions de validite . II s'agit d 'une experience recente faite

au C E R N sur un enorme anneau d 'acce lerateur de par t icules dont le per imet re est

de 27 kilom etres. Pour etud ier les prop rietes fondam entales des part icules elemen-

taires, les exper imentateurs du CERN ont eu besoin de determiner avec une tres

grande precision 1'energie des particules qui tou rnen t dans 1'anneau de Paccelerateur.

En augmentant la precision de leurs mesures, le s physiciens ont decouvert a un cer-

tain stade un phenomene t res etrange : 1'energie du faisceau variait selon les heures

de la jou rnee. On a du consacrer beauc oup de temps et d'efforts, rejeter beaucoup

d 'hypo theses avant d 'arr iver a comprendre et a demontre r que 1'origine de ce com-por tem ent bizarre se t rouvai t dans le mouvem ent de la Lune autour de la Terre. Get

effet gravi tat ionnel est clairernent visible sur 1'ocean : c'est le phenomene des marees .

Cependant, cet effet existe aussi pour la croute terrestre et donne lieu a des deplace-

ments d 'environ trente cent imetres chaque jo ur . Cet te var iat ion minim e cumulee sur

tou te la l ongueur de 1'accelerateur modifie sa circonference de 1 mm et change ainsi

1'energie des part icules.

Ce cas, assez cur ieux, donne a la fois un exemple d 'erreur systemat ique liee a la ne-

gligence d 'un phenom ene phys ique e t donne une be lle i l lus t rat ion du "mecanisme" du

theoreme central l imite ( la necessite d'avoir plusieurs pe ti ts facteurs). II y a beaucoup

de facteurs qui peuvent influencer 1'energie des particules dans un accelerateur : les

variations du c h a m p magnet ique te r res t re , les changements de pression barometr ique,

le mou ve me n t de la Lune , e tc . Chacun de ces facteurs parait etre peu imp or t an t . S i

c'est le cas, et si 1'on ne recherche pas une trop grande precision, les conditions du

theoreme central limite sont satisfaites et la distr ibution d 'une valeur physique reste

gaussienne. Des qu'o n veut au gm enter la precision d 'un e experience, les facteurs

qui auparavant eta ient supposes negligeables devienne nt im por tants e t se manifes tent

sous forme d 'er reurs systematiques .

Soulignons le s conclusions a re tenir . D'abord , pour la plupar t des experiences phy-

siques faites au laboratoire, 1'hypothese selon laquelle la dis t r ibut ion d 'une grandeur

physique est une dis t r ibut ion de Gauss consti tue une t res bonne hypothese de depar t .

C'est le t heoreme central limite qui nous le garant i t . De plus, si jamais on a le moindre

doute sur la forme de la distr ibution, ce meme theoreme nous indique comment on

peut contourner le probleme : il fau t faire plusieurs mesures et travailler sur la valeur

moyenne qui est forcement decrite par la distr ibution normale.




Figure 1.12 : Les relations entre le s dis tr ibut ions binomiale , de Poisson et de Gauss

Neanmoins, il ne faut pas oublier "le point faible" de ce theoreme : c o m m e c'est un

theoreme l imite, le nombre de mesures doit etre grand, et done 1'experience peu t

devenir chere. Pour controler la deviation a la loi gaussienne et savoir combien de

mesures sont necessaires, une analyse plus approfondie est indispensable : elle est

1'objet des paragraphes suivants.



Cette page est laissée intentionnellement en blanc.



C H A P I T R E 2

F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E

On peut formuler un probleme assez general et tres impor tan t pour les applications

physiques. Supposons que soit connue la fonc tion de distr ibution de probab il i ty f(x)

d'une variable aleatoire x (en particulier , la moyenne de cette distr ibution

sa varianc e Quelle est alors la fonction de distr ibution de probabil i te

g(y) d'une variable aleatoire y (e n par t icul ie r , p,y et < j y ) lorsque la relation entre y et

x est donnee par une fonction connue y = y(x) ? C'est, en statistique, le phenomenede la propagation des erreurs.

2.1 P R O P A G A T I O N DES E R R E U R S

Au chapitre precedent, nous avons vu que la valeur moyenne et la variance sont le s

caracteristiques majeures d 'une d is t r ibut ion de probabi l i tes . Elles peuvent m e m e

etre suffisantes pour decrire toute la distr ibution et Ton les interprete alors commevaleur de la grandeur et son incert i tude (er reur ) . Ceci est vrai , en part iculier , dans

le cas de la distribution de Gauss qui est la plus f requemment rencontree dans les

experiences. C'est pourquoi nous aliens trou ve r d 'abord la relation entre les mo yennes

et les variances de x et de y — y(x). La relation entre les variances porte le nom de

la form ule de propagation des erreurs.

2 . 1 . 1 F O R M U L E DE P R O P A G A T I O N DES E R R E U R S

Commengons s implement par chercher la relation entre px et c r ^ , d 'une part et p,y

et < 7 y , d 'autre part. Nous nous l imitons, pour 1'instant, au cas d 'une seule variable

y = y ( x ) .

Developpons cette fonction en serie de Taylor au voisinage de x — p,x :




La valeur mo yenne de y est egale a

L'approximat ion standard consiste a negliger dans cette expression tons les termes

sauf le premier :

C'est un resul ta t qui pour ra i t semb ler evident mais cette expression est approximat ive .

Elle n'est exacte que si la fonction y(x] est l ineaire.

D'une fagon tout a fait analogue, nous pouvons calculer la variance de y :

A par t i r du developpement en serie de Taylor (48) nous avons :

Pour conserver la coherence de nos expressions, gardens un iquement l e t e rme l ineaire.

Alors,

soit

II s'agit encore d 'une expression approchee qui ne prend une valeur exacte que si la

fonction est l ineaire . Nous reviendrons sur la precision de cette approximation a la

f in du chapitre .

N ous pouvons generaliser le s resul ta ts (49) et (50) au cas de plusieurs variables. Soit

une fonct ion de n variables. Pour abreger, utilisons des nota-t ions "vectorielles" :

ic i Developpons la fonct ion en serie de Taylor au voisinage de x = jl. A u

premier ordre , on obt ient :

Cette expression donne pour la valeu r m oyen ne



I I — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 53

et pour la variance :

Supposons que les variables xi soient independantes (nous verrons dans ce chapitre le

cas plus general sans cette hypothese supplementaire) . Alors

Finalement, pour 1'ecart- type < r y , on obtient :

Nous avons ainsi resolu le prob lem e pose au debut du parag raph e. L'expression (54)

permet de calculer 1'ecart-type ay de y si les ecarts < 7 Z - de Xi sont connus.

Reecrivons cette derniere formule en remplagant1

ax et ay par A a ? et Ay :

Ici, toutes les derivees sont calculees pour x\ — H i, x - 2 = j J > 2 , • • • , xn — Hn, c'est-a-direque tous le s x ^ doivent etre remplaces par leurs valeurs moyennes fa .

Soulignons encore une fois que pour obtenir cette expression nous avons utilise deux

hypotheses impor tantes : la premiere est 1'independance des grandeurs a ? , - , la deuxieme

est que, dans le developpement en serie de Taylor de y, nous nous l imitons seulement

aux deux premiers termes.

2.1.2 EXEMPLES DE PROPAGATION DES ERREURS

Les exemples le s plus simples et les plus frequents concernent la somme et le produit

(ou le rappo rt) de deux valeurs physiques. Pour la somm e de deux valeurs x\ et x - i

['expression (55) s'ecrit

car les deux derivees sont

1 Rappelons que, dans ce livre, nous conservons les "anciennes" notations A:r au lieu de ux.




Pour le produi t de deux variables

les derivees sont

et la formule (55) don ne

Dans cette expression ainsi que dans les expressions suivantes nous ecrivons x\ et x %

a la place de /^ i et .Ce choix est volontaire car exper imentalement il est possiblede de terminer mXl et mX2 et non //i et ^2- Pour ne pas in t roduire chaque fois de

nouvelles notations, gardens partout x\ et x - ± qui ne representent pas des fonctions

mais des valeurs experimentales.

D'une fagon analogue, pour le rapport

nous obtenons

Les deux dernieres expressions de Ay peuvent etre reunies sous une forme plus com-

mod e si Ton passe a 1'incertitude relative A y / y :

Cet te formule se generalise facilement au cas du produ i t et du rappor t d 'un nombre

arbitraire de n variables :

Les formulas (56) et (58) ont une structure similaire : la racine carree d 'une somme

de carres. Po ur des estim ations rap ides et simplifiees, on appl ique les majorat ionssuivantes :

et



II — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 55

(on "deduit" parfois cette formule en calculan t la derivee de log y). Cependant 1'utilisa-

t ion de ces majorations n'est justif iee que si Ton veut une evaluation grossiere de

Pincer t i tude . La difference entre la vraie valeur de 1'incertitude (58) et sa majoration

( 6 0 ) peut etre importante. Par exemple, s i 1'on suppose des incertitudes relatives surX i de 5% , la formule exacte donne une incertitude Ay/y = 7% , tandis que sa majora-

t ion conduit a une valeur beaucoup plus grande : 10% ! Plus les variables sont nom-breuses, plus la difference est grande. Ceci s 'explique simplement car 1 'augmentation

de 1'incertitude en fonction du nombre n des variables est en ^Jn dans 1'expression

(58') et en n dans la majorat ion du type (60).

L'expression (55) ou les cas particuliers (56) et (58) donnent une idee sur la fac,on de

diminuer 1 ' incert i tude : il faut toujours se battre contre la plus grande incert i tude.

Si une des incertitudes est seulement trois fois plus petite que les autres, on peut

prat iquement la negliger. Cette approximation donne une erreur supplementaire de

10% dans les calculs d ' incert i tude (c 'est une erreur de deuxieme ordre ) .

Le meil leur choix des condit ions experimentales (des appareils et des m ethodes de

mesure) consiste a avoir si possible les m em es contr ibutions de toutes les variables

differentes dans 1'expression (55), ce qui minimise cette incert i tude.

Parfois, nous rencontrons des fonctions plus compliquees. Prenons un exemple :

Nous pouvons appliquer la formule (55) directem ent. Pour le faire nous calculons le s

derivees :

et obtenons 1'expression suivante de 1'incert i tude su r y :

Le probleme est que, pour des fonct ions compliquees, nous obtenons toujours un

resul tat "complique" et qu'ainsi la probabil i te d'avoir une erreur ar i thmet ique lors de

la derivation ou lors des applications numeriques est t res grande.

II est preferable de proceder autrement : on decompose la fonct ion initiale en fonct ions

elementaires et on fait les operat ions successivement. Dans 1'exemple precedent :

Pour chaque formule , on obtient aisement les incert i tudes :

La probabi l i te d 'erreur dans cette approche est beaucoup plus faible.




II existe un aut re avantage a cette procedure, celle de permettre d 'analyser facilement

le role et la contr ibut ion de chaque variable # , - . Soient

Nous voulons calculer 1'incertitude de y a 10% pres. Nous voyons que Ax2/x% est

beaucoup plus grande que A£3/£3. Ainsi, 1'expression de A z2 peu t etre simplifiee

par

Nous notons aussi q ue Az% ~ 1 est beaucoup plus grande que Axi = 0 , 1 e t ainsi,

pour A z i , nous obtenons 1'expression

Finalement, 1 ' incert i tude sur y est egale a

une expression beaucoup plus simple que (61). Le resultat est y = 2, 5 ± 0, 2.

II fau t souligner que 1'exemple precedent n'est pas artificiel. La raison de ce ph enom ene

un peu etrange est liee au fait qu' i l est difficile d'effectuer une experience ou toutes

les sources d' incer t i tudes ont la m e m e impor tance : il existe une ou deux incert i tudes

dominantes . II faut en profiter car le gain de temps dans le calcul de 1'incert i tude

peut etre assez grand, surtout pour des mesures repet i t ives . De plus, cette analyse

par etapes est utile pour elucider les veritables sources d ' incert i tude s et ainsi prevoir

des possibilites d 'ameliorat ion de 1'experience.

Notons une fois de plus que notre expression (55) n'est pas une formule exacte. Dans

sa demons t ra t ion , nous avons suppose que le developpement en serie de Taylor peut

etre limite a la derivee premiere . A utrem ent d i t , nous remplagons l a fonc t ion y = y(x)

par la fonct ion l ineaire :

Cet te hypothese signifie que la forme de la distr ibution reste inchangee : si x, par

exemple , est dist r ibute selon une loi normale, y est aussi dist r ibute selon une loi

normale .

II existe des situations ou la derivee y'(^) s 'annule et cette approche n'est plus valable.

Un exemple est donne par la fonct ion y = x2

avec // = 0. La dis t r ibut ion de Gauss

est remplacee par la distribution ^2

(voir paragraphe 3.1.3).

II existe des situations moins "dramatiques" ou la derivee est non nulle mais ou il faut

tenir compte des derivees superieures. Par exemple pour la fonct ion y = cotg x et




assez differente de

pour laquelle, pour les fonctions "rapides", 1'ecriture y expiA y est remplacee par

:) | et At/2 = \y(x — Aar) — y(x}\. Dans notre cas,

La valeur de y ne suit plus une distribution de Gauss, cependant, la probabilite que la

vraie valeur de y se trouve dans Pintervalle [y exp — Ayi, y exp + A 3 / 2 ] reste "gaussienne",

a peu pres 68%.Nous reviendrons sur cet aspect du probleme, a la fin du chapitre,lors de la discussion sur les intervalles de confiance.

Ce phenomene peu t apparai t re m em e pou r un monorne y = xn

lorsque x n'est pas

tres grand par rapport a Ax. C'est pourquo i il faut toujou rs se souvenir que n otre

approche app roxim ative n'est correcte que si les ince rti tudes restent petites.

2.1.3 CAS DES VARIABLES CORRELEES

Cherchons a general iser la formule de propagation des er reurs (54) au cas de p lus de deux

var iab les corre lees . Nous considerons le passage de n var iab les {xj} a n va r iab l es {yi}

liees entre elles par des re la t ions generates :

Nous voulons t rouver la re la t ion en t re le s matr i ces de covar i ance de x et de y. D e man i e re

ana logue a (23),on de fm i t la matr i ce de cova r i ance par :

De m e m e , D(y) =cov(y, y). Nous ut i li sons la le t t re D pour ce t te mat r i ce dans le but de

souligner sa relation avec la var iance (24).

C o n f o r me me n t au (51), nous avons :

en acco rd avec (52).

C'est la raison




Un e l emen t cov(yi,yj) de la mat r i c e de c o v a r i a n c e D(y) s 'ec r i t

lei, pour l es va leurs moyennes appara issant dans (63) , nous avons des expressions plus

comp l iquees q ue (53) :

L 'express ion (assez vo lumineuse) de la ma t r ice de covar iance D(y] peut e t re ecr i te sous

une forme beaucoup p lus compac te s i T on introduit la mat r ice du Jacob ien de la t rans -

formation (62 ) :

Toutes les der ivees sont ca lcu lees au point x = jl. A I 'a ide de cette mat r i ce ( ' express ion

(63) s 'ec r i t :

la mat r ice J etant la matrice t ransposee de J.

Dans not re exemple illustratif du p a r a g r a p h e 1.1.5, nous avons chois i une t r ans fo rma t i on

l ineaire Solent xi e t x? deux grandeurs phys iques independantes avec la m e m e moyenne

/j et la meme va r i ance d1. In t roduisons deux grandeurs y\ e t y^ qui leur sont l iees pa r

une relat ion l ineaire :

la mat r i ce de covar iance de x es t d iagona le :

la mat r i ce du Jacob ien s 'ec r i t comme



II - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 59

e t ainsi la matrice de c ova r i a nc e D(y] e s t donnee par :

Comme illustration de la formule de propagation de s e r r eu r s d a n s le cas d e s v a r i ab l e s

cor re l l ees , cons ide rons un exemple d an s lequel nous voulons determiner la v a l e u r d'une

r es i s tance R a ins i que la pu issance P degagee par cette resistance. Si nous c onna i s s ons le

c o u r a n t / qui traverse la r es i s tance et la tension U aux bornes de ce l l e - c i , nous trouvons

immediatement

Le s incertitudes r e l a t i v es sur R et P sont se lon (58)

et

Nous aurions pu choisir une autre approche. En ayant calcule la valeur de la resistance

R — U/1, nous pouvons determiner P a partir de la formule

P =RI2.

Cette relation, compte tenu de (66), nous donnerait

e n contradiction evidente avec (67). Ou se trouve I'erreur dans notre raisonnement ?

Pour obtenir I'expression (55) nous av o n s utilise I ' i ndependa nc e des va r i a b l e s , lei, cette

hypothese n'est passatisfaite car R et / ne peuvent pasetre consideres comme variablesi n d e p e n d a n t e s . Done, la relation (68) n'est pa s correcte.

Pour montrer formellement la correlation entre R et P nous utilisons la procedure d e c r i t e

au debut du paragraphe et nous calculons le Jacobien (64) de passage des variablesU,I.

aux va r iab les P, R :




La mat r i c e de covariance (65) D(P, R ) prend la forme

C o m m e il se doit nous re t rouvons sur la d iagona le les express ions des incer t i tude s

qui peuvent etre reecr i tes sous l es fo rme s (67 ) e t (66 ) respe c t i vem ent , alors que l es

elements non diagonaux nous donnent la covar iance de R et P

I I est i n t e ressan t de remarquer que la cor re la t ion en t re P et R e s t nul le l o r sque l es

cont r ibut ions a I ' incer t i tude AP e t A/?, de la t ens ion et du courant sont ident iques

I I s 'ag i t d 'un a rgume nt supp l emen ta i r e pour e f fec tuer l es mesures en fa i san t en sor te que

toutes le s contributions des di f fe rentes sources d ' incer t i tude so ien t a peu pres le s memes .

Pour retrouver I 'expression correcte de AP, a partir de P = R,P, compte tenu de la

cor re la t ion en t re R et /, ca l cu lons d ' abo rd cov (P t , /). D'apres (63 ) , nous avons :

En ver tu de I ' independance de deux va r i ab l es / et U

Done ,

L ' incer t i tude s u r P s'ecrit a lo rs :

En utilisant le s express ions des derivees



I I - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 61

et la formule (69) , nous obtenons

en accord avec les express ions (66) e t (67 ) .

2.2 D I S T R I B U T I O N DE P R O B A B I L I T E D ' U N E F O N C T I O N

D E V A R I A B L E A L E A T O I R E

Nous pouvons ma in tenant resoudre un prob leme plus complexe e t t rouver la fonction dedistribution de la v a r i a b l e y = y(x] qui es t une fonction d 'une va r i ab l e a lea to i re x.

2.2.1 F O N C T I O N B I U N I V O Q U E

Nous

qu

sur

> u s supposons , tout d 'abo rd , q ue cet te fonction y =y(x] e s t biunivoque, c 'es t -a-d i re

'a une va l eu r de x cor respond une seu le v a l e u r de y e t i nversement . Nous presentons

la f igure 2 .1 un exemple de fonction de ce type .

Figure 2.1 : Une fonc t ion b iunivoque y = y(x)

Nous savons que la probabilite de t r ouve r la v a l e u r de x dans I ' i n te rva l l e compr i s en t re x

e t x + dx est egale a :




Nous cherchons la fonction g(y) qu i nous donne la me me probabil i te de t rouve r la va l eu r

de y dans I ' i n te rva l l e compels entre y e t y + dy :

II su f f i t de reecr i re (70)en r emp lacan t x par y. Pour cela nous devons, d 'abo rd, in t roduire

la fonction inverse :

Ceci est possible car notre fonction y(x) es t biunivoque. On a alors

II nous reste a remp lace r dx par dy c o m m e nous le fa isons dans les changements de

va r iab l es d ' in tegra t ion . La seule dif ference reside dans le fait que la dens i te de probabi l i te

ne peut jamais e t re negat ive . C'es t pourquoi nous defmissons

si la der ivee dx(y)/dy est posi t ive , et

s i la der ivee dx(y]/dy es t negative. Les deux dern ie res expressions peuvent etre reunies

sous une f o rme compacte :

Les fo rmu les (72)e t (73)nous donnent

La comparaison avec (71) nous permet d 'ob ten i r le resu l ta t f ina l :

2.2.2 CAS GENERAL

Si la fonction y = y(x] n 'es t pas biunivoque (f igure 2.2), la t ache devient un peu plus

compl iquee . II faut d'abord in t rodui re toutes le s branches un ivoques pour la fonction

inverse : x\ — x\(y\x-2 — x^y],... ,X k =Xk(y), puis faire la s o m m e s ur tou tes ce s

branches (la probabil i te de t rouver y dans I ' in te rva l le entre y e t y + dy e s t egale a la

s o m m e de tou tes l es p robab i li tes d 'app ar i t ion de x entre Xi e t Xi -f dxi].



I I — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 63

Figure 2.2 : Une fo nct ion non b iun ivoque y — y(%)

A ins i la genera l i sa t i on de I ' express ion ( 74) s'ecrit

Prenons I 'exemple y(x) = x2, avec une fonction de distribution de probabilite de x egale

a f(x). La fonction y(x) =x2 n ' e s t pasb i u n i v o qu e car pour deux va l eu r s de x di f fe rentes

on peu t avo i r la meme v a l e u r de y : y(x) — x2

— ( — x }2

. II existe done d e u x branches de

la fonction inverse :

Leurs der ivees son t :

A i n s i l a dens i te de probab i l i t e g(y] e s t donnee par

soit




L e s formules obtenues sont va lab les dans le cas d'une fonction d 'une va r iab l e y = y(x).

O n peut le s facilement genera l i se r au cas ou nous voulons passer de n var iab les inde-

pendantes x\,x^, .. • , xn = x a n va r i a b l e s i ndependa n tes j/i,y2, • • • > 2/n = y a I 'aide

d 'une transformation y,- = y«(a? i , £ 2 , • • • 5 #n) = yi(x). Alors la densite de probabi-

lite /(xi,# 2 , . . - , xn) = f(x) (voir (18)) se transforme en une dens i te de probabi-

lite < / (y i , 7 / 2 , • • • ,yn) = d(y) a I 'a ide d 'une relation qui est la genera l i sa t ion de (74)

etablie dans l e cas d ' une seu le va r i a b l e . II faut introduire la transformation inverse

Xi = Xi(yi,y2j ... ,yn) =X i ( y ) . La dens i te de probabilite g(y) est

o u | 5 (a? i , x < 2 , . . . , xn)/d(yi, y % , . . . , yn}\ es t l a va l eur abso lue d u Jacob ien d e cette t rans -

formation. Cet te formule e s t a na l ogue a ce l le ut i l i see pour un changement de va r i a b l e s

d'integration. La seule d i f ferenc e es t la prese nce du module deja discutee p r c e d e m m e n t .

Pour le s fonctions qui ne sont pas b iun ivoques , il f audra fa i re la s om m e sur tous le s

branches comme on I 'a fait pour une fonction y — y(x).

2.2.3 EXEMPLE PHYSIQUE

Pour montrer 1 ' importance de ce type de problemes, non seulement pour la statis t ique

mais egalement pour la phys ique en general prenons un exemple i l lustratif . II s'agit

d'une collision elastique entre deux corps (deux particules) de meme masse m. D'apres

le s principes bien connus de la mecanique , nous savons que le mouvement des deux

corps est la resul tante du mouvement du centre de masse et du mouvement relatif

par rapport a ce centre . Habi tue l lement , on in t rodui t un systeme des coordonnees

correspondant au centre de masse car c'est dans ce referentiel que la description

theor ique de 1'interaction entre le s deux corps est la plus simple. Cependant, 1'etude

experimentale se fait dans le systeme dit du laboratoire , c'est-a-dire dans le systeme

ou, avant la collision, un des corps etait au repos. Supposons que nous connaissions le s

caracteristiques de 1'interaction dans le systeme du centre de masse avec, par exemple,une distr ibution angulaire isotrope des particules apres la collision. Qu'observons-

nous exper imentalement , au t rement dit,quelle sera la distr ibution angulaire dans le

systeme du laboratoire ?

Avant de chercher la relation entre les deux fon ctions de distr ib utio n ang ulaires, rap-

pelons la relation entre le s angles de diffusion dans le systeme du laboratoire (fig-

ure 2.3 a) et dans le systeme du centre de masse (figure 2.3 b).

Avant la collision dan s le referentiel du laboratoire , un corps se deplace avec une vitesse

V Q et le deuxieme est fixe. Apres la collision, les deux particules out des vitesses V\et V < 2 qui font les angles 9\ et 9 - 2 avec le vecteur VQ . La collision es t elastique, c 'est-a-

dire que la s t ruc ture in terne des particules reste intacte et que 1'energie cinetique est

conservee. Ainsi les lois de conservation de 1'energie et de I'impulsion




Figure 2.3 : Les vitesses et les angles dans le systeme du laboratoire (a)

et dans le systeme du centre de masse (b)

nous montren t que V\ et V z sont perpendiculaires :

La vitesse du centre de masse est egale a

Dans le systeme du centre de masse (figure 2.3 b ) , le s par t icules ont les vitesses v{ et

V 2 de modules egaux mais de direct ions opposees :

Apres la collision, les modules des vitesses restent inchanges en vertu de 1'elasticitede la collision :

et la collision donne lieu "simplement" a une rotation d'un angle x Quieg

t 1'angle de

diffusion dans le systeme du centre de masse. Dans le systeme du laboratoire apres

la collision, le s vitesses sont egales a :

Si Ton represente graphiquement (figure 2.4), par exemple , la premiere re la t ion, on

voit toute de suite que




Figure 2.4 : Relation entre les angles dans le systeme du laboratoire

et dans le systeme du centre de masse

Deux relations lient les angles polaires de diffusion dans les deux system es. L'an gle

azimutal, bien evidemment , reste invariant et nous le designerons par < p .

Par ailleurs, I'angle solide dans le systeme du centre de masse d$lcm = siuxdxdtpe§t

lie a Tangle solide dans le systeme de laboratoire d£liab = sinOidOidp par la relation

Comme nous 1'avons dit,dans le systeme du centre de masse la dis t r ibut ion angulaire

est isotrope. Cela signifie que la probabi l i te dP que la particule 1 parte dans un angle

solide dQcm divisee par d£lcm ne depend pas de Tangle :

La valeur de cette constante est egale a 1/47T car la probabil i te est normee a 1. V u la

relation entre le s angles solides (79), nous pouvons reecrire /Cm ( X; V7

)s°us la forme

Ainsi nous avons la distr ibution angulaire dans le systeme du laboratoire qui d 'apres

( 7 8 ) s'ecrit :

Les deux fonct ions de distribution sont representees sur la figure 2.5.

La conclusion physique est tres simple : une distribution angulaire isotrope dans le

systeme du centre de masse se manifes tera exper imentalement par une dis t r ibut ion

anisotrope dans le systeme du laboratoire . De plus, on peut econom iser du tem ps en

restreignant les mesures a 9\ < 7 T / 2 .

Du point de vue m athem a t ique , nous avons vu que le changement des variables angu-

laires imp lique une m odificatio n de la forme de la distr ibution (la fonct ion constante

a ete remplacee par une fonction l ineaire).

66



I I - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 6 7

2 . 2 . 4 PRECISION DE LA F O R M U L ED E P R O P A G A T I O N D E S E R R E U R S

Nous avons deja souligne que la formule de propagation des erreurs, largement utilisee

dans le t ra i tement des resultats exper imen taux , est une formule approchee (sauf dans

le cas presque trivial d'une fonction lineaire). Cette approximation est parfois assez

grossiere puisque pour obte nir la formule de propagatio n des erreu rs nous avons utilise

la relation (49) : y(x) ~ y ( ~ x ) , alors que toute la statistique est basee, par la definition

de la variance, su r 1'importance de la difference entre y — x2

et y ~ ~x2.

Dans certains cas, nous pouvons obtenir 1'expression exacte de la variance a^ sansutiliser la formule de propagation des erreurs. Considerons Pexemple tres simple d'un e

fonction produit de deux variables independantes :

Cette fonct ion peut etre mise sous la forme equivalente :

c'est-a-dire sous la forme d 'un developpement en serie de Taylor au voisinage du point

xi = //!, x - 2 ~ f J . 2 - L'expression (80) contient un nombre fini de termes : une constante

U i «2 ; les contributions avec les derivees premieres

et un seul terme avec le s derivees secondes puisque

Compte tenu de 1'independance de x\ et # 2, nous pouvons calculer exactement lavariance d e y :

Figure 2.5: Les distributions angulaires dans le systeme du cne tre de masse (s)et dans le systeme du laboratorie(b)




La formula de propagation des erreurs (57)

est obtenue en negligeant le dernier terme dans le developpement (80). Ainsi cette

formule condui t a une erreur supplemental dans le calcul de ( A y )2

= a^ egale a2 9«

On pourrai t penser qu' i l est facile d'amel iorer la fo rmule de propadgation des erreurs

en poussant plus loin le developpement de la fonction en serie de Taylor. Cette

proposition apparait dans certains l ivres sur 1'analyse des donnees. Techniquement ,

c'est un exercice simple, bien qu'il soit assez penible (il faut faire t res at tent ion et

garder correctement tous les termes de meme ordre dans le developpement et dans

les calculs intermediares). Cependent des problemes majeurs apparaissent dans cettevoie.

Considerons 1'exemple simple d'une fonction d'une seule variable y — y(x). Comme

pour la fo rmule de propagation des erreurs , developpons cet te fonct ion en serie de

Taylor au voisinage de x — px = ~ x :

Nous conservons volontaireme nt le t e rme du troisiem e ordre car il donnera en fait une

contr ibut ion a la variance du mem e ordre que le t e rm e du seconde ordre. L a valeur

moyenne de y prend alors la fo rme

ou apparait le troisieme moment de la distr ibution pxs = (x — x)3

introduit en (12),

qui caracterise I 'asymetrie de la dis tr ibut ion de x. Ainsi , pour la variance, nous

obtenons

ou est en outre introdui t le qua t r ieme moment ^4 = (x — x}4.

Le probleme est resolu formellement mais le prix a payer est 1'introduction de mo-

ments centraux d'ordres superieurs non utilises jusqu'a present et dont la determina-

t ion experim entale peut s 'averer delicate. Pou r obtenir une expression plus precise

de la variance, on a sacrifie la simplicite de la description des grandeurs physiques.

Rapp elons, que dans la plup art des situations, no us travaillons avec des distr ibution s

gaussiennes. La prise en com pte du terme lineaire dans la formule de propagat iondes erreurs nous garant i t la conservation du langage utilise (la variable y est aussi

decrite par la dis tr ibut ion normale ) . II est vrai que, si x est decrite par une distri-

bu t ion gaussienne, nous pouvons exprimer tous les moments d'ordres superieurs a

1'aide de la variance (voir (27)), mais le probleme vient du fait que la variable y n'est

plus gaussienne (on peut verifier que la distribution de y est asymetr ique : ny3 7 ^ 0).

Quand la dis tr ibut ion de y est gaussienne, un ecar t- type < j y a une in terp re tat ion pre-

cise. Dans le cas contraire il peut la perdre. La question qui se pose est de savoir s'il

68



I I — FONCTIONS D ' U N E V A R I A B L E A L E A T O I R E 69

est Pinteressant d'obtenir une expression plus precise de 1'incertitude d 'une grandeur

physique si To n ne peut plus 1'interpreter avec precision.

Pour mieux comprendre , etudions sur un exemple le "passage" d'une dis tr ibut iongaussienne a une distrib utio n plus com plexe. Soient x± et X2 deux variables gaus-

siennes. Quelle est la distribution de leur rapport

Appliquons 1'approche generale presentee dans le paragraphe 2.2.2. II faut passer des

variables x\ et x^ aux variables y et z = # 2 (cette de rniere jou e le role d'une variable

auxiliaire) et integrer sur z.

Pour s imp l i f i e r l es re la t ions, supposons que le s va leu rs moyennes //,• sont posi t ives et que

les incer t i tudes sont fa ib les par rappor t aux va leurs moyennes ( < r z - <C f J - i ) - Cela signif ie

que la distribution cherchee reste proche d 'une distribution gauss ienne. S i /(#i) e t /(x^)

sont les fonctions de distribution de s va r iab l es x\ e t x - z

selon (77), la fonction de distribution g(y) de la va r iab le y prend la forme

Le Jacob ien de la transformation x\ — yz, x % = z es t ega l a

Ains i I ' in tegra le g(y) prend la forme

Cet te dern ie re in tegra le peut etre calcu lee s i T on utilise la va leur de I ' in tegra le aux i l ia i re 2

2 L'astuce pour calculer J(A, B) est classique : il faut utiliser la methode de derivation par rapport

au parametre B :

La derniere integrale se remene a I'integrale connue (25) par le changement lineaire de variable

y =VAz - B/2VA.




on trouve finalement apres quelques calculs

laborieux mais sans difficulte majeure

Dans cette expression

La fonct ion (81) s'ecrit sous une forme qui ressemble beaucoup (sur tout si Ton fait

1'approximation supplementaire A Q ( y ) / A2( y ) w 1) a la distribution de Gauss, mais

sa largeur depend de y.

Un exemple d 'une tel le distr ibution est t race sur la figure 2.6 ( p ou r / ^ i / / /2 — 1,

Figure 2.6 : La fonction de distribution g ( y ) de y = x\jx2 (ligne continue) comparee

a une fonction gaussienne (ligne pointillee).

On constate que,lorsque les incertitudes relatives sont faibles ( < T J < C Hi), la fonction

de dis t r ibut ion g(y) est tres proche d 'un e gauss ienne : c'est une fonct ion qui est tres

piquee au voisinage de y = yo = pi/Hz (on

peut done garder la dependance rapide de

y dans la fonction expon entiel le , mais rem placer parto ut ail leurs y par yo) avec une

largeur ay dont le carre est egal a



II - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 71

Done, en premiere approximation, on retrouve une distr ibution gaussienne avec une

moyenne yo = ^1/^2 et une incertitude ay en parfait accord avec la formule de

propagation des erreurs (55).

Si Ton veut ne pas se limiter a de cette approximation, on peut remarquer que la

fonction g(y] n'est pas tou t a fait symetr ique par rapport a y = yo et aucune gaus-

sienne, meme avec une largeur calculee a partir de la formule de propagation des

erreurs amelioree, ne peut decrire correctement cette distr ibution. Ce fait est illustre

sur la figure 2.6 ou la fonction de distribution (81) est comparee avec une fonction

gaussienne pour laquelle la moyenne y sup et la variance < r ^ u sont calculees a 1'ordre

superieur du developpement en serie de Taylor3

Notons que ces valeurs sont tres p roches de la moyenne / j y et de la variance c r ^ calculees

avec la fonction de distribution (81) :

Neanmoins, la difference entre ces deux fonctions est evidente.

On remarquera que la nouvelle fonction (81)depend de trois variable yo = ^1/^2,

< T I / / - I I et o ~ 2 / H 2 i tandis qu'une gaussienne ne depend que de deux variables. En

principe, des mesures precises de la fonction de distribution g(y) peuvent permettre

d'avoir non seulement des informations sur la variable y mais aussi sur x\ et x < ± (une

des qua t re caracterist iques des dis tr ibut ions initiales / / i , < T I , j j . 2 , & 2 restera toujoursinconnue mais on pourra avoir les rapports entre elle et les autres) .

En conclusion de ce paragraphe, on constate que "Pameliorat ion" de la formule de

propagation des erreurs, grace a 1'augmen tation du nombre de termes dans le develop-

pement en serie de Taylor, ne represente aucune dimcul te . Mais cela n'a pas beaucoupd'interet puisque 1'interpretation du resultat obtenu en termes de probabilites resteassez limite.

2.3 NlVEAU DE CONFIANCE ET

INTERVALLE DE CONFIANCE

Nous avons deja etudie des distributions tres differentes : sym etriques et asymetriques ;

definies sur un intervalle fini, demi-infini et infini ; determinees par un ou plusieursparametres. Si nous conservons la meme approche, la description des donnees experi-mentales dev ient assez lourde (po ur chaque grandeur phy sique on est oblige d' ind iqu er

la loi de probabilite et ses parametres). Sans doute , une telle approche est indispen-

sable pour rester precis dans la description des donnees (sans approximer les distri-

butions de toutes le s grandeurs par une loi gaussienne). Cependant, il est possible de

3 Nous laissons au lecteur le soin de retrouver ces expressions.




proposer une autre fo rme de description des donnees experimentales qui permet , au

moins en premiere approximation, d'unif ier les resul ta ts de distributions differentes.

La not ion unificatrice sera, bien evidemment , celle de probabili ty.

On pent commencer par le cas le plus simple, celui d'une distribution de Gauss. Dans

le paragrap he 1.2, nous avons vu qu'une grande ur decr i te par cet te lo i de probabil i ty

est ent ierement definie par deux valeurs [ i et a et que le resul tat , ecrit sous la fo rme

// ± cr, a u ne interpretation rigoureuse en termes de probabilites. Autrement dit, si

1'on connait // et a on peut donner la probabili te Pr pour que x prenne une valeur

dans 1'intervalle de x\ = n — r < r a # 2 — H +rcr

(quelle que soit la valeur de r] :

A u lieu de caracteriser la variable x par \ i , et cr, on peut la decrire par 1'intervalle

[#1,2:2] et par la probabilite Pr de t rouver x dans cet intervalle. Cette probabilite

s'appelle le niveau de confiance et 1'intervalle correspo ndant rintervalle de confiance.

Plus la probabilite est elevee, plus grand est 1'intervalle correspondant (pour que 1'on

soit certain de t rouver x dans cet intervalle) . B i e n sur , pour presenter un resul tat , on

peu t choisir une valeur quelconqu e de r (et la valeur de Pr cor respondante ) , mais le s

intervalles les plus frequemment utilises sont ceux qui correspondent a un (r = 1) ou

deux (r = 2) ecar t- types . Autrement dit, on choisit le s niveaux de confiance de 68 %

ou 95 %.

Pour une distribution de Gauss, le s relations entre le s niveaux de confiance et les

intervalles de confiance correspondants d 'une par t , et les valeurs de f j , et cr d 'aut re

part, sont simples. Pour f j , et a donnes et Pr choisie, on calcule fac ilem ent 1'intervalle

[ a ? i , # 2] (voir paragraph e 2.1). Et inversement , si 1'on connait [ # i , x? ] et la probabil i te

Pr, on peut re trouver // et a. Si, par exemple , Pr = 95 % , alors r = 2 et on peut

calculer // = $x\ + # 2) et < r = \(x-2 — x$.

Dans leTableau 2.1 la probabilitePr pour que x soit incluse dans 1'intervalle symetrique

[#i=// — rcr, X ? = n + ra] est donnee pour 7 valeurs de r.

Tableau 2.1 : Probabilite Pr (en %) pour que la valeur d'une variable gaussienne x soit dans

1'intervalle [ p , — ra, p, + ra\ pour diverses valeurs de r

A 1'inverse, connaissant Pr, on peut toujours determ iner r et ainsi t rou ve r 1' intervallede confiance. Par exemple, a une probabilite Pr = 95,0% correspond r = 1,960, a

Pr = 99,00%correspond r - 2, 576 et a Pr = 99, 9%correspond r = 3, 290.




Les avantages d 'une telle presentat ion sont , d 'une pa r t , qu'elle est suffisamment infor-

mat ive (elle nous donne le domaine de variation de la valeur de x et la probabili te de 1'y

t rouver ) e t, d 'aut re part , qu 'el le est aisement generalisable aux autres distr ibutions.

Quelle que soit la distribution /(a?), on peut decrire le resultat observe par le niveau

de confiance Pr et 1'intervalle de confiance [xi , xz]

II est vrai que pour une distr ibution non gaussienne, la determination de la moyenne

et de la variance a partir de Pr et [x i ,X2 ] peut etre plus complexe que pour unedistr ibution gaussienne ; mais si Ton dispose d 'une information exhaustive (forme de

la dis t r ibut ion et autres parametres necessaires comme, par exemple, le nombre de

mesures effectuees) ce probleme peut etre resolu.

Des exemples d'ut i l isa t ion des niveaux et des intervalles de confiance seront presentes

lors de la discussion d 'uti l is atio n de la distr ibu tion de Student (pou r un nom bre l imite

de mesures) ou encore de la dis t r ibut ion %2

(pour 1 'ajustement des parametres) .

Notons qu 'un tel language perm et de presenter d 'une fagon tres in format ive un autre

type de resultats exper imentaux : les resul ta ts negatifs, c'est-a-dire le fait qu 'un

p h e n ome n e at tendu n 'est pas observe. Toute la physique des particules en est une

bonne i l lustration : pendant t res longtemps on cherche une particule, on ne la t rouve

pas, mais on con t inue jusqu 'au jou r ou 1'on obtient un resultat posit if . On a chercheainsi la par t icule vehiculant 1'interaction for te, proposee par Yu kawa , ou du positon

(antipart icule de 1'electron) dont 1'existence avait etc predite par Dirac . Aujourd 'hu i

recherche le boson de Higgs (selon le s modeles actuels , c'est une particule qui serait

responsab le de 1'existence de la masse de tou tes les autres particules) : les recherches

de cette part icule out debute il y a plus de quarante ans mais n 'ont toujours pas

about i .

Quand un resultat negatif est ob tenu , on peut quantifier cet echec : on peut dire ,

par exemple, que, dans le domaine de variation des parametres ou la recherche a ete

menee , la probabili te de t rouve r une par t icule est inferieure a une cer taine v aleur.D'habitude, une particule se manifeste par un signal x dans un detec teur. Quand

aucun signal n'est enregistre, on peut considerer que ce signal est infer ieur a une

certaine valeur xi , e t ce , avec une certaine probabili tee Pr(x < x i ) .

C'est pour ce type de resultats qu' i l est utile d ' in t rodu i re des niveaux de confiance

dont 1'intervalle est l imi te d 'un seul cote. On a alors affaire a un intervalle unilateral

(contrai rement a un intervalle bilateral in t rodu i t au dep ar t) . La probabili te que x

soit plus petit que x\ est alors egale a

Avec une dis t r ibut ion de Gauss, on peut fac ilement t rouv er la valeur de xi (ou de r)

telle que la probabili te d 'obtenir x < x\ = // + rcr, soit egale a Pr :




Evideminent , pour une m e m e probabi l i te Pr, les intervalles unila teraux et bila teraux

ne sont pas les memes . Par contre, s i Ton salt calculer les intervalles unilatera ux, par

soustraction , on ob tient facilement les intervalles bilate raux, et vice versa.

Quelques exemples numer iques sont donnes dans le Tableau 2.2.

Tableau 2.2 : Probabilites Pr (en %) pour que la valeur d'une variable gaussienne x soit

inferieure a /j , + rcr

r

Pr

0,0

50,00

0,5

6 9 , 1 5

1,0

8 4 , 1 3

1,5

93,32

2,0

97,72

2,5

99,38

3,0

99,87

3,5

99,98



C H A P I T R E 3

E X P E R I E N C E S A V E C U N N O M B R E L I M I T E

D E M E S U R E S

Ce chapitre presente 1'interet d'explici ter la procedure a adopter dans telle ou telle

s i tuat ion exper imentale . II comprend p lus ieurs paragraphes consacres a des ques-

t ions precises qui apparaissent lors du t r a i t emen t des resul tats exper imentaux. Nous

essayons de montrer les differents "niveaux" d'un te l t r a i t em en t , qu i von t d 'une con-sideration tres simple pouvant prendre quelques minutes j usqu ' a une analyse assez

sophistiquee a laquelle il faut consacrer beaucoup plus de temps . Le choix d 'une

analyse depend de la qual i te du resul ta t que nous desirous obtenir , de 1'effort et du

t emps que nous sommes prets a y consacrer . II faut souligner qu 'en phys ique comm e

dans la vie la m ethode de t rai tement des resul ta ts est choisie pour minimiser le rap-

port qualite/prix. D e plus, ayant obtenu un resul ta t , nous devons nous assurer qu' i l

est "raisonnable" et que notre analyse est bien autocoh erente. N ous i l lustrerons cesetapes du travail et repondrons aux diverses que stions precedentes.

3.1 ECHANTILLON, VALEUR MOYENNE

ET ECART-TYPE

En general , lors d 'une experience, il est difficile de connai tre la dis t r ibut ion de la

valeur physique mesuree x et ainsi de determiner la valeur moyenne de la distr ibution

/ j , et sa variance < r2

. La seule inform at ion dont nous d isposons est un ensemble de

resultats, c 'est-a-dire un n ombr e fini de mesures {xi} ~ xi,X2,%3, • . . ,xn. A par t i r

de ces mesures nous t eu tons de constru ire des valeurs qui t iendront l ieu de moyenne

f j , et de variance < r2

.

La solution de ce probleme est construite en deux etapes. D 'abo rd, par analogic avec

le s definitions "theoriques", nous introduisons la moyenne et la variance experimen-

tales. Ensui te , nous devrons les interpreter en te rmes de probabi l i te . A pr ior i , il est

evident qu 'avec un nombre fini de resultats {x^, la moyenne et la variance experimen-

tales ne sont plus suffisantes pour decrire la d is t r ibu t ion de la grandeur phys ique x.




Nous aurons done besoin de distr ibutions plus compliquees que celles de Gauss et

nous les presentons dans ce chapi tre .

3.1.1 D E F I N I T I O N S ET P R O P R I E T E S

Une experience de physique donne un nombre fini de mesures. Get ensemble de

resul tats {xi} s'appelle un echantillon. Comment a par t i r de ces resul tats obtenir desinform ations sur la valeur moyenne // et sur la variance cr

2? La reponse intuit ive est

presque evidente, surtout compte tenu du theoreme central l imite .

La valeur qui remplace la moyenne / j , peut etre construite s implement comme la

moyenne ar i thmet ique de tous le s resul ta ts {x^} :

N ous appellerons cette valeur la moyenne estimee a partir d'un echantil lon ou plus

s implement la moyenne experimental pour la dist inguer de la vraie moyenne // que

nous appellerons aussi la moyenne theor ique .

Cet te moyenne exper imentale peut etre consideree comme une grandeur phys ique .

Elle est la somme de n grandeurs independantes car nous supposons que les mesures

{%i} sont independantes . Pour n grandeurs independantes , la fonct ion de dis t r ibut ionse factorise en un produi t de fonct ions de distr ibution (voir (18)). (Arm d'al leger le s

demons t ra t ions nous n'ecr ivons pas les integrates multiples pour exprimer les valeurs

moyennes qui sont symbolisees par une barre) . Ains i , la valeur moyenne de m estegale a

(a comparer avec (19)) et la variance c r

2

^ a

(voir la demonstration de la formule (17) et comparer avec (20)) .

Soulignons le resultat deja etabli lors de la demons t ra t ion du theoreme central l imite :

1'ecart-type de la valeur moyenne exper imentale crm decroit comme l/^/n. De plus,

en ver tu de ce theoreme, nous po uvons d ire que la dis t r ibut ion de m devient de plus

en plus proche de la distr ibution normale quand le nombre de mesures n augmente(pour 1'instant nous n 'avons fait aucune hypothese supplementaire sur la forme de la

dis t r ibut ion de x ) .

Le deuxieme probleme est celui de la variance. Par analogic avec la valeur mo yenne

on definit la variance experimentale comme



Il l - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E D E M E S U R E S 77

L'apparit ion de n — 1 a la place de n dans le denominateur peut paraitre un peu

surprenante. Mais on peut la just i f ier mem e qual i ta t ivem ent : une seule mesure est

suffisante pour avoir une information concernant la moyenne mais on a besoin d'au

moins deux mesures pour pouvoir apprecier 1'ecart par rapport a la valeur moyenne.En fait, le veritable argument pour ce choix est la condition d'egalite de la valeur

moyenne de la variance exper imentale s2

et de la variance a2.

D'apres notre definition (85) , la valeur moyenne de la variance experimentale s2

estegale a :

Ecrivons le terme sous la somme en utilisant le fait que les valeurs moyennes de Xi etde ra sont identiques et egales a p :

Le premier terme dans cette expression donne, par definition, cr2, le t roisieme c r

2/n ,

en ver tu de (84). Pour calculer le deuxieme terme explicitons la difference

Alors,

car dans cette somme il n'existe qu'une seule contribution differente de zero pour

k = i. Finalement, nous obtenons la valeur moyenne de la variance :

Ainsi nous avons construit une grandeur s2

qui , dans la l imite d'un grand nombre demesures, nous donne la vraie variance < r

2de la grandeur physique x. Mais nous avons

deja decide de travailler avec la moyenne m. No us avons done a definir la variance s^de cette grandeur (ou Fecart quadratique moyen] a par t i r des resultats exper imentaux

{xi}. Cette definition est evidente :

Lorsque n tend vers 1'infini, cette valeur tend vers zero comme < r2/n conformement

a (84).

II faut maintenant changer le s conventions decrites au paragraphe 1.2. Desormais

un resultat experimental sera caracterise par la valeur moyenne m (82) et par 1'ecart




quadrat ique moyen s^ (88). Soulignons que cet ecart est une caracteristique de m

et represente ainsi 1'incertitude sur cette derniere valeur et non pas sur x. Si Ton

veu t determiner la variance de x il faut utiliser la definition (86) . B ien evidemment ,

les deux valeurs m et sm ne sont plus suffisantes pour presenter toute 1' informationexper imentale (les deu x definitions contiennent explici tement un troisieme parametre ,le nombre de mesures n). Plus tard nous completerons cette description et nous en

donnerons une interpreta t ion exacte a 1'aide des probabi l i tes , com m e cela a deja ete

fait pour la dis t r ibut ion de Gauss.

Par an a lo g i c a vec le s formules (86) e t (83) , on peut defmir la c ova r i a nc e , le coefficient

de correlation e t l es moments d'ordre su p e r i e u r pour un echantillon. Ainsi, pa r exemple,

la cova r iance de deux var iab les x e t y e s t donnee pa r

ou mx,my et mxy sont lesva l eu r s moyennes de x, de y et du produit xy se lon la defmtion

(83). L e coefficient de correlation e s t a lo rs ega l a

ou sx e t S y r e p r e se n t e n t le s rac ines car rees de s va r i a nc es exp r e i men t a l e s de x et de y

de fm ies da ns ( 86 ) .

Nous aurons egalement besoin des moments c en t r a ux m^ pour k >3, qui peuvent e t re

de fm is par

3.1.2 PRECISION DE LA V A R I A N C E E X P E R I M E N T A L EE T C H I F F R E S S I G N I F I C A T I F S

II faut aller plus loin dans 1'analyse des nouvelles definitions. Pour la valeur m oyenne

m , 1 ' incert i tude experim entale est donnee par la racine carree de sa variance , autrem ent

dit par sm. Mais cette valeur sm etant une valeur determinee a par t i r des donnees

experimentales, possede sa propre incert i t ude . N ous devons savoir 1'estimer. Mal-

heureusement , on ne peu t pas obtenir un resultat general pour toute d is t r ibut ion ;

c'est pourquoi on fait 1'hypothese supplementai re que la grandeur x est distribute

selon la lo i normale.

Le probleme devient facile a resoudre bien que sa demons t ra t ion soit assez longue.La mesure de 1'incertitude est la racine carree de 1'ecart quadrat ique moyen. Si 1'on

veut calculer 1'erreur de s " L on doit calculer la variance correspondante :



Ill - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E D E M E S U R E S 79

Pour ca lcu le r s^ ecr ivons d 'abord s^ sous la form e

Prenons le ca r re de cette express ion et ca lcu lons la va leur moyenne s^ a un fac teur

multiplicatif n2(n — I)

2pres. Nous obtenons trois t e rmes. L e premier , e s t donne pa r

ou nous avons introduit, e n accord avec (12), le s momen t s cent raux

p o u r k =2 et k — 4.

Le deux ieme terme es t nu l :

c a r , e n ver tu de la cond i t ion k I dans la deuxieme s o m m e , il con t i en t s e u l e m e n t le s

puissances impa i res de (xi — /u) dont la va leur moyenne es t nul le (voir la r ema rque apres

Ainsi s^ e s t donnee par

peut etre mis sous la forme




I ' e q ua t i on (26)). F i n a l e m e n t , p o u r le t r o i s i em e t e rme , nous a vons

du fait que les puissances impai res de ( a ? , - — /u) donnent zero ; ainsi, dans ce produi t , les

te rmes non nuls cor respondent ai = k,j = louj = k, i = 1 . Le resultat f inal pour s^

est :

Du fait que , d'apres (88),

la variance D(s^) est donnee par

Dans cet te expression, on peut utiliser le fait que, pour une distr ibut ion normale, / /2 = v " 2

et /i4 = 3cr4

(voir (27)) :

L' incer t i tude relative (34) sur la valeur de la var iance exper imentale est egale a

Une fois de plus nous re t rouvons une dependance de la fo r me \j\fn ; au t r emen t di t .il est assez difficile d'avoir une tres bonne precision sur les incertitudes dans une

experience : on a besoin de plusieurs dizaines de mesures pour s 'approcher de la

precision de 1'ordre de 10%. N ou s rev ien dro ns sur la fo rm ule (93) dans un paragrap he

special consacre a la precision des incer t i tudes .

La precision d 'une experience A a ? est determinee a part ir des donnees experimentales

et possede aussi sa propre incer t i tude . Sa connaissance est tres impor tante dans

1'analyse des resultats car elle est liee direc tement a leurs in terpreta t ions en te rmes

de probabilites. Une erreur d'un facteur 2 dans Ax peut modifier completement le s

conclusions.

Dans certaines si tuations, on peu t connai tre de maniere assez exacte la precision sur

1' incert i tude Aa?. S'il s'agit d'une incert i tude purement s tat is t ique nous avons montre

que 1'incertitude relative sur la variance exper imentale est d 'apres (93)



Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 81

Ax est proport ionnel a la racine carree de s^

egale aet ainsi son incertitude relative est

Soulignons que cette fonction decroit tres lentement avec le nombre de mesures n. Sa

courbe est presentee sur la figure 3.1. Pour 5 — 6 mesures, 6& x est a peu pres egale a

1/3 et il faut effectuer une cinquantaine de mesures pour avoir une ince rti tude relative

de 1'ordre de 10%.

Figure 3.1 : L'erreur relative sur 1'incertitude S^^ en fonction du nombre de mesures n

En travaux pratiques, nous obtenons difficilement une precision sur 1'incertitude

superieure a 10%. Nous pouvons le regretter mais il faut s'en contenter en gagnantdu temps de calcul comme nous 1'avons fait au paragraphe precedent.

La precision de 1'incertitude et le nombre de chiffres significatifs qu' i l faut garder dansun resultat final sont directement lies (il vaut mieux conserver un peu plus de chiffres

lors de calculs intermediaries pour eviter les erreurs d'arrondisse m ent). Si la precision

de 1'incertitude est de 1'ordre de 10—30%, il faut retenir un ou deux chiffres significatifsdans 1'incertitude. Le nom bre de chiffres dans la valeur x doit etre coherent avec le

nombre de chiffres dans 1'incertitude.

Par exemple, nous avons obtenu un resultat # e x p = 1, 37685 •10~3avec une incer t i tude

Ax = 4,87611 • 10~5. Dans le resultat final de Ax, il faut retenir un chiffre Ax =

5 • 10~5

si 6 & x est proche de 30% ou deux chiffres Ax = 4, 9 • 10~5

si S & , x est pluto t

proche de 10%. Selon ces deux cas, nous garderons trois ou quatre chiffres pour

exprimer la valeur de xm, soit xm = 1, 38 • 10~3

ou xm = 1, 377 • 10~3

respectivement.




Le resultat final s'ecrit

3.1.3 DISTRIBUTION x2

Pour etidier les caracteristiques de la variance experim entale (85), t rouvons l a fonc t ion

de distr ibution d 'une variable aleatoire y liee aux variables aleatoires a ? i , # 2 , . . . ,xn

par la fonct ion

Supposons que les variables x i , x % , . . . ,xn sont distributes selon une loi norm ale , avec

une moyenne nulle et une variance unite. Pour une seule variable y(x) — x2

le resultat

general a deja ete expr ime par (76). Pour la dis t r ibut ion de Gauss cette formule s'ecrit

comrne

Aut rement d i t , g(y] represente une distribution g a m m a avec a — — 1 / 2 , / ? = 2 e t a une

fonction genera t r i ce

Pour la s o m m e de s n var iab les independan tes (95) nous pouvons ut i l iser la propr ie te (21)

et ecrire la fonction generatrice de Xn '•

Cette expression signifie que Xnaun

e dis t r ibut ion gamm a avec a — n/2 — 1 e t j 3 = 2 :

Ainsi nous avons t rouve ce que Ton appelle la dis t r ibut ion de probabil i te x2

•

Sa valeur moyenne est

et sa variance

Quelques exemples de la dis t r ibut ion %2

sont donnes sur la figure 3.2.



Ill — E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 83

Figure 3 .2 : L a dis tr ibut ion Xn P°ur n — 4,8,16

Dans la limite d'un grand nombre de mesures n — > oo, la distr ibutio n x2

t end , comme

il se doit , vers celle de Gauss. Nous ne demontrons pas ici ce resul tat . Notons

simplement que le changement formel de variable y /2 — > • /j et n/2 — I — ) • n nous

donne la densite de probabili te pour la dis tr ibut ion de Poisson (36) qui tend vers la

dis tr ibut ion de Gauss lorsque n — > • oo.

Notons que la ressemblance formelle entre ces deux distr ibutions , deja mentione e lors

de la discussion de la distribution gamma, conduit a des relations utiles. Par exemple ,

les intervalles de confiance (voir paragraphe 2.3) pour la dis tr ibut ion de Poisson etpour la distribution x2 son

t lies entre eux :

Pour demontre r cette re la t ion, on fait le changement de variable z = x/2 et on integre

n fois par parties :




Nous sommes passes d'une distribution a n variables a une nouvelle distribution d'une

seule variable. Une question assez naturelle peut etre posee : oil et quand les autres

variables ont-elles disparu ? Pour mieux voir et comprendre la technique de ce "tour

de passe-passe", prenons un exemple bien connu de la physique statistique : un gaz

de particules sans interaction qui se trouve a 1'equilibre thermodynamique a la tem-

perature T. Chaque composante Vi (i —x, y , z] de la vitesse des particules du gaz a

une distribution maxwellienne :

ou m est la masse des particules, k la constante de Bolzmann.

Quelle est la loi de distribution de 1'energie des particules ? L'energie est liee a lavitesse par une relation du type (95) :

La probability de trouver les composantes de la vitesse dans les intervalles compris

entre vx et vx + dvx, vy et vy + dvy, vz et vz + dvz est egale a

Nous ne sommes interesses que par 1'energie des particules et ainsi les directions de

la vitesse n'ont aucune importance. Nous pouvons ecrire 1'element de volume dans

1'espace de vitesses dvxdvydvz sous la forme v dvdQv, ou v est le module de la vitesse

et d£ lv 1'angle solide dans cet espace. Calculons 1'integrate sur £lv, c'est-a-dire la

somme sur toutes les directions possibles. Apres une telle sommation, dvxdvydvz se

transforme en 47rv2dv. Le dernier pas concerne le passage de la vitesse a 1'energie :

v = ^/2E/m et dv = dE/VZmE.

On en deduit la distribution de probabilite en energie. La probabilite de trouver la

particule avec une energie dans 1'intervalle compris entre E et E + dE est egale a :

C'est une distribution gamma avec a = 1/2 et (3 = kT. En posant e = 2E/kT et

g(e}de = g(E)dE, on a

soit une distribution %2

avec n = 3.

L e parametre n dans la distribution de Xnes

^ le

nombre de degres de liberte. Dans

cet exemple, \2a

trois degres de liberte. Le passage des vitesses a 1'energie fait

"disparaitre" deux degres de liberte (deux variables) lors de 1'integration sur Tangle

solide.



Ill - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 85

Considerons une autre grandeur directenient liee a la variance exper imentale (86) :

qui peut etre mise sous la forme

Nous verrons que cette grandeur est egalement dis tr ibute selon %

2

mais avec n — 1degres de liberte ! II est possible de prevoir ce resu ltat et m e m e de le comprendre qual-

i tat ivement. Certains arguments quali tat ifs ont e te developpes au paragraphe 2.1.1,

lors de la discussion du fac teur n — I dans la definit ion de la variance experimentale.

II faut aussi noter que les n grandeurs z; = Xi — m sont liees par la relation

et qu 'ainsi dans la form ule (100) nous avons n — 1 et non pas n variables indepe ndante s.

Le pr inc ipe d 'une dem onst ra t ion p lus r igoureuse est le su ivan t . Nous vou lons passer de

n va r i ab l es i ndependan tes x±,x?,. . . ,xn =x a n va r iab l es i ndependan tes yi, y^,. . . ,yn

= y a I ' a ide d 'une t rans fo rmat ion yi =yz'(î, x-2, • • • , xn) =Hi(%}- Pour ce l a , on ut i l i sera

la formule ( 7 7 ) introduite a la fin du pa rag raphe 2 . 2 . 2 .

E f fec tuons une t rans fo rmat ion l i neai re or thogona le

avec

Une rotation dans I ' espace euc l id ien a n d imens i ons es t un exemple d 'une te l le t ransfor -

ma t i on . Le Jacob i en e s t a lors ega l a 1 e t , en ve r t u de ( 7 7 ) , la fonction de distribution e s t

i nchangee . La form ule (101) nous gara nt i t que la forme de la distribution res te gaussi -

enne :

La condition (101) peut encore s 'expr imer a I 'a ide des coef f ic ients c?j sous la forme



86 A N A L Y S E STATISTIQUE DB S D O N N E E S E X P E R I M E N T A L E S

Dans l e cas part icul ier ou

la condition (102) prend la forme

Pour notre fonction w (100), cho is i ssons

et les a u t r e s yi avec i >2 de facon a r b i t r a i r e . IMeanmo ins , le s fonctions yi posseden t le s

proprietes su i v an t e s ( rap p e lo n s q ue tous le s Xj ont les memes // e t cr ) :

et

qui ont ete etablies e n utilisant I ' i ndependance de s X i et la r e la t ion (102). Ainsi le s

va r i a b l e s t/ » sont distributes se lon une loi g au ss i e n n e av e c u n e m o y e n n e nul le et une

v a r i an c e a2.

Les expressions (101) et (103) nous perm et t en t de reecrire w sous la f o rme

A u t r emen t d i t, la grandeur w est distribute selon la loi %2

avec n — l degres de l iber te .

Ains i nous pouvons ut i l i ser les resul ta ts etablis sur la dis t r ibut ion x2

(98—99) et en

dedui re immediatement que

resultats que nous avons deja ob tenus difTeremment (voir (87) et (93)) .

Notons sans demons t ra t ion que, dans un cas general , le nombre de degres de l iber te

v d'une dis t r ibut ion xl pou r la somme de carres du type (104) est egale a

ou / est le nombre de relat ions l ineaires entre |x z-} .




3.2 D I S T R I B U T I O N DE S T U D E N T

Pour pouvoir in terpreter les resul tats exper imentaux en termes de de m (82) et de sm

(88), on a besoin de la fonction de distribution de la variable

ou m et sm sont definies par (82) et (88).

La so lu t ion du prob leme e s t re la t ivement s imple s i nous expr imons cette fonction sous la

forme

La var iab le y\ a une distribution normale (car tous le s x± ont la m e m e distribution norma le )

avec la moyenne nul le (83) et la va r iance unite (84). La var iab le y^ e s t distribute se lon

Xn-i comme nous venons de le demon t re r (104). Ainsi nous connaissons le s distributions

de yi et de y? e t nous voulons t rouve r la distribution du rapport t — yi/^/y^ e n ut i l i sant

le s regies connues de t r a n s f o r ma t i o n des d is t r ibu t ions .

La densite de probabi l i te de y\ e t y? est egale a :

avec 7 /1 qui var ie de —oo j u squ 'a +00 e t y% qui va r ie de 0 jus qu 'a +00. Transformons

d 'abord cette dens i te e n fa i san t l e changement de va r iab les

soit pa r t rans fo rmat ion inverse

Le module du Jacobien de cette t rans fo rmat ion e s t ega l a ^fz^ e t, conformement a (77 ) ,

la nouvel le densi te de probabilite h(z\}zi) e s t




Pour obtenir la densite de probabi l i te f(t] nous in tegrons h(zi,Z2) par rappor t a z - 2 e t

uti l isons la re la t ion f(i) — f(zi}\dz\/dt\ :

Le changement de variable

ramene ce t te integrale a une fonction F.

Figure 3.3 : La distribution de Student pour n = 2 (distribution de Lorentz),

n = 5, et n = oo (distribution de Gauss)

Finalemen t la dis t r ibut ion f(t] s'ecrit

ou t a n — I degres de l iber te . Les variables initiates y\ et y^ (soit Xn-i}en on

^ 1

et n — 1 respec t ivement . L' integrat ion sur z - i a elimine une variable (un degre de

l iberte) : l + (n — 1) — I = n — 1. La constante C dans 1'expression (107) est egale a



Ill - EXPERIENCES A V E C UN N O M B R E LIMITE D E M E S U R E S

Pour n donne, le s fonctions F dans la formule ci-dessus peuvent etre explicitees a

1 'aidede (43) et (44) .

Cette fonction (107) est relat ivement simple. Pour n = 2, on re trouve la distributionde Lorentz. Pour n > 2, la distribution t de Student represente, grosso modo, unecertaine puissance de cette distr ibution. V u la discussion du paragraphe 1.3.3, nous

pouvons tout de suite dire que, pour n donne , seuls les moments p^ avec k < n — 1

peuvent etre definis.

On p eu t aussi calculer facileme nt la valeur m oye nne et la variance de cette distrib utio n

lorsque cette derniere existe :

Dans la limite n — > • oo, la distribution de Student se transforme en distributiongaussienne. La demonstra t ion est simple et peut etre realisee par le lec teur interesse.

Plusieurs exemples de la distribution de Student sont presentes sur la figure 3.3.

La figure 3.4 est une version elargie de la figure 1.12 ; elle montre le s relations quiexistent entre le s differentes distributions. Notons que nous avons regroupe la dis-

tr ibut io n F (45) e t celle de Poisson (36) par suite de la ressemblance fo rme lle deleurs dependances fonctionnelles. Neanmoins, il ne fau t pas oublier que les roles desvariables et des paramet res sont inverses dans ces distributions.

Figure 3 .4 : Les relations entre le s differentes dis tributions

89




3.2.1 PETIT N O M B R E DE M E S U R E S

Com me ngons par un exemple concret : nous m esurons n fois la longueur / d 'une plaque

metall ique et ainsi obtenons des resultats {/ i , l^ , • • • , ln}- Solent n = 6, / i = 4372 mm,/2 = 4364 m m , /3 = 4342 m m , 14 = 4338 m m , 1 5 = 4354 m m e t /6 = 4330 m m . Quelle

est la longueur de la plaque ?

Ier

niveau d'analyse

L'object if est d'avoir une idee sur 1'ordre de grandeur des paramet res du probleme.

II est logique de supposer que la vraie valeur de la longueur se trouve entre la valeur

minimale et la valeur maximale mesurees et que 1'ecart entre ces deux valeurs donne

une estimation de 1' incert i tude. No us prenons c o m m e estimation :

Dans notre cas, lmax =4372 m m e t lmin — 4330 mm , ou

Le resul ta t est s imple et rapide. Peut-on lui donner credit ? Pourquoi pas ? Quels

sont les justificatifs m athem a t iques d'un tel resultat ? Nous ne les avons pas. Nous

avons obtenu une idee de la valeur mesuree et 1'interpretation de la derniere formule

ne peut aller au-dela de ce que nous avons fait : la valeur cherchee est la moyenneentre le s valeurs maximale et minimale mesurees et 1' incert i tude est la moit ie de 1'ecart

correspondant. II est difficile d ' in terpreter cette analyse en termes de probabilites.

IP niveau d'analyse

So n but est d'ob ten ir la valeu r de la long ue ur et de 1'incertitude sur cette v aleur et,en outre, de pouvoir les interpreter en termes de probabil i tes comme nous 1'avons fait

au debut de ce livre (voir le paragraphe 1.2).

Supposons de plus que la distribution de la longueur / est celle de Gauss. Avec cettehypoth ese supplementaire , nous pouvons utiliser la distr ibution de Student etudiee au

debut du paragraphe 3.2. Nous avons vu que si une grandeur physique est dis t r ibu te

selon une lo i normale , alors la valeur

est decrite par la dis t r ibut ion de Student /n_i(t) (107). Dans cette expression, // estla vraie valeur de la grandeur mesuree (dans notre cas, la longueur /), m la moyenne

estimee a par t i r des resultats exper im entaux (82)

et s^ la variance exper imentale de cette moyenne (88)



Ill — EXPERIENCES A V E C UN NOMBRE LIMITE DE MESURES 91

Soulignons une fois de plus que m et sm sont entierement definis par les resultats

expe rim entau x. La form e de la distr ib ution de Stud ent est relativem ent proche de celle

de Gauss (elle est la meme dans la limite n — > • oo) et ainsi nous aliens vi te comprendre

par analogic avec la distribution de Gauss comment nous pouvons 1'utiliser.

En termes de probabili tes, la phrase "t a la dis tr ibut ion de Student" signifie que la

probabi l i te de t rouver la vraie valeur /j de / dans 1'intervalle compris entre m — smt^p

et m + smivp est egale a :

(comme tou jours , c'est 1'aire de la surface sous la courb e de la fonction de distr ibution ;

voir la figure 3.5). Dans la notat ion tvp nous avons introduit les deux paramet resdont depend ce coefficient : v = n — I qui est le nombre de degres de liberte de

notre probleme et la probabili te P desiree. C ette prob ability est le niveau de confi-

ance et 1'intervalle corresp ondan t, FintervaUe de confiance qui ont ete definis dans le

paragraphe 2.3.

Nous connaissons la fonction fv(t) pour un nom bre de mesures donne, c 'es t pourquo inous pouvons etablir une bijection entre la valeur de t^-p qui nous definit 1'intervalle

et la probabili te P (109). Nous pouvons calculer la probabili te qui nous interesse et

determiner numeriquement la valeur correspondante du coefficient tvp qui s'appelle le

coefficient de Student. Ces resultats numeriques sont representes dans le tableau 3.1.Us donnent la valeur de t^ p a prendre pour qu e, pour n = v-}-\ mesures , la probabil i te

de trouver la vraie valeur dans 1'intervalle compris entre m — smtvp et m-\rsmtv-p soitegale a P.

Figure 3.5 : La distribution de Student pour n =6




Tableau 3.1 : Les coefficients de Student tv-p correspondant a un nombre v de degres de l iberteet a une probabili te T

pV

12

3

4

5

6

7

89

10

11

12

1314

15

16

1718

19

20

30

oo

0,2

0,325

0,289

0,277

0 , 2 7 1

0,267

0,265

0,263

0,2620,261

0,260

0,260

0,259

0,259

0,258

0,258

0,258

0,2570,257

0,257

0,257

0,256

0,253

0,4

0,727

0 , 6 1 7

0,584

0,569

0,559

0,553

0,549

0,5460,543

0,542

0,540

0,539

0,538

0,537

0,536

0,535

0,5340,534

0,533

0,5330,530

0,524

0,5

1 , 0 0 0

0 , 8 1 6

0,765

0 , 7 4 1

0,727

0 , 7 1 8

0 , 7 1 1

0,7060,703

0,700

0,697

0,695

0,694

0,692

0 , 6 9 1

0,690

0,6890,688

0,688

0,6870,683

0,674

0,6

1 , 3 7 6

1,061

0,978

0 , 9 4 1

0,920

0,906

0,896

0,8890,883

0,879

0,876

0,873

0,870

0,868

0,866

0,865

0,8630,862

0 , 8 6 1

0,8600,854

0,842

0,7

1 , 9 6 3

1 , 3 8 6

1 , 2 5 0

1,190

1,156

1,134

1,119

1,1081,100

1 , 0 9 3

1,088

1,083

1,079

1 , 0 7 6

1 , 0 7 4

1,071

1 , 0 6 91 , 0 6 7

1 , 0 6 6

1 , 0 6 4

1 , 0 5 5

1 , 0 3 6

0,8

3,078

1,886

1,638

1,533

1 , 4 7 6

1 , 4 4 0

1,415

1 , 3 9 71,383

1,372

1,363

1,356

1,350

1,345

1,341

1,337

1,3331 , 3 3 0

1,328

1,3251,311

1,282

0,9

6 , 3 1 4

2,920

2,353

2 , 1 3 2

2 , 0 1 5

1 , 9 4 3

1 , 8 9 5

1 , 8 6 01,836

1,812

1 , 7 9 6

1 , 7 8 2

1,771

1 , 7 6 1

1,753

1 , 7 4 6

1 , 7 4 01 , 7 3 4

1 , 7 2 9

1,7251 , 6 9 9

1,645

0 , 9 5

12,706

4,303

3 , 1 8 2

2,776

2 , 5 7 1

2,447

2,365

2,3062,262

2,228

2 , 2 0 1

2 , 1 7 9

2 , 1 6 0

2 , 1 4 5

2 , 1 3 2

2 , 1 2 0

2 , 1 1 02 , 1 0 1

2,093

2,086

2,045

1 , 9 6 0

0 , 9 9

63,657

9,925

5,841

4,604

4,032

3,707

3,499

3,3553,250

3 , 1 6 9

3,106

3,055

3,012

2,977

2,947

2 , 9 2 1

2,8982,878

2 , 8 6 1

2,845

2,756

2,576

En prat ique cela signifie que la valeur de 1' incert i tude depend du n om bre de mesures et

de la probabilite avec laquelle nous voulons connaitre la vraie valeur dans 1'intervalleindique :

Dans les condit ions l imites d 'un grand nombre de mesures, les coefficients de Student

tv-p coincident avec les valeurs donnees par la distribution de Gauss (voir la derniere

ligne du tableau 3.1). Par exemple , pour une probabi l i te (un niveau de confiance) de

9 5 % , le coefficient t i / = 0 o ; 7 > = o , 9 5 = 1, 96. Quand le nombre de mesures n 'est pas eleve,

parexemple n —

3,pour

la memeprobabilite il faut prendre Al beaucoup plus grand

£t/=2;7>=0,95 =4, 3.

Desormais, pour un n ombr e fini n de mesures, notre resultat s 'exprimera sous la forme

dont 1'interpretation est un peu plus compliquee que dans le cas de la dis t r ibut ion

de Gauss : nous sommes obliges de donner le nombre de mesures effectuees et la

probabil i te choisie pour pouvoir uti l iser un coefficient de Student .




et

Pour presenter le resultat final (111), choisissons, par exemple, im e probabili ty de

9 5 % , alors le coefficient de Student ^_5.-p=095 = 2 ,57 et A / = 17 mm . Ainsi la

valeur moyenne de la longueur est :

avec un niveau de confiance de 95% pour les 6 mesures effectuees.

Soulignons un point t res impor tan t deja mentionne au debut du paragraphe 2.3.

L' incer t i tude A / dans cette expression est 1'incertitude sur la moyenne ra et non passur la longueur / elle-meme ! Dans le cas d'un grand nombre de mesures, la variance

de la valeur moyenne s^ tend vers zero et non pas vers la veritable variance cr2.

Si nous voulons avoir une estimation de la veritable variance il nous faut utiliser ladefinition (85)

Dans notre exemple, s — A/6 -6 ,6 mm — 16 mm . C'est la raison pour laquelle nous

avons ecrit "la valeur moyenne de la longueur" et non pas "la longueur" tout court.

Nous voyons que le deuxieme niveau d'analyse est plus rigoureux et plus riche d' infor-

mation que le premier , mais il est aussi notablement plus lourd dans son t ra i tement

et surtout dans son in terpreta t ion.

Dans le resultat final, nous avons garde deux chiffres significatifs mais on aurait pun'en garder qu'un seul. Montrons comment evaluer 1'incerti tude de 1' incerti tude.

L 'est imation "theorique" obtenue dans (94) ne depend que du nombre de mesures n,

et conduit pour 1' incerti tude relative a

Rappelons que pour obtenir cette estimation, chaque mesure Xi est supposee avoir

une distribution de Gauss.

II est possible d'obtenir une estimation experim ental e de cette valeur a par t i r des

donnees obtenues. Pour cela, on utilise les formules (94) et (93)

Dans l'exemple de la longueur de la plaque,




et les valeurs exp erim ent ales de 0(8^) et s^. Pour D(s^), on util ise la formule

generale (92)dans laquelle les moments "theoriques" et ^4 sont remplaces par

leurs valeurs experimentales m^ et 7714 in t rodui tes dans (91).

Dans notre exemple,

Finalement , pour <J^ , on obt ient

en parfait accord I 'estimation "theorique".

Ill6

niveau d'analyse

En fait, nous pouvons aller plus loin dans notre analyse des donnees experimentales.

Pour utiliser la dis t r ibut ion de Student, nous avons fait 1 'hypothese supplemental

que la longueur / est dis tr ibute selon la lo i norm ale. Est-ce vrai ? Nos mesures

correspo ndent-elles a une telle hypothese ? II n'est pas tres facile de trouver la reponse

a ces questions, surtout po ur un nom bre si faible de mesures. N eanm oins nous pouv ons

essayer.

Si la dis t r ibut ion de la longueur est vraiment gaussienne, on doit s 'at tendre a avoir ape u pres deux tiers de resul tats dans 1'intervalle compris entre f i — c r et { J , + < r et un peu

moins de la moitie dans 1'intervalle compris entre // — cr/2 et // -f 0"/2 (ceci est facile

a verifier en util isant la derniere ligne du tableau 3.1). Nous ne connaissons ni n ni

< T mais nous pouvons le s estimer a partir de m et s. Dans notre exemple, m — 4350

mm , s = 16 mm . Ainsi nous pouvons at tendre 2 — 3 mesures dans 1'intervalle compris

entre 4342 mm et 4358 mm et 4 dans 1'intervalle compris entre 4334 mm et 4366 mm.

L'experience nous donne 2 et 4 respectivement. Ceci n'est pas mal , surtout s i 1'on se

souvient que s a aussi son incer t i tude et qu'el le n 'est pas negligeable (sonincer t i tude

est egale a 5 mm ; estim ation que 1'onobtient a part ir de la formule (92)).Une analyse supplementaire n'est pas du tou t superflue. Supposons que dans nos

6 mesures nous ayons t rouve le s resul ta ts : 4334, 4335, 4365, 4337, 4363 et 4366

mm . On peut verifier aisement que, pour ce t te deuxieme serie de mesures, on ob-

tient exactement le s m em es valeurs de m et de sm. Mais dans ces condi t ions , on ne

t rouve aucune me sure dans 1 ' intervalle com pris entre 4342 m m et 4358 mm et 6 dans

1'intervalle compris entre 4334 mm et 4366 mm (au lieu de 2 — 3 et 4) ! Qu'est-ce que

cela signifie ?

On peut remarquer que,dans la deuxieme serie, les resultats semblent se regrouper

autou r de deux valeurs et non au tou r d 'une seule. II existe deux explications possi-bles. Soit c 'est un veri table phe nom ene l ie probab lement a une erreur sys temat ique

(par exemple la plaque est legerement courbee et, pour deux cotes, on mesure deux

valeurs differentes). Soit ces resul tats sont lies a la faible statis t ique (6 mesures, ce

n'est pas beaucoup). En tout cas, la conclusion est la m e m e : nos resultats ne sont

apparemment pas cohe rents avec le traitement choisi et, avant de presenter le resultat

final, il faut elucider ce probleme . La moindre des choses est de remesurer la l ongueur

de la plaque pour augmenter sensiblement (!) la statis t ique.



Ill — E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 95

On aurait pu voir qu'il y a probablement un probleme dans le s donnees experimen-

tales en comparan t les est imations "theorique" et experimental de 6< \x. La valeur

"theorique"

est tres differente de celle obtenue a partir des donnees experimentales :

Cette difference peut servir d'indication sur 1'existence d'un probleme dans le s don-

nees. Compte tenu de fait que pour obtenir 1'estimation "theorique" nous n'avons

utilise que 1'hypothese de normal i t e de la distr ibution, c 'est cette hypothese qui doit

etre verifiee en premier lieu.

En fait, il existe une procedure relativement simple (criteres de Pearson) qui permet de

voir si la distribution a l aque l l e on a a f fa i r e est une gauss ienne . Cette procedure e s t

basee sur la verification des relations precises qui existent entre les moments centraux

differents d 'une distribution gauss ienne (voir (27)). Dans ce l i v r e , nous ne p resen tons pas

ces c r i t e r es ca r , dans le s exper iences s imples , ils ne sont pas souvent u t i l i ses .

Nous avons compris que la methode d'analyse des donnees exper imentales depend

de la r igueu r et de la precision du resu ltat que nous voulons ob tenir . N otons que

le premier n iveau, bien qu ' i l ne possede pas de bases m athem a t iques profondes et

qu'il ne soit fonde que sur notre "bon sens", donne presque toujours des resul ta ts

acceptables. La plupar t du temps, il donne tout a fait correc tement la valeur de la

grandeur phys ique (a a pres).

Par centre, 1' incert i tude estimee dans cette m ethode peut etre assez differente de

1' incert i tude exacte par un facteur deux-trois ou m e m e plus (dans notre exemple,

nous avons obtenu une estimation de 21 mm au lieu de s = 16 mm ; nous verronsd'autres exemples ou ce t te difference est encore plus grande). Le premier n iveau

d'analyse des donnees est uti le, sur tout s i Ton tient compte de la facilite avec laquelle

le s resul ta ts sont obtenus.

On peut dire que le deuxieme niveau est un niveau fondamenta l . II donne le s resul ta ts

avec une interpre tat ion precise, y compris po ur 1'analyse posterieure plus sophist iquee.

Cette e tape est indispensable lors d'une experience effectuee en travaux pratiques.

Le t roisieme nive au est presque o bligatoire si nous effectuons une veritable experiencede physique en laboratoire . II touche des aspects un peu differents de la statistique :

il essaie d'analyser la validite des hypotheses qui forment notre theor ie . Dans notre

exemple, nous avons tente de verifier 1'hypothese sur la forme de la distribution pour

la longueur. Jusqu' ic i nous n 'avons pas considere ce type de problem es en statis t ique.

Ces problemes sont importants surtout pour une experience reelle de physique, mais

ils necessitent des resul ta ts statis t iques beaucoup plus fournis que ceux que nous

pouvons obtenir lors de travaux pratiques classiques.




3.3 DEUX RESULTATS E X P E R I M E N T A U X

Un au t re probleme apparait lorsque Ton veut comparer des resultats exper imentaux.

Avant de discuter le cas de deux grandeurs decri tes par la distr ibution de Student ,

commenc.ons par celui de deux grandeurs decri tes par une distr ibution gaussienne.

A partir de deux resultats, x\ ± A#i et £2iA # 2 , il faut introduire leur difference

X = x\ — xi qui a egalement une distribution gaussienne avec une moyenne nulle et

une variance AX2

= Ax± + Ax%. Si la valeur de X est compatible avec 0, compte

tenu de son incer t i tude , alors les deux resultats sont com patibles.

Par exemple , on veut savoir si la temperature dans une piece varie dans le temps.

On a effectue deux mesures a une heure d ' intervalle et on a obtenu deux valeurs

TI = 25, 2 ± 0, 2 °C et T2 = 24, 5 ± 0, 2 °C. La difference T = T I - T2 = 0, 7 °C doitetre comparee avec 0. On voit que cette valeur depasse la? (avec U T = 0, 3 °C) et1'on peut raisonnablement conclure que la t em pe ra tu r e a effectivement varie.

Etudions maintenant un exemple de deux grandeurs decrites par la distribution de

Student .

Supposons qu'un collegue ait mesure la longueur de la meme plaque metallique et

qu'il ait obtenu la valeur

avec la mem e probabi l i te P = 95% mais pour n = 10 mesures. Rappelons que notre

resul tat , pour n = 6 mesures, est

Ces deux valeurs sont legerement differentes et nous voulons savoir si elles sont com-

patibles. Si oui, pouvons-nous le s regrouper d'une certaine fagon pour augmenter la

statistique et ainsi ameliorer la precision ?

3.3.1 COMPARAISON DE DEUX RESULTATS EXPERIMENTAUX

Comme au paragraphe 3.2.1, nous m ontrero ns deux niv eaux de solutions possibles.

Ier niveau d'analyse

II est tres simp le. On voit que les deu x resultats se reco uv rent com pte tenu des

incertitudes presentees et notre conclusion est immediate : les deux valeurs sont com-

patibles. Enco re une fois, dans cette approche, nous ne pouvons pas dire exactementquelle est la probabilite d'avoir cette difference entre les resultats.

IIe niveau d'analyse

Formulons d 'abord cette question d 'une fagon plus generale et plus precise. Soient

deux series de nx et de ny mesures {xi, # 2, • • • , xHx} et {y i , y?,... , yny}. Dans chaque

cas, nous pouvons calculer les moyennes mx et my (82) et les variances s% lx et s^

( 8 8 ) experimentales.




Nous desirons savoir quelle est la probabili te po ur que la valeur absolue de la difference

\mx — my | soit superieure ou inferieure a une valeur donnee . Le probleme est a nouveau

1'absence d' info rm ation sur les veritables valeurs de f i et de < r2

. II peut e tre contourne

en util isant le fait que la variable

ou

a une dis tr ibut ion de Student avec v = nx + ny — 2 degres de l iberte .

L a demonstration de cette propriete suit exactement la demonstration utilisee pour obtenir

la distribution de Student (voir paragraphic 3 . 2 ) . C ' e s t pourquoi ne seront notees que l es

petites modifications a apporter.

et

L e n u m e r a t e u r Y\ est la somme de deux g randeu rs distributes se lon la loi n o rm a l e e t

sa distribution es t done n o r m a l e . L a m oyenne de cette distribution es t nu l l e ca r el le e s t

proportionnelle a la d i f fe rence des moyennes rn^ — rn^ — p, — p — 0 . La va r i ance de YI

e s t I'unite car la v a r i an c e de mx e s t <r2fnx, la v a r i an c e de my e s t <T 2 /n y et la v a r i a n c e

de la d i f fe rence mx —my est done ega le a cr2/nx + cr

2/«y (voir eq.(17)).

L e d e n o m i n a t e u r Y? r ep r es en t e , a un facteur I/a2

pres, la somme de d e u x v a r i ab l e s

i n d e p e n d an te s

qui ont lesdistributions Xnx-iavec nx —1 degres de liberte et %

2_1 avec ny —I degres

de liberte r e s p e c t i v e m e n t (voir (104)). Leu rs fonctions gene ra t r i c es des moments sont

Reecr ivons t sous la forme t




(voir (96)). Ains i la fonction genera t r i ce de la s o m m e

est ega le a

ou nous avons ut i l ise la propr ie te (21). A u t r e m e n t dit, cet te s o m m e a la distribution

Xnx+n -2avecv

— nx+

ny — 2 degres de l iber te (nous avons nx + ny mesures avec deux

re la t ions l inea i res qu i fixent mx

e t my

; voir la r e m a r q u e (105)). Ensui te nous re t rouvons

la demons t ra t i on du pa rag raphe 3 . 2 .

Nous sommes maintenant en mesure de repondre a notre question puisque nous avons

etabli une relation univoque (109) entre la valeur de t et la probabili ty T.

Dans notre exemple, mx = 4355 mm, my = 4350 mm, nx = 10, ny = 6. Pour

connai tre s2

nous devons calculer les sommes (112). Dans notre experience

II faut calculer la somme correspondante a Texperience faite par notre collegue. A

partir de sa valeur de Ara^. = 13 mm et des relations

nous avons

Done,

et la valeur de t correspondante a s2

est egale a

Dans le tableau 3.1, nous voyons que la probabil i te qui correspond au coefficient de

Student t c ± 0, 55 pour v = 14 degres de liberte est P ~ 0, 4.

9 8




Ceci signifie que la probabil i te de t rouver la difference \mx — my\ inferieure a 5 mm

etai t de 40% . II etai t mem e plus probable (60% ) de trouv er cette difference superieure

a 5 mm. Ainsi le "disaccord" de nos deux experiences est tout a fait acceptable et nous

pouvons confirmer notre conclusion intuit i ve par une consideration plus r igoureuse.

Notons que le cr i tere quali tat if applique dans la premiere approche (recouvrement

des barres d 'erreurs) est rapide mais parfois assez dangereux. Quand nous uti l isons

de telles notions nous nous referons a la dis t r ibut ion de Gauss et nous examinons

la probabi l i te pour que mx se t rouve dans 1'intervalle [m y — A r a y , r ay + A m y ] , ou

inversement la probabili te p ou r que my se trouve dans 1'intervalle [m x — A ra x , mx +

A ra^ ] . Pour la dis t r ibut ion de Gauss , la probabil i te d 'apparit ion d 'un evenement en

dehors de 1'intervalle [ f j i — c r , ^+ c r ] est relativement grande, a peu pres 1/3. M eme pou r

une difference \mx — my — 15 mm notre conclusion basee sur ce critere reste la m e m e

car cette difference est compatible avec les incert i tudes des deux series de mesures

(A = ^(Amx + A ra y ) = 15 m m ) . Le trai tement correct nous donne un coefficient

de Student t ~ 1, 65 auquel correspond une probabil i te de presque 90%. Cela signifie

que la probabil i te de trouver une difference de 15 mm ou plus est tres faible, de

1'ordre de 10%. La m ethode quali tat ive basee sur la distr ibution de Gauss donne une

probabil i te trois fois plus for te que celle attendue avec notre methode correcte basee

sur la dis t r ibut ion de Student !

La contradiction apparen te s 'explique par le fait que no tre est imation de a (pour

laquelle nous avons choisi la demi-somme de Amx et de A m y ) etai t grossiere. Nousverrons que 1'incertitude dans 1'experience qui accumule les resul ta ts de deux experi-

ences est pluto t de 10 mm . La valeur de \mx — my\ = 15 mm correspondrait ainsi a

1, 5 « r . Pour la dis t r ibut ion de Gauss, la probabil i te de t rouve r un evenement en dehors

de 1'intervalle \ j i — I , 5 < r , / /+ 1, 5 c r ] est aussi de 1'ordre de 10%. Ainsi nous retrouvons

la coherence entre les deux approches.

La conclusion est la suivante : on peut utiliser le cri tere de recouvrement des incert i-

tudes a condit ion de les recalculer en util isant la me th od e decrite ci-dessous.

Nous avons mont re comment il e s t possible de c o m p a r e r le s moyennes de deux exper iences .

II existe une methode ana logue pour comparer le s var iances exper imenta les , des ignee par

le cr i tere J7

de Fisher , qui donne la probabi l i te pour que le r appo r t s^/sy soit di f ferent

de 1. Pour ce la , il faut in t roduire une distribution spec ia le de ce rappor t que T on peut

obtenir a par t i r de s distributions connues de s^ e t S y et en ut i l i san t des regies genera l es

fo rmu lees au paragraphic 2 . 2 . 2 . D ans ce l ivre, nous ne presentons pas ce c r i t e re car

cette distribution e s t re la t i vement complexe et son utilite prat ique b ien moindre que la

distribution de Student : s i deux echant i l l ons sont v ra iment incompat ib les , ce la appara f t

su r t ou t sur les moyennes e t dans une moindre mesure sur les va r iances .

3.3.2 "ADDITION" DE D E U X R E S U L T A T S EXPERIMENTAUX

Nous sommes assez convaincus que les deux resultats ne sont pas contradictoires et

desirons savoir comment les "reunir" pour avoir une m eil leure statis t ique et plus de

precision sur la grandeur mesuree.



1 0 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S

Nous obtenons assez facilement la formula expr imant la moyenne pour les deux series

de mesures

si nous connaissons les moyennes pour les deux experiences separement

remplagons le s sommes dans (113) par mxnx et myny :

II est utile de reecrire ce t te form ule autrem ent . Rappelons le s relations entre le s

variances experimentales s2

de la grandeur et celles de ses valeurs moyennes slm

(voir eqs. (88) et (110))

et obtenir 1'expression

ou est in t rodu i te 1' incert i tude Am x+y com m e

ou wx et wy peuven t etre in terpretes comme les poids relatifs de deux experiences.

Cette formule a une signification t res simple : moins 1'experience est precise (grande

valeur de A m ^ ) , moins impor tan te est sa contr ibut ion (faible valeur de l / ( A m j )2)

dans le calcul de la moyenne (115).

Quand le nombre de mesures dans chaque experience est relativement grand,Alors nous pouvons rmplacer dans (114)




Dans notre exemple de deux experiences, nous obtenons

mx+y = 4353 mm, Am r+y = 10 mm.

II est logique, com pte tenu du fait que les mesures du collegue etaient plus precises,

que mx+y soit plus proche de sa valeur mx.

Les formules (115) et (116) peuvent etre generalisees faci lement pour un nombre

arbitraire n d'experiences :

II est vrai que cet te fagon de calculer la moyenne su r plusieurs experiences n'est pas

tou jours m athem a t iquem en t irreprochable mais elle donne la possibilite d'avancer et

de reunir le s connaissances obtenues dans des experiences parfois tres differentes.

S'il a e te possible de verifier auparavant que ces series de mesures sont compatibles

(compat ib i l i ty des moyennes et des variances), 1'erreur in t rodui te par cet te procedure

est t res faible. Meme 1'hypothese d'egalite des coefficients de Student pour un grand

nombre de mesures n'est pas mauvaise. Dans le tableau 3.1, on voit que le coefficient

de Student varie peu avec v . Par exemple pour " P = 0 ,95 , t change seulement de

10% quand v passe de 10 a 30. De plus, cet te variat ion est une correct ion dans1' incert i tude, au t remen t dit , c 'est une correct ion de deuxieme ordre .

C'est la raison pour laquelle cette approche est tres util isee en physique quand on veu t

profiter de resul ta ts d'experiences differentes (parfois assez couteuses) pour obtenir la

valeur "universelle" de telle ou telle constante physique fondamentale .

3.4 AUTRES S O U R C E S D ' E R R E U R S

L' incer t i tude naturel le d 'une gran deur ph ysique n 'es t pas la seule possible. U ne aut resource importante d'incert i tude est 1 'appareil de mesure. Par 1'appareil , nous sous-

entendons non seulement 1'appareillage util ise pour faire une experience mais, plus

generalement, la m ethode de mesure choisie.

Nous voulons savoir quel le est Pinfluence de 1'appareil sur la valeur physique ou, en

d 'aut res termes, comment il modifie la fonction de distribution ini t iale. Nous verrons

qu ' i l y a d 'abord une modif icat ion "triviale" de cet te dis t r ibut ion : celle-ci s 'elargi t , ce

qui signifie que les erreurs d 'apparei l s 'a joutent aux erreurs naturel les de la grandeurphysique .

Cependant , une autre modif icat ion de la fonct ion de dis t r ibut ion est aussi possible.

L'apparei l peut decaler la valeur mo yenne, done 1'appareil mesure une valeur systema-

t iquement plus grande (o u plus pet i te) que la valeur "reelle". Ces erreurs s 'appellent le s

erreurs systematiques. Elles ne sont pas forcement de na t u re aleatoire et ne pour ron t

pas etre t rai tees d irec tement a 1'aide des techniques qui ont ete presentees j usqu ' i c i .

L'analyse de ce type d'erreurs, qui est plus complexe, fai t Pobjet de ce paragraphe.




3.4.1 I N C E R T I T U D E S D ' A P P A R E I L

Pour etudier 1'influence d 'un appareil sur la valeur mesuree, choisissons d 'abord un

appareil t res simple — un pese-personne mecanique . Son pr inc ipe de fonc t ionnementest elementaire : le poids d'un objet dont nous voulons connaitre la masse m estcompense par la con traction d'u n ressort. Ce dern ier est lie a une aig uille qui ind iq ue

sur un cadran la vale ur de la m asse. Si le coefficient de raideur est egal a k, le

deplacement du ressort et celui de 1'aiguille est

ou g est 1'acceleration du champ de pesanteur. Supposons que 1'incertitude sur la

valeur de g soit negligeable devant les autres ince rt i tudes. A insi , 1 ' incert i tude sur Axs'ecrit conformement a (58)

/ A x \2

_ / A m \2

(Ak\2

(— ) - (-^-J + (-T) •

La particulari ty de cette formule vient du fait que 1'incertitude de mesure com-

prend deux contr ibut ions , 1'une issue de 1'incertitude naturelle Am et 1'autre issue

de 1'appareil de mesure Ak.

Une expression analogue peut etre obtenue dans un cas plus general . La probabi l i tede trouver une valeur physique x, caracterisee par sa fonct ion de d is t r ibut ion f ( x ) ,

dans 1'intervalle [ x , x + dx] est egale a f ( x ) d x . Cependan t , la probabi l i te pour que

1'appareil donne cette valeur dans un autre intervalle [x',x' + dx'} n'est pas nulle .

Designons cette probabil i te par S(x, x'}dx'.

Pour determiner la probabil i te (F(x')dx'] de detection par 1'appareil de la valeur

phys ique dans 1'intervalle [x', x' + dx'], on doit multipl ier la probabil i te (f(x}dx] p ou r

que cette valeur se trouve dans [x, x + dx], par la probabi l i te (S(x, x')dx') pour que

1'appareil donn e la valeur dans [x', x' + dx'] et calculer la som m e (o u 1'integrate) pour

toutes les valeurs x possibles :

On peut dire qu 'au l ieu de la vraie fonct ion de dis t r ibut ion f ( x ) , 1'appareil nous do nneune fonct ion de dis t r ibut ion modifiee F ( x ) .

La fonct ion S ( x , x ' ) s'appelle la fonction de resolution (la te rminologie v ient de

1'optique). Quelle est la f o r me de cette fonction ? L a reponse a cette question est

difficile. La plupart du temps, la fonction de resolution S(x,x') ne depend que du

module de la difference x — x' :

soit



Ill - E X P E R I E N C E S A V E C U N N O M B R E LIMITE D E M E S U R E S 103

Cet te proprie te signifie que 1'appareil n ' introduit pas d'erreur systematique, c'est-a-

dire qu'il ne modifie pas la valeur moyenne de la distribution.

La va leur moyenne p,p pour la distribution F(x) es t

A I 'a ide de (120) e t en in t roduisant la va r i ab l e t = x — x ' nous obtenons

Nous avons tenu compte de la norma l i sa t ion de f(x] et de S(t) :

et du fait que S(\t\) est une fonction pa i re . I I n 'y a pas d ' e r r eu r sys t ema t i que :

Dans le s memes condi t ions, nous pouvons montrer f a c i l e m e n t que I 'appare i l ne peut

qu ' e l a rg i r la distribution i n i t ia le . L a va r iance de la d is t r ibut ion F(x] e s t

D ' o u

Comme pour les fonctions de distr ibution, on peut affirmer que si les conditions du

theoreme central l imite sont satisfaites (c'est-a-dire s'il y a plusieurs facteurs inde-

pendants qui agissent sur la fonction de resolution et si 1'influence de chacun de cesfacteurs est peti te) , cette fonction a la forme de Gauss :



1 0 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S

avec une variance <r|. Cette fonction ne depend que de \x — x'\ et la moyenne de

F(x) coincide avec la moyenne de f ( x ) . E n resume, dans les condit ions du t heoreme

central l imite, il n'y a pas d 'e r reur sys temat ique e t 1'appareil ne change pas la valeur

moyenne .

Nous ne considererons que le cas ou la fonction de resolution S(x — x'} et la fonction

de dis t r ibut ion f(x) sont decrites par des fonct ions de Gauss. Soient <r| la variance de

S(x-x'), n e t d1, la moyenne et la variance de f ( x ) . On peut alors calculer I 'integrale

(119) et obteni r la fonct ion de dis t r ibut ion F ( x ) , donnee par 1'appareil , qui a aussiune forme gaussienne :

pour re t rouver I ' in tegra le bien connue (25) .

La deux ieme e s t plus e legante : il faut passer par la t rans fo rmat ion de Fourier de cet te

in tegra le et ut i l i ser deux propr ie tes de la t r ans fo rma t ion de Four ier ( la t ransformee de

Four ie r d ' u n e gauss ienne est une gauss ienne et la t rans fo rmee de Four ie r d 'une convo lu-

tion de deux f onc t ions est le produit de leurs t rans fo rmees) . Nous la issons ce t exerc ice

aux lecteurs familiers de la transformation de Fourier.

Ce calcul pe rm e t de verifier que la variance ff p de la fonct ion F(x) est egale a la

somme des variances 0-| et c r j :

Dans une experience reel le deux si tuat ions extremes peuvent etre rencontrees. Celle

ou la variance de 1'appareil est negligeable devant la largeur naturel le (<j| < C < r ? ) et

1'appareil ne change rien ; celle ou la variance d'apparei l est plus importante que lavariance initiale (<r| ^> < r ? ) et on peut alors prendre 1'incertitude de 1'appareil comme

1'incertitude de 1'experience.

En general , la de terminat ion de la fonct ion de resolution n'est pas aisee. Pour le s

appareils simples utilises en t ravaux prat iques, la connaissance precise de la fonct ion

S(x, x') n'est pas indispensable . On peu t se l imi ter a la cal ibrat ion de 1'appareil avec

une fonct ion f(x] bien defrnie. Dans 1'exemple d'un pese-personne, on doit peser des

poids connus (les etalons) et reperer le s indicat ions correspondantes. Ainsi on obt ient

II ex is te deux facons de ca l cu l e r I ' i n tegra le

La premie re e s t d i rec te : on fait le c h a n g e m e n t de var iab le



Ill — E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 105

une echelle de 1'appareil utilisable pour la mesure de poids inconnus. Les fonctions

obtenues de cette maniere se presentent souvent sous la forme d 'une courbe ou d 'une

table d 'e talonnage .

Pour un appareil digital, 1'incertitude de mesure est indiquee dans la description.

Pour un appareil a aiguille, la precision est caracterisee par la classe de 1'appareil qui

est toujours marquee sur son cadran au-dessus du symbole de position de 1'appareil.

L' incer t i tude de 1'appareil est egale au produit de sa classe par la pleine echelle utilisee

p ou r la mesure , divise par 100 :

classe • pleine echellei ncer t i tude — .

100

Pour d iminuer 1' incert i tude de mesure , il faut done toujours travailler avec les echelles

les plus sensibles possibles (les echelles qui donnent la dev iation maximale acceptab le) .

Dans la plupar t des cas, on t ravail le avec des appareils de classe 0,5 ; 1,0 ; 1,5 ou 2,5.

Pour les experiences plus sophist iquees, cette procedure simple n'est plus suffisante.

L'exper imentateur doi t faire une e tude approfondie du nouvel appareil pour avoir le

maximum d ' in format ions sur la fonct ion de resolution S ( x ' , x ) : verifier si elle ne

depend que de \x — x' ou, s inon, etablir la f o r me de cette fonction, etc .

3.4.2 ERREURS S Y S T E M A T I Q U E S

On peut ment ionner trois sources d 'erreurs systematiques : la m e t h o d e de mesure

choisie, le mauvais fonct ionnement de 1'appareillage et les e r reu r s d ' expe r imen ta teu r .

Nous allons etudier toutes ces sources d 'erreurs et de voir ce qu ' i l faut faire dans ces

cas.

Erreurs liees a la methode de mesure

Un exemple simple d 'erreur systematique provenant de la m ethode de mesure est

donne par la determination d 'une resistance inconnue Rx. On peut la mesurer a 1'aide

d 'un vol tm etre ayant une resistance Ry et d 'un amperemetre ayant une resistance R A-Supposons que ces valeurs soient inconnues ; o n sait seulement que Ry est grande par

rappor t a Rx et que R A est pet i te par rappor t a Rx. On branche 1 'amperemetre enserie avec la resis tance inconnue. Le branchement du voltmetre peut etre effectue de

deux fagons : (I) on peut mesurer la tension aux bornes de la resistance Rx (figure 3.6)

ou (II) on peut mesurer la tension aux bornes de la resistance et de 1 'amperemetre

(figure 3.7).

Si on determine la valeur experimentale RGXp de la resistance inconnue Rx comm e le

rapport de la tension amchee sur le vo ltme tre et du courant traversant 1'amperem etre,

p ou r ces deux branchements , on obtient le s relations suivantes entre R eXp et Rx :

Si les appareils ch oisis sont de bo nne qual i te , pour un assez grand domaine de valeurs

de la resistance Rx, telles que Ry ^> Rx RA, on a R exp —Rexp —RX- Neanmoins ,




Figure 3.6 : Premier schema possible pour mesurer la valeur d'une resistance

la premiere m ethode donne toujours des valeurs sys temat iquement plus peti tes que lavraie valeur de Rx, tandis que la deuxieme donne des valeurs sys temat iquement plus

grandes. Dans les deux cas, on a une er reur sys temat ique p lus ou moins impor tan te

en fonction des relations entre Ry, R Ae^ RX •

( I I )

Figure 3.7 : Deuxiem e schema possible pour mesurer la valeur d'une resistance

On p e u t done dire que la premiere methode est preferable pour mesurer des peti tes

resistances tandis que la deuxieme est plus adaptee aux grandes resistances. Cepen-

dant les deux m ethodes donnen t une er reur systematique qu 'on ne peut el iminer qu 'en

connaissant le s valeurs de Ry et R A-

Proposons une troisieme fagon de mesurer la resistance. Pour cela, nous avons besoin

d 'une resistance variable dont nous pouvons etablir la valeur Rv, de deux resistances

identiques R et d'un appareil de mesure (d'un ampereme t re ou d'un vol tme t re , au

choix). Le schema de branc he m ent est presen te sur la figure 3.8.

Si Rx est egale a Rv, alors le courant Ia qui passe par 1'amperemetre (ou le vol tme t re )

est nul. On peut le voir a partir de 1'expression de Ia :

I etant le courant aux bornes du circui t ,

ou Ra est la resistance de 1'appareil (R ^ ou RV)-




Figure 3.8 : Troisieme schema possible pour mesurer la valeur d'une resistance

L'expression (121) peut etre obtenue de la facon suivante. Nous introduisons le s courants

Iv, 1 % , h, 1 - 2 ( f igure 3.8)e t ecr ivons le sys teme de 5 equa t ions

Nous expr imons /„, Ix et /2 en fonction de /, Ia et I\

e t obtenons deux eq ua t ions

En eliminant I\, \ \ e s t possib le d 'ec r i re

Cette relation nous donne la formule (121).

Nous devons faire varier la resistance Rv j usqu ' a annuler le courant Ia.

Quels sont le s avantages d 'une telle meth ode par rapport aux methodes precedentes ?Premierement , il n'y a pas d 'erreu rs systemat iques liees a la methode . Si nos appareilssont precis nous obtiendrons exactement la valeur




Deuxiemement , nos mesures sont extremement s imples : nous voulons annuler le

courant et nous ne devons faire aucun calcul. Troisiemement, il est relat ivementfacile de verifier si le zero est bien etab li . Supposons que la valeur du courant est

non nulle Ia — I Q = t 0, mais te l lement pe t i te que not re ampereme t re n 'a r r ive pas a ledetecter . Pour s 'affranchir du probleme, il suffit d 'augmente r le courant exter ieur /

d 'un fac teur n, afm que le courant Ia augmente aussi d 'un facteur n (voir (121)) et

qu'il redevienne detectable. Ainsi nous pouvons corriger la valeur de Rv pour retablir

le zero.

Les inconvenients possibles de cette methode sont la difficulte de t rouver une resistance

variable de bonne quali te et la duree d 'une telle experience.

Dans 1'example precedent apparaissent deux conceptions differentes d 'une experience.

Dans la premiere approche, nous devons d 'abord calibrer les appareils de mesure(vo l tmet re e t amperemetre) a 1'aide d'e ta lons et e nsuite les uti l iser pour me surer des

valeurs physiques inconnues. Dans la deuxieme approc he, nous com parons directe-

me n t la valeur inconnue a 1'etalon. La deuxieme approche est generalement plus

precise mais elle est aussi plus couteuse. Ces deux conceptions de mesure sont uti-

lisees partout dans la vie courante. Le choix depend de la precision recherchee et des

moyens disponibles. Par exemple nous pouvons mesurer une masse, soit a 1'aide d'un

pese-personne qui uti l ise un ressort prealablement cal ibre, soit a 1'aide d'u ne balance

qui equil ibre la masse inconnue par des poids connus.

Erreurs liees au fonctionnement d'appareils

Le deuxieme type d 'erreurs systematiques est lie au mauvais fon ctionn em ent de 1'appa-

reillage ou au ch angem ent des con dit ions de deroulem ent de 1 'experience. Ces erreurs

peuvent etre diverses et elles dependent de 1'experience concrete . L'exemple le plus

simple est le mauvais reglage du zero de 1'appareil. Avant toute mesure il faut s 'assurer

que le zero est regie correctement. Cette verification ne prend pas beaucoup de temps

mais elle permet d'evi ter des er reurs grossieres et elle doit devenir une habi tude pour

1 exper imen ta teu r .

L' instabi l i te des condit ions de deroulement de 1'experience donne lieu a une derive

systematique des m esures. Par exemp le la positio n du zero d'un w a t t m e t r e pen t

varier lors d 'une experience. Un autre exemple d 'une tel le erreur est la mesure de

la vitesse d'une boule metall ique dans un l iquide visqueux. Si cette experience dure

longtemps, la t e mp e r a tu r e du liquide peut varier avec la var iat ion de la t e mp e r a tu r e

ambiante et ce changement modifie la viscosite du liquide.

Erreurs d'experimentateur

F ina lement le s erreurs de 1 'experimentateur cons t i tuent le t rois ieme type d 'e r reurssystematiques. Par exemple certaines personnes evitent tel ou te l chiffre lors des

estimations de fractions de divisions d'echel le d'un appareil . Ou encore, quand on

modifie les parametres d 'une experience, le sys teme a besoin d 'un ce r tain tem ps pour

se me t t r e en equil ibre et les indicat ions des appareils peuvent etre instables pendan t

quelques secondes. II ne faut pas se precipi ter pour faire le s mesures. Lors des mesures

d'un intervalle de temps, une erreur systematique peut etre in t rodui te par le fait que

des personnes differentes ont des vitesses de reaction differentes.




Une erreur presque inevi table in tervient lors de la l ec ture des indicat ions des appareils

a aiguille : il existe toujours une certaine distance entre 1'aiguille et 1'echelle et le

resultat lu depend de 1'angle de vision. De plus, si 1'aiguille se t rouve ent re deux

divisions d'echelle, il y aura une er reur liee au choix de la valeur re tenue .

Toutes ces erreurs sont presque inevitables. II faut savoir les est imer en sachant bien

que ces est imations sont personnelles, subject ives, de la responsabil i te de 1'experimen-

t a t eur .

3.4.3 C O M M E N T E V I T E R LES E R R E U R S S Y S T E M A T I Q U E S ?

Pour evi ter ces erreurs on peut donner quelques recom mandat ions prat iques. Les er-

reurs systematiques proviennent souvent du mauvai s fonc t ionnement de 1'appareillageou de 1 'experimentateur lui-meme. Ce dernier paragraphe contient quelques recom-

mandations generates qui pe rme t t ron t d'eviter une grande part ie de ces erreurs .

Commengons par les quest ions de planification et de realisation d 'une experience sontd 'une impor tance fondamenta l e . Meme dans le cas d 'une manipu la t ion re lat ivement

simple en t r avaux prat iques i l faut leur consacrer quelques minutes. Quels sont les

points auxquels il faut faire at tent ion ?

Les conditions de deroulement de 1'experience

Une man ipulat ion dure plusieurs heures e t dem ande un effort mental assez important .

L 'expe r imen ta teu r peut etre fat igue et il peu t se t r ompe r . C'est pourquoi il faut

commencer par la preparation de la place de t ravai l : on ne laisse que les objets

indispensables (le cahier d 'experience, la calculatrice, un stylo, etc.) , 1'endroit doit

etre bien eclaire, la t em pe ra tu r e ambian te ne doit pas etre trop elevee e t sur tou t

rester stable, il faut evi te r le s courants d'air. La stabili te de la t em pe ra tu r e rend le

t ravail plus confortable et d i mi nue le s erreurs sys temat iques liees aux changement des

conditions de 1'experience. II faut placer 1'appareillage de fagon telle que les appareils

le s plus f r equemment utilises soient facilement accessibles.

Verification des choses evidentes

Parfois, il vau t m ieux verifier des choses qui paraissent evid entes . Les app areils ne

doiv ent pas b ou ger . Si la base de 1'appareil est consideree com m e ho rizontale i l faut ,

au moins , le verifier a 1'oeil nu. En optique, la condit ion importante est 1'alignement

de tous le s apparei ls sur un meme axe. Ainsi nous evi terons beaucoup d'erreurs sys-

t emat iques et le processus exper imental sera accelere. Si nous ut i l isons un ci rcui t

electrique al imente directement par le reseau EDF, nous devons mesurer la tension

car elle peut e t re differente de 220 V . Les appareils al imentes par des piles ont la"mauvaise habi tude" de t om be r en panne d 'a l imentat ion au moment le plus impor-

t an t de 1'experience. Pour eviter ce probleme il faut verifier 1'etat des piles avant1'experience.

Symetrie apparente

Si le montage possede des elements identiques, i l faut les interchanger et repeter la

mesure. Par exemple , sur la figure 3.8, nous avons un schema pour de te rminer une




resis tance inconnue Rx dans lequel nous utilisons deux resistances supposees iden-

tiques R . II faut s 'en assurer experimentalement en p e r mu tan t ces resistances lorsque

le courant qui passe par 1 'amperemetre est nul . Si, avec les resistances interchang ees,

le courant devient different du zero, il faut soit remplacer le s resistances soit aug-menter 1 ' incert itude de mesure. En travau x pratiques, on uti l ise f requemment des

appareils polyvalents qui peuvent mesurer le courant, la tension ou meme la resis-

tance. Si 1'on utilise deux appareils de ce type dans la meme experience, on peut les

interchanger et verifier la stabili te du resultat .

Quand on mesure la difference de deux temperatures avec deux thermometres dif-

ferents il faut aussi les inte rch ang er. Si le resul ta t n'est pas le meme on doit prendre la

demi-somme des deux mesures com m e valeur experim entale. Si 1'un des t h e rm om e t r e s

(o u les deux) est affecte par une erreur systematique, cette procedure perme t t r a de

s'en affranchir.

Experience preliminaire

Une experience scientifique est toujours precedee d 'une manipulat ion pre l iminaire .

Son but est mul t ip le . L ' expe r imen ta teu r "apprend" la manipu la t ion , s ' en t rame a

effectuer le s operat ions qui seront le s plus frequentes, verifie le fonctionnement des

divers elements. Dans cette m anipu lation, on essaie d 'ob tenir une idee sur 1'intervalle

des valeurs de chaque grande ur phy sique ainsi que sur leurs incert i tud es. Cette mani-

pulation prel iminaire permet de determiner la strategic fu ture pour toute 1'experience.

Mem e en travaux pratiques il faut essayer d'effectuer une experience prel iminai re , bien

que le temps soit t res l imite . II fau t , au moins, prendre connaissance de 1'appareillage

et sur tout de ses composantes qui n 'ont pas ete etudiees auparavant. S i, pendant

1'experience, il faut changer d'echelle et si on ne sait pas effectuer cette operation, on

risque non seuleme nt de perdre du temp s mais aussi de perdre une partie des donnees.

Planification d'une experience

La manipulation prel iminaire fait part ie d 'un probleme plus general de planificat iond'une experience. En travaux pratiques, i l faut cerner exactement les points les plus

delicats et les plus importants du point de vue physique ainsi que 1'enchainement

entre les differentes parties de 1'experience.

Un autr e aspect im po rtant de la planification est 1 'ordre chronologique des mesures

lorsqu'il s'agit de de te rminer une dependance en fonct ion d 'un pa ram e t r e (couran t ,

frequence, tem pe ratu re, e tc .) . Si on cherche, par exemple, la puissance P degagee parune resistance en fonct ion du courant / qui passe dans le circuit et qui varie de 0 a

10 A ( la l imi te de notre amperemetre) , on s 'at tend a une dependance telle que :

La presence de la constante P Q peut etre expliquee par 1'existence de sources de

chaleur , celle de la fonctio n l ineaire par Feffet Peltier et celle de la fonc tion qu adratique

par I'effet Jou le .

Six points (entre 0 et 10 A avec un pas de 2 A) sont largement suffisants pour definir

le s paramet res P Q , a et b. Si nous voulons augmenter la precision sur ces valeurs,




nous pouvons prendre un pas plus pet i t , 1 A . Dans notre systeme, il n'y a pas dedependance rapide en fonction du parametre et i l vaut mieux choisir des points de

mesures distribues de maniere uni forme sur tout intervalle de variation du courant.

Cependant , il ne faut pas perdre de temps en fixant les valeurs de / exactement a1 A ou 2 A. Si nous mesurons la puissance pour I — 1, 95 A au lieu de / = 2, 00 A,la precision sur les paramet res sera la m e m e . Pour accelerer la manipulat ion nous

pouvons faire le s mesures en augment an t progressivement le courant avec un pas de

2 A d e O a l O A . L'avantage est que notre systeme t rouvera chaque fois son equil ibre

assez rapidement . De plus, nous nous at tendons a une dependance reguliere P( I ) et

pouvons controler que la puissance varie lentement avec la variation du courant.

Le probleme concernant 1'ordre des mesures apparait quand il existe une source

d 'erreurs systematiques (par exe mp le, si la t em pe ra tu r e de la piece monte progressive-

ment pendant 1'experience, elle modifie le parametre PQ). Avec 1'ordre precedent nousne trouverons jamais cette source d'erreurs : la fonction P( I} sera toujours reguliere

et cont inue. Par centre , si nous choisissons un ordre different des mesures : / = 0,

10 , 2, 8, 4, 6 A, les points exper imentaux "oscilleront" autour d 'une courbe continue

et ces oscillations seront plus grandes que les inc erti tude s des mesures. Un simp le

changement de 1'ordre des mesures peut nous aider a detecter une erreur systema-t ique.

G'est a Texper imentateur de decider quel est 1'aspect de la manipulation le plus im-

por tan t : la rapidite et la simplicite des mesures ou la securite.Si nous etudions une grandeur dont la depend ance en fonction d'une variable est assez

rapide comme, par exemple , la recherche de la frequence propre d'un circuit R LC parune mesure de la tension en fonction de la frequence, la logique doit etre differente.

La tension aux bornes de la resistance peut etre approchee par la formule

L'experience comprend deux etapes. D'abord, nous de te rminons le comportement

general U(v} avec un pas qui peu t etre assez g rand , 15 H z (qu atre po ints noirs sur lafigure 3.9). Le but de cette e tape est de determiner approximativem ent la position de

la resonance : nous voyons que z /o se t rouve entre 30 et 50 Hz. Ensuite, nous devonsrepeter nos mesures au voisinage de V Q avec un pas beauc oup p lus faible, 2 H z (carres

blancs sur la figure 3.9). I I n'y aucun interet a faire des mesures avec ce pet i t pas loin

de i / o si nous ne nous interessons qu 'a la position de la resonance.

Ces exemples elementaires montrent que 1'ordre et le pas des mesures dependent de

differents facteurs et I 'exper imentateur doit chaque fois decider quels sont les criteres

le s plus impor tan ts pour effectuer ces choix.

Enregistrement des resultats

Lorsque nous enregistrons les resultats, le but est de ne pas introd uire d'erreu rs sup-plem entaires. Le remede est tr ivial : nous devons noter immedia tement tous les

resultats pour ne rien oublier. L'ecri ture doit etre sim ple, concise et elle doit contenir

un m in im um d'explications necessaires pour que nous puissions plus tard comprendre

et in terpre ter ces resultats sans aucune ambigui'te. Une ecriture claire et facilement

lisible depend de notre experience personnelle et elle viendra au fil des annees.




Figure 3.9 : Determination de la position d'une resonance

La fagon la plus traditionnelle d'enregistrement des resultats est 1'utilisation d 'un

cahier d 'experience. L'avantage principal d 'un te l cahier par rapport aux feuilles se-

parees est qu'i l est plus difficile de le perdre . L'inconvenient est que m e m e les mesures

simples ne s'effectuent j amais dans un ordre parfait et que notre enregistrement peut

etre assez disp arate. II n'est pas toujours commode de coller dans ce cahier des feuilles

de papier mil l imetre avec des courbes ou des l istings d'ord inate ur. Cep endant, le

cahier d 'experience reste le meilleur moyen pour eviter la per te d ' informat ion. II

est utile de numeroter ses pages et de reserver une page au debut pour la table des

matieres.

Inscription des resultats

Tous les resul tats doivent etre notes immedia tement , dans leur forme brute et sansla moindre modification. Par exemple, si 1'echelle d'unvo ltme tre est de 5 V , dans le

cahier d'experience il faut noter le nombre de divisions d'echelle ainsi que la valeur

de pleine echelle. Si, par hasard, n ous nous trom pon s lors de la mu ltiplicatio n par 5

nous ne serons plus capables de corriger cette erreur plus t a rd .

Recopier des resultats est tres dangereux. II ne faut jamais utiliser les brouillonsp ou r copier ensuite les resultats dans le cahier de manipulation. Cette operat ion est

t r iplement dangereuse. Prem iereme nt , nous perdons du temps. Deuxiemement , nous

pouvons in troduire des erreurs supplem entaires. Mais le danger le plus important

vient du fait que, lorsque nous copious les resultats, nous ne pouvons pas eviter la

selection.

Dans le bilan d 'une experience, on n'util ise pas toutes le s mesures effectuees. Assez

f requemment , on decide que telle ou telle mesure n'est pas tres parlante o u simplem ent



Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S

inuti le. Au t r e me n t dit , nous selectionnons les resultats. Cette procedure est parfaite-

ment correcte a condition que nos criteres de selection soient objectifs et justes. Si,

plus tard, nous decidons que nous nous sommes t rompes dans le choix des cri teres,

nous devons avoir la possibilite de revoir Fensemble des mesures initiales. La seulesolution a ce probleme est de conserver tous le s resultats des mesures.

Par exemple, nous mesurons des differences de temperatures a 1'aide des deux ther-m om etres. N ous devons enregistrer les indications de deux appareils et en suite calculer

la difference. Si 1'un des appareils fonctionne m al et donne , de t emps en temps, une

valeur fausse nous pourrons trouver plus facilement cette erreur si nous avons deux

enregis t rements separes. N ous verrons alors les fluc tuati on s dans les indications de ce

thermometre. Si nous ne notons que la difference nous ne saurons j ama i s lequel des

deux the rm om e t r e s fonct ion ne mal.

Ordinateur

L'ord ina teur devient de plus en plus present en travaux pratiques. C'est tres bien car

il permet d'accelerer 1'acquisition des donnees d'une fagon spectaculaire. Cependant,il faut com prendre que 1'ordinateur ne peu t p as faire des miracles et la precision d 'une

seule mesure faite avec 1'ordinateur n'augmente pas pour autant ! Quand Pecran de

1'ordinateur afflche hui t chiffres significatifs, nous de vons savoir qu'en realite le nombre

de chiffres significatifs reste le m em e que si nous avions fait la mesure nous-memes.

Simplement, 1'appareil qui sert d'interface entre Pappareil de mesure (un vol tme t re ,

un thermometre, etc.) et 1'ordinateur ne sait pas arrondir correctement le resul ta t .Le nombre de chiffres am dies est defini par le nombre de digits d 'ordinateu r et non

par la veritable precision de 1'experience. Ce ph eno m ene pose un vrai probleme :

1'acquisition au tomat i que des donnees rend difficile la de te rmina t ion de 1'incertitude

de mesure car 1'appareil de mesure est souvent inaccessible. La solution consiste arepeter 1'experience ou une partie de celle-ci. Nous obt iendrons des resul tats differents

et determinerons ainsi 1' incerti tude en utilisant 1'approche decrite dans ce livre.

Schemas et tableaux

Les schemas et les tableaux sont des formes tres pratiques pour limiter Pecri ture et

eviter ainsi le s erreurs inutiles. II ne faut pas que le schema d'une experience soit

trop detail le et qu' i l soi t proche d 'une photographic . II doit contenir le minimum

necessaire d ' informations en expliquant Pidee de Pexperience, en donnant une des-

cription de Pappareillage et les notations utiles. On a parfois besoin d'un schemacomplet dans lequel 1'echelle est soigneusement respectee. Mais dans la plupart des

s i tuat ions, 1'echelle est consciemment modifiee. Par exemple, dans le schema presente

su r la figure 4.4, la vraie taille de la resistance inconnue Rx peut etre de quelques

mill imetres tandis que la resistance variable Rv represente un appareil d 'une dizainede cent im etres . Dans cet te experience, ces resistances jouen t le meme role et le dessin

souligne leur "equivalence".

Tous le s resultats des mesures doivent etre ecrits de preference, sous la forme d 'un

tableau. I I vaut mieux noter le s valeurs de la meme grandeur physique dans une

colonne, car Poeil compare plus facilement deux chiffres ecrits Pun sous Pautre . La

premiere ligne de chaque colonne doit contenir le nom de la grandeur, son symbole

et ses uni tes . Si possible, il faut preparer le s tableaux avant la manipulat ion. II

113



1 1 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S

est toujours utile de reserver quelques colonnes supplementaires. Elles peuvent etre

necessaires pour noter immedia tement les incerti tudes sur les valeurs (surtout si elles

varient lors de 1'experience) ou, plus tard, les resul ta ts obtenus lors du tra i tement des

donnees. Par exemple , si nous mesurons la resistance inconnue comme rappo rt de latension a ses bornes au courant qui la traverse, nous devons preparer six colonnes :

pour la tension et son incer t i tude, pour le courant et son incerti tude et pour la re-

sistance et son incertitude. Si, de plus, les echelles de ces appareils ne sont pas des

multiples de 10, il vaut mieux preparer des colonnes supplementaires pour noter les

mesures brutes comme nous Tavons discute auparavant .

Calculs arithmetiques

Lors des calculs arithmetiques, il ne faut pas se precipiter sur la calculatrice. Prenons

un exemple. Nous determinons la valeur de la chaleur specifique C d'un liquide demasse m contenu dans une boite. Pour cela, nous chauffons ce recipient a 1'aide d'une

petite resistance plongee dans le l iquide. Le courant qui passe par la resistance est /, latension aux bornes de celle-ci [/, la duree du chauffage r. E n premiere approximation,

si nous negligeons les pertes de chaleur (par la surface de la boite ou pour chauffer la

resistance elle-meme, etc.) la chaleur specifique est donnee par :

ou AT est la difference des temperatures apres et avant le chauffage. Soient les valeurs

experimentales : m = 17, 6 g, U = 10, 7 V , / = 42 mA , r = 23, 7 s, AT = 0, 36 K.

L'ordre de calculs doit etre le suivant. Dans 1'expression initiale

nous reecrivons toutes les valeurs dans le mem e systeme d 'uni tes (par exemple, SI) :

nous separons le s chiffres et les unites :

nous faisons les operat ions ar i t hmet iques a 1'aide d'une calculatrice et nous transfor-

mons les unites :

Ici, trois remarques s ' imposent.

Premierement , il est utile de reecrire F avant-derniere expression sous la forme




ou nous avons separe les chiffres significatifs et les ordres de grandeur : si la valeur de

x • 10n

est plus grande que 5 • 10n

nous 1'ecrivons cornrne 0, x • 10n+1

, sinon nous ne

changeons r ien. L'avantage d 'une tel le representation est que nous voyons immedia-

t em en t 1'ordre de grandeur : 10 3. La valeur de la premiere fraction, dans la plupar tdes situations, sera alors de 1'ordre de 1 (de 0,1 a 10).

Deuxiemement , dans le resultat in termediaire nous gardens, pour 1'instant, trois

chiffres significatifs 1,68, bien que les valeurs de AT et de / n'en contiennent que deux.

N ous le faisons vo lontairem ent pour eviter les erre urs supplementaires d'arrondi. Dans

le resultat final, apres avoir calcule 1'incertitude sur C, nous ne laisserons que le nom-

bre de chiffres significatifs correspondant a cette incert i tude (peut etre un seul).

Trois iemement , dans la derniere expression, nous avons choisi le s unites k J / k g - K et

non pas J / k g - K , car nous connaissons la chaleur specifique de 1'eau 4,18 k J / k g - K etcette valeur nous est tres familiere. Meme si le liquide dans le recipient n'est pas de

1'eau, il faut toujours avoir les reperes physiques qui peuvent servir comme moyens

de controle de la validite de notre resultat .

3 .4 .4 COMMENT T R A V A I L L E R A V E CL E S ERREURS S Y S T E M A T I Q U E S ?

Que faire avec les erreu rs systematiques ? Comment peut-on travail ler avec ? Si c'estpossible, il vaut mieux les eviter ou, au m oins, essayer d'elim iner ces sources d'er reu rs

(comme, par exemple, verifier la position du zero de Pappareil) .

Parfois, on ne peut pas eliminer la source de ces erreurs mais on peut in t roduire une

correction pe rm e t t an t de d iminuer Ferreur . Par exemple, si nous effectuons la mesure

d'une puissance electrique supposee constante a 1'aide d 'un wat tme t re . A u debut de

1'experience, nous avons note une valeur de 4,50 W et nous savons que 1'incert i tude

su r cette valeur determinee a partir de la classe de 1'appareil est de 0,02 W. A la

fin de notre experience, nous voyons que le wat tme t r e indique une valeur de 4,42

W. Que devons-nous faire dans cette situation ? II faut debrancher le wat tmetre ducircuit et voir la valeur affichee. S'il indique — 0 , 0 7 W , cela signifie que le zero de

1'appareil a derive et que la puissance mesuree a la fin de 1'experience etai t egale en

fait a 4,49 W. La difference par rapport a la valeur initiale est due, probablement , a la

precision de nos mesures. II faut obligatoirement noter ce phenomene dans le cahier

d'experience, mais pour les calculs ulterieurs on prendra une valeur de la puissance

P = (4 , 50 ± 0 , 0 2 ) W .

Si 1'appareil debranc he indique une valeur 0,00 W , cela signifie que la difference entre

le s deux valeurs de la puissance est due a la variation reelle de la puissance dans le

circuit . Dans ce cas, nous devons utiliser lors des calculs ulterieurs une valeur de lapuissance P = (4, 46 ± 0 , 0 4 ) W ; dans no tre cahier d'experience nous devons note r ce

phenomene et que 1'incertitude a ete calculee non pas a par t i r de la classe de 1'appareil

mais qu'elle a ete est imee grossierement par AP = (.Pmax — -P m m)/2 .

Les erreurs systematiques et statistiques sont de nature differente. Cependant , pour

des raisons de com m odi t e , les deux s'ecrivent sous la m e m e forme ±Ax. II ne faut

pas oub lier que, pour les erreurs statistiques, cette ecri ture suppose une in terpre tat ion




precise en termes de probabili tes. En revanche , pour les erreurs systematiques il n'en

est pas de m e m e : leurs valeurs sont obtenues par des estimations parfois grossieres

et subjectives. C'est pourquoi, dans la l i t terature scientifique, le resul tat final d 'une

experience se presente sous la fo rme

ou A x s ta t est une erreur statistique et Axi et A a ? 2 sont des erreurs systematiques

introduites par des raisons differentes. Formellement , ces erreurs n'obeissent pas aux

memes lois que les incertitud es statistique s. En par ticu lier, la formule de propagation

des erreurs (55) ne peut pas etre appliquee aux erreurs systematiques. On peut levoir dans un exemple tres simple. A 1'aide d'un voltmetre nous avons mesure deux

tensions V\ = 7, 5 V et V - 2 = 6, 3 V . Les ince rti tudes statistiques sont respectivement

A V i = 0 , 4 V e t AV? = 0, 3 V . II existe aussi une erreur dans la position du zero duvol tmetre que nous estimons a AV b = 0 , 1 V . Ainsi, nous pouvons ecrire

Si nous voulons calculer la difference v — V\ — Vz , nous obtenons la valeur

La seule incertitude presente est statistique et calculee selon (56). Le decalage duzero d'apparei l ne peut pas influencer la difference des deux tensions.

Par contre, si nous voulons calculer la somme V = V\ + V? , le resultat sera

Les erreurs systematiques sur la position du zero s'ajoutent dans ce cas. En principe,

on peut util iser la form ule de propagation d'erreu rs a condition d' intro duire les cor-

relations entre le s erreurs. Dans notre cas, le module du coefficient de correlation est

egal a 1. Nous conseillons au lecteur interesse d'obtenir la formule correspondante.

L'ecr i ture d'u n re sultat sous la form e (122) est la seule acceptable. N eanm oins, le

travail avec une telle expression devient complique. C'est pourquoi on introduit aussi

une incerti tude totale de 1'experience qui reuni t toutes le s sources d' incerti tudes :

Cette expression n'est pas mathemat iquement irreprochable mais elle est tres pra-

t ique , par exemple dans la comparaison rapide de deux resultats exper imentaux.

Cette form ule nous aide a comprendre , par exemple, quelle ince rti tude il faut choisir ,celle de 1'appareil ou celle de la lecture, quand nous effectuons des mesures avec le s

appareils a aiguille. Supposons que notre appareil de m esure soit un am perem etre de la

classe 4 avec une pleine echelle de 5 A et que cette echelle possede 100 divisions. Ainsi

1'erreur d'appareil est egale a Aar ap p = 0, 2 A. Nous estimons que notre incerti tude de

lecture est egale a la moit ie de la division d'echelle : Aa?iec t = 0, 025 A . L' incer t i tudede mesure est alors




Si notre amperemetre est de la classe 0,1, alors A a? ap p = 0, 005 A et

Ces deux examples ne sont pas ties realistes : ils servent surtout a illustrer la procedure

a appliquer pour est imer les incert i tudes. En prat iqu e, tous les appareils ont une

echelle telle que 1'incertitude de lecture soit compatible avec celle de 1'appareil :

Aut remen t dit , notre amperemetre dev rait e tre de la classe 1 ou 0,5. Dans ce s con-

ditions, on peut dire que 1'incert i tude de mesure est approximat ivement egale a la

division d'echelle. Cette est imation est utilisee quand on ne dispose pas d 'inform ationsur la classe de 1'appareil. Par exemple, pou r le s appareils avec Paffichage numer ique ,

1'incertitude peut etre est imee grossierement a 1 dans le dernier digi t (a condi t ion,

bien evidemment , que les indications de 1'appareil aient ete stables tout le long de lamesure) .






CHAPITRE 4

A J U S T E M E N T D E S P A R A M E T R E S

On rencontre des nombreuses situations dans lesquels on des parametres sont deter-

mines a pa rtir des donnees experim entales. Par exem ple, on a une fonction qui depend

d'un paramet re et on veut t rouver la valeur de ce dernier p our que cette fon ction repro-

duit bien les donnees. Habi tue l lement , on cherche la meil leure valeur du parametre ,

son incertitude et une maniere d 'evaluer la qualite de la description des donneespar la fonct ion choisie. Cette procedure est appelee ajustement des parametres .

Avant d 'evoquer des approches concretes d 'a jus tement , defmissons quelques propretes

generales des paramet res deduits des donnees experimentale.

En pr incipe, differentes expressions peuvent etre proposees pour definir la valeur d 'unparametre a par t i r des donnees experim entales. Par e xemp le, si Ton fait une serie de

T V mesures d 'une grandeur 1X pour laquelle on obtient les resultats xi,x^, • • • ,XN,

on peut proposer comme valeur de X la moy enne de tous les resultats

ou la moyenne des valeurs maximale x m a x et minimale xmln

Xi et X < 2 sont des estimations differentes de la meme grandeur X. Comme nous

1'avons deja discute dans ce livre, le s deux es t imations peuv ent e tre utilisees dans dess i tuat ions differentes.

On peut donner quelques importantes caracteristiques des telles estimations. La pre-

miere est 1'existence d'une erreur systematique. Si

Ici, on parle d'une grandeur X pour utiliser les exemples deja abordes dans ce l ivre, mais onaurait pu egalement parler d'un parametre X.



120 ANALYSE STATISTIQUE DB S D O N N E E S EXPERIMENTALES

1'estimation est dite biaisee. On a deja vu 1'importance de cette notion dans la

discussion de la variance experimentale au paragraphe 3.1.1. Dans la definition (86),

on a du diviser la somme par N — 1 et n on pas par T V , precisement , pour evi te r une

erreur systematique dans cette def ini t ion. Si 1'estimation n'est pas biaisee, on ditegalement qu'elle est correcte.

La deuxieme caracteristique importante d'une estimation est son efficacite. Parmi

toutes les estimations possibles, 1'estimation efficace est celle dont la variance est la

plus petite.

Regardons le role de cette notion d'efficacite sur un exemple deja etudie : 1'addition

de resultats experimentaux (voir paragraphe 3.3.2).

Quelle est la meilleure fagon de calculer la moyenne de resultats experimentaux dif-

ferents ? Soient N resultats a ? i , X 2 , • • • , # A T qui , en tant que variables aleatoires, ont

la meme moyenne ~ x \ — ~ x ^ = ...— F /v = ^ mais des variances differentes aXl = < T I ,

& x - 2 — ° ~ 2 , • • • ) & X N — VN-

A partir de ces donnees, on peut construir une combinaison lineaire

dans laquelle les difFerents resultats sont ponderes par des poids inconnus pi. Choisis-

sons ces poids en imposant comme condition Pefficacite de 1'estimation. Autrementd i t , on cherche a ce que la variance de X soit minimale.

Avant de calculer la variance de X, on impose que X ait la meme moyenne f i que les

{*.'} :

Cette condition donne

La variance de X se calcule tres facilement en ecrivant Tindependance des {xj} :

c r ^ x peut etre consideree commefonct ion de T V — 1 variablesindependantes p i , p 2 , • • • >PN- i

(pN doit etre exprimee en fonction des autres variables a partir de (123)) :

Pour que &'x(piip2, • • -PN-i) soit minimale, il faut que les derivees partielles corres-

pondantes soient nulles :



IV — AJUSTEMENT D B S P A R A M E T R E S 121

Ainsi on obtient N — 1 conditions :

On pen t ecrire a nouveau ce systeme sous la forme

ou A =pi + P i + • • • + PN- I - En faisant la somme de ces equations on obtient :

soit

Finalement , on t rouve les poids pi qui sont inversemen t propo rtionnels aux variances~2 .

Ainsi pour X et <r^, on retro uv e 1'expression (118) :

On voit que ces caracterist ique s (estimation biaisee, emcacite) sont tres importantes

pour pour opt imiser le choix des parametres.

Nous allons exposer maintenant deux methodes les plus f requemment utilisees (la

methode des moindres carres et celle du m ax im um de vraisemblance) pour ajuster

des parametres .




4.1 M E T H O D E DES M O I N D R E S C A R R E E S

Revenons sur la question posee au debut de ce chapitre : si dans notre fonction

theor ique , des paramet res l ibres existent, comment pouvons-nous les choisir pour

avoir le meilleur accord avec le s points experimentaux ? Par exernple, quelle est lameilleure fagon de tracer une droi te qui passe par les points experimentaux representes

su r la figure 4.1 ?

Figure 4.1 : Trace de la fonction lineaire

Nous disposons de n mesures independantes {y^v} = y r

P' ^ 2

X p> • • • > ? / n

X pd 'une gran-

deur physique y pour n valeurs de son argument {%i} — x i , a ? 2 , • • • ,xn. Supposonsque notre fonction y = y(x] depende aussi de k paramet res {dj} — ai, 02 ; • • • ,

ak-

Cette formulation du probleme suppose que les valeu rs y ,- sont decrites par les variables

aleatoires tandis que les {#;} sont definis d'une fagon deterministe. En pratique, cette

hypothese signifie que les incert i tudes Ax t- sont negligeables. Ainsi le s paramet res {ctj}

sont egalement decrits par les variables aleatoires dont nous devons determiner non

seulement le s valeurs moyennes mais aussi le s variances.

4.1.1 IDEE DE LA METHODS DES M O I N D R E S C A R R E S

Dans un cas general, c'est un probleme assez complexe. C'est pourquoi nous faisons

1'hypothese supplem entaire que y est une fonction lineaire de ses parametres {aj} qui

s'ecrit



IV - A J U S T E M E N T D B S P A R A M E T R E S 123

ou le s fonctions {fi(x)} sont connues. II peut s'agir de monomes c o m m e fi(x] — xl,

dans ce cas nous cherchons les coefficients de developpement en serie de Taylor ou

de fonct ions t r igonometr iques cosinus et sinus et obtenons un developpement en serie

de Four ier . Ains i , malgre ce t te hypothese sur la l ineari te par rappor t aux coefficients{ctj}, notre probleme reste assez general et particulierement utile po ur les applications

physiques.

Pour de terminer k paramet res , il faut que le nombre de poin ts exper imentaux n soit

egal ou superieur a k. Par exemple, pour une droite, nous avons besoin d'au moms

deux points pour definir la pente et la constante a 1'origine. N ous supposons do ne

que n > k.

Une approche assez generale p ou r choisir des parametres est donnee par la methode

des moindres carres. Dans cette methode on affirme que les m eil leurs paramet res {aj}sont tels qu'i ls minimisent la somme des carres :

C'est une sornme sur tous les points exper imentaux i = 1, 2 , . . . , n qui reunit ainsi la

totalite de 1'information exper imentale . Chaque terrne de la somme est le carre de

la difference entre la valeur mesuree y^xp

et la valeur theor ique y(a\, 0 2 , . . . , a^', Xi)calculee pour cette valeur de Xi. Plus proches sont la theor ie et 1'experience, plus peti te

est la contr ibut ion de ce te rme. Chaque terme est pondere par un poids conformement

a son erreur < T ; (voir le paragraphe 3.2.2). Plus grande est < r z - , moins impo r tan te est

la contr ib ution de ce point. De plus, nous supposons que nous connaissons les vraies

variances de chaque point af . En pratique, nous ne pouvons obtenir que les valeurs

experimentales (A y 2e xp

)2.

Le cri tere uti lise (le m in im um de la somme des carres) n'est pas le seul critere possible.

Cependant , on peut demontre r un theoreme mathemat i que (dit de Gauss-Markov)

selon lequel le s parametres determines par la methode des moindres carres sont le splus precis : leur variance sera plus petite que les variances des coefficients obtenues

avec tous autres criteres. Cette affirmation reste vraie quelle que soit la forme de ladis t r ibut ion de probabi l i te (autrement d i t , il n'est pas necessaire de supposer que les

l^fXP

}s°i

ent dist r ibutes selon la loi norm ale et le critere reste toujours valable). Mal-

gre 1'importance de ce theoreme, nous ne don nons pas ici sa demonst ra t ion . Le lecteur

interesse peu t la retrouver dans le s livres de mathemat iques . Notons s implement que

1'idee de la demonstrat ion est proche de celle que nous avons utilisee au debut de ce

chapi t re pour re t rouver la formule (118). II fau t noter que la m ethode des moindres

carres est souvent utilisee dans des situations ou ses condi t ions de validite ne sont pasvraiment remplies (ou si 1'on n'est pas sur qu'elles soient remplies). La raison pour

cela en est simple : on ne dispose pas d'autre m e t h o d e presentant la m e m e simplici te

et la meme puissance.

Dans ce livre, nous nous sommes surtout interesses a la demarche et nous allons

montrer maintenant comment appl iquer la methode pour ob ten i r le s valeurs des

parametres et leurs incer t i tudes .




Pour trouver le minimum de la somme

nous devons resoudre un sys t eme d 'equa t i ons l ineaires :

soit

Dans le cas genera l , II es t plus facile de travailler avec une e c r i tu re matricielle. Pour ce la ,

introduisons la matrice Tde n l ignes et de k co lonnes :

le vecteur (soit la matr ice d 'une co lonne et de n l ignes)

et le vec teu r (soit la mat r i ce d 'une co lonne et de k l ignes)

Avec ce s notations matr i c ie l l es , la s o m m e R (125) s 'ec r i t

e t les equat ions (126)

Nous voulons trouver le vec teu r A a par t i r du vec teu r connu 3 En multipliant (127) par

la matrice (^7T

^7)~

1, nous obtenons le resu l ta t :




Les vec teurs A et y sont lies par une t rans fo rmat ion l ineaire avec un Jacob ien J, c ' es t

pourquoi nous pouvons uti l iser la re lat ion (65) pour les var iances :

La mat r i ce de covar iance D(y] es t d iagona le car toutes les mesures y"p

sont indepen-

dan tes . De plus el le est egale a la m at r ice un i ta i re vu la normal isa t ion du vecteur y :

Ainsi , I 'express ion (129) prend la fo rme

Grace aux formules (128) e t (130) nous avons t rouve les va leurs des parametres {aj} e t

leurs incer t i tudes. Bien que la mat r ice D(y] soit d iagona le , la mat r i ce D(A) ne Tes t pas

(les paramet r es {a,j} ne sont pas independants ) .

Explicitons (128) et (130) pour les cas les plus simples.

Fonction constants

la matrice T se degenere en une seule colonne :

La matrice (.77T

.77) devient un nombre

De meme

Le resultat (128) prend la forme




et 1'expression (130)pour la variance devient

Si toutes les erreurs sont les me me s , < T I = &i = . . . = an = a, nous retrouvons nos

formules pour la moyenne (82)et pour la variance (84) :

Fonction lineaire

la matrice F prend la forme :

la matrice (F^F] est une matrice (2 x 2)

et

La matrice inverse de (J-^ J-} qui est aussi la matrice de covariance (130)s'ecrit

ou




Les expressions (128)donnent

Les elements D(A)\\ et D(A}<2-2 de la matrice de covariance defmissent 1'incertitude

sur cti et sur 0 ,3

Dans le cas general, I'element D(A)i2 est different de 0, ce qui signifie que les deux

parametres a\ et a-i sont correles :

Remarque tres importante. Supposons que toutes les valeurs {y zexp

} soient dis-

tribuees selon une loi normale. Les conditions de minimisation (126) ou (128) fixent k

relations entre les {y zexp }. Ainsi, la somme Rmin ou nous avons remplace les {aj} par

leurs valeurs venant de la minimisation (128) a une distribution x2

avec (n — k) degres

de liberte, conformement a la formule (105). Pour les {yjxp

} distributes selon une loi

normale, la notation standard de cette somme est x2 : Rmin =X m i n - Rappelons que

la valeur moyenne de Xminsel°

n(98) est

alors que son erreur est selon(99)

Autrement dit, si tous nos calculs sont corrects et coherents et si toutes nos hypotheses

sont verifiees, nous devons obtenir pour la somme de carres jR^P

n une valeur proche

de (n — k ) .

A cause de cette relation avec la distribution %2, la methode de moindre carres est

egalement appelee la methode %2.

L'hypothese de la forme gaussienne des distributions y ^ donne une autre interpretation

du critere du minimum des carres. La probability dP que les y{ se trouvent dans les




interval les [yjxp

, y^xp

+ dyi] s'ecrit alors

ou R est defini par (124). Ainsi le m i n i m u m de R(ai,a,2,... , a / j ) , fonc t ion des

parametres 0 1 , 0 2 , . . . , o & , correspond au maxi mum de cet te probabi l i ty . On peu t

dire que les "meilleures valeurs" de 0 1 , 0 2 , . . . , a^ sont celles qui a t t r ibuen t la plus

grande probabilite au resultat observe.

4.1.2 E X E M P L E D ' U N E F O N C T I O N L I N E A I R E

Sur la figure 4.1,nous avons presente un exemple de donnees expe rim ent ales (10

points) pour lesquel les nous voulons ajuster une droite y = a\ + a-^x. Les valeurs

numeriques correspondantes sont reunies dans le tableau4.2.

Ier

niveau d'analyse

Pour une es t imat ion rapide on peut u t i l i ser une procedure presque intui t ive . A Poeil

nu , on trace toute la famille des courbes lineaires qui passent p ar les points expe rimen -

taux et on choisit les valeurs maximale et minimale de a;. La valeur approximat ive

et son erreur peuvent etre definies s implement comme :

Dans not re cas, pour les lignes (1) et (2) on obtient

II

e

niveau d'analyse

Dans le tableau 3.2,nous avons explici te tous les resultats intermediaires necessaires

pour calculer 01 e t a2. L'appl icat ion di recte des fo rmules (133) —(134) nous donne le

resul tat final :

N ou s gardens deux chifFres significatifs dans 1' incert i tude A a2 afin d'avoir , pour les

grandes valeurs de x, le meme nombre de chifFres significatifs dans a^x et dans 01-

Nous pouvons e s t i me r auss i le coe f f i c i en t de cor re la t i on (22) de d e u x p a r a m e t r e s

Sa v a l e u r abso lue e s t relativement g r a n d e , done c es p a r a m e t r e s sont fortement co r re les .

Nous avons pr is cons c ience de ce t t e co r re la t i on lo rs de notre an a l y se rap ide : pour passer




Tableau 3 .2 : L'a jus t emen t des coefficients ai e t a? pour une droite

xt

vrr

(AF

( Ayfx p

) 2

I?

( A 3 / r

p

)

2

t /rp

(Aj/^x p

P

2/eXP

'î

(Ayp

J/*hi

( » rp

- v jh 4

)2

( A 2 / rp

)2

1 2 3 4 5 6 7 8 9 1 0

5,4 3,8 4,0 4,0 3,5 2,1 2,9 2,0 1,1 1,7

0,6 1,1 0,2 0,5 0,5 0,6 0,6 1,1 0,2 0,4

2 , 7 8 0,83 25 4 4 2,78 2,78 0,83 25 6,25

2,8 1,7 75 16 20 16,7 19,4 6,6 225 62,5

3 3 225 64 100 100 136 53 2025 625

15,0 3,1 100 16 14 5,8 8,1 1,7 27,5 10,6

15,0 6,3 300 64 70 35 56,4 13,2 247,5 106,3

5,0 4,5 4,1 3,6 3,2 2,7 2,3 1,8 1,4 0,9

0,4 0,4 0,3 0,6 0,4 1,0 1,0 0,0 2,3 4,0

£

74,25

445,7

3334

201,8

913,7

10

de la droi te (1) a la droite (2 ) il faut changer non seu lement la pente a^ mais auss i la

constante a\. Ceci n 'est pas toujours le cas . Dans une situation ou I'origine x = 0 se

t rouve a peu pres au milieu des points expe r imen taux , le passage d 'une droi te ex t rem e a

une au t re se fait s e u l e me n t par la modification de la pente 0 2 - L ' e r r e u r sur la cons tan te e t

le coe f f i c i en t de cor re la t ion sont pet i ts dans ce cas- l a . Ceci peut ega lement se voir grace

a la formule (135). Quand tous les {a?;} sont du meme s igne , le coe f f i c ien t de corre la t ion

es t grand. Quand I'origine x = 0 se t rouve au milieu de s po in ts exper imentaux , la s o mme

cor respondante es t proche de ze ro .

IIP niveau d'analyse

Dans Interpretation d 'une e xper ience de physique, nous ne pouvons pas nous limiter aux

ca lcu l s des pa ramet res e t a leurs incer t i tude s. Nous devons auss i nous assurer que notre

hypothese, selon laquelle les resu l tats exper imentaux peuvent etre decrits par une fonction

l ineai re , es t cor rec te .

Supposons que notre collegue a f f i rme que la meilleure approximation de ces points expe-

r imen taux n ' es t pas une fonct ion l ineaire y(x) = a\ + a^x, ma is une cons tante :

II appl ique le s formules (131)e t (132) et i l obtient




II su f f i t de regarder la f igure 3.3 pour voi r qu'il se t r o mp e . S on hypothese e s t f ausse , mais

comment pouvons-nous le prouve r ?

La d i f f e rence en t re nos deux resu l ta ts se t rouve dans la valeur de la s o m m e Xmin

c

l

u

''faut ca l cu le r apres avoir chois i les va leurs de s p a rame t re s {az}. Conformement a (136)

et (137), dans not re a jus tement de 10 points avec 2 p a r a me t r e s , on obtient Xmin=

&

avec une i ncer t i tude A.Xmin=

4- La va l eu r obtenue dans la dern ie re l igne du t ab l e au 3.2

(Xmm)exp

— 10 es t en t res bon acco rd avec ce t te es t ima t ion ( les va leu rs de y\^ s o n t

calcu lees avec le s p a rame t re s (139)). Par cen t r e , pour I 'ana lyse de notre col legue, on

s 'a t tendra i t a obtenir Xmin=®avec

^Xmin —^ tandis que la va leu r experimental est

(Xmm)eXP- 145

! Voi|ala contradic t ion !

Nous pouvons re fo rmule r ces conc lus ions en t e r me s de probabi l i te car nous avons deja

etudie la dist r ibut ion %2

au p a rag rap he 2 .3 . 2 . Dans l e t ab leau 3.3, nous presentons le sva leurs %

2et les probab i l i tes P pour que %

2soi t p lus grande ou egale a %

2avec un

nombre donne de degres de l iber te .

Pour notre col legue, la probab i l i te de t r o u v e r x 2P '

U Sg r a n d que 21 ,7 pour v — 9 e s t

inferieure a 1%. La probabi l i te de t rouver x2

proche de 100 es t alors negl igeable. Ainsi

son hypo these es t re futee.

Tableau 3.3 : Les valeurs x^>et

les probabi l i tes P pour que\2>x?,

pour v degres de l iber te pour un e droi te

TV

12

3

4

5

6

7

89

10

11

12

13

14

15

16

17

1819

20

0,98

0,001

0,040

0,185

0,429

0,752

1,134

1,564

2,0322,532

3,059

3,609

4,178

4,765

5,368

5,985

6,614

7,255

7,9068,562

9,237

0,90

0,016

0,211

0,584

1,064

1,610

2,204

2,833

3,4904,168

4,865

5,578

6,304

7,042

7,790

8,547

9,312

10,085

10,86511,651

12,444

0,80

0,064

0,446

1,005

1,649

2,343

3,070

3,822

4,5945,380

6,179

6,989

7,807

8,634

9,467

10,307

11,152

12,002

12,85713,716

14,578

0,70

0,148

0,713

1 , 4 2 4

2,195

3,000

3,828

4,671

5,5276,393

7,267

8,148

9,034

9,926

10,821

11,721

12,624

13,531

14,44015,352

16,266

0,50

0,455

1,386

2,366

3,357

4,351

5,348

6,346

7,3448,343

9,342

10,341

11,340

12,340

13,339

14,339

15,338

16,338

17,33818,338

19,337

0,30

1,074

2,408

3,665

4,878

6,064

7,231

8,383

9,52410,656

11,781

12,899

14,011

15,119

16,222

17,322

18,418

19,511

20,60121,689

22,775

0,20

1,642

3,219

4,642

5,980

7,289

8,558

9,803

11,03012,242

13,442

14,631

15,812

16,985

18,151

19,311

20,465

21,615

22,76023,900

25,038

0,10

2,706

4,605

6,251

7,779

9,236

10,645

12,017

13,36214,684

15,987

17,275

18,549

19,812

21,064

22,307

23,542

24,769

25,98927,204

28,412

0,01

6,635

9,210

11,345

13,277

15,086

16,812

18,475

20,09021,666

23,209

24,725

26,217

27,688

29,141

30,578

32,000

33,409

34,80536,191

37,566

Dans no t re cas , la probabi l i te de t r o u v e r x2> 10 P

ou r v— 8 est approx ima t i vemen t

ega le a 2 5 % . En fait, ce t t e va leur es t assez grande. I I f au t se rappe le r que la dist r ibut ion

X2

es t asymet r ique e t que ( ' i n te rp re ta t ion des resu l ta t s avec ce t te d is t r ibu t ion es t un peu

part icu l iere. Pour illustrer ses proprietes dans notre cas, d iv isons le s valeurs de %2 en 4



IV - AJUSTEMENT D B S P A R A M E T R E S 131

in terva l les : /i=[0,4[, 7 2 = [ 4 , 8 [ , 73 = [ 8 , 1 2 [ et 7 4 = [12 ,oo [ . Le pascorrespond a la

racine carree de la va r i ance . A I 'aide du t ab l eau 3.3, nous eva luons les probabi l i tes pour

que la va leu r de x2 se

t rouve dans I ' in te rva l le cor respondant : P\ ~ 0,15, ^2 — 0,40,

PS ~ 0, 30, PI ~ 0,15. Nous voyons que les probabi l i tes d'obtenir de t res grandes et de

t res pet i tes va leu rs de x2 sont

fa ib les. Leur appar i t ion signifie que le choix de la fonction

etait mauvais. En physique, on considere que le choix d'une fonction es t correct si la

va leur de x2

Par

degre de l iber te es t proche de 1.

II existe un autre argument important qui conduit a interpreter ces probabil ites avec beau-

coup de prudence. Rappe lons que nous avons remplace partout dans nos ca lcu ls le s vra ies

var iances c r ? par les valeurs expe r imen ta l es (Ay^xp

)2, car nous ne conna issons que ces

dernieres. La di f ference entre a^ e t Ay^xp

peut e t re de I 'ordre de 10%.Ainsi nous somme s

capab les de dete rminer %2

a 10 — 20% pres.

En conclusion, notons que la comparaison des deux premiers niveaux d'analyse montre

bien deux par t icular i ty caracterist iques de ce genre d'evaluation rapide : 1'approche

simple reproduit assez bien les valeurs de 01 et de 0 , 3 , mais les incerti tudes sur ces

valeurs peuvent etre tres differentes des valeurs exactes. L'avantage du t roisiemeniveau reside en la possibilite de confirmer ou d'infirmer le choix de la dependance

fonctionnelle.

La methode des moindres carres est une approche tres efficace et elle est largement

suffisante pour le s experiences faites en travaux pratiques. Neanmoins, il existe dessituations ou on ne peut pas 1'appliquer, par exem ple lorsque le nombre d 'evenementsest pet i t et que Ton ne peut pas evaluer correctement le s incertitudes, ou quand le s

incerti tudes sur x ne sont pas negligeables x\,xi,... ,xn. Dans ces situations, on

utilise une autre approche plus generale basee sur la fonction dite de v raisemblance.

4 . 2 METHODE D U M A X I M U M D E V R A I S E M B L A N C E

Une des hypotheses uti l isees pour developper la methode des moindres carres etait la

f o rme gauss ienne de la dis t r ibu t ion des y t-. On peut demont re r que cette condition peut

etre legerement a f fa ib l ie mais que,de toute f acon, ce t te approche n 'es t pas va lab le pour

une dist r ibut ion que lconque . C'est pourquoi on peut chercher a proposer une approche

plus gene ra l e du prob leme.

4.2.1 L'IDEE DE LA METHODE

DU MAXIMUM DE VRAISEMBLANCE

L' idee de la methode du maximum de vra isemblance est assez simple (pour simplifier

encore la pres entat ion, nous supposons qu ' i l n'y qu 'un seul pa rame t re a ; la genera l i sa t ion

au cas de p lus ieurs paramet res e s t relat ive m en t sim ple). Uti lisons la d e ma r c h e adaptee

a la f in du paragraphe 4.1.1, ou nous avons in te rpre te la methode des moindres ca r res

comme cel le qui donne la probabi l i te ma x i ma l e de re t rouver le s va leu rs expe r ime n ta les

avec une fonction theor ique.



132 ANALYSE STATISTIQUE D B S D O N N E E S EXPERIMENTALES

En utilisant les fonctions de distribution /(#z; a) des var i ab les2

i ndependantes X{, on ecr i t

la probab i l i te de t rouver le s va leurs de X i d a n s le s in terva l les [#,,£; + dxi]

Pour que cette probabi l i te soit m a x i m a l e , il faut que la fonction

ait un maximum. Cet te fonction s ' appe l l e la fonction de vraisemblance, et la condition

du maximum de v ra ise mb lance p rend na tu re l l eme n t la forme

A partir de ce t te condition, on t rouve la v a l e u r du pa rame t r e a. I I es t parfois plus commode

de minimiser le logarithme de cette fonction que la fonction e l l e -meme .

O n des i re , par exemple , t rouver la moyenne / j, i n connue d ' une fonction de distribution

gauss ienne. Supposons que la fonction de distribution est la meme pour tous le s Xi (avec

la meme var iance inconnue c r2 ) :

Le logarithme de la fonction de v ra i semb lance s ' ec r i t alors

et sa der ivee

s 'annu le pour

L e signe^sur p soul igne que la methode du max imum de vra i se mb lance nous ind ique com-ment es t imer ce pa rame t r e ; a u t r e m e n t dit, el le fournit une est imat ion. Bien e v i d e mme n t ,

dans ce cas s imp le , on re t rouve une express ion connue de la moyenne.

Mais cet te methode e s t v ra imen t t res genera le . Par exemple, pour une distribution bino-

mia le (qui est une distribution discrete !), on peut t rouver la v a l e u r la p lus v r a i sem b lab l e

2 Pour avoir la meme ecriture qu'au debut du chapitre, la variable aleatoire est representee par la

lettre x.



IV - A J U S T E M E N T DES P A R A M E T R E S 133

de la probabi l i te i nconnue p si , au cours de N exper iences , un evenement se produit x

fois. L a fonction d e v r a i s e m b l a n c e , d 'ap res (30) , s 'ec r i t

e t son max imum cor respond au max imum du logarithme

(dans cet te express ion, nous avons vo lonta i rement omis une cons tan te qui ne depend pas

de p). Alo rs

pour np = x. Autrement d i t , la va l eu r la p lus v ra i semb lab l e de p est

Malheureusement , la methode du maximum de vra isemblance ne peut pas resoudre tous

le s problemes. En par t icu l ie r , le s es t imat ions ob tenues par cette methode peuvent e t rebia isees . Revenons a I ' exemp le d 'une distribution gauss ienne avec le logar i thme de la

fonction de vra isemblance

e t de te rm inons I 'es t imat ion pour la va r i ance .

La der iva t ion de cette express ion par r appo r t a u condui t a ( ' equa t ion

soit

C o m m e nous I ' avons deja vu p lus ieurs fois, pour avoir une estimation correcte (non bia isee)

il faut div iser l a somme pa r T V — 1 e t non pas par N (voir , par exemp le , (85)).

En conclus ion de ce pa ra g ra phe , donnons que lques r emarques conce rnan t le s re la t ions

entre le s deux methodes proposes d 'a jus tem ent des pa rame t r es .

Tout d 'abo rd , la methode de s moindres car res peut e t re cons ideree c o m m e un cas par t i -

cu l ie r de la methode du maximum de v ra i semb lance : s i T on prend comme fonction de




distribution3

de y"p

une gauss i enne avec de s "moyennes" yth

(a;xz) dependan t de un (ou

plus ieurs) pa rame t re ( s ) , on a

e t le logar i thme de la fonction de v ra i semblance donne (a une cons tan te pres) la s o m m e

R (125) avec le signe moins. Ainsi le m a x i m u m de vra i semblance cor respond au minimum

de la somme de s ca r res .

Cette cor respondance n 'es t pas su rp r enan te , compte tenu de ( 'a rgum en ta t ion cho is ie pour

deve lopper la methode du maximum de v ra i semb lance . De plus, elle pe rme t d'utiliser la

puissance de la methode des rnoindres ca r res pour evaluer , par exemp le , les incer t i tudes

sur le s va leurs des parametres (voir le paragraphe suivant).

En fm , si la methode du m a x i m u m de v ra isem b lance soit plus souple que la methode de s

moindres ca r res , on doit se souveni r qu 'e l le n 'est pas parfaite : les estimations qu 'e l l e

propose peuvent e t re biaisees e t il est p lus d i f f ic i le d 'avoi r un jugement sur la qua l i t e de

I'ajustement des parametres. Rappelons que la methode des moindres car res (par a valeur

de x2

obtenue) peut n ous dire si notre hypothese sur la forme de la fonction a a juster est

cor rec te ou non. Au con t ra i re , dans la methode du m a x i m u m de v ra i semblance , ce type

de cr i te re n'ex is te pas.

4 . 2 . 2 I N E G A L I T E DE CRAMER-RAO-FRECHET

Un aspec t important de la methode du maximum de v ra i semblance es t l e ca l cu l des

incert i tudes sur les v a l e u r s de s pa rame t r es .

Commencons par la fonction de v ra i semb lance d ' une distribution norma le (140) e t che r -

chons ( ' i ncer t i tude sur p. Nous avons deja ca l cu le le logarithme de la fonction de v ra isem -

blance dans (141) de cette distribution. O n peut ajouter a cet te express ion une cons tan te

i ndependan te de p c o m m e , pa r exemple ,

ou p es t de fmi pa r (142). O n obtient a lors

La representa t ion de cet te fonction de p es t une pa rabo le dont le maximum se t rouve au

point p = p. Pour N =1, la parabo le cor respondante

est presentee sur la Figure4.2.

3 Pour retrouver exactement les meme expressions que dans la methode de x2>on

reprend les

notations y j pour les variables aleatoires et x^ pour 1'argument des fonctions.



I V — AJUSTEMENT D E S P A R A M E T R E S 135

Figure 4.2 : Le logar i thme de la fonc t ion de vraisemblance d 'une dis tribution gaussienne

Cet te courbe est a la base de ( ' ana lyse de s fonc t ions de v ra i semb lance dependan t d ' un

paramet re . L e segment de droite re l iant les deux branches de la parabole pour InL =

— 1/2, carac te r i se un i n te rva l l e de conf iance

cor respo ndant a une probabi l i te de 68 ,2 7 %, pour une distribution gauss ienne. D 'une facon

ana logue , le segmen t de droite reliant le s deux branches de la parabole pour \nL = —2

correspond a un i n te rva l l e de conf iance de 95 ,45 %.

O n peut d e mo n t r e r pour une c lasse assez la rge de d is t r ibut ions (pas f o r cemen t gaus-

s iennes ) qui ne depende nt que d 'un seu l pa rame t r e , qu'il est poss ib le de t rouver les inter-

va l l es de conf iance de la m e m e f a con .

Par exemple , dans l e cas d 'une distribution binomia le abordee dans le pa rag raphe p rece-

dent , on peut t racer le logar i thme de la fonction de v ra isem b lance en fonction de p. Pourx = 2 et A" =10, cet te fonction

e s t prese ntee sur la F igure 4.3 (dans cet te expres s ion , on a ajoute une cons tan te pour

que la v a l e u r max ima l e de InL(p) soit egale a 0) . Ce n 'est pas une par abo le ma is el le

lui ressemble que lque peu. D 'a i ll eu rs , on peut souvent approx imer le s fonc t ions de ce

type par des parabo les au vois inage du max imum (ce qui signif ie qu'on peut approcher la




fonction de distribution par une gaussienne). La position du maximum de cette fonction

nous donne la valeur de I'estimation (143) : p= 0,2.

Figure 4.3 : Le logarithme de la fonction de vraisemblance

pour une distribution binomiale avec x =2 et N = 10

A partir de cette courbe, nous pouvons facilement trouver tous le s intervalles de con f iance

des i res . Parexemple, pour un intervalle de confiance de 95,45 %, la solution de I'equation

donne [0,036 ;0,505]. On remarque que cet intervalle n'est pas symetrique par rapport

a p = 0 , 2 .

U ne autre ap p r o ch e existe pour determiner ("incertitude sur la valeur de s parametres d an s

la methode du maximum de vraisemblance. El le est beaucoup plus pratique, surtout

lorsque la fonction de vraisemblance depend de plusieurs parametres. Cette approche

porte le nom d'inegalite de Cramer-Rao-Frechet. Donnons sa demonstration dans le cas

ou la vraisemblance L(a) ne depend que d'un seu l parametre a, mais le resultat peut etre

gene ra l i se au cas de plusieurs parametres.

Soit a I'estimation du parametre a. Cette estimation est biaisee par une erreur systerna-

tique f3(a), c'est-a-dire que la valeur moyenne de a est ega le a4

4 Pour simplifier la presentation des formule, nous utiliserons 1'ecriture / • • •dX qui signifie une

integrate multiple sur toutes les variables xt.




En de r i van t cet te re la t ion par rappor t a a e t utilisant le fait que I'estimation a n 'es t

fonction que des donnees exper imenta les {xi}, on obtient

Cet te relation peut encore s 'ec r i re sous la forme

Calcu lons ma in t enan t la der ivee par rapport a a de la relation de no rma l i sa t i on de la

v ra i se mb l an ce

que T on peut mettre sous la forme

En multipliant cette relat ion par a et en le sous t rayant de (145), on obtient

S i Ton app l ique I ' inega l i te de Schwar t z5

aux fonctions

on t rouve

La premie re in tegra le represente la va r i ance < r % du pa rame t r e a, pour laquel le on obtient

f m a l e m e n t I ' inega l i te recherchee :

5 Pour demontrer cette inegalite, il suff i t de remarquer que 1'integrale f ( X f ( x ) + g(x))2dx est

positive quelque soit la valeur de A. Ainsi 1'equation

n'a pas de racines reelles non nulles. Done, le discriminant doit etre negatif. Cette condition

nous donne I'inegalite recherchee.



138 A N A L Y S E S T A T I S T I Q U E DE S D O N N E E S E X P E R I M E N T A L E S

La va leur moyenne du car re de la der ivee logar i thmique de la v r a is e m b l a n c e p e u t e t re mise

sous la f o rme

(pour obteni r cet te re la t ion, il su f f i t de ca lcu le r la der ivee de 1 'equat ion (146) par rap port

a a).

A ins i I'inegalite (147) prend une au tre forme equ iva len te

Pour que cet te inegalite dev ien t une ega l i te , il faut que , dans I ' inega l i te de S c h w a r t z , les

fonct ions / et g soient les memes a un f ac teur multiplicatif A pres, c 'es t -a-d i re que

Aut remen t d i t , la v ra i se mb l an ce doit avo i r une f o rme gauss ienne (a compa re r avec 1 'equat ion

(144))

Notons que, dans ce c a s , la der ivee seconde du logarithme de la v ra i se mb l an ce est une

cons tan te :

A ins i , pour la var i ance , on obtient

soit

C o mme e x e mp le d'utilisation de la f o rmule de C ramer - R ao- F reche t , cons iderons la distri-

bution de Maxwe l l deja etudiee dans le paragraphe 3.1.3. Supposons que soit mesure le

module de la v i tesse des molecu le d 'un gaz et que nous vou l ions de te rm iner la t e m p e r a t u r e

a par t i r des resu l ta ts de N mesures e f fectuees : i;? (i — 1,... , N).



IV - AJUSTEMENT D B S PARAMETRES 139

La fonction de distribution f(v) du module de vi tesse v s ' e c r i t

done, le logarithme de la vra isemblance prend (a une constante pres qui ne nous in te resse

pas) la forme

L'estimation de la t empe ra tu r e T s'obtient e n annu lan t la der ivee pa r rappo r t a T de

cette expression :

Ainsi, on obtient

Cet te express ion cor respond a I ' in t repre ta t ion physique bien connue de la t empe ra tu r e

comme mesure de I 'energ ie c ine t ique moyenne de s molecules. O n peut ver i f ie r a isement

que cette estimation n ' es t pas biaisee (elle ne contient pas d ' e r r eu r sys tema t i que ) , ce qu i

signifie que sa va leur moyenne e s t egale a T :

Pour demon t re r ce res u l ta t , ca l cu lons la va leur moyenne de T e n utilisant la forme expl ic i te

de la distribution de Maxwe l l (151). La va leur moyenne du car re de la v i tess e pour chaquemolecule i, e s t d ' a p res (27 ) , ega le a

O n obtient, ainsi pour

Le paramet re T n 'es t pas biaise, done,

De m e m e , on ca lcu le l a va r iance de ce pa rame t re en utilisant la procedure appl iquee pour

obtenir la formule (84) :




Pour obtenir ce resu l ta t , nous avons utilise I ' i ndependance des va r iab les Vi e t le fait q u e ,

d 'ap res ( 2 7 ) ,

D 'apres la fo rmu le de Crame r -Rao -Freche t , la var iance de la t e m p e r a t u r e e s t donnee par

O n peut ca l cu le r fac i l ement la denomina teu r de cette express ion :

Ainsi , dans l e cas de la distribution de Maxwe l l , I'inegalite dev ien t I 'egal i te .

O n voit que I 'es t imat ion de la t e m p e r a t u r e defmie par (152) est une es t ima t ion non biaisee

e t e f f i cace .

O n peut a isement ver i f ie r que la condi t ion (149) es t sat is fa i te et que la v r a i s e m b l a n c e

peut encore s ' ec r i re sous la forme (150). IMous la issons au l ec teur le soin de re t rouver lava l eu r de A cor respondante a ins i que le coe f f i c i en t de norma l i sa t ion .



C O N C L U S I O N

En conclusion, on retiendra les points suivants.

Le probleme de la determ ination de la valeur d 'une grandeur physique est inseparable

de celle de son incertitude car toutes deux font partie d 'une description unique entermes de probabili tes. En util isant ce langage probabiliste, nous ne pouvons plus

repondre facilement a la question par laquelle nous avons commence cet ouvrage :

"Quelle est la valeur de telle grandeur ?" M ais en donnan t com me reponse la valeur et

son erreu r (et les autres p arametres si , par exe m ple, la distr ibutio n de pro babili te n'est

pas gaussienne), nous apportons une inform ation plus riche et surto ut plus coherente.

Sans connaitre 1'incertitude il est impossible de savoir si Ton peut avoir confiance

en une valeur mesuree : avons-nous obtenu seulement un ordre de grandeur ou

avons-nous reussi a avoir plusieurs chiffres significatifs ? C'est 1'incerti tude qui donne

1'information sur la fiabilite des resultats et sur leur quali te.

On comprend ainsi qu'il est toujours necessaire d'avoir une estimation, meme grossiere,

de 1'erreur exper imentale . En fait , la de te rmina t ion de 1'incerti tude n'est pas plus dif-

ficile que la determination de la valeur elle-meme. L' incert i tude est evaluee avec sa

propre precision. C'est tres important dans les applications car il doit y avoir adequa-tion entre la methode choisie pour obtenir la valeur moyenne avec son erreur et laprecision recherchee : il ne faut pas utiliser des methodes lourdes et complexes si 1'on

cherche une precision de 10%.

L'approche statistique est une approche extremement puissante et informat ive , mais

elle a ses limites : elle doit etre appliquee avec beaucoup de precaut ions au x erreurs

system atiques qui m ette nt en jeu des param etres plus difficiles a analyser.

Finalement, il faut souligner que rien ne peut remplacer le bon sens de 1'experimen-ta teur , ni dans le choix de la methode d'analyse ni dans 1'appreciation des resultats.

Nous esperons que les differents aspects qui ont ete abordes contr ibueront a demystifier

un domaine qui rebute souvent le s exper imentateurs . II existe, certes, une l i t terature

abondante sur ce domaine, notamment dans le s pays anglo-saxons, mais souvent tres

specialisee ou dispersee. Quelques ouvrages de reference sont donnes dans la biblio-graphic pour permettre d'approfondir certaines questions ou pour trouver d'autres

exemples d'application, mais les problemes les plus courants o nt ete t rai tes dans cet

ouvrage volontairement synthetique.






B lB L IO G R A P H IE

R . J . B a r l o w , "A Guide to the U se of Statistical Methods in the Physical Sciences",

Jo nh W iley fe Sons, Chich ester , New Y ork , B risbane, Toronto, S ingapo re, 1989.

E. Be lor izky , "Probabilites et statistiques dans les sciences experiment ales", Nath an ,

Paris, 1998.

G . Cowan , "Statistical Data Analysis", Clarendon Press, Londres, 1987.

D.J . Hudson, "Lectures on Elementary Statistics and Probability", CERN 63-29,

1963 ;

D.J . H udson, "Statistics Lectures II: Maximum Likelihood and Least Squares Theory",

CERN 64-18, 1964.

L. Lyons, "A practical guide to Data Analysis fo r Physical Sciences Students", Cam-

bridge University Press, Oxford, 1991 ;

L. Lyons , "Statistics fo r nuclear and particle physicists", Cambridge University Press,

Oxford, 1986.

M . N eui lly e t CETA M A, "Modelisation et estimation des erreurs de mesure", Lavoisier ,

Technique et Documentation, Londres, Paris , New York, 1998.

M . R . Spiegel, "Theorie et applications de la statistique", Mc-Graw-Hi l l , Londres, 1987.

G .L . Squires, "P ractical P hysics", M cG raw -H ill , Lo ndres, 1968.

B .N. Tay lor, Ch .E . Kuy at t , "Guidelines for Evaluating and Expressing the U ncertainty

ofNIST Measurement Results", NIST Technical Note 1297, 1994

(h t tp : / /phys ic s .n i s t .gov /cuu /Uncer ta in ty /b ib l iog raphy .h tml ) ;

"Guide pour ./'expression de 1'incertitude de mesure", B I P M , CEI, FICC, ISO,

O I M L , U ICPA, U I P P A , ISB N 92-67-20188-3, 1995

(http://www.iso.ch/iso/fr/prods-services/otherpubs/Metrology.html).

B . L . Van der Waerden, "Statistique mathematique", Dunod, Paris, 1967.






I N D E X

"Addition" de deux mesures 99

Ajus tement des parametres 119

Chiffres significatifs 78

Coefficient de correlation 24, 127

Coefficient de Student 91, 97

Comparaison de deux resultats 96

Correlations 23, 57, 125

Covariance (voir aussi m atrice de covariance) 29

Degre de l iberte 91, 97, 127, 130

Distr ibution binomiale 3 1 , 4 9

D istrib utio n constante 18, 66

Distribution gamma 40, 89

Distr ibut ion de Gauss (normale) 25, 42, 89Distr ibution de Lorentz (d e Cauchy) 37, 45, 89

Distr ibution de M axw ell 25, 84, 139

D istrib utio n de Poisson 34, 49, 89

Distribution de Student 87, 89, 90

Distr ibut ion x2

82, 89, 127, 130

Ecart quadrat ique moyen 77

Ecart-type 18

Echantillon 76

Erreur 8

Erreur systematique 9, 101, 105, 116

Estimation 119




Estimation biaisee 120, 140

Estimation efficace 120, 140

Fonction de distribution 16, 17

Fonction de distribution de plusieurs variables 20

Fonction generatrice des moments 19

Fonction generatrice des moments centraux 20

Incertitude d'appareil 9, 102

Incertitude naturelle 8, 101

Incertitude statistique 9, 116

Intervalle de confiance 72, 91

Matrice de covariance 57, 125

Methode de moindres carres (%2) 122

Methode de maximum de vraisemblance 131

Moments 19

Moments centraux 19

Moyenne 17

Moyenne experimentale 76

Niveau de confiance 72, 91

Probabilite 11

Propagation des erreurs 51, 53

Precision de la variance experimentale 78

Theoreme central limite 42

Variable (grandeur) continue 14, 16, 17

Variable (grandeur) discrete 14, 16, 17

Variables independantes 13, 21, 23

Variance 18

Variance experimentale 77

Vraisemblance 132



T A B L E D E S M A T I E R E S

Preface 5

Pourquo i les inc ertit ude s existent-elles ? 7

Chapitre 1. Rappels sur la theor ie des prob abili tes 11

1.1. Probabilites 11

1.1.1. Definitions et proprietes 11

1.1.2. Grandeurs discretes et continues, fonction de distribution 13

1.1.3. Proprietes de la fonct ion de dis tr ibut ion 17

1.1.4. Fonction de dis tr ibut ion de plusieurs variables 201.1.5. Correlations 23

1.2. Di stribu tion de Gauss 25

1.3. Auitres distributions elementaires 30

1.3.1. Distribution binomiale 31

1.3.2. D istrib utio n de Poisson 34

1.3.3. Distribution de Lorentz 37

1.3.4. Dis tributio n gam m a 40

1.4. Theoreme central limite 42

Chapitre 2. Fonctions d'une variable aleatoire 51

2.1. Propagation des erreurs 51

2.1.1. F ormu le de propagation des erreu rs 51

2.1.2. Exemples de propagation des erreurs 53

2.1.3. Cas des variables correlees 57

2 . 2 . Distribution de probabilite d'une fonction de variable aleatoire 61

2.2.1. Fonction biunivoque 61

2.2.2. Cas general 62

2.2.3. Exemple physique 64




2.2.4. Precision de la fo rmule de propagation des erreurs 67

2.3. Niveau de confiance et intervalle de confiance 71

Chapitre 3. Experiences avec un nombre l imite de mesures 75

3.1. Echantillon, valeur moyenne e t ecart - type 75

3.1.1. Definitions et proprietes 76

3.1.2. Precision de la variance experimentale et chifFres significatifs .. 78

3.1.3. Distr ibut ion x2

82

3 . 2 . Dis t r ibu t ion de Student 87

3.2.1. Petit nombre de mesures 903.3. Deux resultats experimentaux 96

3.3.1. Com paraison de deux resultats exp erim entau x 96

3.3.2. " Addit ion " de deux resultats exper imentaux 99

3.4. A utre s sources d'e rre urs 101

3.4.1. Inc ertitu de s d'appare il 102

3.4.2. Erreurs systemat iques 105

3.4.3. Comment eviter les erreurs systemat iques ? 109

3.4.3. Comment travailler avec les erreurs systematiques ? 115

Chapitre 4. Ajus t em en t des parametres 119

4.1. M eth ode des m oindres carres 122

4.1.1. Idee de la methode des m oindre s carres 122

4.1.2. Exemple d'une fonction lineaire 128

4 . 2 . Methode du m axim um de vraisemblance 131

4.2.1. Idee de la m eth od e du m axim um de vraisemblance 131

4.2.2. Inegalite de Cramer-Rao 134

Conclusion 141

Bibliographie 143

Index 145

Table des matieres 147