5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 1/150
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 2/150
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 3/150
ANALYSE STATISTIQUE
DES DONNEES EXPERIMENTALES
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 4/150
Grenoble Sciences
Grenoble Sciences poursuit un triple objectif :
• realiser des ouvrages correspondant a un projet clairement defini, sans contrainte
de mode ou de programme,
• garantir les qualites scientifiqueet pedagogique des ouvrages retenus,
• proposer des ouvrages a un prix accessible au public le plus large possible.
Chaque projet est selectionne au niveau de Grenoble Sciences avec le concours de
referees anonymes. Puis les auteurs travaillent pendant une annee (en moyenne)
avec les membres d'un comite de lecture interactif, dont les noms apparaissent au
debut de 1'ouvrage. Celui-ci est ensuite publie chez 1'editeur le plus adapte.
(Contact: Tel.: (33)476 51 46 95 - E-mail: [email protected])
Deux collections existent chez EDP Sciences :
• la Collection Grenoble Sciences,connue pour son originalite de projets et sa qualite• Grenoble Sciences - Rencontres Scientificjues, collection presentant des themes de
recherche d'actualite, traites par des scientifiques de premier plan issus de
disciplines differentes.
Directeur scientifique de GrenobleSciences
Jean BORNAREL, Professeur a 1'Universite Joseph Fourier, Grenoble 1
Comite de lecture pour"Analyse statistique des donnees experimentales"
J.P. BERTRANDIAS, Professeur a 1'Universite Joseph Fourier, Grenoble 1
C. FURGET, Maitre de conferences a 1'Universite Joseph Fourier, Grenoble 1
B . HOUCHMANDZADEH, Directeur de recherches au CNRS, Grenoble
M . LESIEUR, Professeur a 1'Institut National Polytechnique, Grenoble
C. MlSBAH, Directeur de recherches au CNRS, Grenoble
J.L. PORTESEIL, Professeur a 1'Universite Joseph Fourier, Grenoble 1P. VlLLEMAIN, Maitre de conferences a I'Universite Joseph Fourier, Grenoble1
Grenoble Sciences rec.oit le soutien
du Ministere de 1'Education nationals, du Ministere de la Recherche,
de la Region Rhone-Alpes, du Conseil general de 1'Isere
et de la Ville de Grenoble.
I S B N 2-86883-590-2
© EDP Sciences, 2002
ISBN 2-86883-456-6
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 5/150
ANALYSESTATISTIQUE
DESDONNEES EXP ERIMENT ALES
Konstantin PROTASSOV
SCIENCES
17,avenue du Hoggar
Pare d'Activite de Courtabceuf, BP 112
91944 Les Ulis Cedex A, France
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 6/150
Ouvrages Grenoble Sciences edites par EDP Sciences
Collection Grenoble SciencesChimie. Le minimum vital a savoir (/. Le Coarer) - Electrochimie des solides
(C . Deportes et al.) - Thermodynamique chimique CM . Oturan & M . Robert) - Chimie
organometallique CD .Astruc)
Introduction a la mecanique statistique (E. Belorizky & W . Gorecki) - Mecanique
statistique. Exercices et problemes corriges (E. Belorizky & W . Gorecki) - La symetrie
en mathematiques, physique et chimie (J. Sivardiere) - La cavitation. Mecanismes
physiques et aspects industriels (J.P. Franc et al.) - La turbulence (M . Lesieur) -
Magnetisme : I Fondements, II Materiaux et applications (sous la direction d'E. du
Tremolet de Lacheisserie) - Du Soleil a la Terre. Aeronomie et meteorologie de 1'espace
( J . Lilensten & P.L.Blelly) - Sous les feux du Soleil. Vers une meteorologie de 1'espace
( J . Lilensten & J. Bornarel) - Mecanique. De la formulation lagrangienne au chaos
hamiltonien (C. Gignoux & B. Silvestre-Brac) - La mecanique quantique. Problemes
resolus, Tomes 1 et 2 (V.M. Galitsky, B.M. Karnakov & V.I. Kogan)
Exercices corriges d'analyse, Tomes 1 et 2 CD. Alibert) - Introduction aux varietes
differentielles (J. Lafontaine) - Analyse numerique et equations di f feren t i e l les
(J.P. Demailly) - Mathematiques pour les sciences de la vie, de la nature et de la
sante (F. & J.P. Bertrandias) - Approximation hilbertienne. Splines, ondelettes,
fracta les (M. Atteia & J. Caches) - Mathematiques pour 1'etudiant scientifique,
Tomes 1 et 2 (Ph.]. Haug)
Bacteries et environnement. Adaptations physiologiques (/. Pelmont) - Enzymes.
Catalyseurs du monde vivant ( J . Pelmont) - La plongee sous-marine a 1'air.
L'adaptation de 1'organisme et ses limites (Ph. Foster) - L'ergomotricite. Le corps, le
travail et la sante (M. Gendrier) - Endocrinologie et communications cellulaires
(S . Idelman & J. Verdetti)
L'Asie, source de sciences et de techniques (M. Soutif) - La biologie, des origines a
nos jours (P . Vignais) - Naissance de la physique. De la Sicile a la Chine CM . Soutif)
Minimum Competence in Scientific English (J. Upjohn, S. Blattes & V. Jans) -
Listening Comprehension for Scientific English (J. Upjohn) - Speaking Skills in
Scientific English (J. Upjohn, M.H. Fries & D . Amadis)
Grenoble Sciences - Rencontres Scientifiques
Radiopharmaceutiques. Chimie des radiotraceurs et applications biologiques (sous
la direction de M. Comet & M. Vidal) - Turbulence et determinisme (sous la direction
de M . Lesieur) - Methodes et techniques de la chimie organique (sous la direction de
D . Astruc)
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 7/150
P R E F A C E
Le but de ce peti t ouvrage est de repondre aux questions les plus frequentes que
se pose un exper imen ta teu r et de pe rme t t r e a un e tud ian t d'analyser , d 'une fagon
autonome, ses resul ta ts et leurs precisions. C'est cet esprit assez "uti l i taire" qui ade te rmine le style de presentat ion.
Dans 1'analyse des donnees experiment ales, il existe plusieurs niveaux qui sont condi-
t ionnes par notre desir d 'ob tenir une inform at ion p lus ou moins riche, mais aussi par le
temps que nous somm es prets a y consacrer . F r e q u e mme n t , nous vo ulons just e o btenir
la valeur d 'une grandeur physique sans nous preoccuper de verifier les hypotheses a
la base de notre demarche . Parfois , cependant, le s resultats obtenus nous paraissent
etre en co ntradic tion avec nos estimatio ns prel iminaries et ainsi nous sommes obliges
d'effectuer un travail plus scrupuleux. Ce l ivre est ecrit pour permettre au lecteur dechoisir le niveau d'analyse necessaire.
La par t ie "indispensable" du texte correspondant au premier niveau est composee
avec une police de caracteres norm ale. Les questions qui correspondent a une analyse
plus approfondie et qui necessitent un appareil m athem a t ique plus complexe sont
composees avec une police de caracteres speciale. Cette part ie du livre peut etre sautee
lors d 'une prem iere lec ture .
A la base de tou te analyse des donnees experimentales, on trouve une approche
statis t ique qui exige des considerations m athem a t iques rigoureuses et parfois com-
plexes. Neanmoins, Pexper imen ta teu r n'a pas toujours besoin de connaitre le s detailset les subt i l i tes m athem a t iques . De plus, rares sont les situations ou les conditions
experimentales correspondent exactement aux condit ions d'appl icat ion de te l ou te l
t heoreme . C'est pourquoi 1'accent est mis non pas sur la demonstration des resultatsm athem a t iques mais sur leur signification et leur in terpreta t ion physique. Parfois ,
pour alleger la presentat ion, la r igueur m a t h e m a t i q u e es t volontairement sacrifice et
remplacee par une argumenta t ion "physiquement evidente".
Le plan du livre est simple. Dans 1' introduction, on presente le s causes d 'erreurs et
on definit le langage utilise. Le premier chapitre rappelle le s pr inc ipaux resul ta ts
de statistique essentiels a 1'analyse des donne es. Le deuxieme chapi t re presente des
notions plus complexes de statis t ique, i l est consacre aux fonctions de varables alea-toires. Dans le troisieme chapitre qui est la part ie la plus importante, on s'efforce de
repondre aux questions les plus frequentes qui se posent dans 1'analyse des donnees
experimentales. Le dernier chapitre est consacre aux m ethodes les plus frequemment
utilisees pour 1 'ajustement de parametres .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 8/150
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Bien que ce livre soit particulierernent adapte au t ravail d 'e tud ian t s de second cycle,
il pourra etre egalement uti le aux jeunes chercheurs , aux ingenieurs et a tons ceux
qui sont amenes a realiser des mesures.
J 'a i rnerais remercier m es collegues enseignants et chercheurs qui ont lu le manuscr i t
et qui m ' o n t fait des proposi t ions pour arneliorer son contenu. J e voudrais exprimer
m a profonde grat i tude a M . Elie Belor i zky qui m'a encourage a ecrire ce l ivre et avec
qui j ' a i eu des discussions tres f ructueuses .
6
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 9/150
P O U R Q U O I L ES IN C E R T IT U D E S
E X I S T E N T - E L L E S ?
Le but de la m ajori te des experiences en physique consiste a com prendre un ph enom ene
et a le modeliser correc tement . Nous effectuons des m esures et nou s avons sou vent
a nous poser la question : "quelle est la valeur de telle ou telle grandeur ?", parfois
sans nous demander prealablement si cette formulation est correcte et si nous serons
capables de t rouve r une reponse.
La necessite de cette interrogation prealable devient evidente des qu 'on rnesure la
meme grandeur plusieurs fois. L'exper imenta teur qui le fait est f requemment con-
fronte a une situation assez interessante : s'il utilise des appareils suffisamment pre-
cis, il s 'apergoit que des mesures repetees de la mem e grand eur do nnent parfois des
resul ta ts qui sont un peu differents de celui de la premiere m esure. Ce phe nom ene est
general,que les m esures soient simples ou sophist iquees. Meme les mesures repetees dela longu eur d 'un e t ige metal l ique peuven t donner des valeurs differentes. La repe t i t ion
de 1'experience m ontre que , d 'une part le s resul ta ts sont toujours un peu differents e t
d 'autre par t ce t te difference n'est en general pas tres grande. Dans la plupar t des cas,
on reste proche d 'une certaine valeur moyenne, mais de t emps en temps on t rouve
des valeurs qui sont differentes de celle-ci. Plus les resultats sont eloignes de cette
moyenne , plus ils sont rares.
Pourquoi cette dispersion existe-t-elle ? D'ou vient cette variation ? Une raison de cet
effet est evidente : les condi t ions de deroulement d 'une experience var ient toujours
l egerement , ce qui modifie la grandeur mesurable. Par exemple, quand on determineplusieurs fois la longu eur d 'une t ige metall ique, c 'est la t em pe ra tu r e ambiante qui peut
varier et ainsi faire varier la longueur. Cette variat ion des conditions exterieures (et la
variation correspondante de la valeur physique) peut etre plus ou moins importante,
mais elle est inevitable et, dans les conditions reelles d 'une experience phy sique , on
ne peut pas s'en affranchir.
N ous sommes "condamnes" a effectuer des mesures de grandeurs qui ne sont presque
j ama i s constantes. C'est pourquoi meme la question de savoir quelle est la valeur
d 'un parametre peu t ne pas etre absolument correcte. II faut poser cette question
de maniere per t inente e t t rouver des moyens adequats pour decrire les grandeursphysiques. II faut t rouver une definition qui puisse exprimer cette part icular i ty
phys ique . Cette definition doit refleter le fait que la valeur physique varie tou jours ,
mais que ses variations se regroupent autour d 'une valeur moyenne.
La solution est de caracteriser une grandeur physique non pas par une valeur, mais
p lu to t par la probabil i te de trouver dans une experience telle ou telle valeur. Pour
cela on in t rodu i t une fonct ion appelee distribution de probabilite de detection d 'une
valeur physique, ou plus simplement la distribution d'une valeur physique, qui m ontre
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 10/150
8 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
quelles sont les valeurs les plus frequentes ou les plus rares. II fau t souligner une fois
encore que, dans cette approche, il ne s'agit pas te l lement de la valeur concrete d 'une
grandeur phys ique , mais sur tout de la probabilite de t rouve r differentes valeurs.
On verra par la suite que cette fonct ion — la dis t r ibut ion d 'un e valeur phys ique — est
heureusement suffisamment simple (en tout cas, dans la major i te des experiences).
Elle a deux caracteristiques. La premiere est sa valeur moyenne qui est aussi la
valeur la plus probable. La deuxieme caracteris t ique de cette fonction de dis t r ibut ion
indique, grosso m odo , la region au tour de ce t te moyenne dans laquelle se regroupe lamajor i te des resul ta ts des mesures. Elle caracterise la largeur de cette dis t r ibut ion et
est appelee 1'incertitude. C o m m e nous pourrons le voir par la suite , cette largeur a
une interpretatio n r igo ureuse en t e rm e de probabili tes. Pour des raisons de simplicite
nous appellerons cette incert i tude "1'incertitude naturelle" ou "initiale" de la grandeur
physique elle-meme. Ce n 'est pas tout a fait vrai , puisque cette erreur ou incert i tude
est souvent due aux condi t ions exper imentales . B ien que cette definition ne soit pas
parfai tement r igoureuse , elle est tres uti le pour la comprehens ion.
Le fait que, dans la plupart des experiences, le resul tat puisse etre caracterise par
seulement deux valeurs, permet de revenir sur la question avec laquelle nous avons
com mence no tre discussion : "Peut-on se demander quelle est la valeur d 'un param etre
physique ?" II se trouve que dans le cas ou deux parametres sont necessaires et
suffisants p ou r caracteriser une grandeur phy s ique , on peu t reconcilier notre envie
de poser cette question et la r igueur de 1 ' interpretation d 'un resultat en termes deprobabili tes. La solution existe : on appellera valeur physique la valeur moyenne de la
dis t r ibut ion e t incertitude ou erreur de la valeur phy sique la largeur de la distr ib utio n1.
C'est une convention admise de dire que "la grandeur phys ique a une valeur donnee
avec une incer t i tude donnee". Cela signifie que 1'on presente la valeur moyenne et la
largeur d'une distr ibution et que cette reponse a une in terpre tat ion precise en te rmes
de probabil i tes .
Le but des mesures physiques est la determination de cette fonct ion de d is t r ibu t ion
ou, au moins, de ses deux paramet res m ajeu rs : la m oye nne et la largeu r. Po ur
determiner une distr ibution on doit repeter plusieurs fois une m esure pour connai t rela frequence d 'appar i t ion des valeurs. Pour obtenir 1'ensemble des valeurs possibles
ainsi que leurs probabil i tes d 'apparit ion, on devrai t en fait effectuer un n ombr e infini
de m esures. C'est tres long, trop cher, et personne n 'en a besoin.
On se l imi te done a un n ombr e fmi de mesures . B ien sur , cela in t r od u i t une erreur
Pou r des raisons histo riques, les deux terme s "incertitude" et "erreur" sont uti l ises en physiquepour decrire la largeur d'une distribution. Depuis quelques annees, les organismes scientifiques
internation aux essaient d'introd uire des normes pour util iser correctement ces deux termes (de la
m e m e fagon que 1'on a introdui t le systeme international d'uni tes ) . Aujourd'hui , on appelle uneerreur la difference entre le resultat d'une mesure et la vraie valeur de la grandeur mesuree . Tandisque 1' incertitude de mesure est un parametre, associe au resultat d'une m esure, qui caracterise la
dispersion des valeurs qui peuvent raisonnablement etre attr ibutes a la grandeur mesuree. Dans
ce l ivre, nous tacherons de suivre ces normes, mais parfois nous uti l iserons des expressions plus
habituel les pour un physicien. P ar exernple, une formule tres connue dans 1'analyse des donneesexp erim enatle s porte le nom de "la form ule de propa gation des erreurs". Nous u ti l iserons toujoursce nom bien connu bien que, selon le s normes actuelles, nous aurions du 1'appeller "la formule
de propagation des incertitudes". Le lecteur interesse trouvera dans la bib liogra phie toutes les
references sur les normes actuelles.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 11/150
P O U R Q U O I L E S I N C E R T I T U D E S E X I S T E N T - E L L E S ?
( incer t i tude) supplementaire . Cet te incer t i tude , due a 1'imp ossibilite de m esurer avec
une precision absolue la distribution initiale (naturelle), s'appelle 1'erreur statistique
ou rerreur accidentelle. II est assez facile, du moms en theorie , de diminuer cette
erreur : il suffit d 'augmente r le nombre de mesures . En pr inc ipe , on peut la rendrenegligeable devant I ' ince rt i tud e init iale de la grand eur physiqu e. Ce pendant un a utre
probleme plus delicat apparait.
II est lie au fait que, dans chaque experience physique existe un appareil , plus ou
moins complique, entre 1 'experimentateur et 1'objet mesurable . Get appareil apporte
inevitab lem ent des m odifications de la distr ibutio n init iale : i l la deforme. Dan s le cas
le plus simple, ces changements peuvent etre de deux types : I'appareil peut "decaler"
la valeur moyenne et il peut elargir la distribution.
Le decalage de la valeur moyenne est un exemple de ce qu 'on appelle les "erreurssystematiques". Ce nom expr ime que ces erreurs apparaissent dans chaque mesure .
L'apparei l donne systematiquement une valeur qui est differente (plus grande ou pluspet i te ) de la valeur "reelle". Mesurer avec un appareil dont le zero est mal regie est
1'exemple le plus frequent de ce genre d 'e r reurs . M alheureusem ent , i l es t tres difficile
de com battre ce typ e d 'erreurs : il est a la fois difficile de les deceler et de les corrige r.
Pour cela, il n'y a pas de methodes generates et il faut etudier chaque cas.
Par contre, i l est plus facile de maitr iser 1'elargissement de la distr ibution introduit
par I 'appareil . On verra que cette incert i tude ayant la m e m e origine que les incert i-
tudes init iales (naturel les) s 'a joute "simplement" a celles-ci. Dans un grand nombred'experiences, 1'elargissement du a I'appareil permet de simplifier les mesures : sup-
posons que nous commissions I ' incer t i tude ( la largeur) in t rodui te par un appare i l
et que celle-ci soit nettement plus grande que I ' incert i tude init iale . II est possible
de negliger I ' incer t i tude nature l le par rappor t a I ' incer t i tude d 'appare i l lage . II suf-
fit done de faire une seule mesure et de prendre I ' incer t i tude de I 'appare i l comme
i ncer t i tude de la mesure . Evidemment , dans ce genre d 'experience, i l faut etre sur
que I ' incer t i tude de I 'appare i l domine I ' incer t i tude nature l le , mais on peu t tou jours
le verifier en faisant des mesures repeti t ives. L 'appareil peu precis ne permettra pas
d 'ob ten i r les variatio ns dues a la largeur init iale .
II fau t r emarquer que la separat ion entre incer t i tude d 'appare i l lage et incer t i tude
nature l le reste assez conventionnelle : on peut toujours d ire que la variation descondi t ions d'experience fait partie de I ' incer t i tud e d 'appare i l lage . Dans ce livre, on ne
parle pas des mesures en mecanique quantique, ou existe une incert i tude de la valeur
phys ique a cause de la re lat ion d ' incer t i tude de H eisenberg . En m ecanique quant iq ue ,
1'interference appare i l—obje t devient plus compliquee et interessante. Cependant nos
conclusions generales ne sont p as modifiees puisque , en m ecanique quan tiqu e, la notion
de probabili te est non seulement uti le et nature l le , mais elle est indispensable.
Nous avons compris que pour determiner exper imentalement une valeur phy sique i l est
necessaire (mais pas tou jours suffisant) de tro uv er la mo yenne (la valeur) et la largeur
(I ' incer t i tude) . Sans la determinat ion de I ' incer t i tude , 1'experience n'est pas com-
plete : on ne peu t la comparer ni avec une theorie ni avec une autre experience. N o u s
avons egalement vu que cette incert i tude contient trois contr ibutions possibles. L apremiere est I ' incert i tude naturelle liee aux changements des condit ions d 'experience
ou a la nature-meme des grandeurs (e n statis t ique ou en mecanique quant ique) . La
9
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 12/150
1 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
deuxieme est 1'incertitude statistique due a 1'impossibilite de mesurer precisement la
distr ibution init iale . La troisieme est 1' incert i tude d'appareillage due a 1'irnperfection
des outils de travail de Pexper imentateur .
Un exper imentateur se pose toujours deux questions. Premie remen t , comment peut-
on mesurer une grandeur physique, c'est-a-dire les caracteris t iques de sa distr ibutio n :
la moyenne et la largeur ? Deuxiemement , comment et jusqu'ou faut-il diminuer
cette incert i tude (largeur) de 1'experience ? C'est pourquoi 1 'exper imentateur doit
comprendre les relations entre les trois composantes de 1'incertitude et trouver com-
m ent les minimiser : on peut dim inuer 1 ' incert i tude naturelle en changeant les condi-
t ions de 1'experience, 1'incert i tude statis t ique en augmentant le nombre de mesures ,
1'incertitude d'appareillage en utilisant des appareils plus precis.
Cependant, on ne peut pas reduire les incert i tudes in f in iment . II existe une limiteraisonnab le de 1' incert i tude. L 'evaluatio n de cette l imite est non seulement une ques-
t ion de t emps et d 'argent depenses, mais c'est aussi une question de physique . II ne
faut pas oublier que, quelle que soit la grandeur a mesurer , nous ne pourrons jamais
tenir com pte de tous les facteurs physiques qui peuvent influencer sa valeur. D e plus,
tous nos raisonnements et discussions sont effectues dans le cadre d 'un modele ou,
plus generalement , de notre vision du monde. Ce cadre peut ne pas etre exact .
C'es t pourquoi notre probleme est de choisir des methodes experimentales et des
m e thodes d 'est imat ion des incert i tudes en adequation avec la precision souhai table e t
possible.
Diverses si tuat ions existent selon la precision desiree. Dans la premiere nous voulons
seulement obtenir 1'ordre de grandeur de la valeur mesuree ; dans ce cas, 1'incertitud e
doit aussi etre evaluee grossiere m ent. Dans la seconde nous desirous ob tenir une
precision de 1'ordre de un a dix pour cent ; il faut alors faire at tent ion en determinant
le s incert i tudes, car les m ethodes choisies doivent evoluer en fonction de la precision
requise. Plus on cherche de precision, plus la m ethode doit etre elaboree, mais le prix
a payer est la lenteur des calculs et leur volume . Dans la troisieme nous cherchons a
obtenir une precision du meme ordre de grandeur que celle de Petalon correspondant
au parametre physique mesure ; le probleme de 1'incertitude peut alors etre plusimpor tan t que celui de la valeur.
Dans ce t ouvrage , nous considerons seulement les methodes d 'es t imat ion d 'e r reurs
dans la seconde si tuation. L a plupar t des paragraphes apporte reponse a une ques-
tion concrete : c omme n t calcule-t-on le s incer t i tudes pour une experience avec un
peti t nombre de mesures ? comment peut-on ajuster les parametres d 'une courbe ?
comment compare-t-on une experience et une theorie ? quel est le nombre de chiffres
significatifs ? etc . Le lecteur qui conn ait les bases de la s tat is t ique peut omettre
sans probleme le s premiers paragraphes et chercher la reponse a sa question. Dans
le cas contraire , 1'ouvrage lu i appor te 1'information necessaire sur les parties de la
statistique utiles au t r a i t emen t des incer t i tudes .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 13/150
C H A P I T R E 1
RAPPELS S U R L A T H E O R I E
D E S P R O B A B I L I T E S
Dans ce chapitre , nous avons reuni des not ions de base de la theor ie des probabil i tes :
la definition d 'une probabili ty et ses proprietes elementaires ainsi que 1'introduction
des distr ibutions les plus frequemment ut i l isees dans 1'analyse des donnees experi-
mentales. Parmi ces distributions, celle de Gauss joue un role tres particulier, c'est
pourquoi la pa rtie e sssentielle de ce ch apitre (parag raph es 1.2 et 1.4) lu i est consacreecar elle et est indispensable a la comprehension du reste du livre.
1.1 P R O B A B I L I T E S
Pour pouvoir decrire une grandeur physique en termes de probabili ty il faut rappeler
le s definitions et les proprietes le s plus simples. Po ur le s mesures le s plus frequentes
faites en laboratoire nous n'avons pas besoin de toute la panoplie des methodes de la
statis t ique mathemat i que et notre experience du mon d e est largement sumsante pourcomprendre et assimiler les proprietes fondamentales des probabilites. Logiquement ,
chaque lecteur de ce livre a deja eu 1'occasion dans sa vie de jou e r , au moins aux
cartes et ainsi la notion de probabilite ne lui est pas etrangere.
1.1.1 D E F I N I T I O N S ET P R O P R I E T E S
Supposons que 1'on observe un evenement E repete N e fois (on dit que 1'on prend unechantil lon de N
eevenements) . Dans n cas, cet evenement est caracterise par une
marque d is t inc t ive a (appelee aussi caractere ) . Si les resul tats des evenements dans
cette suite sont independants, alors la probabil i te P(a) que la marque a se manifeste
est definie com m e
On voi t tou te de suite que la probabili te varie de 0 a 1
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 14/150
1 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
et que la somme sur tous les caracteres (de meme nature) possibles {/}, i = a,b,c,...est egale a 1
Un exemple d'evenement est le tirage d'une carte du jeu . La marque distinctive serait
la categoric de couleur (pique, coeur, carreau ou trefle). Pour un jeu de 52 cartes, la
probabilite d 'une categoric de couleur est egale a 1/4. On notera par A 1'ensemble
d 'evenements ou ce signe s'est manifested
Introduisons deux operations tres simples avec les probabilites. Definissons par A +B
1'ensemble des evenements dans lesquels la marque a ou la marque 6, ou les deux, sont
presentes (ici a et 6 peuvent etre de natu re differente). Par exemple , a est une categoricde cou leur, 6 est la valeur de la carte (le roi, la dam e, etc .) De plus, defmissons par AB
1'ensemb le des evenements dans lesquels ces deux signes se ma nife sten t s imul tanement .
Alors,
C'est-a-dire, pour trouver la probabilite qu'un evenement possede au moins une des
marques nous devons, d 'abord, ajouter deux probabili tes P(A) et P(B) . Cependan t ,
certains evenements peuvent avoir le s deux signes en mem e temps et on les a comptesdeux fois. C'est pourquoi il faut soustraire la probabil i te P(AB}.
Preno ns un jeu de 52 cartes avec 13 cartes dans ch aque co uleur (le roi, la dam e, le
valet et 10 cartes numerotees de 1 a 10). Pour une carte tiree au hasard , la probabil i te
d'etre soit le roi soit une carte de cceur (a e tan t le roi, 6 une carte de coeur) est egale a
P("soit le roi, soit une carte de coeur")
= P("roi") + 7>("cceur") - P("roi de cceur")
Introduison s une notion un peu plus com pliquee. S upposons que 1'evenement A puisse
se produire de na manieres differentes, 1'evenement B de n^ manieres et 1'evenement
AB de nab manieres . Si le nombre total de realisations possibles est egal a N (ne pas
confondre avec le nombre N e d'evenements introduit au debut du paragraphe ) , alors
On peut reecrire P(AB') com m e
Pa r m i le s na cas ou 1'evenement A se p r od u i t , il y a une propor t ion
1'evenement B s'est egalement produi t . On peut introduire la probabil i te correspon-
dante qui s'appelle la probabilite conditionnelle P(A/B) de 1'evenement B, c'est-a-dire
la probabilite d'observer B sous reserve que A se soit produit.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 15/150
I - R A P P E L S SUR L A T H E O R I E D B S P R O B A B I L I T E S 13
Ainsi , la derniere formule prend la forme
Si 1'evenement A n'a pas d' influence sur la probabi l i te d 'evenement B, on dit alors
que les deux evenements sont independents et
Dans ces conditions, on obtient pour la probabili te d'apparition de deux evenements
a la fois P(AB) une relat ion tres importante :
ce qui mon t re que les probabili tes des evenements independants se mult ip l i en t . On
utilisera cette propriete plusieurs fois dans ce livre.
Considerons 1'exemple de no tre jeu de 52 cartes. Soit A "un roi", B "une carte de
coeur". Done na = 4, 7 7 . 5 = 13, N = 52 et les probabilites correspondantes :
V u que P(AB) = "P("roi de cceur") = 1/52, on conclut que
et ainsi, dans le jeu de 52 cartes, ces deux evenements sont independants.
Ajou tons jus t e une carte a notre jeu — un j oker qui n 'appart ient a aucune categoric
de couleur. na, a nouveau, est egal a 4, n^ a 13, mais N est egal a 53. Done,
On s'apergoit faci lement que
et ainsi ces deux evenements ne sont plus independants dans le jeu de 53 cartes !
L'explication de cette difference est relativement simple : si nous savons qu 'une carteest un roi alors elle ne peu t pas etre le j oker , et ainsi nous avons deja obtenu unecertaine information pour determiner sa categoric de couleur.
1.1.2 G R A N D E U R S D I S C R E T E S ET C O N T I N U E S ,F O N C T I O N S D E D I S T R I B U T I O N
Une grandeur physique peut avoir une valeur numerique discrete ou continue. Dansle premier cas, on 1'appellera grandeur "discrete", dans le deuxieme, "continue". Les
exemples de grandeurs discretes sont la categoric de couleur, la valeur de la carte, si
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 16/150
14 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
Figure 1.1 : Histogramme de la premiere serie de mesures de la longueur / : sont portees sur 1'axe
des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition
Ton reprend n otre exemple, ou le comptage d 'un detecteur, si 1'on considere des exem-
ples plus phy siques. M ais plus f requemment en physique, on mesure des grandeurscontinues, c o m m e la long ueur, la duree, le courant, etc.
Cette distinction des valeurs (ou des grande urs) discretes et cont inues est tou t a fait
justifiee. Neanmoins , en physique, on decrit assez souvent une grandeur continue
par une v aleur discrete et vice versa. De ce poin t de vu e, cette separat ion est,en
partie, conv entionnelle et les proprietes (ou m em e Pecriture) valables pour les valeurs
discretes seront utilisees pour les valeurs continues et inversement. On franchira cette
front iere regulierement, meme parfois sans se rendre compte de ce que Ton fait . Cette
attitude correspond a un parti pris de presentation. Le lecteur ne doit pas en deduire
que le passage a la limite s 'effectue dans tous les cas sans difficulte.
Pour illustrer le caractere conventionnel de cette distinction, considerons un exem-
ple de mesure de la longueur d 'une chambre (i l est evident que la longueur est
une grandeur cont inue) a 1'aide d'un decimetre qui possede aussi des divisions cen-
t imetr iques . Le fait meme que nous disposions d'un decimetre avec des divisions nous
oblige a decrire une grandeur continue a 1'aide de valeurs entieres done discretes (onaura un certain nombre de decimetres ou de cent imetres) . On peut aller plus loin et
dire que la representation d'une longueur par un nombre fini de chiffres est un passage
oblige d'une valeur continue a une valeur discrete.
Bien sur, il existe des situations ou une valeur discrete ne peut pas etre remplacee par
une valeur continue, par exemple dans le jeu de cartes. Cependant, ces situations sont
rares dans le s experiences de physique. Nous observerons par la suite des passages des
valeurs d'untype a 1'autre. Les proprietes de p robabil i te resteront les memes dans
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 17/150
I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T I E S 15
le s deux cas. C'est pourquoi nous donnerons les demonstrations generales p ou r les
variables continues et considererons que les resultats s'appliquent aussi aux variables
discretes.
Cont inuons notre experience mentale . Supposons qu'apres avoir fait une dizaine de
mesures rapides, nous ayons t rouve une fois la longueur de la chambre egale a 323cent imetres , cinq fois — 324 cm et quatre fois — 325 cm. Les resultats sont presentes
su r la figure 1.1 qui s'appelle un "histogramme". Sur 1'axe des abscisses, on montre la
valeur mesuree et, sur 1'axe des ordonnees, le nom bre re lati f ( H I mesures
de la valeur / par rappor t au nombre total N de mesures) c'est-a-dire la frequence
d 'appar i t ion de chaque valeur . Le sol n 'e ta i t pas plat , notre dec imetre n 'e ta i t pas
toujours droi t , la longueur etait, la plupart du temps, comprise entre 324 et 325 cm
et nous ne savions pas dans quel sens il fallait Tarrondir. D'ou la dispersion de nos
resul tats .
Pour clarifler la si tuation nous avons pris un ins t rumen t de mesure gradue en mil-
l imetres et en augmentant sensiblement le nombre de mesures nous avons obtenu le snouveaux resul ta ts representes sur la figure 1.2. Avec une au t re echelle on r e t rouve
les memes tendances : les resultats sont legerement differents et se regroupent autour
d 'une cer taine valeur .
Figure 1.2 : Histogramme de la deuxieme serie de mesures de la longueur / : sont portees sur 1'axe
des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition
On peut continuer ainsi notre experience en d imin u an t 1'echelle et en au g me n tan t le
nom bre de m esures dans chaque serie . La forme des h is togrammes tendra vers une
forme en cloche qui, lorsque le nombre de mesures tend vers I ' infmi, peu t etre decrite
par une fonct ion cont inue f(x) (figure 1.3).
Chaque histogramme donne le nombre relatif de resultats se trouvant dans un inter-
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 18/150
16 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 1.3 : Fonc t ion de la dens i te de probabi l i t e
valle donne. Ainsi, dans le cas d'u n grand nombre de mesures et selon notre definition( 1 ) , le produi t f(x}dx donne la probabili te que la grandeur mesuree se trouve dans1'intervalle La fonction f(x) represente la densite de probabilite.
On 1'appellera aussi la fonction de distribution de probabilite. x varie au hasard et
s'appelle variable aleatoire.
D'apres notre definition, la probab ili te P de trouv er la valeur dans 1'intervalle co m pris
entre xi et x < i est egale a
qui est la somme (1'integrale) de f(x] pour toutes les valeurs de x entre x\ et x^.
Selon (2), f(x) obeit a la con dit ion
ce qui signifie que la probabi l i te de t rouver une valeur de x quelconque est egale a 1.
Par commodi te mathemat i que , nou s avons pris ici des limites infmies pour 1'integrale.
Mais une grandeur physique, par exemple la longueur, peut ne pas varier dans ceslimites (elle ne peut pas et re negat ive) . Cela signifie que la fonction /(a?) utiliseepour decrire cette grandeur doit devenir tres peti te en dehors des limites que nous
choisissons effectivement.
Pour une grandeur discrete qui prend les valeurs numeriques X { = {x\, x % , . . . } nous
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 19/150
I — R A P P E L S S U E L A T H E O R I E D B S P R O B A B I L I T E S 1 7
avons exactement la m e m e relation de normalisation :
ou 'P(xi) est la probabilite de t rouver la valeur Xi.
On peu t souligner que le passage d'u n h i s togramme a une fonc tion con tinue est ana-
logue a la notion d'integrale comme l imite de la somme des aires de rectangles ele-
ment aires sous la courbe representant une fonction quan d le nomb re de divisions tend
vers 1'infini.
1.1.3 PROPRIETES DE LA F O N C T I O N DE D I S T R I B U T I O N
Com me nt pouv ons-nous caracteriser la fonction de distr ibution de probabili te f(x] ?
Theor iquement , il faut la connaitre a chaque point x mais il est evident que ceci n'est
pas realisable experimentalement : nous ne pouvons pas mesurer la probabili te pour
chaque valeur x.
A priori , cette fonction f(x] doit etre positive, vu sa relation avec la probabilite,
tendre vers zero a plus l ' infini et a moins 1'infini assez rapidement pour que 1'integrale
(5) existe, et avoir la forme de la courbe presentee sur la figure 1.3. II est logiqued ' introduire au moins deux parametres qui decrivent la. position de la cou rbe (c'est-a-dire celle de son maximum) sur 1'axe et son etalement.
Ainsi la premiere caracteristique de la dis tr ibut ion de probabili te f(x) est la valeur
moyenne de x
Ch aque valeur possible de x est multipliee par la probabilite de son apparition f(x)dxet la som me (1'integrale) est effectuee sur toutes les valeurs possibles.
Pour une variable discrete
L a barre sur x est la notat ion standard indiquant la valeur moyenne ar i thmetique.
B ien evidemment , nous supposons que cette integrate (cette somme) ainsi que lesintegrates (les somm es) que no us allons definir existent. C'est une hypoth ese physique
naturelle mais nous discuterons aussi d 'exemples ou elle n'est pas valable.
L'etalement de la distr ibution peut etre decri t par la variance ou le carre de I'ecart-
type et defini par
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 20/150
18 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
pour une variable continue, et par
pour une variable discrete.
Pour chaque valeur de a ? , on considere 1'ecart par rappor t a la valeur moyenne a f
et on calcule la valeur moyenne du carre de cet ecar t . Pourquoi avoir choisi cette
caracteristique p lu to t qu 'une autre ? Parce que la s imple valeur moyenne de 1'ecart
mais nous verronsst nulle. No us aur ions pu prendre com m e caracteris t ique \x — x
a la fin de ce paragraphe que, sous cette forme, la variance ne presente pas certaines
proprietes remarquables et for t utiles .
II est facile de demontre r qu 'avec la definition (7) le carre de 1'ecart-type s 'ecrit
Prenons 1'exemple le plus simple : une distribution de probabi l i ty constante (voir
figure 1.4) d 'une grandeur x qui peut varier de a a &
La valeur de cette constante est definie par la condit ion de normalisation (5).
Figure 1.4 : Distribution constante
La valeur moyenne de x pour cette fonct ion de distr ibution est
et sa variance :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 21/150
I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T I E S 19
Le s deux seu les ca rac t e r i s t i qu e s , peuven t ne pas et re su f f i san tes pour dec r i re
la fonction f(x). On peut a lors de fmi r le s va l eu r s moyennes du cube , de l a qua t r i eme
puissance de I 'ec ar t e tc . De cet te fa con , on obtient un moment central d'ordre n :
Le m ot "cent ra l " soul igne le fait que le moment e s t ca lcu le par rappor t a la v a l e u r moyenne
~ x . Notons q u e , par def in i t ion ,
Parfois, il e s t utile d ' in t rodu i re des moments sans rappor t avec la va leur moyenne
Les m o m e n t s (ou les momen t s cen t r aux ) , a i ns i de fmis , de te rm inen t la distribution f(x)
d 'une facon un ique . O n demon t re fac i l ement que s i deux densi tes de probabi l i tes fi(x) e t
/2(x) ont les m e m e s m o m e n ts , e l les sont ident iques La issons au lec teurinteresse le soin d 'e f fec tuer cette demonstration.
La c o n n a i s s a n c e de tous le s momen t s {fi'n} (o u {pn}} donne une information comp le t e
sur la fonction de distribution de probabi l i te f(x). C e p e n d a n t , i l es t p lus ra t ionne l de
t r a va i l l e r avec une seule fonction c o n t e n a n t tous l e s momen t s dans son express ion . Ce t te
fonction s 'appe l l e la fonction generatrice des moments de fmie par :
La fonction exponent i e l l e peu t e t re deve loppee en ser ie
O n voit que [i 'n es t l e coe f f ic i en t peu t ega l emen t e t re de te rminee a pa r t i r
des der ivees de la fonction M'x(t} :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 22/150
20 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Done pou r t = 0, on obt ien t
D ' u n e facon a na logue , on i n t r o d u i t la fonction generatrice des moments centraux :
La re la t ion en t re ce s deux f onc t ions es t done :
C o n f o r me me n t au theoreme que T on v ien t d ' e n o n ce r , on peut a f f i rme r que I ' ega l i te des
deux fonc tions g e n e r a t r i c e s , i m p l i q u e I 'e g a l i te d e s deux fonc t ions d e
distribution de probabi l i te :
Pour un lec teur in te resse par le s aspec t s m a t h e m a t i q u e s du prob leme, notons que cet te
definition de la fonction gene ratr ice n 'est pas la seule utilisee dans la litterature. On peut
r e mp l ace r la fonction exponen t i e l l e d 'un a rgumen t reel e^par la f onc t ion d 'un a rgument
pu remen t complexe etxt. Dans le premie r cas , la def in i t ion e s t etroitement l iee a la
t r ans fo rma t ion de Lap lace , a l o rs que dans le deux ieme el le e s t l iee a la t rans format ion
de Four ie r . L e s d e u x t r a n s f o r ma t i o n s in tegrates sont t res proches I 'une de I ' au t re : une
ro ta t ion de 7T /2 dans le p lan comp lexe de t p e r m e t de passer d 'une t rans fo rma t ion a
I ' au t r e .
L ' i n t roduc t i on de la fonction gen e ra t r i c e peut etre cons ideree c o m m e une as tuce p e r me t -
tant de fac i l i ter le s diverses d e mo n s t r a t i o n s (ce que nous verrons p lus ta rd) . Ma is on peut
lui donner une i n te rpre ta t ion phys ique plus profonde qui sort du cadre de ce l iv re .
1.1.4 F O N C T I O N DE D I S T R I B U T I O N DE P L U S I E U R S V A R I A B L E S
Examinons maintenant la si tuat ion un peu plus complexe ou nous avons affaire a
deux grandeurs (variables) x\ et x^. Par exemple , nous mesurons la longueur et
la largeur d 'un e piece. Ou enco re, nous faisons deux m esures inde pe nda ntes de la
rneme grandeur : dans ce cas nous pouvons aussi dire que nous travail lons avec deux
grandeurs .
L a const ruct ion et les definit ions sont absolument analogues au cas d'une seule varia-ble . Pour deux grandeurs cont inues, on doi t in t roduire la densi te de probabil i te qui
depend de deux variables / ( a ? i , x ^ } . Ainsi la probabi l i te de t r ouve r la premiere valeur
dans Pinterval le com pris ent re x\ et x\ + dx\ et la deuxiem e valeur dans 1'intervalle
compris ent re
avec la condit ion de normalisat ion :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 23/150
I - R A P P E L S S U R L A T H E O R I E D B S P R O B A B I L I T E S 21
La generalisation de ces defin itions au cas de N variables est evidente.
Parmi t outes les fonctions il existe un cas particulierement important et
interessant en physique. C'est celui ou deux variables x\ etx - 2
sont independantes.Alors, selon la formule (3) , la fonct ion f ( x \ , X 2 ) se separe en un produit de deux
fonctions :
ou ch aque fonction represente la densite de probabi l i te de la variable correspondante.
Etudions le s proprietes remarquables des valeurs moyennes et des variances dans
un cas particulier mais tres frequent en physique : la somme de deux grandeurs
independantes x\ - + - x^. Ces deux grandeurs x\ et x^ peuvent etre deux resultats demesure de la meme grandeur x. Leur somme nous sera utile pour calculer la valeur
moyenne sur deux experiences.
L 'hypothese de leur independance nous permet d'utiliser la propriete (16) et, par
definition, la valeur moyenne de la somme est egale a
la somme des deux valeurs moyennes.
Pour calculer la variance on procede aussi par definition :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 24/150
2 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
On separe cette expression en trois integrates et on utilise la propriete (16)
On obt ient finalement une relation simple
qui montre que la variance de la s omme de deux grandeurs independantes es t egale ala somme de leur variance. Cette formule est la base du traitement des incertitudes
et elle est uti l isee continuellement en physique.
On voit d'ailleurs 1'avantage d 'une telle definition de la variance. N ous avons dit
qu'i l etait "a priori" possible de caracteriser 1'etalement d'une distr ibution f(x) par
par exemple. Mais, avec cette definition, on ne peut ob tenir une relationaussi simple que celle donnee par la form ule (17).
Par analogic, pou r T V grandeurs independantes x±, x % , . . . , XN, on a
On introduit la somme
de ces grandeurs. La moyenne de la somme X est egale a
c'est-a-dire a la somme des moyennes et la variance de X est donnee par
soit la somme des variances.
Pour la fonction genera t r i ce des moments
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 25/150
I — RAPPELS S U R LA THEORIE D B S P R O B A B I L I T I E S 23
on obtient faci lement d 'apres (18)
Cela signifie que la fonction generatr ice des moments d 'une somme de grandeurs indepen-
dan tes e s t ega le au produ i t de s fonctions generat r i ces ind iv idue l les .
D e p lus , s i tou tes le s grandeurs dans ce t te s o m m e ont la m e m e fonction de distribution
on a la meme fonction generat r i ce de mo me n t s pour tou tes l e s g randeurs
e t pour la so mme X on obtient une express ion encore p lus s imple
1.1.5 C O R R E L A T I O N S
J us q u ' a present , nous n 'avons cons idere que des exemp les de grandeurs phys iques (var i a -
bles a lea to i res ) i ndependan tes . Ma i s on rencon tre auss i des var i ab les co r re lees (c 'es t -a -d i re
non i ndependan tes ) . A la fin du paragraphe 1.1.1 (voi r (4)), nous avons vu un tel exemp le
avec une car te ajoutee a un jeu normal de 52 ca r tes , ce qu i ent ra fne que la probabi l i te de
deux evenements A e t B s imu l tanes P(AB) n 'es t pa s egale au produit de s probabi l i tes
Cette inegal i te es t le signe de deux evenements co r re l es .
On peu t penser que de te ls exemp les son t re la t i vemen t ra res en phys ique. En ef fe t , dans
la p lupar t des s i tuat ions ree l les , nous avons af fa i re a des var i ab les a l ea to i res i ndepen-
dan tes c o mme l e s me su re s d ' u n e me me grandeur {x,}. Bien ev idemmen t , il existe de s
s i tuat ions ou une mesure peut in fluencer la su iva nte , c o m m e l a mesure d 'un couran t avec
un ampe reme t r e e l ec t r omecan i que ( d e mau v a i se qua l i t e ) dont l e ressor t es t usage e t se
de fo rme f ac i lem en t . Dans ce ca s , chaq ue mesure r isque de dependre des preceden tes . La
s ta t i s t ique n ' e s t d ' au cu n secours dans ce type de s i tua t i ons . C 'es t un e x e mp l e d ' e r r e u r
sys tema t i que qu'il e s t assez difficile de de tec te r et de corr iger . En physique expe r imen-
t a l e , il ex is te beaucoup de s i tuat ions ou, pour une exper ience prec ise , on doit ut i l iser un
unique apparei l dont on ne connatt pas tres bien le s proprietes. Ce manque de connais-
sance de I ' ap p a re i l l ag e condu i t parfois a des e r reu rs sy s t e ma t i qu e s e t m e m e a de f au sse s
decouver tes .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 26/150
2 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
Neanmoins, en statistique, il existe "un mecanisme" tout a fait n a t u r e ! et frequent d'appa-
rition de s correlations. Meme s i le s va r i a b l e s { a ? ? - } sont independantes, l eu r s fonctions
peuvent etre cor re lees .
Nous caracteriserons la dependance entre deux variables X { e t Xj (avec de s valeurs
moyennes et des v a r i an c e s par le coefficient de correlation q^ j defmi
par :
Le s ecar t s quadratiques moyens c r z e t < T J sont introduits d an s la definition par commodite.
Nous utiliserons auss i la covariance de deux variables :
En particulier, pour i =j
Si les variables X{ e t Xj sont independantes, le coefficient de correlation e st nul : q^ j — 0.
S i Xi e s t proportionnelle a X j , c'est-a-dire ce coefficient es t ega l a ±1 ;
D an s un cas general,
Prenons un exemple, presque trivial, q u i donne une illustration de ce mecanisme d'appa-
rition des correlations. Soient x\ et x deux g r a ndeu r s physiques independantes avec la
meme moyenne / j, et la meme v a r i an c e a2. Introduisons deux grandeurs y{ e t y^ qu i l eu r
sont liees par une relation lineaire :
C a l c u l ons l a covariance c o v ( 2 / 1 , 7 / 2 ) (23).
Tout d'abord, determinons le s moyennes de 7/1 et de 7 /2 :
y T = auxi + 0 1 2 ^ 2 = aii^I+ 012^2"= (an + 012)^ ,
y2 = azixi + 022^2 = ( < * 2 i + ^22)^ -
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 27/150
I - R A P P E L S SUR L A T H E O R I E D B S P R O B A B I L I T E S 25
Autrement dit, d a n s le cas genera l les deux var iab les y\ et yi
ne sont pas i nd epend an tes mais sont correlees.
Get exemple donne une i l lustrat ion de la notion de corre la t ion .
Neanmoins , la notion d ' independance de deux variables n'est pas toujours ev idente . Con-
siderons I 'exemple s imple de la correlat ion des deux var iab les x et y = x2. A priori , nous
pouvons penser qu'el les sont correlees.
D'apres la defini t ion (23), la cov arianc e est donn ee par
Dans le cas genera l , cette expression est di f ferente de z e r o , c 'es t -a -d i re que x et x2
sont
effectivement correlees. Mais il suffit que Ton prenne le cas particulier d ' u n e fonction de
distr ibution f(x) pai re , par exemple la distr ibution de G a u s s (vo i r paragraphe su ivant )
avec f j , =0, pour que et pour que la correlation disparaisse ! Get exemple
n'est pas tres exotique : d a n s le cas d ' u n gaz dont les vitesses des molecules obeissent a
la distribution de Maxwell (voir paragraphe 3.1.3), les composantes de la vitesse (vx, vy
et vz) et I 'energ ie ne sont pas corre lees . A posteriori , on peut
comprendre qualitativement ce resultat : la valeur de x est caracterisee par son module
et son signe tandis que x2 n 'es t caracter ise que par le module de x. Les signes + et —
sont equiprobables en vertu de la symetrie de f(x), c 'est pourquoi x et x2
se trouvent
decorrelees.
1.2 D I S T R I B U T I O N DE G A U S S
La premiere d is t r ibut ion cont inue que Ton etudie ic i est la distr ibution de Gauss.
Cet te d is t r ibut ion est la plus frequente en physique , c'est pou rquo i , dans la l i t te rature ,
on Tappelle aussi la dis t r ibut ion norm ale . Dans cet ouvrage, nous uti l iserons le s
deux denom inatio ns. N ous verro ns, dans le paragraphe suivant consacre au the orem e
central l imi te , pou rquo i cette distr ibutio n jo ue un role s i part iculier . Pou r 1'instant
nous e tudions sur tou t ses propr ie tes .
O n a alors :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 28/150
2 6 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 1.5 : Les dis tr ibut ions de Gauss po ur plusieurs je ux de parametres / j , et < r
Supposons qu 'une valeur physique var ie d 'une fagon continue dans un interval le de
moins 1'infmi jusqu'a plus I 'mfini1. L a densite de probabi l i te f(x] de t rouver la valeur
physique aleatoire x pour une dis t r ibut ion normale est donnee par
La dis t r ibut ion normale est caracterisee par deux parametres ^ et a. Leur sens est
clairement visible sur la figure 1.5 ou nous avons presente plusieurs dis t r ibut ions
correspondant a des / j . et a differents : ^ donne la position de la distribution, < r so n
etalement .
Notons que le facteu r devant la fonction exponentielle est choisi pour que la probabilite
totale soit normee :
Nous avons deja di t , au paragraphe precedent, que la plupart des valeurs physiques varient dans
des limites finies, mais, dans les s i tuat ions exper im entales concre tes, les valeurs reelles ne sontjamais proches des l imites et ainsi 1 'hypothese d'infini te de 1'intervalle de variation n 'a aucuneconsequence sur 1'applicabilite des resultats obtenus.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 29/150
I — RAPPELS SUR LA THEORIE D B S P R O B A B I L I T I E S 27
Rappe lons au lecteur que le ca lcu l de I ' in tegra le
qu i se ren con t re souvent en physique est s imp le.
II suffit de considerer 72
(integrale sur tout le plan xy) et de passer en coordonnees polaires
dans T in teg ra le double :
Calculons la mo yenne et la variance de cette distr ib ution . Par definition, la valeur
moyenne de x est egale a
Ainsi, le parametre p peut etre interprete comme la valeur moyenne de x. Notons
aussi que x = ^ est le maximum de la fonct ion f(x] et que cet te dis tr ibut ion est
symetrique par rappor t a ce point.
De la m e m e fagon, on calcule la variance de la distribution normale :
(La derniere integrale peut etre calculee, par integration par parties.) N ous voyons
pourquoi, des le debut, nous avons designe par a le deuxieme paramet re de cette
dis tr ibut ion.
II est relativement facile de calculer des moments d'ordre plus eleve de la distribution de
Ga us s . II faut in t roduire la fonction genera t r i ce des mom ents c en t raux qu i , pa r definition,
est ega le a
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 30/150
28 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S
Pour la ca lcu le r il su f f i t de fa i r e le changemen t de va r iab l e
comple ter ( ' a rgument de la fonction expone nt ie l l e en fa i san t appara t t re
Ces changemen t s de va r i ab l e nous permet ten t de r e t r o u v e r I ' in tegra le ( 2 5 ) .
A ins i , pour la fonction generat r ice des momen t s cen t r aux on obtient I ' express ion
O n voit que tous les moments impa i r s son t nuls ce qu i e s t ev iden t en ver tu
de la symet r ie de la distribution no rma l e pa r rappor t a x = / / . L e s moments pa i r s son t
Pour voir I'utilite des fonc t ions gen era t r i ces , p renons un exem ple qu i i n te rv iendra au
paragraphe su ivan t . Considerons la distribution d'un e grandeur physique y — ax + b qu i
est une fonction l inea i re d ' u n e a u t r e g r a n d e u r x distribute selon la loi no rma l e avec une
moyenne /^ et une var iance < r2.
La fonction gene ra t r i c e de s momen t s est egale a
done
Selon notre hypothese, la distribution de x est une d is t r ibut ion de Gau ss (26 ) . D ' o u
Cette expression prouve que la grandeur y a aussi une distribution normale de va leur
moyenne a / j , + b et de va r i ance a2< r
2. Les deux resu l ta t s son t presque evidents : la t r ans -
lation change juste la va leur moyenne et le changement d 'echel le multiplie la moyenne par
a e t l a va r iance pa r a2
( l e resu l ta t etait prev is ib le vu l es d imens ions de ces g randeurs) .
Comme la d is t r ibu t ion de Gauss est ent ie rement de terminee par les deux valeurs // , < r
et que la plupart des grandeurs physiques peuvent etre decrites par cette distr ibution,
le s resulta ts expe rim entau x peuv ent etre caracterises par deu x valeurs seulem ent. Par
convent ion, on presente ces derniers sous la forme
II faut expliquer ce que cette ecri ture symbolique signifie. Premierement , en presen-
tant un resultat de cette maniere, on suppose que la distr ibution de la grandeur
2 Les normes ISO proposent d'utiliser la notation ux plutot que Ao\ Cependant, dans ce livre,
nous garderons 1'ecriture Ao: plus habituelle pour les physiciens.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 31/150
I - R A P P E L S S U R L A T H E O R I E D B S P R O B A B I L I T E S 2 9
physique mesuree est gaussienne. Deuxiemement , on prend la valeur rnoyenne de la
dis t r ibut ion pour la valeur "reelle" de la grandeur x et sa largeur a pour 1'erreur. Cette
forme d'ecriture est une convention generate que tout le rnonde accepte en gardant
bien en tete ces hy poth eses. On ne pe ut pas dire que la valeur "reelle" de x varie dela valeur minimale xmin = [ i — a a une valeur maximale C'est faux !
Sous cette ecriture se cache une interpretation en termes de probabili te.
Rappelons que la probabil i te de t rouver une valeur physique dans un intervalle de x\a X2 est egale a 1'integrale de la densite de probabili te dans ces limites. Pour une dis-
t r ibu t ion donnee, on peut calculer les integrales qui nous interessent numer iquement .
En particulier, pour la distr ibution de Gauss (figure 1.6), la probabili te de t rouv er la
valeur x dans 1'intervalle
dans 1'intervalle
dans 1'intervalle
Ces resultats montrent encore une fois a quel point 1' interpretationcomm e valeurs maximale et rninim ale possibles de x est approximative .
Pour une distr ibution de Gauss, la probabili te de retrouver x en dehors de cet in-
tervalle est egale a 1/3, c'est-a-dire tres impor tan te ! Aut r em en t dit, si Ton mesure
Figure 1.6 : La distribution de Gauss
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 32/150
3 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
une grandeur x plusieurs fois, environ un tiers des resultats se t rouve en dehors de
j U ± < T et seulement deux tiers dans I ' intervalle. De ce point de v u e , il n'y a rien de
dramat ique s i le resultat sort de cet intervalle. Par centre, si le resultat se trouve
aussi en deho rs de I ' interva lle la s i tuation devient beauco up pluspreoccupante . La probabil i te d 'u n tel evenement pour la distr ibution de Gauss est
seulement de 0,3 %, c'est-a-dire qu'elle est negligeable, vu le nombre d 'experiences
realisees habituellement au laboratoire (de quelques unites j u squ ' a quelques dizaines).
L'apparit ion du resultat en dehors de I'intervalle de 3er signifie, la plupart du temps,
qu ' i l existe une erreur soit dans le deroulement de 1'experience, soit dans les calculs
de // et de a.
Dans le paragraphe 3.1, nous rev iendro ns sur la definition de f i et de a a partir d 'un
nombre limite de mesures ainsi que sur la precision d 'une telle determination. Si 1'on
ne peut obtenir la valeur de a exper imentale qu'a un facteur 2 pres, on ne doit pas
prendre a la le t tre le s valeurs des probabili tes obtenues avec un a theor ique .
Pour 1 ' instant, que retenir sur la distr ibu tion de Gauss (ou norm ale) ? D'ab ord, le fait
qu 'une tres grande major i te de grandeurs physiques se decri t , au moins en premiere
approx imat ion , par cette distr ibution. Cette circonstance explique son impor tance en
physique. Cette distr ibution est caracterisee par deux paramet res : la valeur m oye nne
H associee a l a 'V ra ie " valeur de la grandeur physique et la largeur a associee a 1'erreur
experimentale. C'est la raison pour laquelle le resul ta t d 'une experience s 'ecrit sous
la forme/ L *
± a ; 1'interpretation d'une telle ecriture est que la probabi l i te pour que lavaleur physique mesuree se tro uv e dans cet inte rvalle est egale a 2/3. Si le resu ltat
sort de I ' intervalle f j , ± 3u, alors il est tres probable qu 'une erreur se soit glissee dans
nos mesures ou dans les calculs de / J ou de a.
1.3 AUTRES D I S T R I B U T I O N S E L E M E N T A I R E S
A u paragraphe precedent , nous avons souligne que la distr ibution de Gauss est la
plus frequente dans la nature . Cependant , elle n'est pas la seule possible. D 'aut resdis t r ibut ions de probabil i te in te rv iennen t f requemment dans la vie courante ; men-
tionno ns en particulier les distribution s de Stu den t, de Poisson, de Lo ren tz, ainsi que
la dis t r ibut ion binomiale et celle du x2.
Les distr ibutions de Student et du x2 son
^ indispensables en physique, mais elles
sont relativem ent complexes. N ous leur consacrerons les paragraphes speciaux dans
le t roixeme chapitre du livre ou nous aborderons des problemes plus avances.
La distr ibution binomiale sera la premiere etudiee parmi celles qui decrivent des
grandeurs discretes. II faut dire qu'elle n'est pas f requemment rencontree dans le sexperiences mais elle est s imple et instructive.
N ous obt iendrons la dis t r ibut ion de Poisson comme une certaine l imite de la distri-
bution binomiale. Cette "transformation" sera le premier exemple du passage d'une
distribution vers une autre. Plus tard, nous verrons que ces distributions se trans-
forment en une distr ibution normale dans la l imite d 'un grand nombre de mesures.
La formulation plus r igoureuse de cette propriete sera donnee au paragraphe suivant
ou nous dem ontrero ns qu' i l s 'agit d 'un resul ta t general valable po ur presque toutes les
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 33/150
I - RAPPELS SUR L A T H E O R I E D B S P R O B A B I L I T E S 31
dis tr ibut ions. La seule exception (physiquement interessante) a cette regie est donnee
par la distribution de Lorentz .
Ici, il faut noter que la "transformation" d'une distr ibution en une autre n'est pas
d 'un interet purement academique ou pedagogique. C'est un probleme pratique car
une telle operat ion peut nous permettre de remplacer , au moins dans une premiere
approche, plusieurs distr ibutions de probabili te complexes par des distributions plus
simples et plus generales et trouver ainsi un langage commun pour une description
uniforme de grandeurs physiques tres diverses.
1.3.1 DISTRIBUTION B I N O M I A L E
Cette distribution decrit des grandeurs discretes qui peuvent prendre seulement deuxvaleurs. Supposons qu'un evenement ait deux realisations possibles ^ 4 et B. Soient p
la probability de la realisation A, q = I — p la probabilite de la realisation B. Si cet
evenement se repete N fois, on peut determiner la probabil i te PN(H) que la realisation
A se produise n fois. La probabili te d'obtenir successivement n fois la realisation Apuis N — n fois la realisation B es t egale . Vu que 1'ordre
de realisations .4 et B est sans importance, il faut multiplier cette probabilite par le
nom bre de possibi li tes d'extraire n objets parmi N objets, c'est-a-dire par
Finalement , la probabilite P^(n) que la realisation A se produise n fois est egale a :
Cette densite de probab ili te est celle de la distr ib ution binom iale. Elle est caracterisee
par deux parametres N et p. Plusieurs exemples de cette distribution sont donnes
sur la figure 1.7.C o m m e exemple ph ysique simp le, considerons N particules d'un gaz sans interaction
dist r ibutes uni fo rmement dans un volume V. Chaque particule a une position alea-toire dans ce vo lum e et a une probabili te p = v/V de se manifester dans une partie v
du volume V. Dans ces conditions la probabili te P/v(n) de t rouver n particules dans
v est donnee par (30) .
II est facile de verifier que la densite de probabilite (30) est normee conformement a
1'equation (2) :
Dete rminons la moyenne du nombre n. Par definition (voir (6')) , elle est egale a
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 34/150
32 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 1.7 : La distribution binomiale pour trois valeurs du parametre p, N etant fixe : N = 10
Nous avons utilise le fait que le terme avec n — 0 est nul ; changeons la variable de
sommation en posant k =n — 1 :
Nous aurions pu prevoir ce resultat directement car si la probabilite de realisation Aest egale a p, a la suite de A f evenements , le nombre moyen de realisations A doit etre
egale a Np.
Pour calculer 1'ecart-type, prenons la definition (7') et utilisons 1'expression (8) :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 35/150
I - RAPPELS SUR L A THEORIE D B S P R O B A B I L I T I E S 33
Pour calculer la premiere somme, nous util isons la mem e astuce que pour le calcul den dans (32) :
Autrement dit , 1 'ecart-type est egal a :
La fonction gene rat r ice des mom ents (14) de la distribution b inomia le es t
La p rem ie re et la deux i eme der ivees de cet te fonction e n t = 0 defmissent le s moments
Ains i la moyenne et la var i ance de la distribution binomia le sont donnees par :
con fo rmemen t a (32 ) e t (33).
Les resul ta ts (32) et (33) peu ven t paraitre t r iv iau x mais ils sont fondamentaux pour
tou te la statis t ique : la valeur moyenne n est proportionnelle au nombre de mesures
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 36/150
3 4 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
tandis que 1'ecart-type es t proportionn el a la racine de N
Pour comprendre 1'importance de ces resultats , rappelons que la valeur moyenne est
associee a la valeur d 'un e grandeur ph ysique xexp et 1'ecart-type a son incert i tude (voir
la discussion suivant la formule (29)) . Si Ton definit 1'erreur (1'incertitude) relative 6
com m e le rappor t
on voit que cette valeur est inversement proportionnelle au nombre de mesures T V
Cela signifie que, plus 1'on fait de mesures, plus la precision est gra nde : une conclusion
evidente , presque triviale. Ce qui est beaucoup moins evident, c 'est la dependance
fonctionnelle de 8 avec N. La formule (35) montre que la precision relative decroit
seulement comme la racine de N. Pour augmenter la precision par un fac teur de 10,
il faut multipl ier le nombre d 'experiences, et ainsi le cou t , par 100 ! Une experience
precise peut couter tres cher et, ic i , on en com prend la raison. V u qu 'une bonne
precision est chere, il faut savoir de quelle precision on a vraiment besoin. C'est une
question non triviale et nous y reviendrons a la fin du l ivre.
N ous avons obtenu la formule (35) a part ir de la distr ibution binomiale mais elle
restera valable quelle que soit la situation experimental. No us reviendrons sur cette
question au paragraphe 2.1.
1 . 3 . 2 DISTRIBUTION DE POISSON
Etudions maintenant un autre phenomene par t icul ie rement interessant : la trans-
formation d'une distribution dans une autre. Prenons comme point de depart la
distr ibution binomiale dans laquelle nous augmentons le nombre de mesures N. Nou s
considerons la l imite quand N est tres grand mais en imposant que le
produi t Np reste constant Np = const = // (c'est-a-dire p — > • 0).
Nous voulons trouver la probabili te P/^(n) que la realisation A se produise n fois au
cours de toutes les mesures :
et du fait que
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 37/150
I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T I E S 35
Rappelons que n restant fini, il est toujours pet i t par rappor t a N. Done,
F inalemen t , pour la probabil i ty P ^ ( n ) , on obtient
. , 1
C'est la dis t r ibut ion de Poisson.
On peut verifier aisement qu'elle est normee :
Nous aur ions pu prevoir ces resul tats a par t i r des expressions relatives a la dis t r ibu-
tion binomiale (32—33).
La fonction genera t r i ce des m o m en t s (14) de la distribution de Poisson est
lorsque T V tend vers Pinfini.
On peut reecrire (1 — p)N~
nc o m m e
L'expression dans le denomina teur tend vers 1 quand N — > oo, par centre
que sa moyenne est egale a // :
et que sa variance est p, (soit un ecar t- type
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 38/150
36 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Le lec teur in teresse r e t rouve ra a i semen t la moyenne et la var i ance de cette distribution a
I 'a ide des deux p remie res der ivees de la fonction M^{t] prises en t = 0.
Notons que la distribution de Poisson ne depend que d'un seul parametre // = Np. La
forme de cette distr ibution pour plusieurs valeurs de p est presentee sur la figure 1.8.
Figure 1.8 : La distribution de Poisson pour plusieurs valeurs du parametre p,
Cette distr ibution de probabil i ty est souvent rencontree en physique atomique ou en
phys ique nucleaire, car le nombre de particules comptees par un detecteur est dis t r ibue
selon cette lo i a condi t ion que le flux de particules reste constant.Prenons un exemple. Supposons qu'a I 'aide d'undetec teur on compte des particules
et que 1'on enregistre leur nombre pendan t une certaine duree, disons 1 seconde. Ces
mesures seront decrites par la distr ibution de Poisson.
Pour le verifier, divisons notre intervalle de t emps (de 1 s) en A * " pet i ts sous-intervalles,
disons de 1 nanoseconde (1 ns = 10~9
s). Supposons que le nombre moyen de par-
ticules enregistrees pendan t 1 s soit egal a // = 8. Alors la probabil i te de detec t ion
d 'une par t icule dans un sous-intervalle est egale a p = II est impor tan t
que cette valeur soit faible pour que Ton puisse negliger la probabil i te de detect ion de
deux particules dans un sous-intervalle de temps.
En pr inc ipe , c'est une distr ibution binomiale ou la realisation A est 1'apparition d 'une
particule dans le detec teur et la realisation B est son absence. Les condi t ions de la
lim ite con st) sont satisfaites
et la dis t r ibut ion devient une dis t r ibut ion de Poisson avec une moyenne J J L = 8
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 39/150
I - R A P P E L S SUR L A T H E O R I E D E S P R O B A B I L I T E S 37
(figure 1.8). n est le nombre de particules detectees pendant 1 seconde. Get exemple
mont re un "passage" entre differentes dis tr ibut ions. On a remplace une distribution
a deux parametres (b inomiale) par une autre beaucoup plus simple (de Poisson) qui
ne contient qu 'un seul paramet re .
1.3 .3 DISTRIBUTION DE LORENTZ
La dis tr ibut ion de Lorentz , qui por te parfois aussi le nom de Cauchy, a une place
particuliere en statistique.
D'u n e par t , la fonct ion de Lorentz (37) est t res importante en physique car elle decrit
des systemes qui se t rouvent dans un etat dit de resonance. Ce phenomene se carac-
terise par une grande am plification des parame tres du systeme. II est connu et utiliseen mecanique (pour mettre en marche une balangoire, un enfant doit effectuer ses
mouvements periodiques avec une certaine frequence) ou en elect romagnet isme ( tous
les postes de radio ou de television util isent le phenomene de resonance pour choisirune stat ion) . En ph ysique microscopiqu e, une resonance decrit , entre autres, la duree
de vie d'une particule ou d'un systeme de particules.
D 'au t re par t , la fonct ion de Lorentz apparai t comme une dis tr ibut ion de proba-bilite sur tout en mecanique quant ique, c'est-a-dire en physique microscopique. C'estpourquoi ce t te dis tr ibut ion de probabili te se manifeste relativement rarement dans
le s problemes macroscopiques et, en particu lier, dans les experiences en trav aux p ra-
tiques.
Neanmoins , elle donne un exemple de distr ibution pour laquelle le s definitions stan-
dards de la statistique ne sont pas toujours valables. Cette raison a elle seule estsuffisante pour que 1'on etudie cet te dis tr ibut ion de maniere plus approfondie.
La distribution de Lorentz est donnee par la fonctio n
qui depend de deux parameteres X Q et a (figure 1.9).
Le coefficient devant la fonction est choisi pour que la probabili te totale de trouverune valeur quelconqu e de x soit egale a 1.
Le calcul de cette integrate ne represente aucune difficulte car la primit ive de cet te
fonction est bien connue (arc tangente) .
On peut voir facilement que cette distr ibution est symetr ique par rapport a XQ qui
est aussi le m axim um de cette fonction. En ce qui concerne le coefficient a, son
in terpreta t ion est aussi claire : il represente la moit ie de la largeur a mi-hauteur etcaracterise ainsi 1'etalement de cette fonction.
Cependant, on rencontre de vrais problemes quand on veut trouver la moyenne et la
variance en utilisant nos definitions habituelles.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 40/150
38 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
Figure 1.9 : La distribution de Lorentz
Le deuxieme terme est egal a X Q en ver tu de la normalisation de la distr ibution. Onpeut dire que la premiere integrale est nulle car la fonction que Ton integre est impaire
par rappor t a £ — 0. F ormel lement , cec i est faux. Du point de vue m athem a t ique ,
cette integrale est divergente. Elle n'es t egale a zero que si 1'on considere ce que
Ton appelle sa valeur pr inc ipale . Autrement d i t , si Ton prend d 'abord un intervalle
d' integrat ion f ini e t symetrique ( — R, R) et si Ton calcule ensuite la limite lorsque
R — > • oo. Done, la valeur moyenne peut etre consideree egale a X Q mais 1'on constate
que le calcul de 1'integrale est un peu delicat.
Le vrai p robleme appara i t quand on veut etablir la variance, car 1'integrale correspo n-
dante
diverge. Cela signifie que Pecart-type, qui etai t pour nous la caracteristique de la
largeur d 'une distribution, n'existe pas au sens de la definition (7). Neanmoins,
1'etalement de la fonct ion de Lorentz peut etre decri t par le parametre a.
D'apres la definition (6) , la valeur moy enne de x est egale a
Pour calculer cette integrale, faisons le changement de variable
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 41/150
I - R A P P E L S SUR L A T H E O R I E D E S P R O B A B I L I T I E S 39
La fonction genera t r i ce (14) ou (15) de la distribution de Loren tz n 'ex is te pas non plus
a cause de la d ivergence de I ' in tegra le co r r espondan te . C ependan t , il es t poss ib le de
remedie r a ce probleme. Au lieu de la definition issue de la transformation de Lap l ace , on
peut choisi r pour fonction generat r ice une def in i t ion issue de la t ransfo rma t ion de Four ier(voir la d iscuss ion a la fin du pa rag raphe 1.1.3) :
ou la fonction exponent i e l l e d 'un a rgument ree l a e te remplacee par la fonction e x-
ponent i e l l e d 'un a rgument purement complexe (pour s imp l i f i e r l a d i scuss ion , on prend
Avec cette definition, la fonction genera t r i ce ex i s te e t el le e s t ega le a :
Ce t te i n teg ra le , r e l a t i vemen t comp l i quee , peu t etre ca l cu l ee d i rec tem ent en u t i li san t l a
theor ie de s fonct ions des va r i ab l es comp lexes . C ep endan t , on peut obten i r ce resu l t a t
ind i rec tement e n utilisant le fait qu ' en p r enan t la t rans fo rmat ion de Fourie r d 'un e fonction
puis la t rans form at ion de Four ier inve rse de la fonction obtenue , on re t rouve la fonction
in i t ia le . A ins i s i F(t) est la t rans fo rmat ion de Fourier de f(x)
a lors
Dans not re cas , e n p renan t
on obtient
ou nous avons uti l ise le fait que a > 0 . Ains i ( 'express ion de la t r ans fo rma t i on de Four ier
d i rec te (40) nous donne la fo rmu le (39) .
Nous sommes en presence d 'une distr ibution pour laquelle les def in i t ions generates
des valeurs m oyennes ne sont pas valables. Ce tte part icular i ty de la d is t r ibut ion de
Lorentz a des consequences tres im po rtantes. N ous verrons au paragraph e suivant
que c'est la seule distr ibution qui ne se transforme pas en une distr ibution de Gauss
lorsque le nombre de mesures devient grand.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 42/150
4 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
1 . 3 . 4 D I S T R I B U T I O N G A M M A
Cet te distribution heri te son nom d 'une fonction spec ia le dite fonction F ou in tegrate
d 'Eu l e r de deux ieme espece. L a fonction F es t de fmie par I ' in tegra le
En principe, x dans ce t te expres s ion peut e t re complexe. Nous n 'e tud ie rons pas toutes
les proprietes de cette fonction, mais nous nous bornerons a la plus in teressante :
qu i se demon t re t res s imp lement : il su f f i t d' in tegrer (41) une fois par par t ies .
Pour x en t ie r , x = n, nous obtenons
ca r
Au t remen t dit, la fonction F est une genera l isat ion de la fonction factor ie l le n\ au cas
d 'un argument non en t ie r , ou mem e comp lexe (dans la l i t t e ra tu re , on rencon t re parfois
I 'ecr i ture x\ qui signif ie T(x + 1)).
Notons que pour le s va leu rs demi -en t i e res x — n + 1/2 , la fonction F peut auss i etre
ecr i te sous une forme r e l a t i vemen t s imple
car I ' integrale
L e changemen t de va r iab l e la rame n e a I ' in tegra le ( 25 ) .
La distribution de probabi l i te liee a la fonction F est decr i te par la fonction
pour x > 0 . Ce t te fonction contient deux pa rame t r es3. Notons que (3 e s t s imp lemen t un
param et re d 'eche l l e . L e choix de la cons tan te devan t la fonction de x e s t dicte, c o m m e
d 'hab i t ude , par la normal isat ion de la probabi l i te totale, ce qu i s e ver i f ie f ac i l emen t a I 'a ide
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 43/150
I — RAPPELS S U R L A T H E O R I E D E S P R O B A B I L I T E S 41
Figure 1.10 : La distribution gamma pour plusieurs valeurs du parametre a, / 3 etant fixe
de (41). Que lques exemples de la distribution gamma (pour (3 = 1) sont representes sur
la figure 1.10.
Calcu lons la moyenne et la var i ance de cette distribution. Par definition,
Nous avons utilise la definition de la fonction F et sa propriete (42).
Pour ca l cu le r l a var i ance , utilisons ( 'express ion (8) :
Le c a l c u l de es t relativement simple :
A ins i la va r iance de cette distribution e s t donnee par
3 Notons la ressemblance formelle entre la dist ribution gamma et celle de Poisson : si Ton remplace
n par a et j j, par x/j3. Cependant, il ne faut pas oublier que les roles des variables et des
parametres sont inverses dans ces distributions.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 44/150
4 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Comp le tons I'etude de la distribution gamma pa r sa fonction genera t r i ce .
Par definition (14),
Ecr ivons /3a+1
sous la forme
e t i n t rodu isons une nouve l l e va r iab l e L 'express ion pour M'(t] dev ien t
L ' i n t eg ra l e dans cet te express ion est egale a F(a + l)pa+l
et f m a l e m e n t M'(t] s ' e c r i t
Nous ve r rons un exemple phys ique de la distribution g a m m a l ie a la distribution de Maxwe l l
de s v i tesses au paragraphe 2 . 2 .3 consac re a la distribution %2
.
1.4 THEOREME ENTRAL L I M I T EConsiderons maintenant un des aspects les plus impor tants de la statistique qui con-
cerne le theoreme central l imi te . Ce theoreme represente non seulernent un resul ta t
mathemat i que puissant niais il est par t icul ierement impor tant pour ses appl icat ions
physiques. II affirme que, dans presque toutes les experiences, on peut travailler avec
une dis t r ibut ion de Gauss .
La form ulat ion exacte de ce t heoreme est la suivante :
Soit x une grandeur physique aleatoire avec une moyenne ^ et une variance < r2
.
Si < 72
est fini, alors la distribution de la valeur moyenne sur un grand nombre
n de mesures
tend vers une distribution de Gauss avec une moyenne // et une variance
Avant de demont re r ce t heo reme , soul ignons un fait tres impor tan t : on ne fait aucune
hypothese sur la forme de la distr ibution de la grandeur aleatoire x ! Elle p e u t me me
avoir une dis t r ibut ion discrete. II faut seulernent que la variance soit finie. Cette
condit ion est presque tou jours satisfaite dans la plupart des experiences, mais nous
citerons un peu plus tard un exemple physique ou cette l imitation est violee et ou la
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 45/150
I - R A P P E L S S U E L A T H E O R I E D B S P R O B A B I L I T E S 43
dis tr ibut ion ne tend pas vers une distributio n norm ale, Ne anmoins, cette situation
reste rare et quand les conditions du theoreme sont remplies, celui-ci nous garanti t
que, pour obtenir un resultat precis et fiable, il faut mesurer plusieurs fois la valeur
de x et calculer sa moyenne .
V u 1'importance du theoreme central l imite, nous donnons ici sa demonstrat ion qui
peu t , cependant , etre oubliee lors d 'une premiere lecture.
Considerons la fonction generat r ice de s moments cent raux pour / — > • 0 :
Ic i , nous avons fait le developpement limite de la fonction exponent ie l le e t nous avonsut i l ise le fait que la v a l e u r moyenne de x es t ega le a ^ et que le car re de I ' eca r t - t ype es t
fmi e t egal a a2
(13). Introduisons d 'abo rd une va leur auxiliaire
dont la fonction generat r ice des moments est donnee par
Pour t fixe, tend vers 0 lorsque n tend vers I'infmi. Nous pouvons a ins i utiliser le
deve loppement (47 ) par rappor t au pa rame t r e t/^/n :
Introduisons maintenant une nouvel le var iable z liee a la valeur moyenne introduite dans
I 'enonce du theoreme
par une re lat ion l ineaire
Toute le s va l eu r s W i appara i ssant dans la derniere express ion ont la meme distribution carle s di f fe rents x^ ont des dist r ibut ions equ iva lentes. Nous pouvons alors ut i l iser la propr ie te
(21) de la fonction genera t r i ce des moments , se lon laquel le la fonction genera t r i ce des
m o m e n t s d 'une s o m m e de n g r a n d e u r s a lea to i res ayan t la meme distribution e s t ega le a
la n-ieme pu issance de leur fonction genera t r i ce :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 46/150
4 4 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Lorsque n tend vers I ' i n f m i , cette expression tend vers
On reconnaf t ici la fonction genera t r i ce ( 26 ) de s moments d 'une dist r ibut ion de G a us s
avec une moyenne nulle et une va r i ance a2
= 1 . Aut rement d i t , dans la limite ou n e s t
g rand , la g randeu r z a une distribution normale avec une moyenne nu l le et une va r i ance
uni te . La va leu r moyenne X est liee a z par
Nous avons deja demont re qu 'une fonction l ineaire (ici X) d 'une g randeu r a lea to i re z
avec une distribution normale a auss i une dis t r ibu t ion normale (voir ( 2 8 ) ) . Ains i la va le urX, dans la limite ou n e s t grand , a une dist r ibut ion de G a us s avec une moyenne p et une
var iance a2/n.
Nous pouvons encore rem arque r que I ' e r reur re la t ive Sx sur la va le u r moyenne X, i n t ro-
duite dans la fo rmule (34) , es t inversement propor t ionne l le a la rac ine carree de n.
Soul ignons que, dans la demonstrat ion, aucune hypothese n'a e te faite sur la forme de la
fonction de distribution de x e t qu 'a ins i ce resu l ta t es t t res genera l .
Le theoreme que nous venons de demont rer est particulierement important pour lesexperiences physiques car il nous donne la garantie que, si le nombre de mesures
est suffisant, nous obtiendrons tot ou tard une valeur physique ayant une distr ibution
bien connue. Cependant, i l s'agit d'un theo reme l imite , c'est-a-dire que le passage vers
une distribution de Gauss ne se realise que si n est suffisamment gran d. Dans une
situation concrete, il faut savoir a quel point la distribution de la grandeur mesuree
est proche de la dis tr ibut ion de Gauss et quand le nombre de mesures est suffisant.
Pour 1'instant, la conclusion physique principale du theoreme central l imite est que
toutes le s grandeurs physiques, ou presque, ont une distribution de Gauss ; de plus
nous savons ce qu'il faut faire pour que la distribution devienne une distributionnormale. Pour eclaircir cet aspect du theoreme, donnons-en une autre formulat ion,
plus "physique", que 1'on peut aussi renc ont rer dans les livres sous le nom du th eo rem ecentral limite :
Si une grandeur physique subit Vinfiuence d'un nombre important de facteurs
independants et si Vinfiuence de chaque facteur pris separement es t petite, alors
la distribution de cette grandeur est une distribution de Gauss.
Les points importants dans cette formulation du theoreme sont la presence d'un
grand nombre de facteurs exterieurs, leur independance et leur faible influence surla grandeur physique.
Les deux formulat ions du theoreme sont re la t iveme nt proc hes I 'une de I 'aut re . Dans la
deux ieme, n joue le role du nombre de fac teu r s i ndependan t s ; a r t - peut e t re consideree
comme la va leu r de la g randeur x in f luencee par un seul f ac t eu r i. Ains i on re t rouve
presque la meme demons t ra t ion du theorem e. Pour n mesures independantes on peut
a f f i rmer que les X { ont la meme d is t r ibut ion e t ainsi la meme va leu r de <r2, mais pour n
fac teu rs independan ts , on ne peut p lus d i re qu ' i l s von t donner la meme d is t r ibu t ion a Xi
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 47/150
I - RAPPELS S UR L A T H E O R I E D B S P R O B A B I L I T E S 45
avec le s memes va leu rs de // et de cr2. Toutefois cela n'est pas un obstac le au theoreme .
Pour le d e mo n t r e r , il faut remplacer une s imple va leur moyenne a r i thme t i que X par une
express ion p lus complexe . Le l ec teu r , ama teu r de rna themat iques , pou r r a mene r l u i -meme
cette etude.
Donnons maintenant le contre-exemple annonce au debut du paragraphe. Dans ce cas
les conditions du theoreme ne sont pas satisfaites et les calculs de la valeur moyenne
ne peu vent sauve r la si tuat ion, la distribution n 'e tan t pas gaussienne. C'est celui de ladistribution de Lorentz discutee au pa ragr ap he 1.3.3 pour laquelle 1'ecart-type dive rge.
I I est fac i le de voir que, pour la distribution de Lo ren t z , le t heo reme cen t r a l limite ne
s ' ap p l i qu e pas . A u t r e m e n t dit, la condition d'ex is tence d ' u n ecar t - type fmi e s t essent i e l l ea ce theoreme e t n'est pas simplement une condition pour faciliter la demonstration.
Si x e s t dist r ibue se lon une loi lo rentz ienne, la va l e u r moyenne
a auss i la distribution de L o r e n t z .
La fonction genera t r i ce de Xi/n defmie par (38) est egale a :
(a compa re r avec (39)). Done la fonction gene ra t r i c e de X es t , e n vertu de (21),
il s 'ag i t d 'une l o ren t z i enne e t non d ' une gaus s i enne !
En physique, cet te distribution est caracteristique de la forme d'une raie dans lestransi t ions electromagnet iques . Get exemple ne signifie pas, cependant , que toutesle s raies mesurees experimentalement ont une forme lorentz ienne . No us verrons plustard que 1'appareil avec lequel on efFectue le s mesures modifie aussi la forme de la
dist r ibut ion et que, pour une dist r ibut ion de Lo rentz ini t iale, on peut mesurer une
distribution de Gauss. N otre exemple de la distribution de Lorentz, bien qu'il soittres impor tan t en physique, reste neanmoins une exception.
Pour illustrer le theorem e central l im ite, considerons quelques exernples. Commengons
par un exemple numer ique simple. Nous pouvons faire cette experience elementaire
a la maison : dans 1'annuaire te lephonique , choisissons 200 numeros au hasard et
calculons pour chaque numero la somme s4 des quatre derniers chiffres. Une telleexperience a ete effectuee avec "Les Pages B lanches" du depar t ement de 1'Isere de
1'annee 1999 ou nou s avons pris les 200 premiers numeros de la page 365. Les resultats
sont presenters sur la figure 1.11 sous la forme d 'h i s togramm e : nous avons repor te ,
pour chaque valeur de 8 4 calculee, sur ces 200 numeros, le nombre de realisations NS4.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 48/150
46 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
II faut comparer ce resultat avec la distr ibution de Gauss representee par une ligne
discontinue :
avec les paramet res p,S4 = 18 et aS4 w 5, 2. Les valeurs de ces parametres ont ete
calculees selon (19) et (20) en supposant que chaque chiffre dans un numero tele-
phonique est distr ibue selon une distr ibution discrete constante avec une moyenne
(9 + 0) /2 = 4, 5 et une variance (9 - 0)2/12 = 6, 75 (a comparer avec (10) et (11)).
La coincidence entre la courbe et 1'histogramme est impress ionnante ! Notons que le
theoreme central l imite suppose que les dis t r ibut ions de Xi doivent etre le s memes et
independantes (ce qui semble etre credible dans notre experience). Alors la s omme sn,pour n termes dans la somme, aura une dis t r ibut ion proche de celle de Gauss lorsque
n — > • oo. Dans notre cas, n = 4, mais nous voyons que la distr ibution de Gauss est
deja une tres bonne approximat ion de la d is t ribut ion de §4.
Figure 1.11 : La dis tr ibut ion de la somme 5 4 des quatre derniers chiffres
dans un numero de telephone
Un autre exemple classique nous montre comment 1 'augmentation de // t ransform e la
distr ibution de Poisson en une distr ibution de Gauss4.
4 A cause de la ressemblance form elle entre les dis trib utio ns gamma et de Poisson, on peut util iser
exactement la m e m e approche pour demon trer que, dans la l imite a — > • oo , la dis tr ibut ion gamma
donne une distribu tion de G auss. Nous laissons cet exercice au lecteur.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 49/150
I - R A P P E L S SUR L A T H E O R I E D B S P R O B A B I L I T E S 47
Rappelons que, pour la distribution de Poisson (36), la probabil i te de t rouver n evene-
rnents dans un interv alle donne e st egale a
Augmentons la valeur du paramet re //. Les nombres d 'evenements H Q po ur lesquels
les probabili tes P^(UQ} sont sensiblement differentes de zero doivent etre proches de la
valeur // ; ainsi nous considerons la l imi te n»1 pou r laquelle nous pouvo ns util iser
la fo rmule de Stir l ing donnant n\
et ecrire la probabili te P ^ (n ) sous la fo rm e
Pour simplifier cette expression dans la l imite p,n»1, utilisons une approche
assez connue dite "methode du col". N ot re fon ctio n P ( j , ( n ) contient deux facteurs, le
premier , I / A / T I , qui varie lentem ent avec n et le deuxieme, e~n\ qui a une var ia t ion
tres rapide avec n du fait de la fonctio n exponentielle ; ici
On peut voir aisement que la fonct ion f^(n) possede un seul m in im um pour n — p , et
qu'elle peut etre developpee en serie de Taylor au voisinage de ce point :
Nous avons utilise ici le fait que /M (/ /) = 0 et f'n(^) = 0, car n — p , est un m in im um
de la fonction, et nous n 'avons garde que le premier t e rme non nul . C o m m e nous
1'avons deja remarque, la probabili te P^(n] ne sera sensiblement differente de zeroqu'au voisinage de n — / j , . Au-dela de cette region, elle est tres petite a cause de lafonction expone ntielle decroissante. A u voisinage de ce poin t , on peut ecrire que
Dans cette expression, nous avons remplace la fonction qui varie lentement avec n par
sa valeur au point n = p. La distribution ainsi obtenue est une dis tr ibut ion de Gauss
avec une moyenne p , et un ecar t- type ^/Ji. D'ailleurs, il est tou t a fait normal que la
moyenne et la variance restent le s memes que pour la dis tr ibut ion de Poisson. Surla figure 1.8, nous avons donne quelques exemples de la distribution de Poisson avecplusieurs valeurs de / j , . Plus la valeur de p est grande, plus la dis tr ibut ion devient
symetr ique par rap po rt au maxim um q ui est aussi la valeur m oyen ne.
Nous avons deja vu au paragraphe 1.3.2 que la distribution de Poisson peut etre
obtenue a partir de la distr ibution binomiale lorsque le nombre de mesures N est
grand et que p est petit , le produit p = Np restant constant. Cela signifie egalement
q u e , dans le cas d'un grand nombre de mesures, la distr ibution binomiale tend vers
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 50/150
48 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
la distr ibution de Gauss. Cependant, il faut interpreter ces l imites avec precaution.
On ne peu t pas dire que la distr ibution de Gauss est un cas par t icul ie r de celle de
Poisson lorsque f j , — > • oo. La dis t r ibut ion de Gauss generale est caracterisee par deux
paramet res independants : la valeur moy enne et 1'ecart-type. La distr ibutio n de Gaussobtenue de la dis t r ibut ion de Poisson dans la limite // — » oo ne depend que d'un seul
pararnetre .
Sur la figure 1.12, nous recapitulons les relations entre ces trois distr ibutions.
Un autre exemple d 'une distr ibution qui tend vers la distr ibution de Gauss quand le
nombre de mesures augmente sera donne plus loin lorsque nous etudierons la distri-
butio n de Stude nt (en 4.3) .
Pour 1'instant, considerons un exemple physique instructif issu d 'une experience reelle
ou nous verrons le fonct ionnement du theoreme central l imi te dans sa deuxieme for-mulation ainsi que ses condit ions de validite . II s'agit d 'une experience recente faite
au C E R N sur un enorme anneau d 'acce lerateur de par t icules dont le per imet re est
de 27 kilom etres. Pour etud ier les prop rietes fondam entales des part icules elemen-
taires, les exper imentateurs du CERN ont eu besoin de determiner avec une tres
grande precision 1'energie des particules qui tou rnen t dans 1'anneau de Paccelerateur.
En augmentant la precision de leurs mesures, le s physiciens ont decouvert a un cer-
tain stade un phenomene t res etrange : 1'energie du faisceau variait selon les heures
de la jou rnee. On a du consacrer beauc oup de temps et d'efforts, rejeter beaucoup
d 'hypo theses avant d 'arr iver a comprendre et a demontre r que 1'origine de ce com-por tem ent bizarre se t rouvai t dans le mouvem ent de la Lune autour de la Terre. Get
effet gravi tat ionnel est clairernent visible sur 1'ocean : c'est le phenomene des marees .
Cependant, cet effet existe aussi pour la croute terrestre et donne lieu a des deplace-
ments d 'environ trente cent imetres chaque jo ur . Cet te var iat ion minim e cumulee sur
tou te la l ongueur de 1'accelerateur modifie sa circonference de 1 mm et change ainsi
1'energie des part icules.
Ce cas, assez cur ieux, donne a la fois un exemple d 'erreur systemat ique liee a la ne-
gligence d 'un phenom ene phys ique e t donne une be lle i l lus t rat ion du "mecanisme" du
theoreme central l imite ( la necessite d'avoir plusieurs pe ti ts facteurs). II y a beaucoup
de facteurs qui peuvent influencer 1'energie des particules dans un accelerateur : les
variations du c h a m p magnet ique te r res t re , les changements de pression barometr ique,
le mou ve me n t de la Lune , e tc . Chacun de ces facteurs parait etre peu imp or t an t . S i
c'est le cas, et si 1'on ne recherche pas une trop grande precision, les conditions du
theoreme central limite sont satisfaites et la distr ibution d 'une valeur physique reste
gaussienne. Des qu'o n veut au gm enter la precision d 'un e experience, les facteurs
qui auparavant eta ient supposes negligeables devienne nt im por tants e t se manifes tent
sous forme d 'er reurs systematiques .
Soulignons le s conclusions a re tenir . D'abord , pour la plupar t des experiences phy-
siques faites au laboratoire, 1'hypothese selon laquelle la dis t r ibut ion d 'une grandeur
physique est une dis t r ibut ion de Gauss consti tue une t res bonne hypothese de depar t .
C'est le t heoreme central limite qui nous le garant i t . De plus, si jamais on a le moindre
doute sur la forme de la distr ibution, ce meme theoreme nous indique comment on
peut contourner le probleme : il fau t faire plusieurs mesures et travailler sur la valeur
moyenne qui est forcement decrite par la distr ibution normale.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 51/150
I - R A P P E L S SUR L A T H E O R I E D B S P R O B A B I L I T E S 49
Figure 1.12 : Les relations entre le s dis tr ibut ions binomiale , de Poisson et de Gauss
Neanmoins, il ne faut pas oublier "le point faible" de ce theoreme : c o m m e c'est un
theoreme l imite, le nombre de mesures doit etre grand, et done 1'experience peu t
devenir chere. Pour controler la deviation a la loi gaussienne et savoir combien de
mesures sont necessaires, une analyse plus approfondie est indispensable : elle est
1'objet des paragraphes suivants.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 52/150
Cette page est laissée intentionnellement en blanc.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 53/150
C H A P I T R E 2
F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E
On peut formuler un probleme assez general et tres impor tan t pour les applications
physiques. Supposons que soit connue la fonc tion de distr ibution de probab il i ty f(x)
d'une variable aleatoire x (en particulier , la moyenne de cette distr ibution
sa varianc e Quelle est alors la fonction de distr ibution de probabil i te
g(y) d'une variable aleatoire y (e n par t icul ie r , p,y et < j y ) lorsque la relation entre y et
x est donnee par une fonction connue y = y(x) ? C'est, en statistique, le phenomenede la propagation des erreurs.
2.1 P R O P A G A T I O N DES E R R E U R S
Au chapitre precedent, nous avons vu que la valeur moyenne et la variance sont le s
caracteristiques majeures d 'une d is t r ibut ion de probabi l i tes . Elles peuvent m e m e
etre suffisantes pour decrire toute la distr ibution et Ton les interprete alors commevaleur de la grandeur et son incert i tude (er reur ) . Ceci est vrai , en part iculier , dans
le cas de la distribution de Gauss qui est la plus f requemment rencontree dans les
experiences. C'est pourquoi nous aliens trou ve r d 'abord la relation entre les mo yennes
et les variances de x et de y — y(x). La relation entre les variances porte le nom de
la form ule de propagation des erreurs.
2 . 1 . 1 F O R M U L E DE P R O P A G A T I O N DES E R R E U R S
Commengons s implement par chercher la relation entre px et c r ^ , d 'une part et p,y
et < 7 y , d 'autre part. Nous nous l imitons, pour 1'instant, au cas d 'une seule variable
y = y ( x ) .
Developpons cette fonction en serie de Taylor au voisinage de x — p,x :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 54/150
5 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
La valeur mo yenne de y est egale a
L'approximat ion standard consiste a negliger dans cette expression tons les termes
sauf le premier :
C'est un resul ta t qui pour ra i t semb ler evident mais cette expression est approximat ive .
Elle n'est exacte que si la fonction y(x] est l ineaire.
D'une fagon tout a fait analogue, nous pouvons calculer la variance de y :
A par t i r du developpement en serie de Taylor (48) nous avons :
Pour conserver la coherence de nos expressions, gardens un iquement l e t e rme l ineaire.
Alors,
soit
II s'agit encore d 'une expression approchee qui ne prend une valeur exacte que si la
fonction est l ineaire . Nous reviendrons sur la precision de cette approximation a la
f in du chapitre .
N ous pouvons generaliser le s resul ta ts (49) et (50) au cas de plusieurs variables. Soit
une fonct ion de n variables. Pour abreger, utilisons des nota-t ions "vectorielles" :
ic i Developpons la fonct ion en serie de Taylor au voisinage de x = jl. A u
premier ordre , on obt ient :
Cette expression donne pour la valeu r m oyen ne
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 55/150
I I — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 53
et pour la variance :
Supposons que les variables xi soient independantes (nous verrons dans ce chapitre le
cas plus general sans cette hypothese supplementaire) . Alors
Finalement, pour 1'ecart- type < r y , on obtient :
Nous avons ainsi resolu le prob lem e pose au debut du parag raph e. L'expression (54)
permet de calculer 1'ecart-type ay de y si les ecarts < 7 Z - de Xi sont connus.
Reecrivons cette derniere formule en remplagant1
ax et ay par A a ? et Ay :
Ici, toutes les derivees sont calculees pour x\ — H i, x - 2 = j J > 2 , • • • , xn — Hn, c'est-a-direque tous le s x ^ doivent etre remplaces par leurs valeurs moyennes fa .
Soulignons encore une fois que pour obtenir cette expression nous avons utilise deux
hypotheses impor tantes : la premiere est 1'independance des grandeurs a ? , - , la deuxieme
est que, dans le developpement en serie de Taylor de y, nous nous l imitons seulement
aux deux premiers termes.
2.1.2 EXEMPLES DE PROPAGATION DES ERREURS
Les exemples le s plus simples et les plus frequents concernent la somme et le produit
(ou le rappo rt) de deux valeurs physiques. Pour la somm e de deux valeurs x\ et x - i
['expression (55) s'ecrit
car les deux derivees sont
1 Rappelons que, dans ce livre, nous conservons les "anciennes" notations A:r au lieu de ux.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 56/150
5 4 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Pour le produi t de deux variables
les derivees sont
et la formule (55) don ne
Dans cette expression ainsi que dans les expressions suivantes nous ecrivons x\ et x %
a la place de /^ i et .Ce choix est volontaire car exper imentalement il est possiblede de terminer mXl et mX2 et non //i et ^2- Pour ne pas in t roduire chaque fois de
nouvelles notations, gardens partout x\ et x - ± qui ne representent pas des fonctions
mais des valeurs experimentales.
D'une fagon analogue, pour le rapport
nous obtenons
Les deux dernieres expressions de Ay peuvent etre reunies sous une forme plus com-
mod e si Ton passe a 1'incertitude relative A y / y :
Cet te formule se generalise facilement au cas du produ i t et du rappor t d 'un nombre
arbitraire de n variables :
Les formulas (56) et (58) ont une structure similaire : la racine carree d 'une somme
de carres. Po ur des estim ations rap ides et simplifiees, on appl ique les majorat ionssuivantes :
et
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 57/150
II — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 55
(on "deduit" parfois cette formule en calculan t la derivee de log y). Cependant 1'utilisa-
t ion de ces majorations n'est justif iee que si Ton veut une evaluation grossiere de
Pincer t i tude . La difference entre la vraie valeur de 1'incertitude (58) et sa majoration
( 6 0 ) peut etre importante. Par exemple, s i 1'on suppose des incertitudes relatives surX i de 5% , la formule exacte donne une incertitude Ay/y = 7% , tandis que sa majora-
t ion conduit a une valeur beaucoup plus grande : 10% ! Plus les variables sont nom-breuses, plus la difference est grande. Ceci s 'explique simplement car 1 'augmentation
de 1'incertitude en fonction du nombre n des variables est en ^Jn dans 1'expression
(58') et en n dans la majorat ion du type (60).
L'expression (55) ou les cas particuliers (56) et (58) donnent une idee sur la fac,on de
diminuer 1 ' incert i tude : il faut toujours se battre contre la plus grande incert i tude.
Si une des incertitudes est seulement trois fois plus petite que les autres, on peut
prat iquement la negliger. Cette approximation donne une erreur supplementaire de
10% dans les calculs d ' incert i tude (c 'est une erreur de deuxieme ordre ) .
Le meil leur choix des condit ions experimentales (des appareils et des m ethodes de
mesure) consiste a avoir si possible les m em es contr ibutions de toutes les variables
differentes dans 1'expression (55), ce qui minimise cette incert i tude.
Parfois, nous rencontrons des fonctions plus compliquees. Prenons un exemple :
Nous pouvons appliquer la formule (55) directem ent. Pour le faire nous calculons le s
derivees :
et obtenons 1'expression suivante de 1'incert i tude su r y :
Le probleme est que, pour des fonct ions compliquees, nous obtenons toujours un
resul tat "complique" et qu'ainsi la probabil i te d'avoir une erreur ar i thmet ique lors de
la derivation ou lors des applications numeriques est t res grande.
II est preferable de proceder autrement : on decompose la fonct ion initiale en fonct ions
elementaires et on fait les operat ions successivement. Dans 1'exemple precedent :
Pour chaque formule , on obtient aisement les incert i tudes :
La probabi l i te d 'erreur dans cette approche est beaucoup plus faible.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 58/150
5 6 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
II existe un aut re avantage a cette procedure, celle de permettre d 'analyser facilement
le role et la contr ibut ion de chaque variable # , - . Soient
Nous voulons calculer 1'incertitude de y a 10% pres. Nous voyons que Ax2/x% est
beaucoup plus grande que A£3/£3. Ainsi, 1'expression de A z2 peu t etre simplifiee
par
Nous notons aussi q ue Az% ~ 1 est beaucoup plus grande que Axi = 0 , 1 e t ainsi,
pour A z i , nous obtenons 1'expression
Finalement, 1 ' incert i tude sur y est egale a
une expression beaucoup plus simple que (61). Le resultat est y = 2, 5 ± 0, 2.
II fau t souligner que 1'exemple precedent n'est pas artificiel. La raison de ce ph enom ene
un peu etrange est liee au fait qu' i l est difficile d'effectuer une experience ou toutes
les sources d' incer t i tudes ont la m e m e impor tance : il existe une ou deux incert i tudes
dominantes . II faut en profiter car le gain de temps dans le calcul de 1'incert i tude
peut etre assez grand, surtout pour des mesures repet i t ives . De plus, cette analyse
par etapes est utile pour elucider les veritables sources d ' incert i tude s et ainsi prevoir
des possibilites d 'ameliorat ion de 1'experience.
Notons une fois de plus que notre expression (55) n'est pas une formule exacte. Dans
sa demons t ra t ion , nous avons suppose que le developpement en serie de Taylor peut
etre limite a la derivee premiere . A utrem ent d i t , nous remplagons l a fonc t ion y = y(x)
par la fonct ion l ineaire :
Cet te hypothese signifie que la forme de la distr ibution reste inchangee : si x, par
exemple , est dist r ibute selon une loi normale, y est aussi dist r ibute selon une loi
normale .
II existe des situations ou la derivee y'(^) s 'annule et cette approche n'est plus valable.
Un exemple est donne par la fonct ion y = x2
avec // = 0. La dis t r ibut ion de Gauss
est remplacee par la distribution ^2
(voir paragraphe 3.1.3).
II existe des situations moins "dramatiques" ou la derivee est non nulle mais ou il faut
tenir compte des derivees superieures. Par exemple pour la fonct ion y = cotg x et
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 59/150
II — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 57
assez differente de
pour laquelle, pour les fonctions "rapides", 1'ecriture y expiA y est remplacee par
:) | et At/2 = \y(x — Aar) — y(x}\. Dans notre cas,
La valeur de y ne suit plus une distribution de Gauss, cependant, la probabilite que la
vraie valeur de y se trouve dans Pintervalle [y exp — Ayi, y exp + A 3 / 2 ] reste "gaussienne",
a peu pres 68%.Nous reviendrons sur cet aspect du probleme, a la fin du chapitre,lors de la discussion sur les intervalles de confiance.
Ce phenomene peu t apparai t re m em e pou r un monorne y = xn
lorsque x n'est pas
tres grand par rapport a Ax. C'est pourquo i il faut toujou rs se souvenir que n otre
approche app roxim ative n'est correcte que si les ince rti tudes restent petites.
2.1.3 CAS DES VARIABLES CORRELEES
Cherchons a general iser la formule de propagation des er reurs (54) au cas de p lus de deux
var iab les corre lees . Nous considerons le passage de n var iab les {xj} a n va r iab l es {yi}
liees entre elles par des re la t ions generates :
Nous voulons t rouver la re la t ion en t re le s matr i ces de covar i ance de x et de y. D e man i e re
ana logue a (23),on de fm i t la matr i ce de cova r i ance par :
De m e m e , D(y) =cov(y, y). Nous ut i li sons la le t t re D pour ce t te mat r i ce dans le but de
souligner sa relation avec la var iance (24).
C o n f o r me me n t au (51), nous avons :
en acco rd avec (52).
C'est la raison
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 60/150
58 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
Un e l emen t cov(yi,yj) de la mat r i c e de c o v a r i a n c e D(y) s 'ec r i t
lei, pour l es va leurs moyennes appara issant dans (63) , nous avons des expressions plus
comp l iquees q ue (53) :
L 'express ion (assez vo lumineuse) de la ma t r ice de covar iance D(y] peut e t re ecr i te sous
une forme beaucoup p lus compac te s i T on introduit la mat r ice du Jacob ien de la t rans -
formation (62 ) :
Toutes les der ivees sont ca lcu lees au point x = jl. A I 'a ide de cette mat r i ce ( ' express ion
(63) s 'ec r i t :
la mat r ice J etant la matrice t ransposee de J.
Dans not re exemple illustratif du p a r a g r a p h e 1.1.5, nous avons chois i une t r ans fo rma t i on
l ineaire Solent xi e t x? deux grandeurs phys iques independantes avec la m e m e moyenne
/j et la meme va r i ance d1. In t roduisons deux grandeurs y\ e t y^ qui leur sont l iees pa r
une relat ion l ineaire :
la mat r i ce de covar iance de x es t d iagona le :
la mat r i ce du Jacob ien s 'ec r i t comme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 61/150
II - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 59
e t ainsi la matrice de c ova r i a nc e D(y] e s t donnee par :
Comme illustration de la formule de propagation de s e r r eu r s d a n s le cas d e s v a r i ab l e s
cor re l l ees , cons ide rons un exemple d an s lequel nous voulons determiner la v a l e u r d'une
r es i s tance R a ins i que la pu issance P degagee par cette resistance. Si nous c onna i s s ons le
c o u r a n t / qui traverse la r es i s tance et la tension U aux bornes de ce l l e - c i , nous trouvons
immediatement
Le s incertitudes r e l a t i v es sur R et P sont se lon (58)
et
Nous aurions pu choisir une autre approche. En ayant calcule la valeur de la resistance
R — U/1, nous pouvons determiner P a partir de la formule
P =RI2.
Cette relation, compte tenu de (66), nous donnerait
e n contradiction evidente avec (67). Ou se trouve I'erreur dans notre raisonnement ?
Pour obtenir I'expression (55) nous av o n s utilise I ' i ndependa nc e des va r i a b l e s , lei, cette
hypothese n'est passatisfaite car R et / ne peuvent pasetre consideres comme variablesi n d e p e n d a n t e s . Done, la relation (68) n'est pa s correcte.
Pour montrer formellement la correlation entre R et P nous utilisons la procedure d e c r i t e
au debut du paragraphe et nous calculons le Jacobien (64) de passage des variablesU,I.
aux va r iab les P, R :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 62/150
60 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S
La mat r i c e de covariance (65) D(P, R ) prend la forme
C o m m e il se doit nous re t rouvons sur la d iagona le les express ions des incer t i tude s
qui peuvent etre reecr i tes sous l es fo rme s (67 ) e t (66 ) respe c t i vem ent , alors que l es
elements non diagonaux nous donnent la covar iance de R et P
I I est i n t e ressan t de remarquer que la cor re la t ion en t re P et R e s t nul le l o r sque l es
cont r ibut ions a I ' incer t i tude AP e t A/?, de la t ens ion et du courant sont ident iques
I I s 'ag i t d 'un a rgume nt supp l emen ta i r e pour e f fec tuer l es mesures en fa i san t en sor te que
toutes le s contributions des di f fe rentes sources d ' incer t i tude so ien t a peu pres le s memes .
Pour retrouver I 'expression correcte de AP, a partir de P = R,P, compte tenu de la
cor re la t ion en t re R et /, ca l cu lons d ' abo rd cov (P t , /). D'apres (63 ) , nous avons :
En ver tu de I ' independance de deux va r i ab l es / et U
Done ,
L ' incer t i tude s u r P s'ecrit a lo rs :
En utilisant le s express ions des derivees
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 63/150
I I - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 61
et la formule (69) , nous obtenons
en accord avec les express ions (66) e t (67 ) .
2.2 D I S T R I B U T I O N DE P R O B A B I L I T E D ' U N E F O N C T I O N
D E V A R I A B L E A L E A T O I R E
Nous pouvons ma in tenant resoudre un prob leme plus complexe e t t rouver la fonction dedistribution de la v a r i a b l e y = y(x] qui es t une fonction d 'une va r i ab l e a lea to i re x.
2.2.1 F O N C T I O N B I U N I V O Q U E
Nous
qu
sur
> u s supposons , tout d 'abo rd , q ue cet te fonction y =y(x] e s t biunivoque, c 'es t -a-d i re
'a une va l eu r de x cor respond une seu le v a l e u r de y e t i nversement . Nous presentons
la f igure 2 .1 un exemple de fonction de ce type .
Figure 2.1 : Une fonc t ion b iunivoque y = y(x)
Nous savons que la probabilite de t r ouve r la v a l e u r de x dans I ' i n te rva l l e compr i s en t re x
e t x + dx est egale a :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 64/150
6 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Nous cherchons la fonction g(y) qu i nous donne la me me probabil i te de t rouve r la va l eu r
de y dans I ' i n te rva l l e compels entre y e t y + dy :
II su f f i t de reecr i re (70)en r emp lacan t x par y. Pour cela nous devons, d 'abo rd, in t roduire
la fonction inverse :
Ceci est possible car notre fonction y(x) es t biunivoque. On a alors
II nous reste a remp lace r dx par dy c o m m e nous le fa isons dans les changements de
va r iab l es d ' in tegra t ion . La seule dif ference reside dans le fait que la dens i te de probabi l i te
ne peut jamais e t re negat ive . C'es t pourquoi nous defmissons
si la der ivee dx(y)/dy est posi t ive , et
s i la der ivee dx(y]/dy es t negative. Les deux dern ie res expressions peuvent etre reunies
sous une f o rme compacte :
Les fo rmu les (72)e t (73)nous donnent
La comparaison avec (71) nous permet d 'ob ten i r le resu l ta t f ina l :
2.2.2 CAS GENERAL
Si la fonction y = y(x] n 'es t pas biunivoque (f igure 2.2), la t ache devient un peu plus
compl iquee . II faut d'abord in t rodui re toutes le s branches un ivoques pour la fonction
inverse : x\ — x\(y\x-2 — x^y],... ,X k =Xk(y), puis faire la s o m m e s ur tou tes ce s
branches (la probabil i te de t rouver y dans I ' in te rva l le entre y e t y + dy e s t egale a la
s o m m e de tou tes l es p robab i li tes d 'app ar i t ion de x entre Xi e t Xi -f dxi].
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 65/150
I I — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 63
Figure 2.2 : Une fo nct ion non b iun ivoque y — y(%)
A ins i la genera l i sa t i on de I ' express ion ( 74) s'ecrit
Prenons I 'exemple y(x) = x2, avec une fonction de distribution de probabilite de x egale
a f(x). La fonction y(x) =x2 n ' e s t pasb i u n i v o qu e car pour deux va l eu r s de x di f fe rentes
on peu t avo i r la meme v a l e u r de y : y(x) — x2
— ( — x }2
. II existe done d e u x branches de
la fonction inverse :
Leurs der ivees son t :
A i n s i l a dens i te de probab i l i t e g(y] e s t donnee par
soit
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 66/150
64 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
L e s formules obtenues sont va lab les dans le cas d'une fonction d 'une va r iab l e y = y(x).
O n peut le s facilement genera l i se r au cas ou nous voulons passer de n var iab les inde-
pendantes x\,x^, .. • , xn = x a n va r i a b l e s i ndependa n tes j/i,y2, • • • > 2/n = y a I 'aide
d 'une transformation y,- = y«(a? i , £ 2 , • • • 5 #n) = yi(x). Alors la densite de probabi-
lite /(xi,# 2 , . . - , xn) = f(x) (voir (18)) se transforme en une dens i te de probabi-
lite < / (y i , 7 / 2 , • • • ,yn) = d(y) a I 'a ide d 'une relation qui est la genera l i sa t ion de (74)
etablie dans l e cas d ' une seu le va r i a b l e . II faut introduire la transformation inverse
Xi = Xi(yi,y2j ... ,yn) =X i ( y ) . La dens i te de probabilite g(y) est
o u | 5 (a? i , x < 2 , . . . , xn)/d(yi, y % , . . . , yn}\ es t l a va l eur abso lue d u Jacob ien d e cette t rans -
formation. Cet te formule e s t a na l ogue a ce l le ut i l i see pour un changement de va r i a b l e s
d'integration. La seule d i f ferenc e es t la prese nce du module deja discutee p r c e d e m m e n t .
Pour le s fonctions qui ne sont pas b iun ivoques , il f audra fa i re la s om m e sur tous le s
branches comme on I 'a fait pour une fonction y — y(x).
2.2.3 EXEMPLE PHYSIQUE
Pour montrer 1 ' importance de ce type de problemes, non seulement pour la statis t ique
mais egalement pour la phys ique en general prenons un exemple i l lustratif . II s'agit
d'une collision elastique entre deux corps (deux particules) de meme masse m. D'apres
le s principes bien connus de la mecanique , nous savons que le mouvement des deux
corps est la resul tante du mouvement du centre de masse et du mouvement relatif
par rapport a ce centre . Habi tue l lement , on in t rodui t un systeme des coordonnees
correspondant au centre de masse car c'est dans ce referentiel que la description
theor ique de 1'interaction entre le s deux corps est la plus simple. Cependant, 1'etude
experimentale se fait dans le systeme dit du laboratoire , c'est-a-dire dans le systeme
ou, avant la collision, un des corps etait au repos. Supposons que nous connaissions le s
caracteristiques de 1'interaction dans le systeme du centre de masse avec, par exemple,une distr ibution angulaire isotrope des particules apres la collision. Qu'observons-
nous exper imentalement , au t rement dit,quelle sera la distr ibution angulaire dans le
systeme du laboratoire ?
Avant de chercher la relation entre les deux fon ctions de distr ib utio n ang ulaires, rap-
pelons la relation entre le s angles de diffusion dans le systeme du laboratoire (fig-
ure 2.3 a) et dans le systeme du centre de masse (figure 2.3 b).
Avant la collision dan s le referentiel du laboratoire , un corps se deplace avec une vitesse
V Q et le deuxieme est fixe. Apres la collision, les deux particules out des vitesses V\et V < 2 qui font les angles 9\ et 9 - 2 avec le vecteur VQ . La collision es t elastique, c 'est-a-
dire que la s t ruc ture in terne des particules reste intacte et que 1'energie cinetique est
conservee. Ainsi les lois de conservation de 1'energie et de I'impulsion
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 67/150
II — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 65
Figure 2.3 : Les vitesses et les angles dans le systeme du laboratoire (a)
et dans le systeme du centre de masse (b)
nous montren t que V\ et V z sont perpendiculaires :
La vitesse du centre de masse est egale a
Dans le systeme du centre de masse (figure 2.3 b ) , le s par t icules ont les vitesses v{ et
V 2 de modules egaux mais de direct ions opposees :
Apres la collision, les modules des vitesses restent inchanges en vertu de 1'elasticitede la collision :
et la collision donne lieu "simplement" a une rotation d'un angle x Quieg
t 1'angle de
diffusion dans le systeme du centre de masse. Dans le systeme du laboratoire apres
la collision, le s vitesses sont egales a :
Si Ton represente graphiquement (figure 2.4), par exemple , la premiere re la t ion, on
voit toute de suite que
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 68/150
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 2.4 : Relation entre les angles dans le systeme du laboratoire
et dans le systeme du centre de masse
Deux relations lient les angles polaires de diffusion dans les deux system es. L'an gle
azimutal, bien evidemment , reste invariant et nous le designerons par < p .
Par ailleurs, I'angle solide dans le systeme du centre de masse d$lcm = siuxdxdtpe§t
lie a Tangle solide dans le systeme de laboratoire d£liab = sinOidOidp par la relation
Comme nous 1'avons dit,dans le systeme du centre de masse la dis t r ibut ion angulaire
est isotrope. Cela signifie que la probabi l i te dP que la particule 1 parte dans un angle
solide dQcm divisee par d£lcm ne depend pas de Tangle :
La valeur de cette constante est egale a 1/47T car la probabil i te est normee a 1. V u la
relation entre le s angles solides (79), nous pouvons reecrire /Cm ( X; V7
)s°us la forme
Ainsi nous avons la distr ibution angulaire dans le systeme du laboratoire qui d 'apres
( 7 8 ) s'ecrit :
Les deux fonct ions de distribution sont representees sur la figure 2.5.
La conclusion physique est tres simple : une distribution angulaire isotrope dans le
systeme du centre de masse se manifes tera exper imentalement par une dis t r ibut ion
anisotrope dans le systeme du laboratoire . De plus, on peut econom iser du tem ps en
restreignant les mesures a 9\ < 7 T / 2 .
Du point de vue m athem a t ique , nous avons vu que le changement des variables angu-
laires imp lique une m odificatio n de la forme de la distr ibution (la fonct ion constante
a ete remplacee par une fonction l ineaire).
66
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 69/150
I I - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 6 7
2 . 2 . 4 PRECISION DE LA F O R M U L ED E P R O P A G A T I O N D E S E R R E U R S
Nous avons deja souligne que la formule de propagation des erreurs, largement utilisee
dans le t ra i tement des resultats exper imen taux , est une formule approchee (sauf dans
le cas presque trivial d'une fonction lineaire). Cette approximation est parfois assez
grossiere puisque pour obte nir la formule de propagatio n des erreu rs nous avons utilise
la relation (49) : y(x) ~ y ( ~ x ) , alors que toute la statistique est basee, par la definition
de la variance, su r 1'importance de la difference entre y — x2
et y ~ ~x2.
Dans certains cas, nous pouvons obtenir 1'expression exacte de la variance a^ sansutiliser la formule de propagation des erreurs. Considerons Pexemple tres simple d'un e
fonction produit de deux variables independantes :
Cette fonct ion peut etre mise sous la forme equivalente :
c'est-a-dire sous la forme d 'un developpement en serie de Taylor au voisinage du point
xi = //!, x - 2 ~ f J . 2 - L'expression (80) contient un nombre fini de termes : une constante
U i «2 ; les contributions avec les derivees premieres
et un seul terme avec le s derivees secondes puisque
Compte tenu de 1'independance de x\ et # 2, nous pouvons calculer exactement lavariance d e y :
Figure 2.5: Les distributions angulaires dans le systeme du cne tre de masse (s)et dans le systeme du laboratorie(b)
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 70/150
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
La formula de propagation des erreurs (57)
est obtenue en negligeant le dernier terme dans le developpement (80). Ainsi cette
formule condui t a une erreur supplemental dans le calcul de ( A y )2
= a^ egale a2 9«
On pourrai t penser qu' i l est facile d'amel iorer la fo rmule de propadgation des erreurs
en poussant plus loin le developpement de la fonction en serie de Taylor. Cette
proposition apparait dans certains l ivres sur 1'analyse des donnees. Techniquement ,
c'est un exercice simple, bien qu'il soit assez penible (il faut faire t res at tent ion et
garder correctement tous les termes de meme ordre dans le developpement et dans
les calculs intermediares). Cependent des problemes majeurs apparaissent dans cettevoie.
Considerons 1'exemple simple d'une fonction d'une seule variable y — y(x). Comme
pour la fo rmule de propagation des erreurs , developpons cet te fonct ion en serie de
Taylor au voisinage de x — px = ~ x :
Nous conservons volontaireme nt le t e rme du troisiem e ordre car il donnera en fait une
contr ibut ion a la variance du mem e ordre que le t e rm e du seconde ordre. L a valeur
moyenne de y prend alors la fo rme
ou apparait le troisieme moment de la distr ibution pxs = (x — x)3
introduit en (12),
qui caracterise I 'asymetrie de la dis tr ibut ion de x. Ainsi , pour la variance, nous
obtenons
ou est en outre introdui t le qua t r ieme moment ^4 = (x — x}4.
Le probleme est resolu formellement mais le prix a payer est 1'introduction de mo-
ments centraux d'ordres superieurs non utilises jusqu'a present et dont la determina-
t ion experim entale peut s 'averer delicate. Pou r obtenir une expression plus precise
de la variance, on a sacrifie la simplicite de la description des grandeurs physiques.
Rapp elons, que dans la plup art des situations, no us travaillons avec des distr ibution s
gaussiennes. La prise en com pte du terme lineaire dans la formule de propagat iondes erreurs nous garant i t la conservation du langage utilise (la variable y est aussi
decrite par la dis tr ibut ion normale ) . II est vrai que, si x est decrite par une distri-
bu t ion gaussienne, nous pouvons exprimer tous les moments d'ordres superieurs a
1'aide de la variance (voir (27)), mais le probleme vient du fait que la variable y n'est
plus gaussienne (on peut verifier que la distribution de y est asymetr ique : ny3 7 ^ 0).
Quand la dis tr ibut ion de y est gaussienne, un ecar t- type < j y a une in terp re tat ion pre-
cise. Dans le cas contraire il peut la perdre. La question qui se pose est de savoir s'il
68
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 71/150
I I — FONCTIONS D ' U N E V A R I A B L E A L E A T O I R E 69
est Pinteressant d'obtenir une expression plus precise de 1'incertitude d 'une grandeur
physique si To n ne peut plus 1'interpreter avec precision.
Pour mieux comprendre , etudions sur un exemple le "passage" d'une dis tr ibut iongaussienne a une distrib utio n plus com plexe. Soient x± et X2 deux variables gaus-
siennes. Quelle est la distribution de leur rapport
Appliquons 1'approche generale presentee dans le paragraphe 2.2.2. II faut passer des
variables x\ et x^ aux variables y et z = # 2 (cette de rniere jou e le role d'une variable
auxiliaire) et integrer sur z.
Pour s imp l i f i e r l es re la t ions, supposons que le s va leu rs moyennes //,• sont posi t ives et que
les incer t i tudes sont fa ib les par rappor t aux va leurs moyennes ( < r z - <C f J - i ) - Cela signif ie
que la distribution cherchee reste proche d 'une distribution gauss ienne. S i /(#i) e t /(x^)
sont les fonctions de distribution de s va r iab l es x\ e t x - z
selon (77), la fonction de distribution g(y) de la va r iab le y prend la forme
Le Jacob ien de la transformation x\ — yz, x % = z es t ega l a
Ains i I ' in tegra le g(y) prend la forme
Cet te dern ie re in tegra le peut etre calcu lee s i T on utilise la va leur de I ' in tegra le aux i l ia i re 2
2 L'astuce pour calculer J(A, B) est classique : il faut utiliser la methode de derivation par rapport
au parametre B :
La derniere integrale se remene a I'integrale connue (25) par le changement lineaire de variable
y =VAz - B/2VA.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 72/150
7 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
on trouve finalement apres quelques calculs
laborieux mais sans difficulte majeure
Dans cette expression
La fonct ion (81) s'ecrit sous une forme qui ressemble beaucoup (sur tout si Ton fait
1'approximation supplementaire A Q ( y ) / A2( y ) w 1) a la distribution de Gauss, mais
sa largeur depend de y.
Un exemple d 'une tel le distr ibution est t race sur la figure 2.6 ( p ou r / ^ i / / /2 — 1,
Figure 2.6 : La fonction de distribution g ( y ) de y = x\jx2 (ligne continue) comparee
a une fonction gaussienne (ligne pointillee).
On constate que,lorsque les incertitudes relatives sont faibles ( < T J < C Hi), la fonction
de dis t r ibut ion g(y) est tres proche d 'un e gauss ienne : c'est une fonct ion qui est tres
piquee au voisinage de y = yo = pi/Hz (on
peut done garder la dependance rapide de
y dans la fonction expon entiel le , mais rem placer parto ut ail leurs y par yo) avec une
largeur ay dont le carre est egal a
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 73/150
II - F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 71
Done, en premiere approximation, on retrouve une distr ibution gaussienne avec une
moyenne yo = ^1/^2 et une incertitude ay en parfait accord avec la formule de
propagation des erreurs (55).
Si Ton veut ne pas se limiter a de cette approximation, on peut remarquer que la
fonction g(y] n'est pas tou t a fait symetr ique par rapport a y = yo et aucune gaus-
sienne, meme avec une largeur calculee a partir de la formule de propagation des
erreurs amelioree, ne peut decrire correctement cette distr ibution. Ce fait est illustre
sur la figure 2.6 ou la fonction de distribution (81) est comparee avec une fonction
gaussienne pour laquelle la moyenne y sup et la variance < r ^ u sont calculees a 1'ordre
superieur du developpement en serie de Taylor3
Notons que ces valeurs sont tres p roches de la moyenne / j y et de la variance c r ^ calculees
avec la fonction de distribution (81) :
Neanmoins, la difference entre ces deux fonctions est evidente.
On remarquera que la nouvelle fonction (81)depend de trois variable yo = ^1/^2,
< T I / / - I I et o ~ 2 / H 2 i tandis qu'une gaussienne ne depend que de deux variables. En
principe, des mesures precises de la fonction de distribution g(y) peuvent permettre
d'avoir non seulement des informations sur la variable y mais aussi sur x\ et x < ± (une
des qua t re caracterist iques des dis tr ibut ions initiales / / i , < T I , j j . 2 , & 2 restera toujoursinconnue mais on pourra avoir les rapports entre elle et les autres) .
En conclusion de ce paragraphe, on constate que "Pameliorat ion" de la formule de
propagation des erreurs, grace a 1'augmen tation du nombre de termes dans le develop-
pement en serie de Taylor, ne represente aucune dimcul te . Mais cela n'a pas beaucoupd'interet puisque 1'interpretation du resultat obtenu en termes de probabilites resteassez limite.
2.3 NlVEAU DE CONFIANCE ET
INTERVALLE DE CONFIANCE
Nous avons deja etudie des distributions tres differentes : sym etriques et asymetriques ;
definies sur un intervalle fini, demi-infini et infini ; determinees par un ou plusieursparametres. Si nous conservons la meme approche, la description des donnees experi-mentales dev ient assez lourde (po ur chaque grandeur phy sique on est oblige d' ind iqu er
la loi de probabilite et ses parametres). Sans doute , une telle approche est indispen-
sable pour rester precis dans la description des donnees (sans approximer les distri-
butions de toutes le s grandeurs par une loi gaussienne). Cependant, il est possible de
3 Nous laissons au lecteur le soin de retrouver ces expressions.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 74/150
72 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
proposer une autre fo rme de description des donnees experimentales qui permet , au
moins en premiere approximation, d'unif ier les resul ta ts de distributions differentes.
La not ion unificatrice sera, bien evidemment , celle de probabili ty.
On pent commencer par le cas le plus simple, celui d'une distribution de Gauss. Dans
le paragrap he 1.2, nous avons vu qu'une grande ur decr i te par cet te lo i de probabil i ty
est ent ierement definie par deux valeurs [ i et a et que le resul tat , ecrit sous la fo rme
// ± cr, a u ne interpretation rigoureuse en termes de probabilites. Autrement dit, si
1'on connait // et a on peut donner la probabili te Pr pour que x prenne une valeur
dans 1'intervalle de x\ = n — r < r a # 2 — H +rcr
(quelle que soit la valeur de r] :
A u lieu de caracteriser la variable x par \ i , et cr, on peut la decrire par 1'intervalle
[#1,2:2] et par la probabilite Pr de t rouver x dans cet intervalle. Cette probabilite
s'appelle le niveau de confiance et 1'intervalle correspo ndant rintervalle de confiance.
Plus la probabilite est elevee, plus grand est 1'intervalle correspondant (pour que 1'on
soit certain de t rouver x dans cet intervalle) . B i e n sur , pour presenter un resul tat , on
peu t choisir une valeur quelconqu e de r (et la valeur de Pr cor respondante ) , mais le s
intervalles les plus frequemment utilises sont ceux qui correspondent a un (r = 1) ou
deux (r = 2) ecar t- types . Autrement dit, on choisit le s niveaux de confiance de 68 %
ou 95 %.
Pour une distribution de Gauss, le s relations entre le s niveaux de confiance et les
intervalles de confiance correspondants d 'une par t , et les valeurs de f j , et cr d 'aut re
part, sont simples. Pour f j , et a donnes et Pr choisie, on calcule fac ilem ent 1'intervalle
[ a ? i , # 2] (voir paragraph e 2.1). Et inversement , si 1'on connait [ # i , x? ] et la probabil i te
Pr, on peut re trouver // et a. Si, par exemple , Pr = 95 % , alors r = 2 et on peut
calculer // = \(x\ + # 2) et < r = \(x-2 — x\).
Dans leTableau 2.1 la probabilitePr pour que x soit incluse dans 1'intervalle symetrique
[#i=// — rcr, X ? = n + ra] est donnee pour 7 valeurs de r.
Tableau 2.1 : Probabilite Pr (en %) pour que la valeur d'une variable gaussienne x soit dans
1'intervalle [ p , — ra, p, + ra\ pour diverses valeurs de r
A 1'inverse, connaissant Pr, on peut toujours determ iner r et ainsi t rou ve r 1' intervallede confiance. Par exemple, a une probabilite Pr = 95,0% correspond r = 1,960, a
Pr = 99,00%correspond r - 2, 576 et a Pr = 99, 9%correspond r = 3, 290.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 75/150
II — F O N C T I O N S D ' U N E V A R I A B L E A L E A T O I R E 73
Les avantages d 'une telle presentat ion sont , d 'une pa r t , qu'elle est suffisamment infor-
mat ive (elle nous donne le domaine de variation de la valeur de x et la probabili te de 1'y
t rouver ) e t, d 'aut re part , qu 'el le est aisement generalisable aux autres distr ibutions.
Quelle que soit la distribution /(a?), on peut decrire le resultat observe par le niveau
de confiance Pr et 1'intervalle de confiance [xi , xz]
II est vrai que pour une distr ibution non gaussienne, la determination de la moyenne
et de la variance a partir de Pr et [x i ,X2 ] peut etre plus complexe que pour unedistr ibution gaussienne ; mais si Ton dispose d 'une information exhaustive (forme de
la dis t r ibut ion et autres parametres necessaires comme, par exemple, le nombre de
mesures effectuees) ce probleme peut etre resolu.
Des exemples d'ut i l isa t ion des niveaux et des intervalles de confiance seront presentes
lors de la discussion d 'uti l is atio n de la distr ibu tion de Student (pou r un nom bre l imite
de mesures) ou encore de la dis t r ibut ion %2
(pour 1 'ajustement des parametres) .
Notons qu 'un tel language perm et de presenter d 'une fagon tres in format ive un autre
type de resultats exper imentaux : les resul ta ts negatifs, c'est-a-dire le fait qu 'un
p h e n ome n e at tendu n 'est pas observe. Toute la physique des particules en est une
bonne i l lustration : pendant t res longtemps on cherche une particule, on ne la t rouve
pas, mais on con t inue jusqu 'au jou r ou 1'on obtient un resultat posit if . On a chercheainsi la par t icule vehiculant 1'interaction for te, proposee par Yu kawa , ou du positon
(antipart icule de 1'electron) dont 1'existence avait etc predite par Dirac . Aujourd 'hu i
recherche le boson de Higgs (selon le s modeles actuels , c'est une particule qui serait
responsab le de 1'existence de la masse de tou tes les autres particules) : les recherches
de cette part icule out debute il y a plus de quarante ans mais n 'ont toujours pas
about i .
Quand un resultat negatif est ob tenu , on peut quantifier cet echec : on peut dire ,
par exemple, que, dans le domaine de variation des parametres ou la recherche a ete
menee , la probabili te de t rouve r une par t icule est inferieure a une cer taine v aleur.D'habitude, une particule se manifeste par un signal x dans un detec teur. Quand
aucun signal n'est enregistre, on peut considerer que ce signal est infer ieur a une
certaine valeur xi , e t ce , avec une certaine probabili tee Pr(x < x i ) .
C'est pour ce type de resultats qu' i l est utile d ' in t rodu i re des niveaux de confiance
dont 1'intervalle est l imi te d 'un seul cote. On a alors affaire a un intervalle unilateral
(contrai rement a un intervalle bilateral in t rodu i t au dep ar t) . La probabili te que x
soit plus petit que x\ est alors egale a
Avec une dis t r ibut ion de Gauss, on peut fac ilement t rouv er la valeur de xi (ou de r)
telle que la probabili te d 'obtenir x < x\ = // + rcr, soit egale a Pr :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 76/150
7 4 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Evideminent , pour une m e m e probabi l i te Pr, les intervalles unila teraux et bila teraux
ne sont pas les memes . Par contre, s i Ton salt calculer les intervalles unilatera ux, par
soustraction , on ob tient facilement les intervalles bilate raux, et vice versa.
Quelques exemples numer iques sont donnes dans le Tableau 2.2.
Tableau 2.2 : Probabilites Pr (en %) pour que la valeur d'une variable gaussienne x soit
inferieure a /j , + rcr
r
Pr
0,0
50,00
0,5
6 9 , 1 5
1,0
8 4 , 1 3
1,5
93,32
2,0
97,72
2,5
99,38
3,0
99,87
3,5
99,98
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 77/150
C H A P I T R E 3
E X P E R I E N C E S A V E C U N N O M B R E L I M I T E
D E M E S U R E S
Ce chapitre presente 1'interet d'explici ter la procedure a adopter dans telle ou telle
s i tuat ion exper imentale . II comprend p lus ieurs paragraphes consacres a des ques-
t ions precises qui apparaissent lors du t r a i t emen t des resul tats exper imentaux. Nous
essayons de montrer les differents "niveaux" d'un te l t r a i t em en t , qu i von t d 'une con-sideration tres simple pouvant prendre quelques minutes j usqu ' a une analyse assez
sophistiquee a laquelle il faut consacrer beaucoup plus de temps . Le choix d 'une
analyse depend de la qual i te du resul ta t que nous desirous obtenir , de 1'effort et du
t emps que nous sommes prets a y consacrer . II faut souligner qu 'en phys ique comm e
dans la vie la m ethode de t rai tement des resul ta ts est choisie pour minimiser le rap-
port qualite/prix. D e plus, ayant obtenu un resul ta t , nous devons nous assurer qu' i l
est "raisonnable" et que notre analyse est bien autocoh erente. N ous i l lustrerons cesetapes du travail et repondrons aux diverses que stions precedentes.
3.1 ECHANTILLON, VALEUR MOYENNE
ET ECART-TYPE
En general , lors d 'une experience, il est difficile de connai tre la dis t r ibut ion de la
valeur physique mesuree x et ainsi de determiner la valeur moyenne de la distr ibution
/ j , et sa variance < r2
. La seule inform at ion dont nous d isposons est un ensemble de
resultats, c 'est-a-dire un n ombr e fini de mesures {xi} ~ xi,X2,%3, • . . ,xn. A par t i r
de ces mesures nous t eu tons de constru ire des valeurs qui t iendront l ieu de moyenne
f j , et de variance < r2
.
La solution de ce probleme est construite en deux etapes. D 'abo rd, par analogic avec
le s definitions "theoriques", nous introduisons la moyenne et la variance experimen-
tales. Ensui te , nous devrons les interpreter en te rmes de probabi l i te . A pr ior i , il est
evident qu 'avec un nombre fini de resultats {x^, la moyenne et la variance experimen-
tales ne sont plus suffisantes pour decrire la d is t r ibu t ion de la grandeur phys ique x.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 78/150
7 6 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Nous aurons done besoin de distr ibutions plus compliquees que celles de Gauss et
nous les presentons dans ce chapi tre .
3.1.1 D E F I N I T I O N S ET P R O P R I E T E S
Une experience de physique donne un nombre fini de mesures. Get ensemble de
resul tats {xi} s'appelle un echantillon. Comment a par t i r de ces resul tats obtenir desinform ations sur la valeur moyenne // et sur la variance cr
2? La reponse intuit ive est
presque evidente, surtout compte tenu du theoreme central l imite .
La valeur qui remplace la moyenne / j , peut etre construite s implement comme la
moyenne ar i thmet ique de tous le s resul ta ts {x^} :
N ous appellerons cette valeur la moyenne estimee a partir d'un echantil lon ou plus
s implement la moyenne experimental pour la dist inguer de la vraie moyenne // que
nous appellerons aussi la moyenne theor ique .
Cet te moyenne exper imentale peut etre consideree comme une grandeur phys ique .
Elle est la somme de n grandeurs independantes car nous supposons que les mesures
{%i} sont independantes . Pour n grandeurs independantes , la fonct ion de dis t r ibut ionse factorise en un produi t de fonct ions de distr ibution (voir (18)). (Arm d'al leger le s
demons t ra t ions nous n'ecr ivons pas les integrates multiples pour exprimer les valeurs
moyennes qui sont symbolisees par une barre) . Ains i , la valeur moyenne de m estegale a
(a comparer avec (19)) et la variance c r
2
^ a
(voir la demonstration de la formule (17) et comparer avec (20)) .
Soulignons le resultat deja etabli lors de la demons t ra t ion du theoreme central l imite :
1'ecart-type de la valeur moyenne exper imentale crm decroit comme l/^/n. De plus,
en ver tu de ce theoreme, nous po uvons d ire que la dis t r ibut ion de m devient de plus
en plus proche de la distr ibution normale quand le nombre de mesures n augmente(pour 1'instant nous n 'avons fait aucune hypothese supplementaire sur la forme de la
dis t r ibut ion de x ) .
Le deuxieme probleme est celui de la variance. Par analogic avec la valeur mo yenne
on definit la variance experimentale comme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 79/150
Il l - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E D E M E S U R E S 77
L'apparit ion de n — 1 a la place de n dans le denominateur peut paraitre un peu
surprenante. Mais on peut la just i f ier mem e qual i ta t ivem ent : une seule mesure est
suffisante pour avoir une information concernant la moyenne mais on a besoin d'au
moins deux mesures pour pouvoir apprecier 1'ecart par rapport a la valeur moyenne.En fait, le veritable argument pour ce choix est la condition d'egalite de la valeur
moyenne de la variance exper imentale s2
et de la variance a2.
D'apres notre definition (85) , la valeur moyenne de la variance experimentale s2
estegale a :
Ecrivons le terme sous la somme en utilisant le fait que les valeurs moyennes de Xi etde ra sont identiques et egales a p :
Le premier terme dans cette expression donne, par definition, cr2, le t roisieme c r
2/n ,
en ver tu de (84). Pour calculer le deuxieme terme explicitons la difference
Alors,
car dans cette somme il n'existe qu'une seule contribution differente de zero pour
k = i. Finalement, nous obtenons la valeur moyenne de la variance :
Ainsi nous avons construit une grandeur s2
qui , dans la l imite d'un grand nombre demesures, nous donne la vraie variance < r
2de la grandeur physique x. Mais nous avons
deja decide de travailler avec la moyenne m. No us avons done a definir la variance s^de cette grandeur (ou Fecart quadratique moyen] a par t i r des resultats exper imentaux
{xi}. Cette definition est evidente :
Lorsque n tend vers 1'infini, cette valeur tend vers zero comme < r2/n conformement
a (84).
II faut maintenant changer le s conventions decrites au paragraphe 1.2. Desormais
un resultat experimental sera caracterise par la valeur moyenne m (82) et par 1'ecart
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 80/150
7 8 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
quadrat ique moyen s^ (88). Soulignons que cet ecart est une caracteristique de m
et represente ainsi 1'incertitude sur cette derniere valeur et non pas sur x. Si Ton
veu t determiner la variance de x il faut utiliser la definition (86) . B ien evidemment ,
les deux valeurs m et sm ne sont plus suffisantes pour presenter toute 1' informationexper imentale (les deu x definitions contiennent explici tement un troisieme parametre ,le nombre de mesures n). Plus tard nous completerons cette description et nous en
donnerons une interpreta t ion exacte a 1'aide des probabi l i tes , com m e cela a deja ete
fait pour la dis t r ibut ion de Gauss.
Par an a lo g i c a vec le s formules (86) e t (83) , on peut defmir la c ova r i a nc e , le coefficient
de correlation e t l es moments d'ordre su p e r i e u r pour un echantillon. Ainsi, pa r exemple,
la cova r iance de deux var iab les x e t y e s t donnee pa r
ou mx,my et mxy sont lesva l eu r s moyennes de x, de y et du produit xy se lon la defmtion
(83). L e coefficient de correlation e s t a lo rs ega l a
ou sx e t S y r e p r e se n t e n t le s rac ines car rees de s va r i a nc es exp r e i men t a l e s de x et de y
de fm ies da ns ( 86 ) .
Nous aurons egalement besoin des moments c en t r a ux m^ pour k >3, qui peuvent e t re
de fm is par
3.1.2 PRECISION DE LA V A R I A N C E E X P E R I M E N T A L EE T C H I F F R E S S I G N I F I C A T I F S
II faut aller plus loin dans 1'analyse des nouvelles definitions. Pour la valeur m oyenne
m , 1 ' incert i tude experim entale est donnee par la racine carree de sa variance , autrem ent
dit par sm. Mais cette valeur sm etant une valeur determinee a par t i r des donnees
experimentales, possede sa propre incert i t ude . N ous devons savoir 1'estimer. Mal-
heureusement , on ne peu t pas obtenir un resultat general pour toute d is t r ibut ion ;
c'est pourquoi on fait 1'hypothese supplementai re que la grandeur x est distribute
selon la lo i normale.
Le probleme devient facile a resoudre bien que sa demons t ra t ion soit assez longue.La mesure de 1'incertitude est la racine carree de 1'ecart quadrat ique moyen. Si 1'on
veut calculer 1'erreur de s " L on doit calculer la variance correspondante :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 81/150
Ill - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E D E M E S U R E S 79
Pour ca lcu le r s^ ecr ivons d 'abord s^ sous la form e
Prenons le ca r re de cette express ion et ca lcu lons la va leur moyenne s^ a un fac teur
multiplicatif n2(n — I)
2pres. Nous obtenons trois t e rmes. L e premier , e s t donne pa r
ou nous avons introduit, e n accord avec (12), le s momen t s cent raux
p o u r k =2 et k — 4.
Le deux ieme terme es t nu l :
c a r , e n ver tu de la cond i t ion k I dans la deuxieme s o m m e , il con t i en t s e u l e m e n t le s
puissances impa i res de (xi — /u) dont la va leur moyenne es t nul le (voir la r ema rque apres
Ainsi s^ e s t donnee par
peut etre mis sous la forme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 82/150
8 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
I ' e q ua t i on (26)). F i n a l e m e n t , p o u r le t r o i s i em e t e rme , nous a vons
du fait que les puissances impai res de ( a ? , - — /u) donnent zero ; ainsi, dans ce produi t , les
te rmes non nuls cor respondent ai = k,j = louj = k, i = 1 . Le resultat f inal pour s^
est :
Du fait que , d'apres (88),
la variance D(s^) est donnee par
Dans cet te expression, on peut utiliser le fait que, pour une distr ibut ion normale, / /2 = v " 2
et /i4 = 3cr4
(voir (27)) :
L' incer t i tude relative (34) sur la valeur de la var iance exper imentale est egale a
Une fois de plus nous re t rouvons une dependance de la fo r me \j\fn ; au t r emen t di t .il est assez difficile d'avoir une tres bonne precision sur les incertitudes dans une
experience : on a besoin de plusieurs dizaines de mesures pour s 'approcher de la
precision de 1'ordre de 10%. N ou s rev ien dro ns sur la fo rm ule (93) dans un paragrap he
special consacre a la precision des incer t i tudes .
La precision d 'une experience A a ? est determinee a part ir des donnees experimentales
et possede aussi sa propre incer t i tude . Sa connaissance est tres impor tante dans
1'analyse des resultats car elle est liee direc tement a leurs in terpreta t ions en te rmes
de probabilites. Une erreur d'un facteur 2 dans Ax peut modifier completement le s
conclusions.
Dans certaines si tuations, on peu t connai tre de maniere assez exacte la precision sur
1' incert i tude Aa?. S'il s'agit d'une incert i tude purement s tat is t ique nous avons montre
que 1'incertitude relative sur la variance exper imentale est d 'apres (93)
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 83/150
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 81
Ax est proport ionnel a la racine carree de s^
egale aet ainsi son incertitude relative est
Soulignons que cette fonction decroit tres lentement avec le nombre de mesures n. Sa
courbe est presentee sur la figure 3.1. Pour 5 — 6 mesures, 6& x est a peu pres egale a
1/3 et il faut effectuer une cinquantaine de mesures pour avoir une ince rti tude relative
de 1'ordre de 10%.
Figure 3.1 : L'erreur relative sur 1'incertitude S^^ en fonction du nombre de mesures n
En travaux pratiques, nous obtenons difficilement une precision sur 1'incertitude
superieure a 10%. Nous pouvons le regretter mais il faut s'en contenter en gagnantdu temps de calcul comme nous 1'avons fait au paragraphe precedent.
La precision de 1'incertitude et le nombre de chiffres significatifs qu' i l faut garder dansun resultat final sont directement lies (il vaut mieux conserver un peu plus de chiffres
lors de calculs intermediaries pour eviter les erreurs d'arrondisse m ent). Si la precision
de 1'incertitude est de 1'ordre de 10—30%, il faut retenir un ou deux chiffres significatifsdans 1'incertitude. Le nom bre de chiffres dans la valeur x doit etre coherent avec le
nombre de chiffres dans 1'incertitude.
Par exemple, nous avons obtenu un resultat # e x p = 1, 37685 •10~3avec une incer t i tude
Ax = 4,87611 • 10~5. Dans le resultat final de Ax, il faut retenir un chiffre Ax =
5 • 10~5
si 6 & x est proche de 30% ou deux chiffres Ax = 4, 9 • 10~5
si S & , x est pluto t
proche de 10%. Selon ces deux cas, nous garderons trois ou quatre chiffres pour
exprimer la valeur de xm, soit xm = 1, 38 • 10~3
ou xm = 1, 377 • 10~3
respectivement.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 84/150
8 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Le resultat final s'ecrit
3.1.3 DISTRIBUTION x2
Pour etidier les caracteristiques de la variance experim entale (85), t rouvons l a fonc t ion
de distr ibution d 'une variable aleatoire y liee aux variables aleatoires a ? i , # 2 , . . . ,xn
par la fonct ion
Supposons que les variables x i , x % , . . . ,xn sont distributes selon une loi norm ale , avec
une moyenne nulle et une variance unite. Pour une seule variable y(x) — x2
le resultat
general a deja ete expr ime par (76). Pour la dis t r ibut ion de Gauss cette formule s'ecrit
comrne
Aut rement d i t , g(y] represente une distribution g a m m a avec a — — 1 / 2 , / ? = 2 e t a une
fonction genera t r i ce
Pour la s o m m e de s n var iab les independan tes (95) nous pouvons ut i l iser la propr ie te (21)
et ecrire la fonction generatrice de Xn '•
Cette expression signifie que Xnaun
e dis t r ibut ion gamm a avec a — n/2 — 1 e t j 3 = 2 :
Ainsi nous avons t rouve ce que Ton appelle la dis t r ibut ion de probabil i te x2
•
Sa valeur moyenne est
et sa variance
Quelques exemples de la dis t r ibut ion %2
sont donnes sur la figure 3.2.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 85/150
Ill — E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 83
Figure 3 .2 : L a dis tr ibut ion Xn P°ur n — 4,8,16
Dans la limite d'un grand nombre de mesures n — > oo, la distr ibutio n x2
t end , comme
il se doit , vers celle de Gauss. Nous ne demontrons pas ici ce resul tat . Notons
simplement que le changement formel de variable y /2 — > • /j et n/2 — I — ) • n nous
donne la densite de probabili te pour la dis tr ibut ion de Poisson (36) qui tend vers la
dis tr ibut ion de Gauss lorsque n — > • oo.
Notons que la ressemblance formelle entre ces deux distr ibutions , deja mentione e lors
de la discussion de la distribution gamma, conduit a des relations utiles. Par exemple ,
les intervalles de confiance (voir paragraphe 2.3) pour la dis tr ibut ion de Poisson etpour la distribution x2 son
t lies entre eux :
Pour demontre r cette re la t ion, on fait le changement de variable z = x/2 et on integre
n fois par parties :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 86/150
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Nous sommes passes d'une distribution a n variables a une nouvelle distribution d'une
seule variable. Une question assez naturelle peut etre posee : oil et quand les autres
variables ont-elles disparu ? Pour mieux voir et comprendre la technique de ce "tour
de passe-passe", prenons un exemple bien connu de la physique statistique : un gaz
de particules sans interaction qui se trouve a 1'equilibre thermodynamique a la tem-
perature T. Chaque composante Vi (i —x, y , z] de la vitesse des particules du gaz a
une distribution maxwellienne :
ou m est la masse des particules, k la constante de Bolzmann.
Quelle est la loi de distribution de 1'energie des particules ? L'energie est liee a lavitesse par une relation du type (95) :
La probability de trouver les composantes de la vitesse dans les intervalles compris
entre vx et vx + dvx, vy et vy + dvy, vz et vz + dvz est egale a
Nous ne sommes interesses que par 1'energie des particules et ainsi les directions de
la vitesse n'ont aucune importance. Nous pouvons ecrire 1'element de volume dans
1'espace de vitesses dvxdvydvz sous la forme v dvdQv, ou v est le module de la vitesse
et d£ lv 1'angle solide dans cet espace. Calculons 1'integrate sur £lv, c'est-a-dire la
somme sur toutes les directions possibles. Apres une telle sommation, dvxdvydvz se
transforme en 47rv2dv. Le dernier pas concerne le passage de la vitesse a 1'energie :
v = ^/2E/m et dv = dE/VZmE.
On en deduit la distribution de probabilite en energie. La probabilite de trouver la
particule avec une energie dans 1'intervalle compris entre E et E + dE est egale a :
C'est une distribution gamma avec a = 1/2 et (3 = kT. En posant e = 2E/kT et
g(e}de = g(E)dE, on a
soit une distribution %2
avec n = 3.
L e parametre n dans la distribution de Xnes
^ le
nombre de degres de liberte. Dans
cet exemple, \2a
trois degres de liberte. Le passage des vitesses a 1'energie fait
"disparaitre" deux degres de liberte (deux variables) lors de 1'integration sur Tangle
solide.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 87/150
Ill - E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 85
Considerons une autre grandeur directenient liee a la variance exper imentale (86) :
qui peut etre mise sous la forme
Nous verrons que cette grandeur est egalement dis tr ibute selon %
2
mais avec n — 1degres de liberte ! II est possible de prevoir ce resu ltat et m e m e de le comprendre qual-
i tat ivement. Certains arguments quali tat ifs ont e te developpes au paragraphe 2.1.1,
lors de la discussion du fac teur n — I dans la definit ion de la variance experimentale.
II faut aussi noter que les n grandeurs z; = Xi — m sont liees par la relation
et qu 'ainsi dans la form ule (100) nous avons n — 1 et non pas n variables indepe ndante s.
Le pr inc ipe d 'une dem onst ra t ion p lus r igoureuse est le su ivan t . Nous vou lons passer de
n va r i ab l es i ndependan tes x±,x?,. . . ,xn =x a n va r iab l es i ndependan tes yi, y^,. . . ,yn
= y a I ' a ide d 'une t rans fo rmat ion yi =yz'(^i, x-2, • • • , xn) =Hi(%}- Pour ce l a , on ut i l i sera
la formule ( 7 7 ) introduite a la fin du pa rag raphe 2 . 2 . 2 .
E f fec tuons une t rans fo rmat ion l i neai re or thogona le
avec
Une rotation dans I ' espace euc l id ien a n d imens i ons es t un exemple d 'une te l le t ransfor -
ma t i on . Le Jacob i en e s t a lors ega l a 1 e t , en ve r t u de ( 7 7 ) , la fonction de distribution e s t
i nchangee . La form ule (101) nous gara nt i t que la forme de la distribution res te gaussi -
enne :
La condition (101) peut encore s 'expr imer a I 'a ide des coef f ic ients c?j sous la forme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 88/150
86 A N A L Y S E STATISTIQUE DB S D O N N E E S E X P E R I M E N T A L E S
Dans l e cas part icul ier ou
la condition (102) prend la forme
Pour notre fonction w (100), cho is i ssons
et les a u t r e s yi avec i >2 de facon a r b i t r a i r e . IMeanmo ins , le s fonctions yi posseden t le s
proprietes su i v an t e s ( rap p e lo n s q ue tous le s Xj ont les memes // e t cr ) :
et
qui ont ete etablies e n utilisant I ' i ndependance de s X i et la r e la t ion (102). Ainsi le s
va r i a b l e s t/ » sont distributes se lon une loi g au ss i e n n e av e c u n e m o y e n n e nul le et une
v a r i an c e a2.
Les expressions (101) et (103) nous perm et t en t de reecrire w sous la f o rme
A u t r emen t d i t, la grandeur w est distribute selon la loi %2
avec n — l degres de l iber te .
Ains i nous pouvons ut i l i ser les resul ta ts etablis sur la dis t r ibut ion x2
(98—99) et en
dedui re immediatement que
resultats que nous avons deja ob tenus difTeremment (voir (87) et (93)) .
Notons sans demons t ra t ion que, dans un cas general , le nombre de degres de l iber te
v d'une dis t r ibut ion xl pou r la somme de carres du type (104) est egale a
ou / est le nombre de relat ions l ineaires entre |x z-} .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 89/150
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 87
3.2 D I S T R I B U T I O N DE S T U D E N T
Pour pouvoir in terpreter les resul tats exper imentaux en termes de de m (82) et de sm
(88), on a besoin de la fonction de distribution de la variable
ou m et sm sont definies par (82) et (88).
La so lu t ion du prob leme e s t re la t ivement s imple s i nous expr imons cette fonction sous la
forme
La var iab le y\ a une distribution normale (car tous le s x± ont la m e m e distribution norma le )
avec la moyenne nul le (83) et la va r iance unite (84). La var iab le y^ e s t distribute se lon
Xn-i comme nous venons de le demon t re r (104). Ainsi nous connaissons le s distributions
de yi et de y? e t nous voulons t rouve r la distribution du rapport t — yi/^/y^ e n ut i l i sant
le s regies connues de t r a n s f o r ma t i o n des d is t r ibu t ions .
La densite de probabi l i te de y\ e t y? est egale a :
avec 7 /1 qui var ie de —oo j u squ 'a +00 e t y% qui va r ie de 0 jus qu 'a +00. Transformons
d 'abord cette dens i te e n fa i san t l e changement de va r iab les
soit pa r t rans fo rmat ion inverse
Le module du Jacobien de cette t rans fo rmat ion e s t ega l a ^fz^ e t, conformement a (77 ) ,
la nouvel le densi te de probabilite h(z\}zi) e s t
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 90/150
88 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Pour obtenir la densite de probabi l i te f(t] nous in tegrons h(zi,Z2) par rappor t a z - 2 e t
uti l isons la re la t ion f(i) — f(zi}\dz\/dt\ :
Le changement de variable
ramene ce t te integrale a une fonction F.
Figure 3.3 : La distribution de Student pour n = 2 (distribution de Lorentz),
n = 5, et n = oo (distribution de Gauss)
Finalemen t la dis t r ibut ion f(t] s'ecrit
ou t a n — I degres de l iber te . Les variables initiates y\ et y^ (soit Xn-i}en on
^ 1
et n — 1 respec t ivement . L' integrat ion sur z - i a elimine une variable (un degre de
l iberte) : l + (n — 1) — I = n — 1. La constante C dans 1'expression (107) est egale a
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 91/150
Ill - EXPERIENCES A V E C UN N O M B R E LIMITE D E M E S U R E S
Pour n donne, le s fonctions F dans la formule ci-dessus peuvent etre explicitees a
1 'aidede (43) et (44) .
Cette fonction (107) est relat ivement simple. Pour n = 2, on re trouve la distributionde Lorentz. Pour n > 2, la distribution t de Student represente, grosso modo, unecertaine puissance de cette distr ibution. V u la discussion du paragraphe 1.3.3, nous
pouvons tout de suite dire que, pour n donne , seuls les moments p^ avec k < n — 1
peuvent etre definis.
On p eu t aussi calculer facileme nt la valeur m oye nne et la variance de cette distrib utio n
lorsque cette derniere existe :
Dans la limite n — > • oo, la distribution de Student se transforme en distributiongaussienne. La demonstra t ion est simple et peut etre realisee par le lec teur interesse.
Plusieurs exemples de la distribution de Student sont presentes sur la figure 3.3.
La figure 3.4 est une version elargie de la figure 1.12 ; elle montre le s relations quiexistent entre le s differentes distributions. Notons que nous avons regroupe la dis-
tr ibut io n F (45) e t celle de Poisson (36) par suite de la ressemblance fo rme lle deleurs dependances fonctionnelles. Neanmoins, il ne fau t pas oublier que les roles desvariables et des paramet res sont inverses dans ces distributions.
Figure 3 .4 : Les relations entre le s differentes dis tributions
89
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 92/150
9 0 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
3.2.1 PETIT N O M B R E DE M E S U R E S
Com me ngons par un exemple concret : nous m esurons n fois la longueur / d 'une plaque
metall ique et ainsi obtenons des resultats {/ i , l^ , • • • , ln}- Solent n = 6, / i = 4372 mm,/2 = 4364 m m , /3 = 4342 m m , 14 = 4338 m m , 1 5 = 4354 m m e t /6 = 4330 m m . Quelle
est la longueur de la plaque ?
Ier
niveau d'analyse
L'object if est d'avoir une idee sur 1'ordre de grandeur des paramet res du probleme.
II est logique de supposer que la vraie valeur de la longueur se trouve entre la valeur
minimale et la valeur maximale mesurees et que 1'ecart entre ces deux valeurs donne
une estimation de 1' incert i tude. No us prenons c o m m e estimation :
Dans notre cas, lmax =4372 m m e t lmin — 4330 mm , ou
Le resul ta t est s imple et rapide. Peut-on lui donner credit ? Pourquoi pas ? Quels
sont les justificatifs m athem a t iques d'un tel resultat ? Nous ne les avons pas. Nous
avons obtenu une idee de la valeur mesuree et 1'interpretation de la derniere formule
ne peut aller au-dela de ce que nous avons fait : la valeur cherchee est la moyenneentre le s valeurs maximale et minimale mesurees et 1' incert i tude est la moit ie de 1'ecart
correspondant. II est difficile d ' in terpreter cette analyse en termes de probabilites.
IP niveau d'analyse
So n but est d'ob ten ir la valeu r de la long ue ur et de 1'incertitude sur cette v aleur et,en outre, de pouvoir les interpreter en termes de probabil i tes comme nous 1'avons fait
au debut de ce livre (voir le paragraphe 1.2).
Supposons de plus que la distribution de la longueur / est celle de Gauss. Avec cettehypoth ese supplementaire , nous pouvons utiliser la distr ibution de Student etudiee au
debut du paragraphe 3.2. Nous avons vu que si une grandeur physique est dis t r ibu te
selon une lo i normale , alors la valeur
est decrite par la dis t r ibut ion de Student /n_i(t) (107). Dans cette expression, // estla vraie valeur de la grandeur mesuree (dans notre cas, la longueur /), m la moyenne
estimee a par t i r des resultats exper im entaux (82)
et s^ la variance exper imentale de cette moyenne (88)
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 93/150
Ill — EXPERIENCES A V E C UN NOMBRE LIMITE DE MESURES 91
Soulignons une fois de plus que m et sm sont entierement definis par les resultats
expe rim entau x. La form e de la distr ib ution de Stud ent est relativem ent proche de celle
de Gauss (elle est la meme dans la limite n — > • oo) et ainsi nous aliens vi te comprendre
par analogic avec la distribution de Gauss comment nous pouvons 1'utiliser.
En termes de probabili tes, la phrase "t a la dis tr ibut ion de Student" signifie que la
probabi l i te de t rouver la vraie valeur /j de / dans 1'intervalle compris entre m — smt^p
et m + smivp est egale a :
(comme tou jours , c'est 1'aire de la surface sous la courb e de la fonction de distr ibution ;
voir la figure 3.5). Dans la notat ion tvp nous avons introduit les deux paramet resdont depend ce coefficient : v = n — I qui est le nombre de degres de liberte de
notre probleme et la probabili te P desiree. C ette prob ability est le niveau de confi-
ance et 1'intervalle corresp ondan t, FintervaUe de confiance qui ont ete definis dans le
paragraphe 2.3.
Nous connaissons la fonction fv(t) pour un nom bre de mesures donne, c 'es t pourquo inous pouvons etablir une bijection entre la valeur de t^-p qui nous definit 1'intervalle
et la probabili te P (109). Nous pouvons calculer la probabili te qui nous interesse et
determiner numeriquement la valeur correspondante du coefficient tvp qui s'appelle le
coefficient de Student. Ces resultats numeriques sont representes dans le tableau 3.1.Us donnent la valeur de t^ p a prendre pour qu e, pour n = v-}-\ mesures , la probabil i te
de trouver la vraie valeur dans 1'intervalle compris entre m — smtvp et m-\rsmtv-p soitegale a P.
Figure 3.5 : La distribution de Student pour n =6
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 94/150
92 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Tableau 3.1 : Les coefficients de Student tv-p correspondant a un nombre v de degres de l iberteet a une probabili te T
pV
12
3
4
5
6
7
89
10
11
12
1314
15
16
1718
19
20
30
oo
0,2
0,325
0,289
0,277
0 , 2 7 1
0,267
0,265
0,263
0,2620,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,2570,257
0,257
0,257
0,256
0,253
0,4
0,727
0 , 6 1 7
0,584
0,569
0,559
0,553
0,549
0,5460,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,5340,534
0,533
0,5330,530
0,524
0,5
1 , 0 0 0
0 , 8 1 6
0,765
0 , 7 4 1
0,727
0 , 7 1 8
0 , 7 1 1
0,7060,703
0,700
0,697
0,695
0,694
0,692
0 , 6 9 1
0,690
0,6890,688
0,688
0,6870,683
0,674
0,6
1 , 3 7 6
1,061
0,978
0 , 9 4 1
0,920
0,906
0,896
0,8890,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,8630,862
0 , 8 6 1
0,8600,854
0,842
0,7
1 , 9 6 3
1 , 3 8 6
1 , 2 5 0
1,190
1,156
1,134
1,119
1,1081,100
1 , 0 9 3
1,088
1,083
1,079
1 , 0 7 6
1 , 0 7 4
1,071
1 , 0 6 91 , 0 6 7
1 , 0 6 6
1 , 0 6 4
1 , 0 5 5
1 , 0 3 6
0,8
3,078
1,886
1,638
1,533
1 , 4 7 6
1 , 4 4 0
1,415
1 , 3 9 71,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,3331 , 3 3 0
1,328
1,3251,311
1,282
0,9
6 , 3 1 4
2,920
2,353
2 , 1 3 2
2 , 0 1 5
1 , 9 4 3
1 , 8 9 5
1 , 8 6 01,836
1,812
1 , 7 9 6
1 , 7 8 2
1,771
1 , 7 6 1
1,753
1 , 7 4 6
1 , 7 4 01 , 7 3 4
1 , 7 2 9
1,7251 , 6 9 9
1,645
0 , 9 5
12,706
4,303
3 , 1 8 2
2,776
2 , 5 7 1
2,447
2,365
2,3062,262
2,228
2 , 2 0 1
2 , 1 7 9
2 , 1 6 0
2 , 1 4 5
2 , 1 3 2
2 , 1 2 0
2 , 1 1 02 , 1 0 1
2,093
2,086
2,045
1 , 9 6 0
0 , 9 9
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,3553,250
3 , 1 6 9
3,106
3,055
3,012
2,977
2,947
2 , 9 2 1
2,8982,878
2 , 8 6 1
2,845
2,756
2,576
En prat ique cela signifie que la valeur de 1' incert i tude depend du n om bre de mesures et
de la probabilite avec laquelle nous voulons connaitre la vraie valeur dans 1'intervalleindique :
Dans les condit ions l imites d 'un grand nombre de mesures, les coefficients de Student
tv-p coincident avec les valeurs donnees par la distribution de Gauss (voir la derniere
ligne du tableau 3.1). Par exemple , pour une probabi l i te (un niveau de confiance) de
9 5 % , le coefficient t i / = 0 o ; 7 > = o , 9 5 = 1, 96. Quand le nombre de mesures n 'est pas eleve,
parexemple n —
3,pour
la memeprobabilite il faut prendre Al beaucoup plus grand
£t/=2;7>=0,95 =4, 3.
Desormais, pour un n ombr e fini n de mesures, notre resultat s 'exprimera sous la forme
dont 1'interpretation est un peu plus compliquee que dans le cas de la dis t r ibut ion
de Gauss : nous sommes obliges de donner le nombre de mesures effectuees et la
probabil i te choisie pour pouvoir uti l iser un coefficient de Student .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 95/150
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 93
et
Pour presenter le resultat final (111), choisissons, par exemple, im e probabili ty de
9 5 % , alors le coefficient de Student ^_5.-p=095 = 2 ,57 et A / = 17 mm . Ainsi la
valeur moyenne de la longueur est :
avec un niveau de confiance de 95% pour les 6 mesures effectuees.
Soulignons un point t res impor tan t deja mentionne au debut du paragraphe 2.3.
L' incer t i tude A / dans cette expression est 1'incertitude sur la moyenne ra et non passur la longueur / elle-meme ! Dans le cas d'un grand nombre de mesures, la variance
de la valeur moyenne s^ tend vers zero et non pas vers la veritable variance cr2.
Si nous voulons avoir une estimation de la veritable variance il nous faut utiliser ladefinition (85)
Dans notre exemple, s — A/6 -6 ,6 mm — 16 mm . C'est la raison pour laquelle nous
avons ecrit "la valeur moyenne de la longueur" et non pas "la longueur" tout court.
Nous voyons que le deuxieme niveau d'analyse est plus rigoureux et plus riche d' infor-
mation que le premier , mais il est aussi notablement plus lourd dans son t ra i tement
et surtout dans son in terpreta t ion.
Dans le resultat final, nous avons garde deux chiffres significatifs mais on aurait pun'en garder qu'un seul. Montrons comment evaluer 1'incerti tude de 1' incerti tude.
L 'est imation "theorique" obtenue dans (94) ne depend que du nombre de mesures n,
et conduit pour 1' incerti tude relative a
Rappelons que pour obtenir cette estimation, chaque mesure Xi est supposee avoir
une distribution de Gauss.
II est possible d'obtenir une estimation experim ental e de cette valeur a par t i r des
donnees obtenues. Pour cela, on utilise les formules (94) et (93)
Dans l'exemple de la longueur de la plaque,
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 96/150
9 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
et les valeurs exp erim ent ales de 0(8^) et s^. Pour D(s^), on util ise la formule
generale (92)dans laquelle les moments "theoriques" et ^4 sont remplaces par
leurs valeurs experimentales m^ et 7714 in t rodui tes dans (91).
Dans notre exemple,
Finalement , pour <J^ , on obt ient
en parfait accord I 'estimation "theorique".
Ill6
niveau d'analyse
En fait, nous pouvons aller plus loin dans notre analyse des donnees experimentales.
Pour utiliser la dis t r ibut ion de Student, nous avons fait 1 'hypothese supplemental
que la longueur / est dis tr ibute selon la lo i norm ale. Est-ce vrai ? Nos mesures
correspo ndent-elles a une telle hypothese ? II n'est pas tres facile de trouver la reponse
a ces questions, surtout po ur un nom bre si faible de mesures. N eanm oins nous pouv ons
essayer.
Si la dis t r ibut ion de la longueur est vraiment gaussienne, on doit s 'at tendre a avoir ape u pres deux tiers de resul tats dans 1'intervalle compris entre f i — c r et { J , + < r et un peu
moins de la moitie dans 1'intervalle compris entre // — cr/2 et // -f 0"/2 (ceci est facile
a verifier en util isant la derniere ligne du tableau 3.1). Nous ne connaissons ni n ni
< T mais nous pouvons le s estimer a partir de m et s. Dans notre exemple, m — 4350
mm , s = 16 mm . Ainsi nous pouvons at tendre 2 — 3 mesures dans 1'intervalle compris
entre 4342 mm et 4358 mm et 4 dans 1'intervalle compris entre 4334 mm et 4366 mm.
L'experience nous donne 2 et 4 respectivement. Ceci n'est pas mal , surtout s i 1'on se
souvient que s a aussi son incer t i tude et qu'el le n 'est pas negligeable (sonincer t i tude
est egale a 5 mm ; estim ation que 1'onobtient a part ir de la formule (92)).Une analyse supplementaire n'est pas du tou t superflue. Supposons que dans nos
6 mesures nous ayons t rouve le s resul ta ts : 4334, 4335, 4365, 4337, 4363 et 4366
mm . On peut verifier aisement que, pour ce t te deuxieme serie de mesures, on ob-
tient exactement le s m em es valeurs de m et de sm. Mais dans ces condi t ions , on ne
t rouve aucune me sure dans 1 ' intervalle com pris entre 4342 m m et 4358 mm et 6 dans
1'intervalle compris entre 4334 mm et 4366 mm (au lieu de 2 — 3 et 4) ! Qu'est-ce que
cela signifie ?
On peut remarquer que,dans la deuxieme serie, les resultats semblent se regrouper
autou r de deux valeurs et non au tou r d 'une seule. II existe deux explications possi-bles. Soit c 'est un veri table phe nom ene l ie probab lement a une erreur sys temat ique
(par exemple la plaque est legerement courbee et, pour deux cotes, on mesure deux
valeurs differentes). Soit ces resul tats sont lies a la faible statis t ique (6 mesures, ce
n'est pas beaucoup). En tout cas, la conclusion est la m e m e : nos resultats ne sont
apparemment pas cohe rents avec le traitement choisi et, avant de presenter le resultat
final, il faut elucider ce probleme . La moindre des choses est de remesurer la l ongueur
de la plaque pour augmenter sensiblement (!) la statis t ique.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 97/150
Ill — E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 95
On aurait pu voir qu'il y a probablement un probleme dans le s donnees experimen-
tales en comparan t les est imations "theorique" et experimental de 6< \x. La valeur
"theorique"
est tres differente de celle obtenue a partir des donnees experimentales :
Cette difference peut servir d'indication sur 1'existence d'un probleme dans le s don-
nees. Compte tenu de fait que pour obtenir 1'estimation "theorique" nous n'avons
utilise que 1'hypothese de normal i t e de la distr ibution, c 'est cette hypothese qui doit
etre verifiee en premier lieu.
En fait, il existe une procedure relativement simple (criteres de Pearson) qui permet de
voir si la distribution a l aque l l e on a a f fa i r e est une gauss ienne . Cette procedure e s t
basee sur la verification des relations precises qui existent entre les moments centraux
differents d 'une distribution gauss ienne (voir (27)). Dans ce l i v r e , nous ne p resen tons pas
ces c r i t e r es ca r , dans le s exper iences s imples , ils ne sont pas souvent u t i l i ses .
Nous avons compris que la methode d'analyse des donnees exper imentales depend
de la r igueu r et de la precision du resu ltat que nous voulons ob tenir . N otons que
le premier n iveau, bien qu ' i l ne possede pas de bases m athem a t iques profondes et
qu'il ne soit fonde que sur notre "bon sens", donne presque toujours des resul ta ts
acceptables. La plupar t du temps, il donne tout a fait correc tement la valeur de la
grandeur phys ique (a a pres).
Par centre, 1' incert i tude estimee dans cette m ethode peut etre assez differente de
1' incert i tude exacte par un facteur deux-trois ou m e m e plus (dans notre exemple,
nous avons obtenu une estimation de 21 mm au lieu de s = 16 mm ; nous verronsd'autres exemples ou ce t te difference est encore plus grande). Le premier n iveau
d'analyse des donnees est uti le, sur tout s i Ton tient compte de la facilite avec laquelle
le s resul ta ts sont obtenus.
On peut dire que le deuxieme niveau est un niveau fondamenta l . II donne le s resul ta ts
avec une interpre tat ion precise, y compris po ur 1'analyse posterieure plus sophist iquee.
Cette e tape est indispensable lors d'une experience effectuee en travaux pratiques.
Le t roisieme nive au est presque o bligatoire si nous effectuons une veritable experiencede physique en laboratoire . II touche des aspects un peu differents de la statistique :
il essaie d'analyser la validite des hypotheses qui forment notre theor ie . Dans notre
exemple, nous avons tente de verifier 1'hypothese sur la forme de la distribution pour
la longueur. Jusqu' ic i nous n 'avons pas considere ce type de problem es en statis t ique.
Ces problemes sont importants surtout pour une experience reelle de physique, mais
ils necessitent des resul ta ts statis t iques beaucoup plus fournis que ceux que nous
pouvons obtenir lors de travaux pratiques classiques.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 98/150
9 6 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
3.3 DEUX RESULTATS E X P E R I M E N T A U X
Un au t re probleme apparait lorsque Ton veut comparer des resultats exper imentaux.
Avant de discuter le cas de deux grandeurs decri tes par la distr ibution de Student ,
commenc.ons par celui de deux grandeurs decri tes par une distr ibution gaussienne.
A partir de deux resultats, x\ ± A#i et £2iA # 2 , il faut introduire leur difference
X = x\ — xi qui a egalement une distribution gaussienne avec une moyenne nulle et
une variance AX2
= Ax± + Ax%. Si la valeur de X est compatible avec 0, compte
tenu de son incer t i tude , alors les deux resultats sont com patibles.
Par exemple , on veut savoir si la temperature dans une piece varie dans le temps.
On a effectue deux mesures a une heure d ' intervalle et on a obtenu deux valeurs
TI = 25, 2 ± 0, 2 °C et T2 = 24, 5 ± 0, 2 °C. La difference T = T I - T2 = 0, 7 °C doitetre comparee avec 0. On voit que cette valeur depasse la? (avec U T = 0, 3 °C) et1'on peut raisonnablement conclure que la t em pe ra tu r e a effectivement varie.
Etudions maintenant un exemple de deux grandeurs decrites par la distribution de
Student .
Supposons qu'un collegue ait mesure la longueur de la meme plaque metallique et
qu'il ait obtenu la valeur
avec la mem e probabi l i te P = 95% mais pour n = 10 mesures. Rappelons que notre
resul tat , pour n = 6 mesures, est
Ces deux valeurs sont legerement differentes et nous voulons savoir si elles sont com-
patibles. Si oui, pouvons-nous le s regrouper d'une certaine fagon pour augmenter la
statistique et ainsi ameliorer la precision ?
3.3.1 COMPARAISON DE DEUX RESULTATS EXPERIMENTAUX
Comme au paragraphe 3.2.1, nous m ontrero ns deux niv eaux de solutions possibles.
Ier niveau d'analyse
II est tres simp le. On voit que les deu x resultats se reco uv rent com pte tenu des
incertitudes presentees et notre conclusion est immediate : les deux valeurs sont com-
patibles. Enco re une fois, dans cette approche, nous ne pouvons pas dire exactementquelle est la probabilite d'avoir cette difference entre les resultats.
IIe niveau d'analyse
Formulons d 'abord cette question d 'une fagon plus generale et plus precise. Soient
deux series de nx et de ny mesures {xi, # 2, • • • , xHx} et {y i , y?,... , yny}. Dans chaque
cas, nous pouvons calculer les moyennes mx et my (82) et les variances s% lx et s^
( 8 8 ) experimentales.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 99/150
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 97
Nous desirons savoir quelle est la probabili te po ur que la valeur absolue de la difference
\mx — my | soit superieure ou inferieure a une valeur donnee . Le probleme est a nouveau
1'absence d' info rm ation sur les veritables valeurs de f i et de < r2
. II peut e tre contourne
en util isant le fait que la variable
ou
a une dis tr ibut ion de Student avec v = nx + ny — 2 degres de l iberte .
L a demonstration de cette propriete suit exactement la demonstration utilisee pour obtenir
la distribution de Student (voir paragraphic 3 . 2 ) . C ' e s t pourquoi ne seront notees que l es
petites modifications a apporter.
et
L e n u m e r a t e u r Y\ est la somme de deux g randeu rs distributes se lon la loi n o rm a l e e t
sa distribution es t done n o r m a l e . L a m oyenne de cette distribution es t nu l l e ca r el le e s t
proportionnelle a la d i f fe rence des moyennes rn^ — rn^ — p, — p — 0 . La va r i ance de YI
e s t I'unite car la v a r i an c e de mx e s t <r2fnx, la v a r i an c e de my e s t <T 2 /n y et la v a r i a n c e
de la d i f fe rence mx —my est done ega le a cr2/nx + cr
2/«y (voir eq.(17)).
L e d e n o m i n a t e u r Y? r ep r es en t e , a un facteur I/a2
pres, la somme de d e u x v a r i ab l e s
i n d e p e n d an te s
qui ont lesdistributions Xnx-iavec nx —1 degres de liberte et %
2_1 avec ny —I degres
de liberte r e s p e c t i v e m e n t (voir (104)). Leu rs fonctions gene ra t r i c es des moments sont
Reecr ivons t sous la forme t
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 100/15
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
(voir (96)). Ains i la fonction genera t r i ce de la s o m m e
est ega le a
ou nous avons ut i l ise la propr ie te (21). A u t r e m e n t dit, cet te s o m m e a la distribution
Xnx+n -2avecv
— nx+
ny — 2 degres de l iber te (nous avons nx + ny mesures avec deux
re la t ions l inea i res qu i fixent mx
e t my
; voir la r e m a r q u e (105)). Ensui te nous re t rouvons
la demons t ra t i on du pa rag raphe 3 . 2 .
Nous sommes maintenant en mesure de repondre a notre question puisque nous avons
etabli une relation univoque (109) entre la valeur de t et la probabili ty T.
Dans notre exemple, mx = 4355 mm, my = 4350 mm, nx = 10, ny = 6. Pour
connai tre s2
nous devons calculer les sommes (112). Dans notre experience
II faut calculer la somme correspondante a Texperience faite par notre collegue. A
partir de sa valeur de Ara^. = 13 mm et des relations
nous avons
Done,
et la valeur de t correspondante a s2
est egale a
Dans le tableau 3.1, nous voyons que la probabil i te qui correspond au coefficient de
Student t c ± 0, 55 pour v = 14 degres de liberte est P ~ 0, 4.
9 8
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 101/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 99
Ceci signifie que la probabil i te de t rouver la difference \mx — my\ inferieure a 5 mm
etai t de 40% . II etai t mem e plus probable (60% ) de trouv er cette difference superieure
a 5 mm. Ainsi le "disaccord" de nos deux experiences est tout a fait acceptable et nous
pouvons confirmer notre conclusion intuit i ve par une consideration plus r igoureuse.
Notons que le cr i tere quali tat if applique dans la premiere approche (recouvrement
des barres d 'erreurs) est rapide mais parfois assez dangereux. Quand nous uti l isons
de telles notions nous nous referons a la dis t r ibut ion de Gauss et nous examinons
la probabi l i te pour que mx se t rouve dans 1'intervalle [m y — A r a y , r ay + A m y ] , ou
inversement la probabili te p ou r que my se trouve dans 1'intervalle [m x — A ra x , mx +
A ra^ ] . Pour la dis t r ibut ion de Gauss , la probabil i te d 'apparit ion d 'un evenement en
dehors de 1'intervalle [ f j i — c r , ^+ c r ] est relativement grande, a peu pres 1/3. M eme pou r
une difference \mx — my — 15 mm notre conclusion basee sur ce critere reste la m e m e
car cette difference est compatible avec les incert i tudes des deux series de mesures
(A = ^(Amx + A ra y ) = 15 m m ) . Le trai tement correct nous donne un coefficient
de Student t ~ 1, 65 auquel correspond une probabil i te de presque 90%. Cela signifie
que la probabil i te de trouver une difference de 15 mm ou plus est tres faible, de
1'ordre de 10%. La m ethode quali tat ive basee sur la distr ibution de Gauss donne une
probabil i te trois fois plus for te que celle attendue avec notre methode correcte basee
sur la dis t r ibut ion de Student !
La contradiction apparen te s 'explique par le fait que no tre est imation de a (pour
laquelle nous avons choisi la demi-somme de Amx et de A m y ) etai t grossiere. Nousverrons que 1'incertitude dans 1'experience qui accumule les resul ta ts de deux experi-
ences est pluto t de 10 mm . La valeur de \mx — my\ = 15 mm correspondrait ainsi a
1, 5 « r . Pour la dis t r ibut ion de Gauss, la probabil i te de t rouve r un evenement en dehors
de 1'intervalle \ j i — I , 5 < r , / /+ 1, 5 c r ] est aussi de 1'ordre de 10%. Ainsi nous retrouvons
la coherence entre les deux approches.
La conclusion est la suivante : on peut utiliser le cri tere de recouvrement des incert i-
tudes a condit ion de les recalculer en util isant la me th od e decrite ci-dessous.
Nous avons mont re comment il e s t possible de c o m p a r e r le s moyennes de deux exper iences .
II existe une methode ana logue pour comparer le s var iances exper imenta les , des ignee par
le cr i tere J7
de Fisher , qui donne la probabi l i te pour que le r appo r t s^/sy soit di f ferent
de 1. Pour ce la , il faut in t roduire une distribution spec ia le de ce rappor t que T on peut
obtenir a par t i r de s distributions connues de s^ e t S y et en ut i l i san t des regies genera l es
fo rmu lees au paragraphic 2 . 2 . 2 . D ans ce l ivre, nous ne presentons pas ce c r i t e re car
cette distribution e s t re la t i vement complexe et son utilite prat ique b ien moindre que la
distribution de Student : s i deux echant i l l ons sont v ra iment incompat ib les , ce la appara f t
su r t ou t sur les moyennes e t dans une moindre mesure sur les va r iances .
3.3.2 "ADDITION" DE D E U X R E S U L T A T S EXPERIMENTAUX
Nous sommes assez convaincus que les deux resultats ne sont pas contradictoires et
desirons savoir comment les "reunir" pour avoir une m eil leure statis t ique et plus de
precision sur la grandeur mesuree.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 102/15
1 0 0 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Nous obtenons assez facilement la formula expr imant la moyenne pour les deux series
de mesures
si nous connaissons les moyennes pour les deux experiences separement
remplagons le s sommes dans (113) par mxnx et myny :
II est utile de reecrire ce t te form ule autrem ent . Rappelons le s relations entre le s
variances experimentales s2
de la grandeur et celles de ses valeurs moyennes slm
(voir eqs. (88) et (110))
et obtenir 1'expression
ou est in t rodu i te 1' incert i tude Am x+y com m e
ou wx et wy peuven t etre in terpretes comme les poids relatifs de deux experiences.
Cette formule a une signification t res simple : moins 1'experience est precise (grande
valeur de A m ^ ) , moins impor tan te est sa contr ibut ion (faible valeur de l / ( A m j )2)
dans le calcul de la moyenne (115).
Quand le nombre de mesures dans chaque experience est relativement grand,Alors nous pouvons rmplacer dans (114)
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 103/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 101
Dans notre exemple de deux experiences, nous obtenons
mx+y = 4353 mm, Am r+y = 10 mm.
II est logique, com pte tenu du fait que les mesures du collegue etaient plus precises,
que mx+y soit plus proche de sa valeur mx.
Les formules (115) et (116) peuvent etre generalisees faci lement pour un nombre
arbitraire n d'experiences :
II est vrai que cet te fagon de calculer la moyenne su r plusieurs experiences n'est pas
tou jours m athem a t iquem en t irreprochable mais elle donne la possibilite d'avancer et
de reunir le s connaissances obtenues dans des experiences parfois tres differentes.
S'il a e te possible de verifier auparavant que ces series de mesures sont compatibles
(compat ib i l i ty des moyennes et des variances), 1'erreur in t rodui te par cet te procedure
est t res faible. Meme 1'hypothese d'egalite des coefficients de Student pour un grand
nombre de mesures n'est pas mauvaise. Dans le tableau 3.1, on voit que le coefficient
de Student varie peu avec v . Par exemple pour " P = 0 ,95 , t change seulement de
10% quand v passe de 10 a 30. De plus, cet te variat ion est une correct ion dans1' incert i tude, au t remen t dit , c 'est une correct ion de deuxieme ordre .
C'est la raison pour laquelle cette approche est tres util isee en physique quand on veu t
profiter de resul ta ts d'experiences differentes (parfois assez couteuses) pour obtenir la
valeur "universelle" de telle ou telle constante physique fondamentale .
3.4 AUTRES S O U R C E S D ' E R R E U R S
L' incer t i tude naturel le d 'une gran deur ph ysique n 'es t pas la seule possible. U ne aut resource importante d'incert i tude est 1 'appareil de mesure. Par 1'appareil , nous sous-
entendons non seulement 1'appareillage util ise pour faire une experience mais, plus
generalement, la m ethode de mesure choisie.
Nous voulons savoir quel le est Pinfluence de 1'appareil sur la valeur physique ou, en
d 'aut res termes, comment il modifie la fonction de distribution ini t iale. Nous verrons
qu ' i l y a d 'abord une modif icat ion "triviale" de cet te dis t r ibut ion : celle-ci s 'elargi t , ce
qui signifie que les erreurs d 'apparei l s 'a joutent aux erreurs naturel les de la grandeurphysique .
Cependant , une autre modif icat ion de la fonct ion de dis t r ibut ion est aussi possible.
L'apparei l peut decaler la valeur mo yenne, done 1'appareil mesure une valeur systema-
t iquement plus grande (o u plus pet i te) que la valeur "reelle". Ces erreurs s 'appellent le s
erreurs systematiques. Elles ne sont pas forcement de na t u re aleatoire et ne pour ron t
pas etre t rai tees d irec tement a 1'aide des techniques qui ont ete presentees j usqu ' i c i .
L'analyse de ce type d'erreurs, qui est plus complexe, fai t Pobjet de ce paragraphe.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 104/15
1 0 2 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
3.4.1 I N C E R T I T U D E S D ' A P P A R E I L
Pour etudier 1'influence d 'un appareil sur la valeur mesuree, choisissons d 'abord un
appareil t res simple — un pese-personne mecanique . Son pr inc ipe de fonc t ionnementest elementaire : le poids d'un objet dont nous voulons connaitre la masse m estcompense par la con traction d'u n ressort. Ce dern ier est lie a une aig uille qui ind iq ue
sur un cadran la vale ur de la m asse. Si le coefficient de raideur est egal a k, le
deplacement du ressort et celui de 1'aiguille est
ou g est 1'acceleration du champ de pesanteur. Supposons que 1'incertitude sur la
valeur de g soit negligeable devant les autres ince rt i tudes. A insi , 1 ' incert i tude sur Axs'ecrit conformement a (58)
/ A x \2
_ / A m \2
(Ak\2
(— ) - (-^-J + (-T) •
La particulari ty de cette formule vient du fait que 1'incertitude de mesure com-
prend deux contr ibut ions , 1'une issue de 1'incertitude naturelle Am et 1'autre issue
de 1'appareil de mesure Ak.
Une expression analogue peut etre obtenue dans un cas plus general . La probabi l i tede trouver une valeur physique x, caracterisee par sa fonct ion de d is t r ibut ion f ( x ) ,
dans 1'intervalle [ x , x + dx] est egale a f ( x ) d x . Cependan t , la probabi l i te pour que
1'appareil donne cette valeur dans un autre intervalle [x',x' + dx'} n'est pas nulle .
Designons cette probabil i te par S(x, x'}dx'.
Pour determiner la probabil i te (F(x')dx'] de detection par 1'appareil de la valeur
phys ique dans 1'intervalle [x', x' + dx'], on doit multipl ier la probabil i te (f(x}dx] p ou r
que cette valeur se trouve dans [x, x + dx], par la probabi l i te (S(x, x')dx') pour que
1'appareil donn e la valeur dans [x', x' + dx'] et calculer la som m e (o u 1'integrate) pour
toutes les valeurs x possibles :
On peut dire qu 'au l ieu de la vraie fonct ion de dis t r ibut ion f ( x ) , 1'appareil nous do nneune fonct ion de dis t r ibut ion modifiee F ( x ) .
La fonct ion S ( x , x ' ) s'appelle la fonction de resolution (la te rminologie v ient de
1'optique). Quelle est la f o r me de cette fonction ? L a reponse a cette question est
difficile. La plupart du temps, la fonction de resolution S(x,x') ne depend que du
module de la difference x — x' :
soit
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 105/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E LIMITE D E M E S U R E S 103
Cet te proprie te signifie que 1'appareil n ' introduit pas d'erreur systematique, c'est-a-
dire qu'il ne modifie pas la valeur moyenne de la distribution.
La va leur moyenne p,p pour la distribution F(x) es t
A I 'a ide de (120) e t en in t roduisant la va r i ab l e t = x — x ' nous obtenons
Nous avons tenu compte de la norma l i sa t ion de f(x] et de S(t) :
et du fait que S(\t\) est une fonction pa i re . I I n 'y a pas d ' e r r eu r sys t ema t i que :
Dans le s memes condi t ions, nous pouvons montrer f a c i l e m e n t que I 'appare i l ne peut
qu ' e l a rg i r la distribution i n i t ia le . L a va r iance de la d is t r ibut ion F(x] e s t
D ' o u
Comme pour les fonctions de distr ibution, on peut affirmer que si les conditions du
theoreme central l imite sont satisfaites (c'est-a-dire s'il y a plusieurs facteurs inde-
pendants qui agissent sur la fonction de resolution et si 1'influence de chacun de cesfacteurs est peti te) , cette fonction a la forme de Gauss :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 106/15
1 0 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
avec une variance <r|. Cette fonction ne depend que de \x — x'\ et la moyenne de
F(x) coincide avec la moyenne de f ( x ) . E n resume, dans les condit ions du t heoreme
central l imite, il n'y a pas d 'e r reur sys temat ique e t 1'appareil ne change pas la valeur
moyenne .
Nous ne considererons que le cas ou la fonction de resolution S(x — x'} et la fonction
de dis t r ibut ion f(x) sont decrites par des fonct ions de Gauss. Soient <r| la variance de
S(x-x'), n e t d1, la moyenne et la variance de f ( x ) . On peut alors calculer I 'integrale
(119) et obteni r la fonct ion de dis t r ibut ion F ( x ) , donnee par 1'appareil , qui a aussiune forme gaussienne :
pour re t rouver I ' in tegra le bien connue (25) .
La deux ieme e s t plus e legante : il faut passer par la t rans fo rmat ion de Fourier de cet te
in tegra le et ut i l i ser deux propr ie tes de la t r ans fo rma t ion de Four ier ( la t ransformee de
Four ie r d ' u n e gauss ienne est une gauss ienne et la t rans fo rmee de Four ie r d 'une convo lu-
tion de deux f onc t ions est le produit de leurs t rans fo rmees) . Nous la issons ce t exerc ice
aux lecteurs familiers de la transformation de Fourier.
Ce calcul pe rm e t de verifier que la variance ff p de la fonct ion F(x) est egale a la
somme des variances 0-| et c r j :
Dans une experience reel le deux si tuat ions extremes peuvent etre rencontrees. Celle
ou la variance de 1'appareil est negligeable devant la largeur naturel le (<j| < C < r ? ) et
1'appareil ne change rien ; celle ou la variance d'apparei l est plus importante que lavariance initiale (<r| ^> < r ? ) et on peut alors prendre 1'incertitude de 1'appareil comme
1'incertitude de 1'experience.
En general , la de terminat ion de la fonct ion de resolution n'est pas aisee. Pour le s
appareils simples utilises en t ravaux prat iques, la connaissance precise de la fonct ion
S(x, x') n'est pas indispensable . On peu t se l imi ter a la cal ibrat ion de 1'appareil avec
une fonct ion f(x] bien defrnie. Dans 1'exemple d'un pese-personne, on doit peser des
poids connus (les etalons) et reperer le s indicat ions correspondantes. Ainsi on obt ient
II ex is te deux facons de ca l cu l e r I ' i n tegra le
La premie re e s t d i rec te : on fait le c h a n g e m e n t de var iab le
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 107/15
Ill — E X P E R I E N C E S A V E C UN N O M B R E L I M I T E DE M E S U R E S 105
une echelle de 1'appareil utilisable pour la mesure de poids inconnus. Les fonctions
obtenues de cette maniere se presentent souvent sous la forme d 'une courbe ou d 'une
table d 'e talonnage .
Pour un appareil digital, 1'incertitude de mesure est indiquee dans la description.
Pour un appareil a aiguille, la precision est caracterisee par la classe de 1'appareil qui
est toujours marquee sur son cadran au-dessus du symbole de position de 1'appareil.
L' incer t i tude de 1'appareil est egale au produit de sa classe par la pleine echelle utilisee
p ou r la mesure , divise par 100 :
classe • pleine echellei ncer t i tude — .
100
Pour d iminuer 1' incert i tude de mesure , il faut done toujours travailler avec les echelles
les plus sensibles possibles (les echelles qui donnent la dev iation maximale acceptab le) .
Dans la plupar t des cas, on t ravail le avec des appareils de classe 0,5 ; 1,0 ; 1,5 ou 2,5.
Pour les experiences plus sophist iquees, cette procedure simple n'est plus suffisante.
L'exper imentateur doi t faire une e tude approfondie du nouvel appareil pour avoir le
maximum d ' in format ions sur la fonct ion de resolution S ( x ' , x ) : verifier si elle ne
depend que de \x — x' ou, s inon, etablir la f o r me de cette fonction, etc .
3.4.2 ERREURS S Y S T E M A T I Q U E S
On peut ment ionner trois sources d 'erreurs systematiques : la m e t h o d e de mesure
choisie, le mauvais fonct ionnement de 1'appareillage et les e r reu r s d ' expe r imen ta teu r .
Nous allons etudier toutes ces sources d 'erreurs et de voir ce qu ' i l faut faire dans ces
cas.
Erreurs liees a la methode de mesure
Un exemple simple d 'erreur systematique provenant de la m ethode de mesure est
donne par la determination d 'une resistance inconnue Rx. On peut la mesurer a 1'aide
d 'un vol tm etre ayant une resistance Ry et d 'un amperemetre ayant une resistance R A-Supposons que ces valeurs soient inconnues ; o n sait seulement que Ry est grande par
rappor t a Rx et que R A est pet i te par rappor t a Rx. On branche 1 'amperemetre enserie avec la resis tance inconnue. Le branchement du voltmetre peut etre effectue de
deux fagons : (I) on peut mesurer la tension aux bornes de la resistance Rx (figure 3.6)
ou (II) on peut mesurer la tension aux bornes de la resistance et de 1 'amperemetre
(figure 3.7).
Si on determine la valeur experimentale RGXp de la resistance inconnue Rx comm e le
rapport de la tension amchee sur le vo ltme tre et du courant traversant 1'amperem etre,
p ou r ces deux branchements , on obtient le s relations suivantes entre R eXp et Rx :
Si les appareils ch oisis sont de bo nne qual i te , pour un assez grand domaine de valeurs
de la resistance Rx, telles que Ry ^> Rx RA, on a R exp —Rexp —RX- Neanmoins ,
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 108/15
106 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 3.6 : Premier schema possible pour mesurer la valeur d'une resistance
la premiere m ethode donne toujours des valeurs sys temat iquement plus peti tes que lavraie valeur de Rx, tandis que la deuxieme donne des valeurs sys temat iquement plus
grandes. Dans les deux cas, on a une er reur sys temat ique p lus ou moins impor tan te
en fonction des relations entre Ry, R Ae^ RX •
( I I )
Figure 3.7 : Deuxiem e schema possible pour mesurer la valeur d'une resistance
On p e u t done dire que la premiere methode est preferable pour mesurer des peti tes
resistances tandis que la deuxieme est plus adaptee aux grandes resistances. Cepen-
dant les deux m ethodes donnen t une er reur systematique qu 'on ne peut el iminer qu 'en
connaissant le s valeurs de Ry et R A-
Proposons une troisieme fagon de mesurer la resistance. Pour cela, nous avons besoin
d 'une resistance variable dont nous pouvons etablir la valeur Rv, de deux resistances
identiques R et d'un appareil de mesure (d'un ampereme t re ou d'un vol tme t re , au
choix). Le schema de branc he m ent est presen te sur la figure 3.8.
Si Rx est egale a Rv, alors le courant Ia qui passe par 1'amperemetre (ou le vol tme t re )
est nul. On peut le voir a partir de 1'expression de Ia :
I etant le courant aux bornes du circui t ,
ou Ra est la resistance de 1'appareil (R ^ ou RV)-
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 109/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 107
Figure 3.8 : Troisieme schema possible pour mesurer la valeur d'une resistance
L'expression (121) peut etre obtenue de la facon suivante. Nous introduisons le s courants
Iv, 1 % , h, 1 - 2 ( f igure 3.8)e t ecr ivons le sys teme de 5 equa t ions
Nous expr imons /„, Ix et /2 en fonction de /, Ia et I\
e t obtenons deux eq ua t ions
En eliminant I\, \ \ e s t possib le d 'ec r i re
Cette relation nous donne la formule (121).
Nous devons faire varier la resistance Rv j usqu ' a annuler le courant Ia.
Quels sont le s avantages d 'une telle meth ode par rapport aux methodes precedentes ?Premierement , il n'y a pas d 'erreu rs systemat iques liees a la methode . Si nos appareilssont precis nous obtiendrons exactement la valeur
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 110/15
1 0 8 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Deuxiemement , nos mesures sont extremement s imples : nous voulons annuler le
courant et nous ne devons faire aucun calcul. Troisiemement, il est relat ivementfacile de verifier si le zero est bien etab li . Supposons que la valeur du courant est
non nulle Ia — I Q = t 0, mais te l lement pe t i te que not re ampereme t re n 'a r r ive pas a ledetecter . Pour s 'affranchir du probleme, il suffit d 'augmente r le courant exter ieur /
d 'un fac teur n, afm que le courant Ia augmente aussi d 'un facteur n (voir (121)) et
qu'il redevienne detectable. Ainsi nous pouvons corriger la valeur de Rv pour retablir
le zero.
Les inconvenients possibles de cette methode sont la difficulte de t rouver une resistance
variable de bonne quali te et la duree d 'une telle experience.
Dans 1'example precedent apparaissent deux conceptions differentes d 'une experience.
Dans la premiere approche, nous devons d 'abord calibrer les appareils de mesure(vo l tmet re e t amperemetre) a 1'aide d'e ta lons et e nsuite les uti l iser pour me surer des
valeurs physiques inconnues. Dans la deuxieme approc he, nous com parons directe-
me n t la valeur inconnue a 1'etalon. La deuxieme approche est generalement plus
precise mais elle est aussi plus couteuse. Ces deux conceptions de mesure sont uti-
lisees partout dans la vie courante. Le choix depend de la precision recherchee et des
moyens disponibles. Par exemple nous pouvons mesurer une masse, soit a 1'aide d'un
pese-personne qui uti l ise un ressort prealablement cal ibre, soit a 1'aide d'u ne balance
qui equil ibre la masse inconnue par des poids connus.
Erreurs liees au fonctionnement d'appareils
Le deuxieme type d 'erreurs systematiques est lie au mauvais fon ctionn em ent de 1'appa-
reillage ou au ch angem ent des con dit ions de deroulem ent de 1 'experience. Ces erreurs
peuvent etre diverses et elles dependent de 1'experience concrete . L'exemple le plus
simple est le mauvais reglage du zero de 1'appareil. Avant toute mesure il faut s 'assurer
que le zero est regie correctement. Cette verification ne prend pas beaucoup de temps
mais elle permet d'evi ter des er reurs grossieres et elle doit devenir une habi tude pour
1 exper imen ta teu r .
L' instabi l i te des condit ions de deroulement de 1'experience donne lieu a une derive
systematique des m esures. Par exemp le la positio n du zero d'un w a t t m e t r e pen t
varier lors d 'une experience. Un autre exemple d 'une tel le erreur est la mesure de
la vitesse d'une boule metall ique dans un l iquide visqueux. Si cette experience dure
longtemps, la t e mp e r a tu r e du liquide peut varier avec la var iat ion de la t e mp e r a tu r e
ambiante et ce changement modifie la viscosite du liquide.
Erreurs d'experimentateur
F ina lement le s erreurs de 1 'experimentateur cons t i tuent le t rois ieme type d 'e r reurssystematiques. Par exemple certaines personnes evitent tel ou te l chiffre lors des
estimations de fractions de divisions d'echel le d'un appareil . Ou encore, quand on
modifie les parametres d 'une experience, le sys teme a besoin d 'un ce r tain tem ps pour
se me t t r e en equil ibre et les indicat ions des appareils peuvent etre instables pendan t
quelques secondes. II ne faut pas se precipi ter pour faire le s mesures. Lors des mesures
d'un intervalle de temps, une erreur systematique peut etre in t rodui te par le fait que
des personnes differentes ont des vitesses de reaction differentes.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 111/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 109
Une erreur presque inevi table in tervient lors de la l ec ture des indicat ions des appareils
a aiguille : il existe toujours une certaine distance entre 1'aiguille et 1'echelle et le
resultat lu depend de 1'angle de vision. De plus, si 1'aiguille se t rouve ent re deux
divisions d'echelle, il y aura une er reur liee au choix de la valeur re tenue .
Toutes ces erreurs sont presque inevitables. II faut savoir les est imer en sachant bien
que ces est imations sont personnelles, subject ives, de la responsabil i te de 1'experimen-
t a t eur .
3.4.3 C O M M E N T E V I T E R LES E R R E U R S S Y S T E M A T I Q U E S ?
Pour evi ter ces erreurs on peut donner quelques recom mandat ions prat iques. Les er-
reurs systematiques proviennent souvent du mauvai s fonc t ionnement de 1'appareillageou de 1 'experimentateur lui-meme. Ce dernier paragraphe contient quelques recom-
mandations generates qui pe rme t t ron t d'eviter une grande part ie de ces erreurs .
Commengons par les quest ions de planification et de realisation d 'une experience sontd 'une impor tance fondamenta l e . Meme dans le cas d 'une manipu la t ion re lat ivement
simple en t r avaux prat iques i l faut leur consacrer quelques minutes. Quels sont les
points auxquels il faut faire at tent ion ?
Les conditions de deroulement de 1'experience
Une man ipulat ion dure plusieurs heures e t dem ande un effort mental assez important .
L 'expe r imen ta teu r peut etre fat igue et il peu t se t r ompe r . C'est pourquoi il faut
commencer par la preparation de la place de t ravai l : on ne laisse que les objets
indispensables (le cahier d 'experience, la calculatrice, un stylo, etc.) , 1'endroit doit
etre bien eclaire, la t em pe ra tu r e ambian te ne doit pas etre trop elevee e t sur tou t
rester stable, il faut evi te r le s courants d'air. La stabili te de la t em pe ra tu r e rend le
t ravail plus confortable et d i mi nue le s erreurs sys temat iques liees aux changement des
conditions de 1'experience. II faut placer 1'appareillage de fagon telle que les appareils
le s plus f r equemment utilises soient facilement accessibles.
Verification des choses evidentes
Parfois, il vau t m ieux verifier des choses qui paraissent evid entes . Les app areils ne
doiv ent pas b ou ger . Si la base de 1'appareil est consideree com m e ho rizontale i l faut ,
au moins , le verifier a 1'oeil nu. En optique, la condit ion importante est 1'alignement
de tous le s apparei ls sur un meme axe. Ainsi nous evi terons beaucoup d'erreurs sys-
t emat iques et le processus exper imental sera accelere. Si nous ut i l isons un ci rcui t
electrique al imente directement par le reseau EDF, nous devons mesurer la tension
car elle peut e t re differente de 220 V . Les appareils al imentes par des piles ont la"mauvaise habi tude" de t om be r en panne d 'a l imentat ion au moment le plus impor-
t an t de 1'experience. Pour eviter ce probleme il faut verifier 1'etat des piles avant1'experience.
Symetrie apparente
Si le montage possede des elements identiques, i l faut les interchanger et repeter la
mesure. Par exemple , sur la figure 3.8, nous avons un schema pour de te rminer une
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 112/15
110 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
resis tance inconnue Rx dans lequel nous utilisons deux resistances supposees iden-
tiques R . II faut s 'en assurer experimentalement en p e r mu tan t ces resistances lorsque
le courant qui passe par 1 'amperemetre est nul . Si, avec les resistances interchang ees,
le courant devient different du zero, il faut soit remplacer le s resistances soit aug-menter 1 ' incert itude de mesure. En travau x pratiques, on uti l ise f requemment des
appareils polyvalents qui peuvent mesurer le courant, la tension ou meme la resis-
tance. Si 1'on utilise deux appareils de ce type dans la meme experience, on peut les
interchanger et verifier la stabili te du resultat .
Quand on mesure la difference de deux temperatures avec deux thermometres dif-
ferents il faut aussi les inte rch ang er. Si le resul ta t n'est pas le meme on doit prendre la
demi-somme des deux mesures com m e valeur experim entale. Si 1'un des t h e rm om e t r e s
(o u les deux) est affecte par une erreur systematique, cette procedure perme t t r a de
s'en affranchir.
Experience preliminaire
Une experience scientifique est toujours precedee d 'une manipulat ion pre l iminaire .
Son but est mul t ip le . L ' expe r imen ta teu r "apprend" la manipu la t ion , s ' en t rame a
effectuer le s operat ions qui seront le s plus frequentes, verifie le fonctionnement des
divers elements. Dans cette m anipu lation, on essaie d 'ob tenir une idee sur 1'intervalle
des valeurs de chaque grande ur phy sique ainsi que sur leurs incert i tud es. Cette mani-
pulation prel iminaire permet de determiner la strategic fu ture pour toute 1'experience.
Mem e en travaux pratiques il faut essayer d'effectuer une experience prel iminai re , bien
que le temps soit t res l imite . II fau t , au moins, prendre connaissance de 1'appareillage
et sur tout de ses composantes qui n 'ont pas ete etudiees auparavant. S i, pendant
1'experience, il faut changer d'echelle et si on ne sait pas effectuer cette operation, on
risque non seuleme nt de perdre du temp s mais aussi de perdre une partie des donnees.
Planification d'une experience
La manipulation prel iminaire fait part ie d 'un probleme plus general de planificat iond'une experience. En travaux pratiques, i l faut cerner exactement les points les plus
delicats et les plus importants du point de vue physique ainsi que 1'enchainement
entre les differentes parties de 1'experience.
Un autr e aspect im po rtant de la planification est 1 'ordre chronologique des mesures
lorsqu'il s'agit de de te rminer une dependance en fonct ion d 'un pa ram e t r e (couran t ,
frequence, tem pe ratu re, e tc .) . Si on cherche, par exemple, la puissance P degagee parune resistance en fonct ion du courant / qui passe dans le circuit et qui varie de 0 a
10 A ( la l imi te de notre amperemetre) , on s 'at tend a une dependance telle que :
La presence de la constante P Q peut etre expliquee par 1'existence de sources de
chaleur , celle de la fonctio n l ineaire par Feffet Peltier et celle de la fonc tion qu adratique
par I'effet Jou le .
Six points (entre 0 et 10 A avec un pas de 2 A) sont largement suffisants pour definir
le s paramet res P Q , a et b. Si nous voulons augmenter la precision sur ces valeurs,
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 113/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 111
nous pouvons prendre un pas plus pet i t , 1 A . Dans notre systeme, il n'y a pas dedependance rapide en fonction du parametre et i l vaut mieux choisir des points de
mesures distribues de maniere uni forme sur tout intervalle de variation du courant.
Cependant , il ne faut pas perdre de temps en fixant les valeurs de / exactement a1 A ou 2 A. Si nous mesurons la puissance pour I — 1, 95 A au lieu de / = 2, 00 A,la precision sur les paramet res sera la m e m e . Pour accelerer la manipulat ion nous
pouvons faire le s mesures en augment an t progressivement le courant avec un pas de
2 A d e O a l O A . L'avantage est que notre systeme t rouvera chaque fois son equil ibre
assez rapidement . De plus, nous nous at tendons a une dependance reguliere P( I ) et
pouvons controler que la puissance varie lentement avec la variation du courant.
Le probleme concernant 1'ordre des mesures apparait quand il existe une source
d 'erreurs systematiques (par exe mp le, si la t em pe ra tu r e de la piece monte progressive-
ment pendant 1'experience, elle modifie le parametre PQ). Avec 1'ordre precedent nousne trouverons jamais cette source d'erreurs : la fonction P( I} sera toujours reguliere
et cont inue. Par centre , si nous choisissons un ordre different des mesures : / = 0,
10 , 2, 8, 4, 6 A, les points exper imentaux "oscilleront" autour d 'une courbe continue
et ces oscillations seront plus grandes que les inc erti tude s des mesures. Un simp le
changement de 1'ordre des mesures peut nous aider a detecter une erreur systema-t ique.
G'est a Texper imentateur de decider quel est 1'aspect de la manipulation le plus im-
por tan t : la rapidite et la simplicite des mesures ou la securite.Si nous etudions une grandeur dont la depend ance en fonction d'une variable est assez
rapide comme, par exemple , la recherche de la frequence propre d'un circuit R LC parune mesure de la tension en fonction de la frequence, la logique doit etre differente.
La tension aux bornes de la resistance peut etre approchee par la formule
L'experience comprend deux etapes. D'abord, nous de te rminons le comportement
general U(v} avec un pas qui peu t etre assez g rand , 15 H z (qu atre po ints noirs sur lafigure 3.9). Le but de cette e tape est de determiner approximativem ent la position de
la resonance : nous voyons que z /o se t rouve entre 30 et 50 Hz. Ensuite, nous devonsrepeter nos mesures au voisinage de V Q avec un pas beauc oup p lus faible, 2 H z (carres
blancs sur la figure 3.9). I I n'y aucun interet a faire des mesures avec ce pet i t pas loin
de i / o si nous ne nous interessons qu 'a la position de la resonance.
Ces exemples elementaires montrent que 1'ordre et le pas des mesures dependent de
differents facteurs et I 'exper imentateur doit chaque fois decider quels sont les criteres
le s plus impor tan ts pour effectuer ces choix.
Enregistrement des resultats
Lorsque nous enregistrons les resultats, le but est de ne pas introd uire d'erreu rs sup-plem entaires. Le remede est tr ivial : nous devons noter immedia tement tous les
resultats pour ne rien oublier. L'ecri ture doit etre sim ple, concise et elle doit contenir
un m in im um d'explications necessaires pour que nous puissions plus tard comprendre
et in terpre ter ces resultats sans aucune ambigui'te. Une ecriture claire et facilement
lisible depend de notre experience personnelle et elle viendra au fil des annees.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 114/15
112 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Figure 3.9 : Determination de la position d'une resonance
La fagon la plus traditionnelle d'enregistrement des resultats est 1'utilisation d 'un
cahier d 'experience. L'avantage principal d 'un te l cahier par rapport aux feuilles se-
parees est qu'i l est plus difficile de le perdre . L'inconvenient est que m e m e les mesures
simples ne s'effectuent j amais dans un ordre parfait et que notre enregistrement peut
etre assez disp arate. II n'est pas toujours commode de coller dans ce cahier des feuilles
de papier mil l imetre avec des courbes ou des l istings d'ord inate ur. Cep endant, le
cahier d 'experience reste le meilleur moyen pour eviter la per te d ' informat ion. II
est utile de numeroter ses pages et de reserver une page au debut pour la table des
matieres.
Inscription des resultats
Tous les resul tats doivent etre notes immedia tement , dans leur forme brute et sansla moindre modification. Par exemple, si 1'echelle d'unvo ltme tre est de 5 V , dans le
cahier d'experience il faut noter le nombre de divisions d'echelle ainsi que la valeur
de pleine echelle. Si, par hasard, n ous nous trom pon s lors de la mu ltiplicatio n par 5
nous ne serons plus capables de corriger cette erreur plus t a rd .
Recopier des resultats est tres dangereux. II ne faut jamais utiliser les brouillonsp ou r copier ensuite les resultats dans le cahier de manipulation. Cette operat ion est
t r iplement dangereuse. Prem iereme nt , nous perdons du temps. Deuxiemement , nous
pouvons in troduire des erreurs supplem entaires. Mais le danger le plus important
vient du fait que, lorsque nous copious les resultats, nous ne pouvons pas eviter la
selection.
Dans le bilan d 'une experience, on n'util ise pas toutes le s mesures effectuees. Assez
f requemment , on decide que telle ou telle mesure n'est pas tres parlante o u simplem ent
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 115/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S
inuti le. Au t r e me n t dit , nous selectionnons les resultats. Cette procedure est parfaite-
ment correcte a condition que nos criteres de selection soient objectifs et justes. Si,
plus tard, nous decidons que nous nous sommes t rompes dans le choix des cri teres,
nous devons avoir la possibilite de revoir Fensemble des mesures initiales. La seulesolution a ce probleme est de conserver tous le s resultats des mesures.
Par exemple, nous mesurons des differences de temperatures a 1'aide des deux ther-m om etres. N ous devons enregistrer les indications de deux appareils et en suite calculer
la difference. Si 1'un des appareils fonctionne m al et donne , de t emps en temps, une
valeur fausse nous pourrons trouver plus facilement cette erreur si nous avons deux
enregis t rements separes. N ous verrons alors les fluc tuati on s dans les indications de ce
thermometre. Si nous ne notons que la difference nous ne saurons j ama i s lequel des
deux the rm om e t r e s fonct ion ne mal.
Ordinateur
L'ord ina teur devient de plus en plus present en travaux pratiques. C'est tres bien car
il permet d'accelerer 1'acquisition des donnees d'une fagon spectaculaire. Cependant,il faut com prendre que 1'ordinateur ne peu t p as faire des miracles et la precision d 'une
seule mesure faite avec 1'ordinateur n'augmente pas pour autant ! Quand Pecran de
1'ordinateur afflche hui t chiffres significatifs, nous de vons savoir qu'en realite le nombre
de chiffres significatifs reste le m em e que si nous avions fait la mesure nous-memes.
Simplement, 1'appareil qui sert d'interface entre Pappareil de mesure (un vol tme t re ,
un thermometre, etc.) et 1'ordinateur ne sait pas arrondir correctement le resul ta t .Le nombre de chiffres am dies est defini par le nombre de digits d 'ordinateu r et non
par la veritable precision de 1'experience. Ce ph eno m ene pose un vrai probleme :
1'acquisition au tomat i que des donnees rend difficile la de te rmina t ion de 1'incertitude
de mesure car 1'appareil de mesure est souvent inaccessible. La solution consiste arepeter 1'experience ou une partie de celle-ci. Nous obt iendrons des resul tats differents
et determinerons ainsi 1' incerti tude en utilisant 1'approche decrite dans ce livre.
Schemas et tableaux
Les schemas et les tableaux sont des formes tres pratiques pour limiter Pecri ture et
eviter ainsi le s erreurs inutiles. II ne faut pas que le schema d'une experience soit
trop detail le et qu' i l soi t proche d 'une photographic . II doit contenir le minimum
necessaire d ' informations en expliquant Pidee de Pexperience, en donnant une des-
cription de Pappareillage et les notations utiles. On a parfois besoin d'un schemacomplet dans lequel 1'echelle est soigneusement respectee. Mais dans la plupart des
s i tuat ions, 1'echelle est consciemment modifiee. Par exemple, dans le schema presente
su r la figure 4.4, la vraie taille de la resistance inconnue Rx peut etre de quelques
mill imetres tandis que la resistance variable Rv represente un appareil d 'une dizainede cent im etres . Dans cet te experience, ces resistances jouen t le meme role et le dessin
souligne leur "equivalence".
Tous le s resultats des mesures doivent etre ecrits de preference, sous la forme d 'un
tableau. I I vaut mieux noter le s valeurs de la meme grandeur physique dans une
colonne, car Poeil compare plus facilement deux chiffres ecrits Pun sous Pautre . La
premiere ligne de chaque colonne doit contenir le nom de la grandeur, son symbole
et ses uni tes . Si possible, il faut preparer le s tableaux avant la manipulat ion. II
113
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 116/15
1 1 4 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
est toujours utile de reserver quelques colonnes supplementaires. Elles peuvent etre
necessaires pour noter immedia tement les incerti tudes sur les valeurs (surtout si elles
varient lors de 1'experience) ou, plus tard, les resul ta ts obtenus lors du tra i tement des
donnees. Par exemple , si nous mesurons la resistance inconnue comme rappo rt de latension a ses bornes au courant qui la traverse, nous devons preparer six colonnes :
pour la tension et son incer t i tude, pour le courant et son incerti tude et pour la re-
sistance et son incertitude. Si, de plus, les echelles de ces appareils ne sont pas des
multiples de 10, il vaut mieux preparer des colonnes supplementaires pour noter les
mesures brutes comme nous Tavons discute auparavant .
Calculs arithmetiques
Lors des calculs arithmetiques, il ne faut pas se precipiter sur la calculatrice. Prenons
un exemple. Nous determinons la valeur de la chaleur specifique C d'un liquide demasse m contenu dans une boite. Pour cela, nous chauffons ce recipient a 1'aide d'une
petite resistance plongee dans le l iquide. Le courant qui passe par la resistance est /, latension aux bornes de celle-ci [/, la duree du chauffage r. E n premiere approximation,
si nous negligeons les pertes de chaleur (par la surface de la boite ou pour chauffer la
resistance elle-meme, etc.) la chaleur specifique est donnee par :
ou AT est la difference des temperatures apres et avant le chauffage. Soient les valeurs
experimentales : m = 17, 6 g, U = 10, 7 V , / = 42 mA , r = 23, 7 s, AT = 0, 36 K.
L'ordre de calculs doit etre le suivant. Dans 1'expression initiale
nous reecrivons toutes les valeurs dans le mem e systeme d 'uni tes (par exemple, SI) :
nous separons le s chiffres et les unites :
nous faisons les operat ions ar i t hmet iques a 1'aide d'une calculatrice et nous transfor-
mons les unites :
Ici, trois remarques s ' imposent.
Premierement , il est utile de reecrire F avant-derniere expression sous la forme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 117/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 115
ou nous avons separe les chiffres significatifs et les ordres de grandeur : si la valeur de
x • 10n
est plus grande que 5 • 10n
nous 1'ecrivons cornrne 0, x • 10n+1
, sinon nous ne
changeons r ien. L'avantage d 'une tel le representation est que nous voyons immedia-
t em en t 1'ordre de grandeur : 10 3. La valeur de la premiere fraction, dans la plupar tdes situations, sera alors de 1'ordre de 1 (de 0,1 a 10).
Deuxiemement , dans le resultat in termediaire nous gardens, pour 1'instant, trois
chiffres significatifs 1,68, bien que les valeurs de AT et de / n'en contiennent que deux.
N ous le faisons vo lontairem ent pour eviter les erre urs supplementaires d'arrondi. Dans
le resultat final, apres avoir calcule 1'incertitude sur C, nous ne laisserons que le nom-
bre de chiffres significatifs correspondant a cette incert i tude (peut etre un seul).
Trois iemement , dans la derniere expression, nous avons choisi le s unites k J / k g - K et
non pas J / k g - K , car nous connaissons la chaleur specifique de 1'eau 4,18 k J / k g - K etcette valeur nous est tres familiere. Meme si le liquide dans le recipient n'est pas de
1'eau, il faut toujours avoir les reperes physiques qui peuvent servir comme moyens
de controle de la validite de notre resultat .
3 .4 .4 COMMENT T R A V A I L L E R A V E CL E S ERREURS S Y S T E M A T I Q U E S ?
Que faire avec les erreu rs systematiques ? Comment peut-on travail ler avec ? Si c'estpossible, il vaut mieux les eviter ou, au m oins, essayer d'elim iner ces sources d'er reu rs
(comme, par exemple, verifier la position du zero de Pappareil) .
Parfois, on ne peut pas eliminer la source de ces erreurs mais on peut in t roduire une
correction pe rm e t t an t de d iminuer Ferreur . Par exemple, si nous effectuons la mesure
d'une puissance electrique supposee constante a 1'aide d 'un wat tme t re . A u debut de
1'experience, nous avons note une valeur de 4,50 W et nous savons que 1'incert i tude
su r cette valeur determinee a partir de la classe de 1'appareil est de 0,02 W. A la
fin de notre experience, nous voyons que le wat tme t r e indique une valeur de 4,42
W. Que devons-nous faire dans cette situation ? II faut debrancher le wat tmetre ducircuit et voir la valeur affichee. S'il indique — 0 , 0 7 W , cela signifie que le zero de
1'appareil a derive et que la puissance mesuree a la fin de 1'experience etai t egale en
fait a 4,49 W. La difference par rapport a la valeur initiale est due, probablement , a la
precision de nos mesures. II faut obligatoirement noter ce phenomene dans le cahier
d'experience, mais pour les calculs ulterieurs on prendra une valeur de la puissance
P = (4 , 50 ± 0 , 0 2 ) W .
Si 1'appareil debranc he indique une valeur 0,00 W , cela signifie que la difference entre
le s deux valeurs de la puissance est due a la variation reelle de la puissance dans le
circuit . Dans ce cas, nous devons utiliser lors des calculs ulterieurs une valeur de lapuissance P = (4, 46 ± 0 , 0 4 ) W ; dans no tre cahier d'experience nous devons note r ce
phenomene et que 1'incertitude a ete calculee non pas a par t i r de la classe de 1'appareil
mais qu'elle a ete est imee grossierement par AP = (.Pmax — -P m m)/2 .
Les erreurs systematiques et statistiques sont de nature differente. Cependant , pour
des raisons de com m odi t e , les deux s'ecrivent sous la m e m e forme ±Ax. II ne faut
pas oub lier que, pour les erreurs statistiques, cette ecri ture suppose une in terpre tat ion
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 118/15
A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
precise en termes de probabili tes. En revanche , pour les erreurs systematiques il n'en
est pas de m e m e : leurs valeurs sont obtenues par des estimations parfois grossieres
et subjectives. C'est pourquoi, dans la l i t terature scientifique, le resul tat final d 'une
experience se presente sous la fo rme
ou A x s ta t est une erreur statistique et Axi et A a ? 2 sont des erreurs systematiques
introduites par des raisons differentes. Formellement , ces erreurs n'obeissent pas aux
memes lois que les incertitud es statistique s. En par ticu lier, la formule de propagation
des erreurs (55) ne peut pas etre appliquee aux erreurs systematiques. On peut levoir dans un exemple tres simple. A 1'aide d'un voltmetre nous avons mesure deux
tensions V\ = 7, 5 V et V - 2 = 6, 3 V . Les ince rti tudes statistiques sont respectivement
A V i = 0 , 4 V e t AV? = 0, 3 V . II existe aussi une erreur dans la position du zero duvol tmetre que nous estimons a AV b = 0 , 1 V . Ainsi, nous pouvons ecrire
Si nous voulons calculer la difference v — V\ — Vz , nous obtenons la valeur
La seule incertitude presente est statistique et calculee selon (56). Le decalage duzero d'apparei l ne peut pas influencer la difference des deux tensions.
Par contre, si nous voulons calculer la somme V = V\ + V? , le resultat sera
Les erreurs systematiques sur la position du zero s'ajoutent dans ce cas. En principe,
on peut util iser la form ule de propagation d'erreu rs a condition d' intro duire les cor-
relations entre le s erreurs. Dans notre cas, le module du coefficient de correlation est
egal a 1. Nous conseillons au lecteur interesse d'obtenir la formule correspondante.
L'ecr i ture d'u n re sultat sous la form e (122) est la seule acceptable. N eanm oins, le
travail avec une telle expression devient complique. C'est pourquoi on introduit aussi
une incerti tude totale de 1'experience qui reuni t toutes le s sources d' incerti tudes :
Cette expression n'est pas mathemat iquement irreprochable mais elle est tres pra-
t ique , par exemple dans la comparaison rapide de deux resultats exper imentaux.
Cette form ule nous aide a comprendre , par exemple, quelle ince rti tude il faut choisir ,celle de 1'appareil ou celle de la lecture, quand nous effectuons des mesures avec le s
appareils a aiguille. Supposons que notre appareil de m esure soit un am perem etre de la
classe 4 avec une pleine echelle de 5 A et que cette echelle possede 100 divisions. Ainsi
1'erreur d'appareil est egale a Aar ap p = 0, 2 A. Nous estimons que notre incerti tude de
lecture est egale a la moit ie de la division d'echelle : Aa?iec t = 0, 025 A . L' incer t i tudede mesure est alors
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 119/15
Ill - E X P E R I E N C E S A V E C U N N O M B R E L I M I T E D E M E S U R E S 117
Si notre amperemetre est de la classe 0,1, alors A a? ap p = 0, 005 A et
Ces deux examples ne sont pas ties realistes : ils servent surtout a illustrer la procedure
a appliquer pour est imer les incert i tudes. En prat iqu e, tous les appareils ont une
echelle telle que 1'incertitude de lecture soit compatible avec celle de 1'appareil :
Aut remen t dit , notre amperemetre dev rait e tre de la classe 1 ou 0,5. Dans ce s con-
ditions, on peut dire que 1'incert i tude de mesure est approximat ivement egale a la
division d'echelle. Cette est imation est utilisee quand on ne dispose pas d 'inform ationsur la classe de 1'appareil. Par exemple, pou r le s appareils avec Paffichage numer ique ,
1'incertitude peut etre est imee grossierement a 1 dans le dernier digi t (a condi t ion,
bien evidemment , que les indications de 1'appareil aient ete stables tout le long de lamesure) .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 120/15
Cette page est laissée intentionnellement en blanc.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 121/15
CHAPITRE 4
A J U S T E M E N T D E S P A R A M E T R E S
On rencontre des nombreuses situations dans lesquels on des parametres sont deter-
mines a pa rtir des donnees experim entales. Par exem ple, on a une fonction qui depend
d'un paramet re et on veut t rouver la valeur de ce dernier p our que cette fon ction repro-
duit bien les donnees. Habi tue l lement , on cherche la meil leure valeur du parametre ,
son incertitude et une maniere d 'evaluer la qualite de la description des donneespar la fonct ion choisie. Cette procedure est appelee ajustement des parametres .
Avant d 'evoquer des approches concretes d 'a jus tement , defmissons quelques propretes
generales des paramet res deduits des donnees experimentale.
En pr incipe, differentes expressions peuvent etre proposees pour definir la valeur d 'unparametre a par t i r des donnees experim entales. Par e xemp le, si Ton fait une serie de
T V mesures d 'une grandeur 1X pour laquelle on obtient les resultats xi,x^, • • • ,XN,
on peut proposer comme valeur de X la moy enne de tous les resultats
ou la moyenne des valeurs maximale x m a x et minimale xmln
Xi et X < 2 sont des estimations differentes de la meme grandeur X. Comme nous
1'avons deja discute dans ce livre, le s deux es t imations peuv ent e tre utilisees dans dess i tuat ions differentes.
On peut donner quelques importantes caracteristiques des telles estimations. La pre-
miere est 1'existence d'une erreur systematique. Si
Ici, on parle d'une grandeur X pour utiliser les exemples deja abordes dans ce l ivre, mais onaurait pu egalement parler d'un parametre X.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 122/15
120 ANALYSE STATISTIQUE DB S D O N N E E S EXPERIMENTALES
1'estimation est dite biaisee. On a deja vu 1'importance de cette notion dans la
discussion de la variance experimentale au paragraphe 3.1.1. Dans la definition (86),
on a du diviser la somme par N — 1 et n on pas par T V , precisement , pour evi te r une
erreur systematique dans cette def ini t ion. Si 1'estimation n'est pas biaisee, on ditegalement qu'elle est correcte.
La deuxieme caracteristique importante d'une estimation est son efficacite. Parmi
toutes les estimations possibles, 1'estimation efficace est celle dont la variance est la
plus petite.
Regardons le role de cette notion d'efficacite sur un exemple deja etudie : 1'addition
de resultats experimentaux (voir paragraphe 3.3.2).
Quelle est la meilleure fagon de calculer la moyenne de resultats experimentaux dif-
ferents ? Soient N resultats a ? i , X 2 , • • • , # A T qui , en tant que variables aleatoires, ont
la meme moyenne ~ x \ — ~ x ^ = ...— F /v = ^ mais des variances differentes aXl = < T I ,
& x - 2 — ° ~ 2 , • • • ) & X N — VN-
A partir de ces donnees, on peut construir une combinaison lineaire
dans laquelle les difFerents resultats sont ponderes par des poids inconnus pi. Choisis-
sons ces poids en imposant comme condition Pefficacite de 1'estimation. Autrementd i t , on cherche a ce que la variance de X soit minimale.
Avant de calculer la variance de X, on impose que X ait la meme moyenne f i que les
{*.'} :
Cette condition donne
La variance de X se calcule tres facilement en ecrivant Tindependance des {xj} :
c r ^ x peut etre consideree commefonct ion de T V — 1 variablesindependantes p i , p 2 , • • • >PN- i
(pN doit etre exprimee en fonction des autres variables a partir de (123)) :
Pour que &'x(piip2, • • -PN-i) soit minimale, il faut que les derivees partielles corres-
pondantes soient nulles :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 123/15
IV — AJUSTEMENT D B S P A R A M E T R E S 121
Ainsi on obtient N — 1 conditions :
On pen t ecrire a nouveau ce systeme sous la forme
ou A =pi + P i + • • • + PN- I - En faisant la somme de ces equations on obtient :
soit
Finalement , on t rouve les poids pi qui sont inversemen t propo rtionnels aux variances~2 .
Ainsi pour X et <r^, on retro uv e 1'expression (118) :
On voit que ces caracterist ique s (estimation biaisee, emcacite) sont tres importantes
pour pour opt imiser le choix des parametres.
Nous allons exposer maintenant deux methodes les plus f requemment utilisees (la
methode des moindres carres et celle du m ax im um de vraisemblance) pour ajuster
des parametres .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 124/15
122 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
4.1 M E T H O D E DES M O I N D R E S C A R R E E S
Revenons sur la question posee au debut de ce chapitre : si dans notre fonction
theor ique , des paramet res l ibres existent, comment pouvons-nous les choisir pour
avoir le meilleur accord avec le s points experimentaux ? Par exernple, quelle est lameilleure fagon de tracer une droi te qui passe par les points experimentaux representes
su r la figure 4.1 ?
Figure 4.1 : Trace de la fonction lineaire
Nous disposons de n mesures independantes {y^v} = y r
P' ^ 2
X p> • • • > ? / n
X pd 'une gran-
deur physique y pour n valeurs de son argument {%i} — x i , a ? 2 , • • • ,xn. Supposonsque notre fonction y = y(x] depende aussi de k paramet res {dj} — ai, 02 ; • • • ,
ak-
Cette formulation du probleme suppose que les valeu rs y ,- sont decrites par les variables
aleatoires tandis que les {#;} sont definis d'une fagon deterministe. En pratique, cette
hypothese signifie que les incert i tudes Ax t- sont negligeables. Ainsi le s paramet res {ctj}
sont egalement decrits par les variables aleatoires dont nous devons determiner non
seulement le s valeurs moyennes mais aussi le s variances.
4.1.1 IDEE DE LA METHODS DES M O I N D R E S C A R R E S
Dans un cas general, c'est un probleme assez complexe. C'est pourquoi nous faisons
1'hypothese supplem entaire que y est une fonction lineaire de ses parametres {aj} qui
s'ecrit
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 125/15
IV - A J U S T E M E N T D B S P A R A M E T R E S 123
ou le s fonctions {fi(x)} sont connues. II peut s'agir de monomes c o m m e fi(x] — xl,
dans ce cas nous cherchons les coefficients de developpement en serie de Taylor ou
de fonct ions t r igonometr iques cosinus et sinus et obtenons un developpement en serie
de Four ier . Ains i , malgre ce t te hypothese sur la l ineari te par rappor t aux coefficients{ctj}, notre probleme reste assez general et particulierement utile po ur les applications
physiques.
Pour de terminer k paramet res , il faut que le nombre de poin ts exper imentaux n soit
egal ou superieur a k. Par exemple, pour une droite, nous avons besoin d'au moms
deux points pour definir la pente et la constante a 1'origine. N ous supposons do ne
que n > k.
Une approche assez generale p ou r choisir des parametres est donnee par la methode
des moindres carres. Dans cette methode on affirme que les m eil leurs paramet res {aj}sont tels qu'i ls minimisent la somme des carres :
C'est une sornme sur tous les points exper imentaux i = 1, 2 , . . . , n qui reunit ainsi la
totalite de 1'information exper imentale . Chaque terrne de la somme est le carre de
la difference entre la valeur mesuree y^xp
et la valeur theor ique y(a\, 0 2 , . . . , a^', Xi)calculee pour cette valeur de Xi. Plus proches sont la theor ie et 1'experience, plus peti te
est la contr ibut ion de ce te rme. Chaque terme est pondere par un poids conformement
a son erreur < T ; (voir le paragraphe 3.2.2). Plus grande est < r z - , moins impo r tan te est
la contr ib ution de ce point. De plus, nous supposons que nous connaissons les vraies
variances de chaque point af . En pratique, nous ne pouvons obtenir que les valeurs
experimentales (A y 2e xp
)2.
Le cri tere uti lise (le m in im um de la somme des carres) n'est pas le seul critere possible.
Cependant , on peut demontre r un theoreme mathemat i que (dit de Gauss-Markov)
selon lequel le s parametres determines par la methode des moindres carres sont le splus precis : leur variance sera plus petite que les variances des coefficients obtenues
avec tous autres criteres. Cette affirmation reste vraie quelle que soit la forme de ladis t r ibut ion de probabi l i te (autrement d i t , il n'est pas necessaire de supposer que les
l^fXP
}s°i
ent dist r ibutes selon la loi norm ale et le critere reste toujours valable). Mal-
gre 1'importance de ce theoreme, nous ne don nons pas ici sa demonst ra t ion . Le lecteur
interesse peu t la retrouver dans le s livres de mathemat iques . Notons s implement que
1'idee de la demonstrat ion est proche de celle que nous avons utilisee au debut de ce
chapi t re pour re t rouver la formule (118). II fau t noter que la m ethode des moindres
carres est souvent utilisee dans des situations ou ses condi t ions de validite ne sont pasvraiment remplies (ou si 1'on n'est pas sur qu'elles soient remplies). La raison pour
cela en est simple : on ne dispose pas d'autre m e t h o d e presentant la m e m e simplici te
et la meme puissance.
Dans ce livre, nous nous sommes surtout interesses a la demarche et nous allons
montrer maintenant comment appl iquer la methode pour ob ten i r le s valeurs des
parametres et leurs incer t i tudes .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 126/15
124 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Pour trouver le minimum de la somme
nous devons resoudre un sys t eme d 'equa t i ons l ineaires :
soit
Dans le cas genera l , II es t plus facile de travailler avec une e c r i tu re matricielle. Pour ce la ,
introduisons la matrice Tde n l ignes et de k co lonnes :
le vecteur (soit la matr ice d 'une co lonne et de n l ignes)
et le vec teu r (soit la mat r i ce d 'une co lonne et de k l ignes)
Avec ce s notations matr i c ie l l es , la s o m m e R (125) s 'ec r i t
e t les equat ions (126)
Nous voulons trouver le vec teu r A a par t i r du vec teu r connu 3 En multipliant (127) par
la matrice (^7T
^7)~
1, nous obtenons le resu l ta t :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 127/15
IV - A J U S T E M E N T D B S P A R A M E T R E S 125
Les vec teurs A et y sont lies par une t rans fo rmat ion l ineaire avec un Jacob ien J, c ' es t
pourquoi nous pouvons uti l iser la re lat ion (65) pour les var iances :
La mat r i ce de covar iance D(y] es t d iagona le car toutes les mesures y"p
sont indepen-
dan tes . De plus el le est egale a la m at r ice un i ta i re vu la normal isa t ion du vecteur y :
Ainsi , I 'express ion (129) prend la fo rme
Grace aux formules (128) e t (130) nous avons t rouve les va leurs des parametres {aj} e t
leurs incer t i tudes. Bien que la mat r ice D(y] soit d iagona le , la mat r i ce D(A) ne Tes t pas
(les paramet r es {a,j} ne sont pas independants ) .
Explicitons (128) et (130) pour les cas les plus simples.
Fonction constants
la matrice T se degenere en une seule colonne :
La matrice (.77T
.77) devient un nombre
De meme
Le resultat (128) prend la forme
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 128/15
126 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S
et 1'expression (130)pour la variance devient
Si toutes les erreurs sont les me me s , < T I = &i = . . . = an = a, nous retrouvons nos
formules pour la moyenne (82)et pour la variance (84) :
Fonction lineaire
la matrice F prend la forme :
la matrice (F^F] est une matrice (2 x 2)
et
La matrice inverse de (J-^ J-} qui est aussi la matrice de covariance (130)s'ecrit
ou
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 129/15
IV - A J U S T E M E N T D B S P A R A M E T R E S 127
Les expressions (128)donnent
Les elements D(A)\\ et D(A}<2-2 de la matrice de covariance defmissent 1'incertitude
sur cti et sur 0 ,3
Dans le cas general, I'element D(A)i2 est different de 0, ce qui signifie que les deux
parametres a\ et a-i sont correles :
Remarque tres importante. Supposons que toutes les valeurs {y zexp
} soient dis-
tribuees selon une loi normale. Les conditions de minimisation (126) ou (128) fixent k
relations entre les {y zexp }. Ainsi, la somme Rmin ou nous avons remplace les {aj} par
leurs valeurs venant de la minimisation (128) a une distribution x2
avec (n — k) degres
de liberte, conformement a la formule (105). Pour les {yjxp
} distributes selon une loi
normale, la notation standard de cette somme est x2 : Rmin =X m i n - Rappelons que
la valeur moyenne de Xminsel°
n(98) est
alors que son erreur est selon(99)
Autrement dit, si tous nos calculs sont corrects et coherents et si toutes nos hypotheses
sont verifiees, nous devons obtenir pour la somme de carres jR^P
n une valeur proche
de (n — k ) .
A cause de cette relation avec la distribution %2, la methode de moindre carres est
egalement appelee la methode %2.
L'hypothese de la forme gaussienne des distributions y ^ donne une autre interpretation
du critere du minimum des carres. La probability dP que les y{ se trouvent dans les
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 130/15
128 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S
interval les [yjxp
, y^xp
+ dyi] s'ecrit alors
ou R est defini par (124). Ainsi le m i n i m u m de R(ai,a,2,... , a / j ) , fonc t ion des
parametres 0 1 , 0 2 , . . . , o & , correspond au maxi mum de cet te probabi l i ty . On peu t
dire que les "meilleures valeurs" de 0 1 , 0 2 , . . . , a^ sont celles qui a t t r ibuen t la plus
grande probabilite au resultat observe.
4.1.2 E X E M P L E D ' U N E F O N C T I O N L I N E A I R E
Sur la figure 4.1,nous avons presente un exemple de donnees expe rim ent ales (10
points) pour lesquel les nous voulons ajuster une droite y = a\ + a-^x. Les valeurs
numeriques correspondantes sont reunies dans le tableau4.2.
Ier
niveau d'analyse
Pour une es t imat ion rapide on peut u t i l i ser une procedure presque intui t ive . A Poeil
nu , on trace toute la famille des courbes lineaires qui passent p ar les points expe rimen -
taux et on choisit les valeurs maximale et minimale de a;. La valeur approximat ive
et son erreur peuvent etre definies s implement comme :
Dans not re cas, pour les lignes (1) et (2) on obtient
II
e
niveau d'analyse
Dans le tableau 3.2,nous avons explici te tous les resultats intermediaires necessaires
pour calculer 01 e t a2. L'appl icat ion di recte des fo rmules (133) —(134) nous donne le
resul tat final :
N ou s gardens deux chifFres significatifs dans 1' incert i tude A a2 afin d'avoir , pour les
grandes valeurs de x, le meme nombre de chifFres significatifs dans a^x et dans 01-
Nous pouvons e s t i me r auss i le coe f f i c i en t de cor re la t i on (22) de d e u x p a r a m e t r e s
Sa v a l e u r abso lue e s t relativement g r a n d e , done c es p a r a m e t r e s sont fortement co r re les .
Nous avons pr is cons c ience de ce t t e co r re la t i on lo rs de notre an a l y se rap ide : pour passer
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 131/15
IV - A J U S T E M E N T D B S P A R A M E T R E S 129
Tableau 3 .2 : L'a jus t emen t des coefficients ai e t a? pour une droite
xt
vrr
(AF
( Ayfx p
) 2
I?
( A 3 / r
p
)
2
t /rp
(Aj/^x p
P
2/eXP
'^i
(Ayp
J/*hi
( » rp
- v jh 4
)2
( A 2 / rp
)2
1 2 3 4 5 6 7 8 9 1 0
5,4 3,8 4,0 4,0 3,5 2,1 2,9 2,0 1,1 1,7
0,6 1,1 0,2 0,5 0,5 0,6 0,6 1,1 0,2 0,4
2 , 7 8 0,83 25 4 4 2,78 2,78 0,83 25 6,25
2,8 1,7 75 16 20 16,7 19,4 6,6 225 62,5
3 3 225 64 100 100 136 53 2025 625
15,0 3,1 100 16 14 5,8 8,1 1,7 27,5 10,6
15,0 6,3 300 64 70 35 56,4 13,2 247,5 106,3
5,0 4,5 4,1 3,6 3,2 2,7 2,3 1,8 1,4 0,9
0,4 0,4 0,3 0,6 0,4 1,0 1,0 0,0 2,3 4,0
£
74,25
445,7
3334
201,8
913,7
10
de la droi te (1) a la droite (2 ) il faut changer non seu lement la pente a^ mais auss i la
constante a\. Ceci n 'est pas toujours le cas . Dans une situation ou I'origine x = 0 se
t rouve a peu pres au milieu des points expe r imen taux , le passage d 'une droi te ex t rem e a
une au t re se fait s e u l e me n t par la modification de la pente 0 2 - L ' e r r e u r sur la cons tan te e t
le coe f f i c i en t de cor re la t ion sont pet i ts dans ce cas- l a . Ceci peut ega lement se voir grace
a la formule (135). Quand tous les {a?;} sont du meme s igne , le coe f f i c ien t de corre la t ion
es t grand. Quand I'origine x = 0 se t rouve au milieu de s po in ts exper imentaux , la s o mme
cor respondante es t proche de ze ro .
IIP niveau d'analyse
Dans Interpretation d 'une e xper ience de physique, nous ne pouvons pas nous limiter aux
ca lcu l s des pa ramet res e t a leurs incer t i tude s. Nous devons auss i nous assurer que notre
hypothese, selon laquelle les resu l tats exper imentaux peuvent etre decrits par une fonction
l ineai re , es t cor rec te .
Supposons que notre collegue a f f i rme que la meilleure approximation de ces points expe-
r imen taux n ' es t pas une fonct ion l ineaire y(x) = a\ + a^x, ma is une cons tante :
II appl ique le s formules (131)e t (132) et i l obtient
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 132/15
130 A N A L Y S E STATISTIQUE D B S D O N N E E S E X P E R I M E N T A L E S
II su f f i t de regarder la f igure 3.3 pour voi r qu'il se t r o mp e . S on hypothese e s t f ausse , mais
comment pouvons-nous le prouve r ?
La d i f f e rence en t re nos deux resu l ta ts se t rouve dans la valeur de la s o m m e Xmin
c
l
u
''faut ca l cu le r apres avoir chois i les va leurs de s p a rame t re s {az}. Conformement a (136)
et (137), dans not re a jus tement de 10 points avec 2 p a r a me t r e s , on obtient Xmin=
&
avec une i ncer t i tude A.Xmin=
4- La va l eu r obtenue dans la dern ie re l igne du t ab l e au 3.2
(Xmm)exp
— 10 es t en t res bon acco rd avec ce t te es t ima t ion ( les va leu rs de y\^ s o n t
calcu lees avec le s p a rame t re s (139)). Par cen t r e , pour I 'ana lyse de notre col legue, on
s 'a t tendra i t a obtenir Xmin=®avec
^Xmin —^ tandis que la va leu r experimental est
(Xmm)eXP- 145
! Voi|ala contradic t ion !
Nous pouvons re fo rmule r ces conc lus ions en t e r me s de probabi l i te car nous avons deja
etudie la dist r ibut ion %2
au p a rag rap he 2 .3 . 2 . Dans l e t ab leau 3.3, nous presentons le sva leurs %
2et les probab i l i tes P pour que %
2soi t p lus grande ou egale a %
2avec un
nombre donne de degres de l iber te .
Pour notre col legue, la probab i l i te de t r o u v e r x 2P '
U Sg r a n d que 21 ,7 pour v — 9 e s t
inferieure a 1%. La probabi l i te de t rouver x2
proche de 100 es t alors negl igeable. Ainsi
son hypo these es t re futee.
Tableau 3.3 : Les valeurs x^>et
les probabi l i tes P pour que\2>x?,
pour v degres de l iber te pour un e droi te
TV
12
3
4
5
6
7
89
10
11
12
13
14
15
16
17
1819
20
0,98
0,001
0,040
0,185
0,429
0,752
1,134
1,564
2,0322,532
3,059
3,609
4,178
4,765
5,368
5,985
6,614
7,255
7,9068,562
9,237
0,90
0,016
0,211
0,584
1,064
1,610
2,204
2,833
3,4904,168
4,865
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,86511,651
12,444
0,80
0,064
0,446
1,005
1,649
2,343
3,070
3,822
4,5945,380
6,179
6,989
7,807
8,634
9,467
10,307
11,152
12,002
12,85713,716
14,578
0,70
0,148
0,713
1 , 4 2 4
2,195
3,000
3,828
4,671
5,5276,393
7,267
8,148
9,034
9,926
10,821
11,721
12,624
13,531
14,44015,352
16,266
0,50
0,455
1,386
2,366
3,357
4,351
5,348
6,346
7,3448,343
9,342
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,33818,338
19,337
0,30
1,074
2,408
3,665
4,878
6,064
7,231
8,383
9,52410,656
11,781
12,899
14,011
15,119
16,222
17,322
18,418
19,511
20,60121,689
22,775
0,20
1,642
3,219
4,642
5,980
7,289
8,558
9,803
11,03012,242
13,442
14,631
15,812
16,985
18,151
19,311
20,465
21,615
22,76023,900
25,038
0,10
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,36214,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,98927,204
28,412
0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,09021,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,80536,191
37,566
Dans no t re cas , la probabi l i te de t r o u v e r x2> 10 P
ou r v— 8 est approx ima t i vemen t
ega le a 2 5 % . En fait, ce t t e va leur es t assez grande. I I f au t se rappe le r que la dist r ibut ion
X2
es t asymet r ique e t que ( ' i n te rp re ta t ion des resu l ta t s avec ce t te d is t r ibu t ion es t un peu
part icu l iere. Pour illustrer ses proprietes dans notre cas, d iv isons le s valeurs de %2 en 4
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 133/15
IV - AJUSTEMENT D B S P A R A M E T R E S 131
in terva l les : /i=[0,4[, 7 2 = [ 4 , 8 [ , 73 = [ 8 , 1 2 [ et 7 4 = [12 ,oo [ . Le pascorrespond a la
racine carree de la va r i ance . A I 'aide du t ab l eau 3.3, nous eva luons les probabi l i tes pour
que la va leu r de x2 se
t rouve dans I ' in te rva l le cor respondant : P\ ~ 0,15, ^2 — 0,40,
PS ~ 0, 30, PI ~ 0,15. Nous voyons que les probabi l i tes d'obtenir de t res grandes et de
t res pet i tes va leu rs de x2 sont
fa ib les. Leur appar i t ion signifie que le choix de la fonction
etait mauvais. En physique, on considere que le choix d'une fonction es t correct si la
va leur de x2
Par
degre de l iber te es t proche de 1.
II existe un autre argument important qui conduit a interpreter ces probabil ites avec beau-
coup de prudence. Rappe lons que nous avons remplace partout dans nos ca lcu ls le s vra ies
var iances c r ? par les valeurs expe r imen ta l es (Ay^xp
)2, car nous ne conna issons que ces
dernieres. La di f ference entre a^ e t Ay^xp
peut e t re de I 'ordre de 10%.Ainsi nous somme s
capab les de dete rminer %2
a 10 — 20% pres.
En conclusion, notons que la comparaison des deux premiers niveaux d'analyse montre
bien deux par t icular i ty caracterist iques de ce genre d'evaluation rapide : 1'approche
simple reproduit assez bien les valeurs de 01 et de 0 , 3 , mais les incerti tudes sur ces
valeurs peuvent etre tres differentes des valeurs exactes. L'avantage du t roisiemeniveau reside en la possibilite de confirmer ou d'infirmer le choix de la dependance
fonctionnelle.
La methode des moindres carres est une approche tres efficace et elle est largement
suffisante pour le s experiences faites en travaux pratiques. Neanmoins, il existe dessituations ou on ne peut pas 1'appliquer, par exem ple lorsque le nombre d 'evenementsest pet i t et que Ton ne peut pas evaluer correctement le s incertitudes, ou quand le s
incerti tudes sur x ne sont pas negligeables x\,xi,... ,xn. Dans ces situations, on
utilise une autre approche plus generale basee sur la fonction dite de v raisemblance.
4 . 2 METHODE D U M A X I M U M D E V R A I S E M B L A N C E
Une des hypotheses uti l isees pour developper la methode des moindres carres etait la
f o rme gauss ienne de la dis t r ibu t ion des y t-. On peut demont re r que cette condition peut
etre legerement a f fa ib l ie mais que,de toute f acon, ce t te approche n 'es t pas va lab le pour
une dist r ibut ion que lconque . C'est pourquoi on peut chercher a proposer une approche
plus gene ra l e du prob leme.
4.2.1 L'IDEE DE LA METHODE
DU MAXIMUM DE VRAISEMBLANCE
L' idee de la methode du maximum de vra isemblance est assez simple (pour simplifier
encore la pres entat ion, nous supposons qu ' i l n'y qu 'un seul pa rame t re a ; la genera l i sa t ion
au cas de p lus ieurs paramet res e s t relat ive m en t sim ple). Uti lisons la d e ma r c h e adaptee
a la f in du paragraphe 4.1.1, ou nous avons in te rpre te la methode des moindres ca r res
comme cel le qui donne la probabi l i te ma x i ma l e de re t rouver le s va leu rs expe r ime n ta les
avec une fonction theor ique.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 134/15
132 ANALYSE STATISTIQUE D B S D O N N E E S EXPERIMENTALES
En utilisant les fonctions de distribution /(#z; a) des var i ab les2
i ndependantes X{, on ecr i t
la probab i l i te de t rouver le s va leurs de X i d a n s le s in terva l les [#,,£; + dxi]
Pour que cette probabi l i te soit m a x i m a l e , il faut que la fonction
ait un maximum. Cet te fonction s ' appe l l e la fonction de vraisemblance, et la condition
du maximum de v ra ise mb lance p rend na tu re l l eme n t la forme
A partir de ce t te condition, on t rouve la v a l e u r du pa rame t r e a. I I es t parfois plus commode
de minimiser le logarithme de cette fonction que la fonction e l l e -meme .
O n des i re , par exemple , t rouver la moyenne / j, i n connue d ' une fonction de distribution
gauss ienne. Supposons que la fonction de distribution est la meme pour tous le s Xi (avec
la meme var iance inconnue c r2 ) :
Le logarithme de la fonction de v ra i semb lance s ' ec r i t alors
et sa der ivee
s 'annu le pour
L e signe^sur p soul igne que la methode du max imum de vra i se mb lance nous ind ique com-ment es t imer ce pa rame t r e ; a u t r e m e n t dit, el le fournit une est imat ion. Bien e v i d e mme n t ,
dans ce cas s imp le , on re t rouve une express ion connue de la moyenne.
Mais cet te methode e s t v ra imen t t res genera le . Par exemple, pour une distribution bino-
mia le (qui est une distribution discrete !), on peut t rouver la v a l e u r la p lus v r a i sem b lab l e
2 Pour avoir la meme ecriture qu'au debut du chapitre, la variable aleatoire est representee par la
lettre x.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 135/15
IV - A J U S T E M E N T DES P A R A M E T R E S 133
de la probabi l i te i nconnue p si , au cours de N exper iences , un evenement se produit x
fois. L a fonction d e v r a i s e m b l a n c e , d 'ap res (30) , s 'ec r i t
e t son max imum cor respond au max imum du logarithme
(dans cet te express ion, nous avons vo lonta i rement omis une cons tan te qui ne depend pas
de p). Alo rs
pour np = x. Autrement d i t , la va l eu r la p lus v ra i semb lab l e de p est
Malheureusement , la methode du maximum de vra isemblance ne peut pas resoudre tous
le s problemes. En par t icu l ie r , le s es t imat ions ob tenues par cette methode peuvent e t rebia isees . Revenons a I ' exemp le d 'une distribution gauss ienne avec le logar i thme de la
fonction de vra isemblance
e t de te rm inons I 'es t imat ion pour la va r i ance .
La der iva t ion de cette express ion par r appo r t a u condui t a ( ' equa t ion
soit
C o m m e nous I ' avons deja vu p lus ieurs fois, pour avoir une estimation correcte (non bia isee)
il faut div iser l a somme pa r T V — 1 e t non pas par N (voir , par exemp le , (85)).
En conclus ion de ce pa ra g ra phe , donnons que lques r emarques conce rnan t le s re la t ions
entre le s deux methodes proposes d 'a jus tem ent des pa rame t r es .
Tout d 'abo rd , la methode de s moindres car res peut e t re cons ideree c o m m e un cas par t i -
cu l ie r de la methode du maximum de v ra i semb lance : s i T on prend comme fonction de
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 136/15
134 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
distribution3
de y"p
une gauss i enne avec de s "moyennes" yth
(a;xz) dependan t de un (ou
plus ieurs) pa rame t re ( s ) , on a
e t le logar i thme de la fonction de v ra i semblance donne (a une cons tan te pres) la s o m m e
R (125) avec le signe moins. Ainsi le m a x i m u m de vra i semblance cor respond au minimum
de la somme de s ca r res .
Cette cor respondance n 'es t pas su rp r enan te , compte tenu de ( 'a rgum en ta t ion cho is ie pour
deve lopper la methode du maximum de v ra i semb lance . De plus, elle pe rme t d'utiliser la
puissance de la methode des rnoindres ca r res pour evaluer , par exemp le , les incer t i tudes
sur le s va leurs des parametres (voir le paragraphe suivant).
En fm , si la methode du m a x i m u m de v ra isem b lance soit plus souple que la methode de s
moindres ca r res , on doit se souveni r qu 'e l le n 'est pas parfaite : les estimations qu 'e l l e
propose peuvent e t re biaisees e t il est p lus d i f f ic i le d 'avoi r un jugement sur la qua l i t e de
I'ajustement des parametres. Rappelons que la methode des moindres car res (par a valeur
de x2
obtenue) peut n ous dire si notre hypothese sur la forme de la fonction a a juster est
cor rec te ou non. Au con t ra i re , dans la methode du m a x i m u m de v ra i semblance , ce type
de cr i te re n'ex is te pas.
4 . 2 . 2 I N E G A L I T E DE CRAMER-RAO-FRECHET
Un aspec t important de la methode du maximum de v ra i semblance es t l e ca l cu l des
incert i tudes sur les v a l e u r s de s pa rame t r es .
Commencons par la fonction de v ra i semb lance d ' une distribution norma le (140) e t che r -
chons ( ' i ncer t i tude sur p. Nous avons deja ca l cu le le logarithme de la fonction de v ra isem -
blance dans (141) de cette distribution. O n peut ajouter a cet te express ion une cons tan te
i ndependan te de p c o m m e , pa r exemple ,
ou p es t de fmi pa r (142). O n obtient a lors
La representa t ion de cet te fonction de p es t une pa rabo le dont le maximum se t rouve au
point p = p. Pour N =1, la parabo le cor respondante
est presentee sur la Figure4.2.
3 Pour retrouver exactement les meme expressions que dans la methode de x2>on
reprend les
notations y j pour les variables aleatoires et x^ pour 1'argument des fonctions.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 137/15
I V — AJUSTEMENT D E S P A R A M E T R E S 135
Figure 4.2 : Le logar i thme de la fonc t ion de vraisemblance d 'une dis tribution gaussienne
Cet te courbe est a la base de ( ' ana lyse de s fonc t ions de v ra i semb lance dependan t d ' un
paramet re . L e segment de droite re l iant les deux branches de la parabole pour InL =
— 1/2, carac te r i se un i n te rva l l e de conf iance
cor respo ndant a une probabi l i te de 68 ,2 7 %, pour une distribution gauss ienne. D 'une facon
ana logue , le segmen t de droite reliant le s deux branches de la parabole pour \nL = —2
correspond a un i n te rva l l e de conf iance de 95 ,45 %.
O n peut d e mo n t r e r pour une c lasse assez la rge de d is t r ibut ions (pas f o r cemen t gaus-
s iennes ) qui ne depende nt que d 'un seu l pa rame t r e , qu'il est poss ib le de t rouver les inter-
va l l es de conf iance de la m e m e f a con .
Par exemple , dans l e cas d 'une distribution binomia le abordee dans le pa rag raphe p rece-
dent , on peut t racer le logar i thme de la fonction de v ra isem b lance en fonction de p. Pourx = 2 et A" =10, cet te fonction
e s t prese ntee sur la F igure 4.3 (dans cet te expres s ion , on a ajoute une cons tan te pour
que la v a l e u r max ima l e de InL(p) soit egale a 0) . Ce n 'est pas une par abo le ma is el le
lui ressemble que lque peu. D 'a i ll eu rs , on peut souvent approx imer le s fonc t ions de ce
type par des parabo les au vois inage du max imum (ce qui signif ie qu'on peut approcher la
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 138/15
136 A N A L Y S E S T A T I S T I Q U E D E S D O N N E E S E X P E R I M E N T A L E S
fonction de distribution par une gaussienne). La position du maximum de cette fonction
nous donne la valeur de I'estimation (143) : p= 0,2.
Figure 4.3 : Le logarithme de la fonction de vraisemblance
pour une distribution binomiale avec x =2 et N = 10
A partir de cette courbe, nous pouvons facilement trouver tous le s intervalles de con f iance
des i res . Parexemple, pour un intervalle de confiance de 95,45 %, la solution de I'equation
donne [0,036 ;0,505]. On remarque que cet intervalle n'est pas symetrique par rapport
a p = 0 , 2 .
U ne autre ap p r o ch e existe pour determiner ("incertitude sur la valeur de s parametres d an s
la methode du maximum de vraisemblance. El le est beaucoup plus pratique, surtout
lorsque la fonction de vraisemblance depend de plusieurs parametres. Cette approche
porte le nom d'inegalite de Cramer-Rao-Frechet. Donnons sa demonstration dans le cas
ou la vraisemblance L(a) ne depend que d'un seu l parametre a, mais le resultat peut etre
gene ra l i se au cas de plusieurs parametres.
Soit a I'estimation du parametre a. Cette estimation est biaisee par une erreur systerna-
tique f3(a), c'est-a-dire que la valeur moyenne de a est ega le a4
4 Pour simplifier la presentation des formule, nous utiliserons 1'ecriture / • • •dX qui signifie une
integrate multiple sur toutes les variables xt.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 139/15
IV - A J U S T E M E N T D B S P A R A M E T R E S 137
En de r i van t cet te re la t ion par rappor t a a e t utilisant le fait que I'estimation a n 'es t
fonction que des donnees exper imenta les {xi}, on obtient
Cet te relation peut encore s 'ec r i re sous la forme
Calcu lons ma in t enan t la der ivee par rapport a a de la relation de no rma l i sa t i on de la
v ra i se mb l an ce
que T on peut mettre sous la forme
En multipliant cette relat ion par a et en le sous t rayant de (145), on obtient
S i Ton app l ique I ' inega l i te de Schwar t z5
aux fonctions
on t rouve
La premie re in tegra le represente la va r i ance < r % du pa rame t r e a, pour laquel le on obtient
f m a l e m e n t I ' inega l i te recherchee :
5 Pour demontrer cette inegalite, il suff i t de remarquer que 1'integrale f ( X f ( x ) + g(x))2dx est
positive quelque soit la valeur de A. Ainsi 1'equation
n'a pas de racines reelles non nulles. Done, le discriminant doit etre negatif. Cette condition
nous donne I'inegalite recherchee.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 140/15
138 A N A L Y S E S T A T I S T I Q U E DE S D O N N E E S E X P E R I M E N T A L E S
La va leur moyenne du car re de la der ivee logar i thmique de la v r a is e m b l a n c e p e u t e t re mise
sous la f o rme
(pour obteni r cet te re la t ion, il su f f i t de ca lcu le r la der ivee de 1 'equat ion (146) par rap port
a a).
A ins i I'inegalite (147) prend une au tre forme equ iva len te
Pour que cet te inegalite dev ien t une ega l i te , il faut que , dans I ' inega l i te de S c h w a r t z , les
fonct ions / et g soient les memes a un f ac teur multiplicatif A pres, c 'es t -a-d i re que
Aut remen t d i t , la v ra i se mb l an ce doit avo i r une f o rme gauss ienne (a compa re r avec 1 'equat ion
(144))
Notons que, dans ce c a s , la der ivee seconde du logarithme de la v ra i se mb l an ce est une
cons tan te :
A ins i , pour la var i ance , on obtient
soit
C o mme e x e mp le d'utilisation de la f o rmule de C ramer - R ao- F reche t , cons iderons la distri-
bution de Maxwe l l deja etudiee dans le paragraphe 3.1.3. Supposons que soit mesure le
module de la v i tesse des molecu le d 'un gaz et que nous vou l ions de te rm iner la t e m p e r a t u r e
a par t i r des resu l ta ts de N mesures e f fectuees : i;? (i — 1,... , N).
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 141/15
IV - AJUSTEMENT D B S PARAMETRES 139
La fonction de distribution f(v) du module de vi tesse v s ' e c r i t
done, le logarithme de la vra isemblance prend (a une constante pres qui ne nous in te resse
pas) la forme
L'estimation de la t empe ra tu r e T s'obtient e n annu lan t la der ivee pa r rappo r t a T de
cette expression :
Ainsi, on obtient
Cet te express ion cor respond a I ' in t repre ta t ion physique bien connue de la t empe ra tu r e
comme mesure de I 'energ ie c ine t ique moyenne de s molecules. O n peut ver i f ie r a isement
que cette estimation n ' es t pas biaisee (elle ne contient pas d ' e r r eu r sys tema t i que ) , ce qu i
signifie que sa va leur moyenne e s t egale a T :
Pour demon t re r ce res u l ta t , ca l cu lons la va leur moyenne de T e n utilisant la forme expl ic i te
de la distribution de Maxwe l l (151). La va leur moyenne du car re de la v i tess e pour chaquemolecule i, e s t d ' a p res (27 ) , ega le a
O n obtient, ainsi pour
Le paramet re T n 'es t pas biaise, done,
De m e m e , on ca lcu le l a va r iance de ce pa rame t re en utilisant la procedure appl iquee pour
obtenir la formule (84) :
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 142/15
140 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Pour obtenir ce resu l ta t , nous avons utilise I ' i ndependance des va r iab les Vi e t le fait q u e ,
d 'ap res ( 2 7 ) ,
D 'apres la fo rmu le de Crame r -Rao -Freche t , la var iance de la t e m p e r a t u r e e s t donnee par
O n peut ca l cu le r fac i l ement la denomina teu r de cette express ion :
Ainsi , dans l e cas de la distribution de Maxwe l l , I'inegalite dev ien t I 'egal i te .
O n voit que I 'es t imat ion de la t e m p e r a t u r e defmie par (152) est une es t ima t ion non biaisee
e t e f f i cace .
O n peut a isement ver i f ie r que la condi t ion (149) es t sat is fa i te et que la v r a i s e m b l a n c e
peut encore s ' ec r i re sous la forme (150). IMous la issons au l ec teur le soin de re t rouver lava l eu r de A cor respondante a ins i que le coe f f i c i en t de norma l i sa t ion .
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 143/15
C O N C L U S I O N
En conclusion, on retiendra les points suivants.
Le probleme de la determ ination de la valeur d 'une grandeur physique est inseparable
de celle de son incertitude car toutes deux font partie d 'une description unique entermes de probabili tes. En util isant ce langage probabiliste, nous ne pouvons plus
repondre facilement a la question par laquelle nous avons commence cet ouvrage :
"Quelle est la valeur de telle grandeur ?" M ais en donnan t com me reponse la valeur et
son erreu r (et les autres p arametres si , par exe m ple, la distr ibutio n de pro babili te n'est
pas gaussienne), nous apportons une inform ation plus riche et surto ut plus coherente.
Sans connaitre 1'incertitude il est impossible de savoir si Ton peut avoir confiance
en une valeur mesuree : avons-nous obtenu seulement un ordre de grandeur ou
avons-nous reussi a avoir plusieurs chiffres significatifs ? C'est 1'incerti tude qui donne
1'information sur la fiabilite des resultats et sur leur quali te.
On comprend ainsi qu'il est toujours necessaire d'avoir une estimation, meme grossiere,
de 1'erreur exper imentale . En fait , la de te rmina t ion de 1'incerti tude n'est pas plus dif-
ficile que la determination de la valeur elle-meme. L' incert i tude est evaluee avec sa
propre precision. C'est tres important dans les applications car il doit y avoir adequa-tion entre la methode choisie pour obtenir la valeur moyenne avec son erreur et laprecision recherchee : il ne faut pas utiliser des methodes lourdes et complexes si 1'on
cherche une precision de 10%.
L'approche statistique est une approche extremement puissante et informat ive , mais
elle a ses limites : elle doit etre appliquee avec beaucoup de precaut ions au x erreurs
system atiques qui m ette nt en jeu des param etres plus difficiles a analyser.
Finalement, il faut souligner que rien ne peut remplacer le bon sens de 1'experimen-ta teur , ni dans le choix de la methode d'analyse ni dans 1'appreciation des resultats.
Nous esperons que les differents aspects qui ont ete abordes contr ibueront a demystifier
un domaine qui rebute souvent le s exper imentateurs . II existe, certes, une l i t terature
abondante sur ce domaine, notamment dans le s pays anglo-saxons, mais souvent tres
specialisee ou dispersee. Quelques ouvrages de reference sont donnes dans la biblio-graphic pour permettre d'approfondir certaines questions ou pour trouver d'autres
exemples d'application, mais les problemes les plus courants o nt ete t rai tes dans cet
ouvrage volontairement synthetique.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 144/15
Cette page est laissée intentionnellement en blanc.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 145/15
B lB L IO G R A P H IE
R . J . B a r l o w , "A Guide to the U se of Statistical Methods in the Physical Sciences",
Jo nh W iley fe Sons, Chich ester , New Y ork , B risbane, Toronto, S ingapo re, 1989.
E. Be lor izky , "Probabilites et statistiques dans les sciences experiment ales", Nath an ,
Paris, 1998.
G . Cowan , "Statistical Data Analysis", Clarendon Press, Londres, 1987.
D.J . Hudson, "Lectures on Elementary Statistics and Probability", CERN 63-29,
1963 ;
D.J . H udson, "Statistics Lectures II: Maximum Likelihood and Least Squares Theory",
CERN 64-18, 1964.
L. Lyons, "A practical guide to Data Analysis fo r Physical Sciences Students", Cam-
bridge University Press, Oxford, 1991 ;
L. Lyons , "Statistics fo r nuclear and particle physicists", Cambridge University Press,
Oxford, 1986.
M . N eui lly e t CETA M A, "Modelisation et estimation des erreurs de mesure", Lavoisier ,
Technique et Documentation, Londres, Paris , New York, 1998.
M . R . Spiegel, "Theorie et applications de la statistique", Mc-Graw-Hi l l , Londres, 1987.
G .L . Squires, "P ractical P hysics", M cG raw -H ill , Lo ndres, 1968.
B .N. Tay lor, Ch .E . Kuy at t , "Guidelines for Evaluating and Expressing the U ncertainty
ofNIST Measurement Results", NIST Technical Note 1297, 1994
(h t tp : / /phys ic s .n i s t .gov /cuu /Uncer ta in ty /b ib l iog raphy .h tml ) ;
"Guide pour ./'expression de 1'incertitude de mesure", B I P M , CEI, FICC, ISO,
O I M L , U ICPA, U I P P A , ISB N 92-67-20188-3, 1995
(http://www.iso.ch/iso/fr/prods-services/otherpubs/Metrology.html).
B . L . Van der Waerden, "Statistique mathematique", Dunod, Paris, 1967.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 146/15
Cette page est laissée intentionnellement en blanc.
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 147/15
I N D E X
"Addition" de deux mesures 99
Ajus tement des parametres 119
Chiffres significatifs 78
Coefficient de correlation 24, 127
Coefficient de Student 91, 97
Comparaison de deux resultats 96
Correlations 23, 57, 125
Covariance (voir aussi m atrice de covariance) 29
Degre de l iberte 91, 97, 127, 130
Distr ibution binomiale 3 1 , 4 9
D istrib utio n constante 18, 66
Distribution gamma 40, 89
Distr ibut ion de Gauss (normale) 25, 42, 89Distr ibution de Lorentz (d e Cauchy) 37, 45, 89
Distr ibution de M axw ell 25, 84, 139
D istrib utio n de Poisson 34, 49, 89
Distribution de Student 87, 89, 90
Distr ibut ion x2
82, 89, 127, 130
Ecart quadrat ique moyen 77
Ecart-type 18
Echantillon 76
Erreur 8
Erreur systematique 9, 101, 105, 116
Estimation 119
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 148/15
1 4 6 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
Estimation biaisee 120, 140
Estimation efficace 120, 140
Fonction de distribution 16, 17
Fonction de distribution de plusieurs variables 20
Fonction generatrice des moments 19
Fonction generatrice des moments centraux 20
Incertitude d'appareil 9, 102
Incertitude naturelle 8, 101
Incertitude statistique 9, 116
Intervalle de confiance 72, 91
Matrice de covariance 57, 125
Methode de moindres carres (%2) 122
Methode de maximum de vraisemblance 131
Moments 19
Moments centraux 19
Moyenne 17
Moyenne experimentale 76
Niveau de confiance 72, 91
Probabilite 11
Propagation des erreurs 51, 53
Precision de la variance experimentale 78
Theoreme central limite 42
Variable (grandeur) continue 14, 16, 17
Variable (grandeur) discrete 14, 16, 17
Variables independantes 13, 21, 23
Variance 18
Variance experimentale 77
Vraisemblance 132
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 149/15
T A B L E D E S M A T I E R E S
Preface 5
Pourquo i les inc ertit ude s existent-elles ? 7
Chapitre 1. Rappels sur la theor ie des prob abili tes 11
1.1. Probabilites 11
1.1.1. Definitions et proprietes 11
1.1.2. Grandeurs discretes et continues, fonction de distribution 13
1.1.3. Proprietes de la fonct ion de dis tr ibut ion 17
1.1.4. Fonction de dis tr ibut ion de plusieurs variables 201.1.5. Correlations 23
1.2. Di stribu tion de Gauss 25
1.3. Auitres distributions elementaires 30
1.3.1. Distribution binomiale 31
1.3.2. D istrib utio n de Poisson 34
1.3.3. Distribution de Lorentz 37
1.3.4. Dis tributio n gam m a 40
1.4. Theoreme central limite 42
Chapitre 2. Fonctions d'une variable aleatoire 51
2.1. Propagation des erreurs 51
2.1.1. F ormu le de propagation des erreu rs 51
2.1.2. Exemples de propagation des erreurs 53
2.1.3. Cas des variables correlees 57
2 . 2 . Distribution de probabilite d'une fonction de variable aleatoire 61
2.2.1. Fonction biunivoque 61
2.2.2. Cas general 62
2.2.3. Exemple physique 64
5/9/2018 Analyse statistique des donn es exp rimentales - slidepdf.com
http://slidepdf.com/reader/full/analyse-statistique-des-donnees-experimentales 150/15
1 4 8 A N A L Y S E S T A T I S T I Q U E D B S D O N N E E S E X P E R I M E N T A L E S
2.2.4. Precision de la fo rmule de propagation des erreurs 67
2.3. Niveau de confiance et intervalle de confiance 71
Chapitre 3. Experiences avec un nombre l imite de mesures 75
3.1. Echantillon, valeur moyenne e t ecart - type 75
3.1.1. Definitions et proprietes 76
3.1.2. Precision de la variance experimentale et chifFres significatifs .. 78
3.1.3. Distr ibut ion x2
82
3 . 2 . Dis t r ibu t ion de Student 87
3.2.1. Petit nombre de mesures 903.3. Deux resultats experimentaux 96
3.3.1. Com paraison de deux resultats exp erim entau x 96
3.3.2. " Addit ion " de deux resultats exper imentaux 99
3.4. A utre s sources d'e rre urs 101
3.4.1. Inc ertitu de s d'appare il 102
3.4.2. Erreurs systemat iques 105
3.4.3. Comment eviter les erreurs systemat iques ? 109
3.4.3. Comment travailler avec les erreurs systematiques ? 115
Chapitre 4. Ajus t em en t des parametres 119
4.1. M eth ode des m oindres carres 122
4.1.1. Idee de la methode des m oindre s carres 122
4.1.2. Exemple d'une fonction lineaire 128
4 . 2 . Methode du m axim um de vraisemblance 131
4.2.1. Idee de la m eth od e du m axim um de vraisemblance 131
4.2.2. Inegalite de Cramer-Rao 134
Conclusion 141
Bibliographie 143
Index 145
Table des matieres 147