47
INFOS Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel ® ainsi que des tables statistiques. Ces classeurs permettent d'illustrer les différents outils statistiques présentés dans l'ouvrage : Roger JOURNEAUX Traitements des mesures Editions Ellipses INFOS............................................................................................................................................... 1 A . Gestion des feuilles Excel ® .................................................................................................... 2 La gestion des erreurs............................................................................................................. 2 La gestion des graphes............................................................................................................ 3 Le classeur " graphe "............................................................................................................. 6 B. Descriptif des classeurs Excel ® . .............................................................................................. 8 TABLES ......................................................................................................................................... 25 Loi normale........................................................................................................................... 26 Loi de Student. ...................................................................................................................... 28 Loi du CHI2. ......................................................................................................................... 30 Loi de Snedecor..................................................................................................................... 32 Comparaison de deux étendues............................................................................................. 36 Test de Wilcoxon Mann Whitney........................................................................................... 39 Test de Wilcoxon. .................................................................................................................. 40 Test des corrélations des rangs de Spearman....................................................................... 41 Test de Kolmogorov-Smirnov................................................................................................ 42 Test du carré des différences successives. ............................................................................ 43 Test des signes....................................................................................................................... 44 Test de Cochran. ................................................................................................................... 45

Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

Embed Size (px)

Citation preview

Page 1: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

INFOS

Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. Ces classeurs permettent d'illustrer les différents outils statistiques présentés dans l'ouvrage :

Roger JOURNEAUX

Traitements des mesures Editions Ellipses

INFOS............................................................................................................................................... 1

A . Gestion des feuilles Excel® .................................................................................................... 2

La gestion des erreurs............................................................................................................. 2

La gestion des graphes............................................................................................................ 3

Le classeur " graphe "............................................................................................................. 6

B. Descriptif des classeurs Excel®. .............................................................................................. 8

TABLES......................................................................................................................................... 25

Loi normale........................................................................................................................... 26

Loi de Student. ...................................................................................................................... 28

Loi du CHI2. ......................................................................................................................... 30

Loi de Snedecor..................................................................................................................... 32

Comparaison de deux étendues............................................................................................. 36

Test de Wilcoxon Mann Whitney........................................................................................... 39

Test de Wilcoxon. .................................................................................................................. 40

Test des corrélations des rangs de Spearman....................................................................... 41

Test de Kolmogorov-Smirnov................................................................................................ 42

Test du carré des différences successives. ............................................................................ 43

Test des signes....................................................................................................................... 44

Test de Cochran. ................................................................................................................... 45

Page 2: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

2 infos

A . Gestion des feuilles Excel®

Ces pages donnent quelques indications concernant la gestion des feuilles Excel® proposées. Certaines restrictions sont présentes dans certaines applications liées au nombre limité des

cases dans Excel® 97. Pour les modifier, il faut aller dans la macro correspondante : les restrictions sont au début après les entrées liées au nombre d'itérations, en particulier dans les simulations qui sont d'autant plus fiables que ces nombres sont élevés.

La gestion des erreurs.

Il peut arriver que les macros engendrent une erreur à cause d’une donnée mal choisie. Ceci est en particulier possible dans les programmes par itération (régressions) parce que des conditions initiales sont mal adaptées. Un message est alors affiché :

Eliminer d’abord la fenêtre en cliquant sur " débogage " qui indique où s’est produite

l’erreur et affiche l’éditeur Visual Basic. Pour relancer la macro, il est nécessaire de réinitialiser les calculs en activant la fenêtre Exécution/Réinitialiser.

Dans certains cas, un message apparaît pour signaler une particularité qui interrompt le programme.

Il faut alors cliquer sur OK et modifier l’entrée mal choisie puis relancer la macro. Le message peut simplement indiquer qu’une partie seulement du programme peut être

exécutée, par exemple dans les régressions si les variances ne sont pas données et que seul le traitement classique est possible.

Page 3: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 3

Il suffit de cliquer sur OK et le programme se poursuit avec les restrictions indiquées.

La gestion des graphes.

Les représentations graphiques sont en général gérées par une macro, ce qui permet en particulier d’adapter certains choix en fonction des grandeurs manipulées. Il est possible de remettre en cause ces choix en modifiant les paramètres du graphe.

Les titres.

Les titres ou légendes des axes peuvent être précisés par l’utilisateur. Pour cela, cliquer sur le graphe, activer la fenêtre Graphique/Options du graphique/Titres. La fenêtre suivante (ici partiellement reproduite) permet d’entrer le titre et le nom des ordonnées.

La fenêtre quadrillage permet de l’adapter au problème traité. Ces titres peuvent être affichés avec la police adaptée. Pour cela, double-cliquer sur le titre

en question et ouvrir la fenêtre Police qui permet de faire le choix. On peut aussi, avec la fenêtre Alignement faire pivoter le titre.

On peut aussi modifier les noms des différentes courbes en cliquant sur le graphe et en activant la fenêtre Graphique/Données source/Séries. On choisit à gauche la série concernée et on place dans la partie droite le nom retenu. Ne pas modifier les deux cases inférieures qui sont gérées par la macro.

Page 4: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

4 infos

La nature du graphe peut aussi être modifiée avec certaines précautions. La plupart des

représentations sont du type " nuage de points ". Les points sont souvent isolés, avec des couleurs et formes données.

On peut, pour des questions de clarté, surtout si plusieurs courbes sont sur le même graphe, modifier l’aspect du graphe. Pour cela, cliquer sur le graphe et activer Graphique/Type de

graphique. La fenêtre ci-dessous apparaît et permet de choisir de relier les points avec ou sans lissage, avec ou sans les points expérimentaux représentés. Une fenêtre indique la nature de l’opération.

On peut également modifier l’aspect des points en cliquant toujours sur le graphe et en

plaçant la souris sur un point de la série à modifier. Quand l’infobulle apparaît, double cliquer et la fenêtre ci-dessous permet les modifications du trait de jonction s’il existe (à gauche de la fenêtre) et le point (à droite). On peut choisir la forme (style), la taille, la couleur de l’entourage (premier

Page 5: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 5

plan) et du point lui-même (fond). On peut, à gauche, choisir également la présence ou non du trait de liaison, avec ou sans lissage. C’est l’opération analogue à celle évoquée dans le paragraphe précédent mais qui permet ici de traiter chaque série individuellement, alors que l’opération précédente était globale.

Pour certains graphes censés représenter des histogrammes, la représentation par des

courbes en nuage de points a été préférée. Il est tentant, avec la fenêtre ci-dessus Type de graphique, de passer à la représentation histogramme. On peut effectuer cette transformation, mais il faut la supprimer avant toute relance de la macro qui émettrait alors un message d’erreur (problème de gestion de l’axe des abscisses différent). On peut remarquer que cette nouvelle visualisation indique toutes les valeurs en abscisse, alors que la représention en nuage de points n’en retient que 10 (c’est un choix souvent retenu pour des questions de lisibilité). Si le nombre de classes est grand, la lecture de l’échelle devient pratiquement impossible. On peut diminuer le nombre de ces indications en abscisse en cliquant sur cet axe et en modifiant la fenêtre Format de

l’axe/Echelle/nombre d’abscisse entre les étiquettes. Toutes les modifications décrites ci-dessus ne sont pas remises en cause quand on relance la

macro

La gestion des échelles.

La plupart du temps, les échelles sont demandées dans la feuille de calcul. La macro détermine alors le format de l’écriture des nombres. Il est possible de le modifier pour mieux l’adapter à chaque cas. Pour cela, double-cliquer sur l’axe concerné (si les infos-bulles sont activées, la mention Axe des ordonnées apparaît). La fenêtre affichée permet de réaliser les modifications suivantes :

Police permet de choisir la nature des caractères, en particulier leur taille. Alignement permet d’orienter les nombres. Ces deux choix ne sont pas remis en cause en relançant la macro.

Page 6: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

6 infos

Nombre donne la nature de l’affichage par le choix de la structure du nombre (nombre classique, scientifique, pourcentage etc) et le nombre de décimales. Un exemple illustre le choix et peut aider à le faire.

Echelle permet de fixer les valeurs maximum et minimum, ainsi que l’unité principale (par défaut prise au 1/10 de l’étendue). A noter que ce choix est redondant avec celui proposé dans la feuille de calcul.

Ces deux derniers choix sont remis en cause par la relance de la macro.

Le classeur " graphe "

Il permet de traiter une représentation graphique standard. Les grandeurs en ordonnées sont au nombre de 1 (feuille 1), 2 (feuille 2) ou 3 (feuille 3). La grandeur abscisse est entrée dans la colonne B, les ordonnées dans les colonnes C, D et E selon la feuille..

Une macro permet de gérer le graphe en fonction en particulier du nombre de données choisi et des échelles sur les axes.

Chaque graphe est réalisé dans la feuille correspondante. Pour adapter à une autre feuille,

réaliser les opérations suivantes : - activer la fenêtre Options/Macros/Macros , choisir la macro (graphe1, graphe2 ou

graphe3) et cliquer Modifier dans la fenêtre. - modifier les ordres : Sheets("Feuil2").Select ActiveChart.SeriesCollection(1).XValues = "=Feuil2! et les suivants selon le choix : Feuil4 par exemple. La nouvelle feuille doit aussi contenir un graphe. On peut soit le réaliser (voir suite pour

cette tâche) soit le copier/coller à partir de la feuille correspondante. Noter son numéro pour le reporter dans la macro selon les modalités décrites plus loin.

Pour que la macro soit opérationnelle, il faut également que la nouvelle feuille contienne les

informations (données numériques) aux bonnes places. Ces données nécessaires sont : nombre de données en C20, échelles sur les axes en

H18-H21. On peut les modifier en position sur la feuille à condition de faire la modification correspondante dans la macro dans les instructions suivantes :

nmes = Range("c20")

xmax = Range("h18")

xmin = Range("h19")

ymax = Range("h20")

ymin = Range("h21") Si on change de même les colonnes de données, il faut modifier les lignes suivantes de la

macro :

Page 7: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 7

ActiveChart.SeriesCollection(1).XValues = "=Feuil1!R24C2:R" & (23 + nmes) & "C2" (pour les abscisses)

ActiveChart.SeriesCollection(1).Values = "=Feuil1!R24C3:R" & (23 + nmes) & "C3" (pour les ordonnées)

Si par exemple les données abscisses sont dans la colonne E (rang 5) à partir de la ligne 15, il faut écrire :

ActiveChart.SeriesCollection(1).XValues = "=Feuil1!R15C5:R" & (14 + nmes) &

"C5" Une ligne supplémentaire permet de tracer, pour les mêmes abscisses, une autre série

d’ordonnées :

ActiveChart.SeriesCollection(4).Values = "=Feuil2!R5C1:R" & (4 + nmes) & "C1" On note que ces valeurs sont des ordonnées Values de la série 4 Collection(4), (alors que

les abscisses sont collection(1).Xvalues), sur la feuille 2, dans la colonne 1 et à partir de la cellule 5. On peut évidemment rajouter autant d’ordonnées que l’on veut par addition d’une ligne semblable à la précédente.

Les noms attribués aux séries, au graphe et aux axes, les échelles, les polices, l’écriture des nombres sont modifiables par les techniques indiquées dans l’annexe Gestion des graphes.

Quels que soient les choix, il est impératif de ne pas effacer les graphes. On peut éloigner celui qui n’est pas utilisé de la zone de travail.

En cas d’effacement accidentel, essayer de rattraper l’erreur par la fenêtre Edition qui permet de revenir en arrière en annulant les ordres antérieurs. Si l’opération échoue, il faut redéfinir un graphe par :

- Insertion /Graphique et choisir Nuages de points - Suivant /Séries fait apparaître la fenêtre du choix des données par Ajouter.

Les trois cases contiennent, de haut en bas : - le nom de la série - les valeurs à porter en abscisse - les valeurs à porter en ordonnée

Ces deux dernières informations sont de la forme : =Feuil1!$B$24:$B$28

où on reconnaît le numéro de la feuille et la plage de cellules. On peut cliquer sur Suivant pour entrer les noms du graphique et des coordonnées, puis

ensuite sur Fin. Le graphe est opérationnel mais il faut connaître son numéro pour le reporter dans la macro.

Pour cela, cliquer (partie droite de la souris) sur le graphe pour le sélectionner et activer Affichage/Fenêtre graphique. Son numéro est indiqué. Il faut alors revenir à la macro et adapter la ligne :

ActiveSheet.ChartObjects("Graphique 1").Activate

Page 8: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

8 infos

B. Descriptif des classeurs Excel®.

Certaines feuilles des classeurs décrites réalisent des simulations impliquant un grand nombre de calculs par itération. Pour diminuer le plus possible les temps de calcul, il est recommandé de passer dans la mode "calcul sur commande" en activant la fenêtre "outils/options/calcul" et activer le mode de calcul "sur ordre". A la fin de la simulation, si on veut effectuer une tâche non gérée par la macro, il suffit d'appuyer sur la touche F9.

Dans certains cas, des cellules affichent des résultats intermédiaires à chaque itération. Il est recommandé alors de placer ces cellules en dehors de la fenêtre, l'affichage étant une perte de temps.

Classeur “abersim“

Il est utilisé au chapitre 3 où est abordé le problème des valeurs aberrantes (voir le classeur “unegrand“ où les tests sont utilisés).

Ce classeur produit par simulation une série d'échantillons (nombre choisi en C8) de taille choisie en C9. Les nombres sont extraits d'une population dont la loi de probabilité (qu'on peut choisir en H6) est gaussienne, uniforme ou triangulaire. Il est recommandé de choisir un nombre d'échantillons élevé (au moins 1000 mais moins de 65000)

Pour chaque échantillon, la valeur maximum est considérée comme valeur aberrante possible et on en déduit la quantité a introduite dans le test de comparaison à la moyenne (feuille 1), de Grubbs (feuille 2). Les valeurs ainsi calculées sont triées par ordre décroissant. Un tableau donne les valeurs de a qui ont un certain pourcentage d'être dépassées en fonction de la loi de probabilité, de la taille de l'échantillon et du nombre de simulations. On peut trouver la valeur de a pour un pourcentage quelconque choisi en H13., ou inversement la probabilité liée à une valeur de a .

Un histogramme permet de visualiser la loi de répartition de la grandeur a. Si les simulations pour les trois lois de probabilité sont effectuées, on peut avoir une

représentation graphique comparant les valeurs limites pour ces trois lois. Ce graphe n'est pas géré par une macro. On l'actualise en actionnant la touche F9.

Classeur “alea“

Il est utilisé au chapitre 10. La feuille 1 effectue deux tests permettant d'évaluer le caractère aléatoire d'une série de

mesures. Les deux tests choisis sont le test du carré des différences successives et le test des signes.

Dans les deux cas, la valeur de la grandeur caractéristique est donnée, ainsi que la valeur de u qui suit une loi normale si la taille de l'échantillon est suffisamment grande (environ 20). La probabilité d'être dépassée fournie doit donc être remplacée par celle donnée par une table (partie droite de la feuille) si la taille est inférieure à 20.

Les feuilles 2 et 3 effectuent des simulations qui permettent de retrouver les lois de probabilité suivies par les grandeurs calculées dans les deux tests du caractère aléatoire d'une suite: le test du carré moyen des différences successives (feuille 2) et des signes (feuille 3).

Dans chaque cas, on choisit la taille de l'échantillon, le nombre d'itérations utilisées pour la simulation, la loi de probabilité de la population dont sont extraits les échantillons (gaussienne, loi uniforme ou triangulaire). La grandeur caractéristique est affichée pour chaque échantillon. puis ces valeurs sont alors classées, ce qui permet d'avoir accès à leur loi de répartition.

Dans la feuille 2 ces valeurs sont alors classées, ce qui permet d'avoir accès à leur loi de répartition. On en déduit, pour plusieurs taux choisis, la valeur limite de la grandeur a. On peut aussi choisir un pourcentage et en déduire la valeur correspondante.

La feuille 3 traite du cas du test des signes. La grandeur caractéristique N est analysée par son histogramme, ce qui permet d'en déduire

les pourcentages pour chaque valeur ainsi que les pourcentages cumulés.

Page 9: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 9

Classeur “anacpr“

Ce classeur est utilisé au chapitre 12. Il propose une analyse en composantes principales pour un ensemble d'individus colonnes et

lignes. Chaque colonne représente les valeurs prises par une variable numérique. Chaque ligne représente un individu pour qui on a mesuré les valeurs des différentes variables. Les lignes et colonnes ne sont donc pas interchangeables.

Les résultats sont présentés dans les feuilles 2 à 9. Un lien hypertexte permet de choisir la représentation : résultats numériques (feuille 1), représentation graphique des individus lignes (3 à 5), colonnes (6 à 8) ou réunis (9). Chaque représentation graphique propose deux versions. La première affiche les noms mais les coordonnées sont arrondies, ce qui conduit à des ex-æquo dont la liste est donnée à droite du graphe. La deuxième représente les variables en vraie grandeur.

Classeur “anafacto“

Ce classeur est utilisé au chapitre 12. Il propose une analyse factorielle des correspondances pour un ensemble d'individus

colonnes et lignes. Chaque case représente les valeurs prises par une variable non numérique. Chaque ligne représente en général un individu pour qui on a mesuré les valeurs des différentes variables colonnes. Les lignes et colonnes sont interchangeables compte tenu de la nature des variables.

Les résultats sont présentés dans les feuilles 2 à 9. Un lien hypertexte permet de choisir la représentation : résultats numériques (feuille 1), représentation graphique des individus lignes (3 à 5), colonnes (6 à 8) ou réunis (9). Chaque représentation graphique propose deux versions. La première affiche les noms mais les coordonnées sont arrondies, ce qui conduit à des ex-æquo dont la liste est donnée à droite du graphe. La deuxième représente les variables en vraie grandeur.

Classeur "anova "

Utilisé dans le chapitre 9. Il traite l’analyse de variance pour des variables d’intervalle (attachées aux grandeurs

mesurables). La feuille 1 traite le cas de l’analyse simple sur 50 grandeurs entrées en colonnes D à BA. Il

faut également entrer le nombre de colonnes utilisées. Les résultats sont constitués par les carrés moyens du modèle (B) et de l’erreur (W), du

coefficient de Snedecor ainsi que sa probabilité d’être dépassé. Un message donne la conclusion au risque 5%.

La feuille 2 traite le cas de l’analyse de variance double pour un tableau de 200 lignes et 50 colonnes maximum, avec 100 termes maximum pour chaque case.

Compte tenu du caractère complexe de la structure des données, une macro permet de présenter le tableau à remplir en fonction des nombres de lignes, colonnes et termes de chaque case.

Il faut entrer également les noms des facteurs, ainsi que la nature de leur modalité (fixe ou aléatoire)

Les résultats donnent en particulier les coefficients F de Snedecor pour l’interaction et les deux facteurs (compte tenu de la nature des modalités), avec la probabilité d’être dépassés. Une conclusion est donnée au risque 5%.

A partir des la colonne BA sont également donnés des résultats intermédiaires : les moyennes des lignes, colonnes et cases.

Une condition d’utilisation des programmes précédents est que les échantillons puissent être considérés comme extraits de populations de même variance. La feuille 3 permet une telle étude.

On peut traiter 100 échantillons maximum de tailles inférieures à 1000. Le test de Bartlett est effectué, avec ses conclusions en colonne O. On donne également les

variances de tous les échantillons.

Page 10: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

10 infos

Le test de Cochran est effectué si tous les échantillons ont même taille. Si le degré de liberté et le nombre d’échantillons sont inférieurs à 20, les conclusions du test sont données au risque 5%. Sinon, il faut consulter la table de Cochran (à partir de la colonne HA) et faire une interpolation.

Un tableau donne par ailleurs tous les coefficients de Snedecor pour les combinaisons des échantillons deux à deux (à partir des colonnes DB).

La feuille 5 permet de retrouver par simulation une estimation des valeurs limites du coefficient utilisé dans le test de Cochran.

On choisit la taille commune aux échantillons (C12) ainsi que leur nombre (C13). On simule alors ces échantillons un grand nombre de fois (choix en C15) par extraction d'une loi de probabilité gaussienne, rectangulaire ou triangulaire (choix en H10).

Le coefficient est calculé pour chaque itération, l'ensemble est ordonné (colonne B). On en déduit les valeurs limites pour un certain nombre de risques donnés. On peut également choisir un pourcentage et en déduire la valeur de k, ou une valeur de k et en déduire la probabilité correspondante.

Classeur “approx“

Il permet une recherche des coefficients de régression par approximation dans le cas de la méthode de la variance.

La feuille 1 propose la recherche manuelle des coefficients a et b pour une régression sur la fonction linéaire : y=ax+b.

On cherche à minimiser la somme [ ]2iii ybaxwS ∑ −+= , xi et yi valeurs expérimentales.

Les poids sont les valeurs inverses des quantités:

)()( xVarayVar 2+

On choisit, entre C15 et C18, les fourchettes pour les coefficients a et b. On en déduit 11*11 couples (a,b) par découpage des fourchettes ainsi choisies en 10 sous-intervalles. La valeur minimum de la somme est repérée et deux nouvelles fourchettes en sont déduites qui remplacent les anciennes. On peut ainsi réduire les intervalles pour en déduire la meilleure estimation des grandeurs S, a et b.

La feuille 2 propose la même technique de recherche manuelle des coefficients a et n pour

une régression sur la fonction puissance : naxy = .

On choisit, entre C15 et C18, les fourchettes pour les coefficients a et n. Le déroulement des opérations se fait comme dans la feuille 1.

Classeur “cahlc“

Ce classeur est utilisé au chapitre 12. Il propose une classification ascendante hiérarchique pour un ensemble d'individus colonnes

et lignes. Chaque case représente les valeurs prises par une variable non numérique. Chaque ligne représente en général un individu pour qui on a mesuré les valeurs des différentes variables colonnes. Les lignes et colonnes sont interchangeables compte tenu de la nature des variables et la classification porte sur les deux types de variables.

Les résultats sont présentés dans les feuilles 2 à 13. Un lien hypertexte permet de choisir la représentation.

Les résultats numériques et les agglomérations successives sont données respectivement pour les colonnes et lignes selon le critère de regroupement du saut maximum (feuille 2 et 5), du saut minimum (3 et 6) et de la moyenne pondérée (4 et 7). Chaque feuille donne, de gauche à droite, les ensembles successivement agglomérés (compositions, tailles, distances), la composition des regroupements successifs, la composition des ensembles agglomérés en fonction du niveau de la ramification et le tableau des distances initiales

Les feuilles 8 à 13 donnent une représentation graphique pour ces mêmes situations.

Classeur “cahmes“

Ce classeur est utilisé au chapitre 12.

Page 11: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 11

Il propose une classification ascendante hiérarchique pour un ensemble d'individus colonnes et lignes. Chaque colonne représente les valeurs prises par une variable numérique. Chaque ligne représente un individu pour qui on a mesuré les valeurs des différentes variables. Les lignes et colonnes ne sont donc pas interchangeables. La classification porte sur les variables lignes pour lesquelles une distance euclidienne est possible.

Les résultats sont présentés dans les feuilles 2 à 7. Un lien hypertexte permet de choisir la représentation.

Les résultats numériques et les agglomérations successives sont données pour le critère de regroupement du saut maximum (feuille 2), du saut minimum (3) et de la moyenne pondérée (4). Chaque feuille donne, de gauche à droite, les ensembles successivement agglomérés (compositions, tailles, distances), la composition des regroupements successifs, la composition des ensembles agglomérés en fonction du niveau de la ramification et le tableau des distances initiales.

Les feuilles 5 à 7 donnent une représentation graphique pour ces mêmes techniques de

regroupement.

Classeur "compar"

Utilisé dans le chapitre 9. Permet de comparer des séries de résultats expérimentaux en fonction de la nature des

variables. La feuille “student“ permet la comparaison de deux échantillons de variables d’intervalle

normales par deux voies : le t de Student et l’utilisation des étendues. Deux tests sur les variances (Snedecor et étendues) sont effectués pour vérifier la validité

des tests ci-dessus. Si le nombre de données est le même pour les deux échantillons, le résultat est aussi

présenté pour les données considérées comme pairées . Les deux tests peuvent donner des résultats différents. C’est l’utilisateur qui choisit la bonne

hypothèse : données pairées ou non. La feuille “WMW“ effectue le test des rangs de WILCOXON-MANN-WHITNEY pour des

données non pairées, non gaussiennes ou ordinales. La feuille “wilcox“ effectue le test des rangs de Wilcoxon pour des échantillons pairés. Pour ces deux tests, une quantité z (qui suit une loi normale) est calculée quelle que soit la

taille des échantillons et donne des résultats acceptables quand les tailles sont supérieures à 10. Dans le cas contraire, il faut consulter la table correspondante disponible à partir de la colonne T.

La feuille “signes“ effectue le test des signes. On calcule le minimum des sommes positive ou négative des signes, ainsi que la probabilité

de ne pas être dépassée par la loi binomiale. La feuille "etend" permet de comparer deux moyennes et deux dispersions par utilisation

des étendues de deux échantillons (voir chapitre 9 pour les détails des tests). La comparaison des deux moyennes donne la valeur de a qui compare la différence des

moyennes à une dispersion moyenne. Au taux 1%, une table donne les valeurs critiques en

fonction de 1n et 2n tailles des échantillons. Pour d'autres effectifs ou taux de confiance, réaliser

une simulation dans la feuille 5. Le rapport des étendues supérieur à 1 est donné en H35. Le comparer à la valeur critique

(taux 5%) du tableau, en tenant compte de l'indication des effectifs numérateur/dénominateur en J35 et J36. Pour une étude plus précise, utiliser la simulation de la feuille 6.

Page 12: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

12 infos

Les feuilles 1 et 2 contiennent en réserve des tableaux de nombres utilisés dans les feuilles “WMW“ et “wilcox“ à utiliser en cas d'effacement accidentel de ces tableaux dans les feuilles correspondantes.

Les feuilles 3 et 4 permettent d'évaluer les valeurs limites utilisées dans les tests de Wilcoxon-Mann-Whitney (feuille 3) et Wicoxon (feuille 4) par une méthode de simulation.

On choisit en feuille 3 la taille des deux échantillons et le nombre de cas simulés. On calcule

à chaque itération les sommes 1S et 2S pour chaque lot de mesures. Deux histogrammes de ces

grandeurs permettent d'en déduire les probabilités d'occurrence et les probabilités cumulées. On choisit en feuille 4 la taille commune des deux échantillons et le nombre de simulations.

Les sommes +S et −S sont calculées et traitées comme dans la feuille précédente.

Les feuilles 5 et 6 présentent des simulations concernant les grandeurs caractéristiques utilisées dans la feuille "etend".

La feuille 5 permet d'évaluer les valeurs limites utilisées dans le test de comparaison de moyennes avec les étendues comme indices de dispersion.

La feuille 6 permet d'évaluer les valeurs limites utilisées dans le test de comparaison de deux étendues considérées comme indices de dispersion.

Classeur "correlat "

Utilisé dans le chapitre 8. La feuille 1 traite du cas des grandeurs mesurables. On peut analyser jusqu’à 20 colonnes de 1000 données. Un tableau donne, pour tous les couples d’échantillons non vides, le coefficient de

corrélation, le t de Student et la probabilité d’être dépassé. On peut choisir un couple de données et obtenir la représentation graphique d’une des

grandeurs en fonction de l’autre. La feuille 2 détermine les coefficients de corrélation des rangs de Spearman pour un lot

d'échantillons comme en feuille 1. Ce test est en particulier applicable au cas de grandeurs ordinales. Les coefficients de Student associés sont donnés, avec la probabilité d’être dépassés. Si la taille des échantillons est faible (<20), consulter de préférence la table donnée sur la droite de la feuille.

A partir de la colonne AS sont également donnés des résultats concernant les rangs pour chaque variable.

La feuille 4 permet de retrouver les valeurs limites pour le test de Spearman par une méthode de simulation.

On choisit la taille de chacun des deux échantillons (C18) et le nombre de simulations (C19). Les valeurs simulées sont extraites d'une population dont la loi de probabilité est choisie (H12).

Les valeurs du coefficient de corrélation de Spearman sont calculées puis ordonnées. On en déduit les valeurs possibles et leur pourcentage cumulé.

Classeur "deviat"

Utilisé dans le chapitre 6. Il permet, à partir d’une série de résultats expérimentaux donnant la déviation par un prisme

en fonction de l’angle d’incidence, de trouver le couple angle du prisme-indice de réfraction de la substance.

La feuille 1 effectue les calculs par une régression générale à solution non linéaire. Il faut entrer un couple angle-indice initial et lancer les calculs. On obtient un nouveau couple et on relance la macro jusqu’à ce que les variations des deux paramètres soient jugées négligeables. On trouve ainsi les valeurs cherchées et l’écart-type associé. Une représentation graphique déviation en fonction d’incidence est possible pour comparer les résultats expérimentaux et les valeurs issues de la régression.

Page 13: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 13

La feuille 2 permet de trouver le couple inconnu par tâtonnement. La somme des écarts quadratiques entre expérience et calculs permet d’apprécier la convergence. Les essais successifs sont mémorisés et le meilleur est retenu. On donne également le nombre de résultats du calcul inférieurs ou supérieurs aux valeurs expérimentales. Une représentation graphique illustre les résultats.

Classeur "enquet1"

Ce classeur permet de traiter une enquête de 10 questions maximum. Chaque question peut recevoir un nombre de réponses inférieur ou égal à 10, éventuellement différent pour chaque question.

Il est impératif d’entrer en feuille 1 : - le nombre d’individus testés - le nombre de questions - le nombre de réponses possibles pour chaque question traitée - le numéro de la réponse privilégiée Le codage brut (de 1 à 10) est entré dans les colonnes correspondantes. Si un nombre

supérieur à celui qui est prévu est entré, un message d’erreur est renvoyé au moment du codage présence/absence.

Pour chaque question, un tableau présence/absence est calculé en cliquant le bouton correspondant. On peut faire un traitement total avec le bouton “traitement total“ proposé.

Plusieurs traitements descriptifs sont proposés. Sur la feuille 1, on peut obtenir : - un bilan pour les réponses privilégiées par un tableau présence-absence - un bilan par question pour la réponse privilégiée - un bilan par individu - un tableau de Burt Sur la feuille 2, on obtient : - un bilan par question pour les différentes réponses possibles - un tri croisé pour le couple de questions choisi

Classeur “enquet2“

Ce classeur permet d'étudier un ensemble de données présentées sous la forme d'un codage présence-absence, et pour éventuellement deux enquêtes parallèles du type pré-test et post-test.

La feuille 2 donne les résultats pour les individus. On obtient les effectifs selon le nombre de bonnes réponses, avec histogramme, et la comparaison entre les deux enquêtes.

La feuille 3 donne les bilans par réponse : effectifs par question et effectifs par nombre de bonnes réponses.

La feuille 4 donne les trois tableaux de Burt: avant (pré-test), après (post-test) et mixte.

Classeur “etendsim“

Utilisé au chapitre 3. Ce classeur permet de comparer l'étendue d'un échantillon et l'écart-type de la population

dont il est extrait par simulation. On peut choisir trois répartitions centrées réduites : normale, triangulaire ou rectangulaire.

L'écart-type est donc égal à 1et la moyenne 0. On choisit également le nombre d'itérations, c'est à dire le nombre d'échantillons dont on fait

la moyenne des étendues. Pur une taille d'échantillons entre 5 et 12, on obtient alors la moyenne de tous les

échantillons, l'écart-type de toutes les valeurs simulées, la moyenne du rapport étendue/écart-type expérimental et la moyenne de l'étendue. Ces deux derniers nombres sont très proches, mais c'est le dernier qui répond au problème et doit être retenu.

On peut également choisir de travailler sur un seul type d'échantillon (à droite de la feuille) dont on choisit la taille (K12). Le choix de la loi de répartition et du nombre d'itérations se fait de la même façon que précédemment.

Page 14: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

14 infos

On étudie également le rapport m/∆ qui est trié en colonne J. On en déduit des probabilités d'être dépassée pour cette grandeur d’où la quantité q du

chapitre 3.

Classeur "graphe"

Ce classeur est à usage général. Se reporter à l’annexe A pour plus de détails sur ce classeur et les problèmes de gestion des graphes.

Classeur "incertAB ".

Utilisé dans le chapitre 3. La feuille 1 détermine l’incertitude totale pour des mesures caractérisées par deux

variances : la variance des incertitudes de type A et la variance associée aux incertitudes de type B en fonction du nombre de mesures. On peut traiter en même temps plusieurs exemples selon le nombre de mesures effectuées. Un graphe associé permet de comparer les parts respectives des incertitudes dans le résultat final, en particulier pour le choix du nombre de mesures à effectuer pour diminuer le rôle des incertitudes A.

La feuille 2 permet de calculer la variance attachée à la valeur d'une mesure. Cette mesure est réalisée avec un appareil dont on connaît deux causes d'incertitude:

- le nombre de digits sur chaque calibre - le pourcentage de la valeur lue On entre le nombre de mesures étudiées (D12), le nombre de digits incertitude (D13) et le

pourcentage d'incertitude de la valeur lue. Les mesures sont entrées colonne B et la valeur du digit de poids le plus faible en colonne

C (cette valeur dépend du calibre) dans la même unité que le résultat de la mesure. Les deux termes de l'incertitude, l'écart-type et la variance résultants sont donnés dans les

colonnes D à G.

Classeur “pondmes“

Ce classeur est utilisé dans le chapitre 3. La feuille 1 calcule des "moyennes" pondérées à partir de données issues de répartitions

normales ou rectangulaire (choix en E7). Ces lois ont même moyenne (choisie en E8) et des écarts-types choisis (colonne A). Chaque échantillon est de taille choisie en E5. On fixe le nombre d'échantillons traités en E6

Trois types de pondération sont utilisés : - on prend les inverses des variances calculées en colonne C à partir des écarts-types. On

obtient la moyenne pondérée au sens classique du terme. -on calcule une moyenne sans pondération -on effectue une pondération en choisissant des termes quelconques en colonne B. Ces

valeurs sont prises en tant que variances en cohérence avec le premier cas. On calcule alors les trois moyennes ainsi définies des valeurs simulées (à partir de la

colonne D), ainsi que les chi2 ∑−2i

2i mx

σ)( correspondants (colonnes G:I). On en déduit les

moyennes de ces moyennes et leurs variances (I12:K14). On calcule également les effectifs expérimentaux des classes de limites définies en colonne

M. On calcule également les effectifs théoriques des répartitions gaussiennes attendues (moyennes et variances expérimentales ci-dessus).

On en déduit les valeurs du coefficient chi2 et la probabilité d'être dépassé. Si cette probabilité est supérieure à 5%, on peut accepter le caractère gaussien des moyennes

avec ce risque. Des représentations graphiques des effectifs théoriques et expérimentaux sont disponibles à

la droite de la feuille. Entrer les valeurs extrêmes des abscisses et ordonnées.

Page 15: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 15

La feuille 2 reprend les calculs comme en feuille 1. Ici, les lois ont des moyennes différentes choisies en colonne A et des écarts-types choisis en colonne B. Chaque échantillon est de taille choisie en E5. On fixe le nombre d'échantillons traités en E6.

On peut choisir trois cas pour la loi de probabilité : gauss (1), rectangle (2) ou mixte (3). Trois types de pondération sont utilisés : - on prend les inverses des variances calculées en colonne D à partir des écarts-types. On

obtient la moyenne pondérée au sens classique du terme. -on calcule une moyenne sans pondération -on effectue une pondération en choisissant des termes quelconques en colonne B. Ces

valeurs sont prises en tant que variances, en cohérence avec le premier cas. On calcule alors les trois moyennes ainsi définies des valeurs simulées (à partir de la

colonne E). On en déduit les moyennes de ces moyennes et leurs variances (I12:K14). On calcule également les effectifs expérimentaux des classes de limites définies en colonne

M. On calcule également les effectifs théoriques des répartitions gaussiennes attendues (moyennes et variances expérimentales ci-dessus).

On en déduit les valeurs du coefficient chi2 et la probabilité d'être dépassé. Si cette probabilité est supérieure à 5%, on peut accepter le caractère gaussien des moyennes

avec ce risque. Des représentations graphiques des effectifs théoriques et expérimentaux sont disponibles à

la droite de la feuille. Entrer les valeurs extrêmes des abscisses et ordonnées.

Classeur “reglnmc“

Ce classeur calcule la pente et l'ordonnée à l'origine de la droite qui représente au mieux les points expérimentaux par une méthode exacte (voir rglinear). A partir des données x et y et de leurs variances, on effectue une simulation de type Monte Carlo pour estimer les variances des paramètres et comparer aux résultats de la régression par une méthode analogue à celle du classeur “rgexmc“.

On prend les valeurs expérimentales de x et de y comme références . On simule alors des valeurs de x et y expérimentales par addition d'une perturbation gaussienne avec les variances expérimentales choisies. On en déduit les coefficients et leurs variances, avec ou sans le terme correctif lié à S. Il faut entrer en F29 et F30 des valeurs estimées de la pente et de l'ordonnée à l'origine.

La simulation étant répétée plusieurs fois (choix de ce nombre d'itérations en L12), on en déduit les moyennes des différentes grandeurs ci-dessus, mais également les variances des échantillons de paramètres obtenus qui peuvent être considérées comme les valeurs sans biais puisque ces coefficients sont eux-mêmes non biaisés.

Classeur "regpoly "

Utilisé dans le chapitre 6. Il permet d’effectuer une régression de type polynomial sur une série de données (maximum

1000) jusqu’au degré 9. La feuille 1 propose la technique classique, avec pondération si les variances sont connues

au moins pour une grandeur. Dans ce cas, il faut introduire des coefficients initiaux qui sont recalculés et réutilisés pour les itérations suivantes. On arrête le processus quand les variations sont jugées négligeables.

Les coefficients et les écarts-types associés sont donnés. Dans le cas pondéré, la valeur du CHI2 est calculée, avec la probabilité d’être dépassée, ce qui permet de juger la validité du modèle.

La feuille 2 donne les représentations graphiques des données expérimentales et calculées.

Page 16: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

16 infos

La feuille 3 réalise la régression avec ou sans pondération mais par la technique générale à solution non linéaire. Les coefficients initiaux sont demandés, y compris pour la méthode sans pondération. Les nouveaux coefficients sont calculés et réutilisés pour les calculs suivants. On arrête le processus quand les variations sont jugées négligeables. Les mêmes résultats que sur la feuille 1 sont donnés. La feuille 4 propose les représentations graphiques.

La feuille 5 effectue la régression par la méthode exacte. Il faut entrer une estimation des coefficients qui sont ensuite déterminés par approximations successives. Les variances doivent être toutes non nulles

Dans les trois types de régression, l’interpolation pour une série de valeurs de x est effectuée, avec détermination des écarts-types. La macro utilise des résultats de la régression qui sont sur la feuille. Il ne faut pas effacer ces données pour que l’interpolation soit possible. En cas d’effacement accidentel, il faut relancer les calculs de régression.

Classeur "rgcbob "

Utilisé aux chapitres 5 et 6. La feuille 1 reprend le classeur " rglinear " adapté à un cas particulier : l’étude de la

fréquence de résonance d’un circuit bouchon constitué d’une bobine en parallèle sur une capacité connue variable. C’est un exemple de régression linéaire après changement de variable. On peut en déduire le coefficient L de la bobine ainsi que sa capacité parallèle parasite. Les deux cas, pondéré ou non, sont envisagés. La feuille 2 donne les représentations graphiques comparatives.

La feuille 4 traite le même problème mais par la technique de la régression à solution non linéaire du classeur (méthode de la variance).

Classeur "rgexmc"

Utilisé dans le chapitre 6. La feuille 1 de calcul reprend la régression par la méthode exacte (voir le classeur "rggene"). Une seconde macro (vers colonne AA) permet de faire une simulation en prenant des

valeurs de x et y perturbées par des termes d'incertitude déterminés à partir des variances de travail. Les coefficients sont alors estimés, ainsi que leur variance (colonne AD et suite). On donne également les deux variances estimées à chaque itération , avec ou sans le terme S (colonnes AE-AF et suite).

Le nombre d'itérations est choisi en AA7. La simulation étant répétée plusieurs fois, on en déduit les moyennes des différentes

grandeurs ci-dessus, mais également les variances des échantillons de paramètres obtenus qui peuvent être considérées comme les valeurs sans biais puisque ces coefficients sont eux-mêmes non biaisés.

Dans la feuille 3, on effectue des simulations comme en feuille 1 mais exploitables pour

étudier les lois de répartition des paramètres de la régression des feuilles précédentes . On obtient comme en feuille 1 les différentes sommes, les valeurs des paramètres areg,

leur variance avec ou sans le terme S ainsi que leurs moyennes. Quand cette simulation est terminée, on choisit un paramètres sur la droite de la feuille

(à partir de la colonne AQ). On obtient pour chaque simulation les deux quantités

1ect

aa01

)( −=α

2ect

aa02

)( −=α . Ces quantités sont respectivement : la valeur moyenne du

paramètre, sa valeur pour une simulation, l'écart-type avec ou sans le terme S. Ces deux lots sont triés et comparés aux deux lois de Gauss et de Student.

On obtient également les valeurs de ce paramètre (rangés en colonne AQ) qui isolent un certain pourcentage de la répartition obtenue.

On calcule également une quantité telle que α en prenant pour ect l'écart-type obtenu directement sur la population des paramètres (colonne BG).

On en déduit l'histogramme et la comparaison à une loi de Gauss conduisant au chi2.

Page 17: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 17

A droite de la même feuille, on étudie le problème de l'appartenance à un modèle d'un

couple expérimental ( 0x , 0y ) à partir des simulations précédentes.

On entre la valeur de 0x (CA22), la variance attribuée à 0y (CA23) et la variance

2

yrs (CA24) déterminée à partir de l'étude en feuille 4. La simulation consiste à fabriquer à

chaque étape une valeur de 0y par une perturbation aléatoire et gaussienne autour de la

valeur )( 0r xfy0

= (donnée en CE23), la fonction f(x) étant évaluée avec les moyennes des

coefficients obtenues par la simulation sur les coefficients (partie gauche de la feuille). De

même, la quantité )( 0r xfy0

= est calculée en prenant à chaque étape les coefficients obtenus

à chaque étape correspondante de la simulation concernant les paramètres.

On en déduit un lot de valeurs 2y

2y

r0

0r

0

ss

yy

+

−=

(α qui sont analysées. On compare

leur répartition ux lois de Gauss et Student. On peut aussi en déduire (colonnes CG,CH)

les valeurs de α limitant la loi de répartition pour des probabilités données. La feuille 4 permet d'étudier le comportement d'une variable y de régression. On utilise les

simulations de la feuille 3 qui fournissent à chaque pas les valeurs des y de régression, ainsi que leur moyenne et variance. Elles permettent d'en déduire les quantités

1ect

yy ir1

−=β et

2ect

yy ir2

−=β

pour la variable choisie par son numéro en K35.

La quantité iy représente la valeur initiale de y, c'est donc une constante pour chaque

valeur de x. Les quantités ect sont les écarts-types de la grandeur ry sans le terme S (indice 1)

ou avec (indice 2) calculés également à chaque itération. Des histogrammes de ces deux grandeurs sont calculés. Les effectifs théoriques correspondant à deux lois sont calculés : la loi normale réduite et la loi de Student de degré de liberté n-m (n nombre de points étudiés, m nombre de paramètres). Un test de chi2 est effectué pour les quatre possibilités : deux lots d'effectifs expérimentaux et deux lots d'effectifs théoriques selon les deux lois.

On effectue alors la même étude que pour les coefficients en introduisant la quantité :

ect

yy ir −=β , ect est ici l'écart-type déduit de la variance obtenue directement par la

simulation. Cette grandeur est comme précédemment confrontée à la répartition de Gauss.

Classeur "rggene"

Présenté au chapitre 6. Permet d’effectuer une régression générale soit par la méthode de la variance (feuilles 1 et

2), soit par la méthode exacte (feuilles 4 et 5). Il faut pour cela connaître la fonction de la variable x en fonction de paramètres inconnus,

les dérivées de cette fonction par rapport à la variable et aux paramètres inconnus, la dérivée seconde par rapport à x dans le cas de la méthode exacte. Cette fonction et ses dérivées doivent être entrées dans la fenêtre macro qu’on active par Outils/Macros/Macros/Modifier. La feuille 3 donne des indications sur la marche à suivre.

On entre une estimation des paramètres inconnus qui sont alors corrigés par la macro et réutilisés pour les itérations successives. On arrête les calculs quand les variations sont jugées négligeables (cas de la variance). Pour la méthode exacte, les itérations sont automatiques et stoppées quand les variations relatives des paramètres sont inférieures à 10-6.

On obtient les résultats classiques : valeurs des paramètres, écarts-types, valeurs du CHI2.

Page 18: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

18 infos

L’interpolation pour une série de valeurs de x est effectuée, avec détermination des écarts-types. La macro utilise des résultats de la régression. Il ne faut pas effacer ces données pour que l’interpolation soit possible. En cas d’effacement accidentel, il faut relancer les calculs de régression.

Les feuilles 2 et 5 donnent les représentations graphiques comparées des valeurs

expérimentales et calculées dans les deux cas de régression.

Classeur "rglinear "

Utilisé dans le chapitre 5. Il effectue les régressions linéaires soit par la méthode de la variance, soit par la méthode

exacte. La feuille 1 effectue les calculs par la méthode classique et par la technique avec

pondération si les variances sont données au moins pour la grandeur x. Dans ce dernier cas, les valeurs successives de la pente doivent être entrées jusqu’à ce que les variations soient jugées négligeables. Les valeurs calculées dans les deux cas sont à comparer aux valeurs expérimentales. Les incertitudes d’interpolation sont calculées pour tous les points expérimentaux.

Une autre macro permet de déterminer les valeurs interpolées de y et l’écart-type associé pour des valeurs de x choisies.

La feuille 2 permet de visualiser les représentations graphiques y=f(x) avec ou sans pondération, ainsi que les écarts-types pour l’interpolation dans les deux cas.

La feuille 4 effectue les calculs par la méthode exacte. Il faut alors donner les estimations de pente et ordonnée à l'origine. Ce traitement suppose que toutes les variances soient non nulles. Si certaines variances peuvent être considérées comme nulles, leur donner une valeur très faible par rapport aux autres variances pour que les calculs soient possibles.

Classeur "rgmulrlc "

Utilisé dans le chapitre 6. Ce classeur effectue une régression multiple avec changements de variable. L’impédance d’une

portion de circuit RLC série est de la forme :

22

222222

C

1L

C

L2R

C

1LRZ

ωω

ωω ++−=−+= )( .

Si on considère les variables 2Z et ω, on se trouve en présence d'une régression multiple générale

)()( ωω FfaZmk

1k

kk2 == ∑

=

=

avec C

L2Ra1A 2

1 −==)( 22 La2A ==)(

23C

1a3A ==)(

1f1 =)(ω 22f ωω =)(

23

1f

ωω =)(

La feuille 1 effectue la régression multiple correspondante. Elle donne les trois coefficients A . Les grandeurs R, L et C sont ensuite calculées. Le calcul avec pondération nécessite la connaissance préalable des estimations des valeurs de A(2) et A(3) qui sont ensuite corrigées automatiquement. Si on ne connaît pas cette estimation, il suffit de prendre une valeur quelconque non nulle : les valeurs de la régression non pondérée sont alors une bonne estimation.

On en déduit les valeurs des composants et les écarts-types, ainsi que le CHI2 dans le cas pondéré.

La feuille 2 donne les représentations graphiques comparées des valeurs expérimentales et calculées.

Page 19: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 19

La feuille 4 effectue sur les mêmes données une régression à solution non linéaire (méthode

de la variance) comme dans " rggene ". Les expressions de la fonction 22

C

1LRZ )(

ωω −+= et

des dérivées sont entrées dans la macro permettant d’effectuer la régression. Les résultats sont donnés comme en feuille 1.

La feuille 5 donne les représentations graphiques comme sur la feuille 2.

Classeur "rgmulti "

Utilisé dans le chapitre 6 Il permet une régression multiple d’une grandeur u en fonction de deux autres x et y, avec un

degré maximum choisi. L’intérêt du classeur est surtout de trouver par interpolation la valeur de u associée à un

couple (x,y) donné.

Classeur "rgngauss ".

Utilisé dans le chapitre 6. La feuille 1 permet une régression du type somme de gaussiennes par la méthode générale à

solution non linéaire. C'est l'adaptation du programme général de régression à solution non linéaire " rggene ". Les entrées des fonctions et des dérivées dans la macro sont effectuées.

Les valeurs initiales des paramètres sont entrées. Les calculs sont effectués par une macro et donnent les nouvelles valeurs qui sont réutilisées pour les calculs suivants. Les deux cas, pondéré ou non, sont considérés. On arrête l’itération quand on juge que les variations sont négligeables.

On obtient les valeurs interpolées pour une série de valeurs de l'abscisse x. La feuille 2 donne les représentations graphiques des décompositions.

Classeur "rgpuiss "

Utilisé dans les chapitres 5 et 6. La feuille 1 effectue une régression linéaire après changement de variable. On cherche la

fonction de régression sous la forme naxy = . On effectue le changement de variable u=Ln(y) et

v=Ln(x) puis une régression linéaire u=n*v+b, avec b=Ln(a). On entre une estimation de n pour les calculs pondérés et on itère les calculs jusqu’à ce que

les variations soient négligeables. On obtient les coefficients et les écarts-types, ainsi que le CHI2 dans le cas pondéré. Une représentation graphique compare les données expérimentales et calculées.

La feuille 2 effectue une régression à solution non linéaire par adaptation du classeur " rggene ". Les fonctions sont déjà entrées dans la macro. Le couple n,a initial est entré et les calculs se font par macro jusqu’à ce que les variations soient négligeables. Les résultats sont les mêmes qu’en feuille 1, ainsi que les représentations graphiques.

La feuille 3 effectue la régression par la méthode exacte. Dans les trois feuilles, un lot de valeurs de x peuvent être choisies et leurs valeurs

interpolées calculées, ainsi que les écarts-types correspondants.

Classeur "rgvarmc"

Ce classeur reprend la méthode de la variance dans les trois premières feuilles. La feuille 4 propose une simulation de cette technique de régression à partir des données

entrées comme dans la feuille 1. On choisit un nombre d'itérations en H18. A chacune de ces itérations, les données X et Y initiales sont modifiées par addition d'une perturbation gaussienne avec les variances expérimentales choisies. On en déduit les coefficients et leurs variances à chaque pas. On fournit en fin de calcul les moyennes et variances des coefficients des lots ainsi constitués. On obtient également les moyennes des variances de chaque étape qu'on peut comparer aux variances précédentes.

Page 20: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

20 infos

Classeur "spline "

Utilisé dans le chapitre 6. Si on dispose de n couples de points (x,y), on peut chercher un polynôme qui passe

exactement par tous les points. La technique des splines cubiques est utilisée ici. Elle consiste à chercher non pas un mais

plusieurs polynômes de degré 3 qui répondent localement, par exemple sur deux points, à la question posée. Il existe une infinité de solutions, mais on va imposer à deux polynômes passant par le même point d’avoir des dérivées premières égales (même pente) et des dérivées secondes égales (même courbure).

Les valeurs de x et y sont entrées dans les colonnes C et D. Le nombre de couples est choisi en B17.

Attention!! les valeurs de x doivent être rangées par ordre croissant. Si ce n'est pas le cas, effectuer cette opération par le bouton macro correspondant..

On peut ensuite obtenir les valeurs de y par interpolation sur une série de valeurs de x entrées en colonne J.

Une représentation graphique est également donnée.

Classeur "testchi2 "

Utilisé dans le chapitre 10 Il permet de calculer le coefficient CHI2 pour un tableau de contingence. Ce tableau a une

structure qui permet de visualiser, dans trois cases adjacentes : - la valeur entrée de l’effectif - la valeur théorique de l’effectif correspondant - la contribution au CHI2 de ces effectifs. Les valeurs aux marges sont également indiquées. La valeur finale du CHI2 et sa probabilité d’être dépassée sont calculées.

Classeur "testgauss "

Utilisé dans le chapitre 10. La feuille 1 permet de tester l’ajustement à une loi de Gauss pour des effectifs

expérimentaux. Ces effectifs sont entrés, ainsi que les centres des classes. On en déduit les limites de classes comme centres des intervalles.

Une première macro permet d’effectuer des regroupements si les effectifs sont inférieurs à 5. La valeur du CHI2 est alors calculée, ainsi que la probabilité d’être dépassée. Cette même macro effectue un test de Kolmogorov-Smirnov.

La droite de Henry est tracée par une autre macro. La droite de régression et son équation sont données sur le graphe.

La feuille 2 permet de calculer les effectifs associés à un ensemble de résultats expérimentaux. Les limites de classes sont choisies par l’utilisateur. Les centres des classes sont calculés comme centres des limites de classes.

Ces effectifs peuvent être traités par la feuille 1 par un collage. Pour cela, sélectionner les effectifs, copier par Ctrl-C, sélectionner la case C11 de la feuille 1 et effectuer un collage spécial par Edition/Collage spécial/Valeurs.

La feuille 4 effectue un test de Kolmogorov-Smirnov dans le cas de données non regroupées.

La feuille 5 permet de retrouver les valeurs limites mD pour le test de Kolmogorov-

Smirnov. On peut comparer les données à une distribution rectangulaire ou gaussienne.

On obtient, pour plusieurs probabilités, la valeur limite de la grandeur mD .

On peut aussi choisir une probabilité ou une valeur de mD et en déduire l'autre grandeur.

Classeur "therreur "

Utilisé dans le chapitre 2.

Page 21: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 21

Il permet d’illustrer la théorie des erreurs de Laplace. Ces trois feuilles présentent trois façons de simuler des perturbations aléatoires apportées à

une valeur "vraie" ou de référence (ici 200). La première ajoute n fois un nombre de la forme ARRONDI(2*ALEA()-1;0). Un tel nombre

peut être égal à 1, -1 ou 0, avec des probabilités respectives de 0.25,0.25 et 0.5. La deuxième génère des nombres en ajoutant n fois un nombre aléatoire compris entre -1 et

1 : 2*(ALEA()-0,5+……). La troisième génère des nombres en ajoutant n fois un nombre aléatoire de la forme : SI(ALEA()<0,5;0,5;-0,5) Ce nombre prend donc les deux valeurs possibles 0.5 et –0.5 avec des probabilités égales. Toutes ces opérations sont gérées par une macro. On choisit le nombre n qui doit être compris entre 2 et 20. Dans les trois cas, on donne les résultats suivants : - la valeur du CHI2 pour tester le caractère gaussien des effectifs trouvés - la droite de Henry - l’histogramme des effectifs expérimentaux et gaussiens théoriques.

Classeur "thlimcnt"

Utilisé dans les chapitres 1 et 3. Il permet d’illustrer le théorème de la limite centrale. La feuille 1 génère une population rectangulaire dont les bornes sont choisies. On étudie la

moyenne de nech valeurs extraites de cette population. On compare les moyennes et les écarts-types de l’ensemble du tirage et des moyennes de taille nech. Les tests de CHI2 confirment les deux lois de probabilité : rectangulaire pour les valeurs initiales et gaussienne pour les moyennes. Un histogramme illustre les résultats en comparant l’ensemble du tirage et les moyennes calculées. Deux droites de Henry concernant les moyennes et une colonne de résultats illustre la différence des lois de probabilité.

La feuille 2 présente les mêmes calculs mais à partir d’une population gaussienne. Les feuilles 3 et 4 utilisent les résultats respectifs des feuilles 2 et 1 pour illustrer les

propriétés des trois coefficients :

n

s

mt

µ−= 2

22 s

1nσ

χ )( −=

n

mz σ

µ−= .

Les grandeurs µ et σ sont les valeurs théoriques choisies dans la feuille correspondante (1 ou 2).

Pour la feuille 2 avec des résultats initiaux issus d’une loi normale, les coefficients t et 2χ

suivent bien les lois de Student et du CHI2, ce qui n’est plus le cas pour la feuille 1 dont les échantillons sont issus d’une loi rectangulaire. La quantité z suit une loi normale dans les deux cas, ce qui illustre le théorème.

Classeur "transer".

Utilisé dans le chapitre 4. La feuille 1 traite le cas particulier de la détermination d’un indice de réfraction par mesure

de l’angle de réfraction limite. L’exemple est basé sur des résultats simulés, ce qui permet, par variation des conditions, de voir les différents problèmes posés par la transmission des incertitudes. L’angle est imposé à la valeur de 40° et l’écart-type est choisi (inférieur à 20) par l’utilisateur. Les angles sont alors issus d’une loi gaussienne. On compare en particulier les indices obtenus par moyenne des indices individuels calculés ou à partir de la moyenne des angles initiaux. On compare enfin les intervalles de confiance à partir des valeurs extrêmes des angles et des indices, puis par transmission classique des incertitudes. Deux graphes visualisent les effectifs

Page 22: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

22 infos

de l’angle et de l’indice. La répartition du second est d’autant plus asymétrique que l’écart-type est grand.

La feuille 2 est un outil qui généralise les résultats précédents. On peut traiter le cas d’une grandeur fonction de n grandeurs primaires (n<10). Il faut entrer dans la macro de traitement la fonction en question et les dérivées par rapport aux grandeurs.

Comme dans la feuille 1, on effectue les calculs soit sur chaque grandeur, soit sur chaque lot de mesures (ceci dans le cas où les échantillons sur chaque grandeur sont de même taille). On donne également les différents intervalles de confiance comme dans la feuille 1.

Les feuilles 4 et 5 proposent des simulations pour illustrer les problèmes posés par ces changements de variable.

La feuille 4 traite le problème le plus simple. A partir de valeurs de x simulées (extraites d'une population normale ou rectangulaire), on effectue un changement de variable par une fonction y=f(x). Cette fonction, ainsi que ses dérivées, sont entrées par l'utilisateur dans les macros correspondantes. On choisit également la moyenne et l'écart-type, ainsi que le nombre de simulations.

On en déduit diverses grandeurs concernant les x simulés et les valeurs correspondantes de f(x), à comparer aux valeurs attendues.

On donne également deux histogrammes des grandeurs x et f(x) sur la droite de la feuille. La feuille 5 reprend une simulation analogue à partir d'une gaussienne dont on choisit les

caractéristiques. Ici, les grandeurs simulées sont regroupées en échantillons de taille également choisie. On calcule alors (colonnes B à E) pour chaque échantillon, les quantités mx (moyenne) et varx (variance). Les quantités f(mx) et les variances vary estimées par la méthode classique sont également données.

On en déduit diverses grandeurs concernant les x simulés et les valeurs correspondantes de f(x), à comparer aux valeurs attendues.

On donne également sur la droite de la feuille deux histogrammes des grandeurs x et mx d'une part, y=f(x) et y=f(mx) d'autre part.

La feuille 6 effectue une simulation mais avec la possibilité de traiter 1, 2 ou 3 variables x,

y, z avec une fonction u=f(x,yz) qui est choisie par l’utilisateur et placée dans la macro Function fxyz(x,y,z) par la méthode habituelle. On simule un grand nombre de variables x,y,z issues de populations gaussiennes de moyennes et écarts-types choisis. On étudie alors la population des u générés. On teste en particulier le caractère gaussien de cette population par un test de chi2. On peut également trouver les valeurs de u qui limitent des pourcentages choisis, ce qui permet de trouver des intervalles de confiance pour la grandeur u.

Un graphe est disponible sur la droite de la feuille.

Classeur "triangle"

Utilisé dans le chapitre 1. C’est un classeur de simulation. Il génère des nombres suivant une loi de probabilité

triangulaire à partir de la loi rectangulaire donnée par la fonction alea(). Les effectifs expérimentaux sur un tirage de x nombres (entre 100 et 5000) sont comparés

aux effectifs théoriques pour les deux lois de probabilité. Un test de CHI2 valide les hypothèses. Les histogrammes correspondants sont également donnés.

Classeur "unegrand"

Utilisé dans le chapitre 3. Il permet d’effectuer un traitement statistique (incertitudes de type A) sur les résultats de n

mesures. On calcule les indices de tendance centrale (moyenne, valeur centrale), les indices de

dispersion (variance de l’échantillon et de la moyenne, étendue, valeurs extrêmes). On en déduit l’intervalle de confiance à partir de l’écart-type et de l’étendue.

Page 23: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 23

Les valeurs maximum et minimum sont testées pour savoir si elles peuvent être considérées comme aberrantes par deux tests différents : comparaison à la moyenne et test de Grubbs.

Si le nombre de mesures est inférieur à 40, le test de normalité de Shapiro-Wilk est proposé. Sinon, la normalité peut être testée avec le classeur « testgauss ».

Le test des signes renseigne sur le caractère aléatoire de la suite de résultats. Plusieurs tableaux (entourés de rouge) contiennent des valeurs utilisées par la macro

effectuant les calculs. Il faut absolument éviter de déplacer ou effacer ces tableaux. En cas d'effacement, on les retrouve en feuille 2, ce qui permet de les recopier en feuille 1 en respectant la position.

Classeur "vardep"

Utilisé dans le chapitre 4. Il permet de traiter le cas de variables non indépendantes dans un cas particulier. C’est la situation où une valeur est obtenue à partir de mesures en progression arithmétique

et dont on veut obtenir la raison par des différences successives. Le cas le plus typique est celui de la mesure des distances parcourues par un mobile à des intervalles de temps égaux. Si la vitesse est uniforme, on se trouve bien dans le cas ci-dessus.

Les données sont entrées et on choisit le nombre d’intervalles sur lesquels on veut faire les différences.

On obtient la valeur de la moyenne et de la variance de ces différences dans le cas où on considère les grandeurs indépendantes et celui où on tient compte de la covariance. On en déduit la " vitesse " c’est à dire la raison de la progression géométrique dans les deux hypothèses.

La matrice des covariances est donnée également à titre illustratif

Page 24: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran
Page 25: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 25

Tables Loi normale. 340 Loi de Student. 342 Loi du CHI2. 344 Loi de Snedecor. 346 Comparaison de deux étendues. 350 Test de Wilcoxon Mann Whitney. 353 Test de Wilcoxon. 354 Test des corrélations des rangs de Spearman 355 Test de Kolmogorov-Smirnov. 356 Test du carré des différences successives. 357 Test des signes. 358 Test de Cochran. 359

Page 26: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

26 infos

Loi normale.

Le premier tableau donne la probabilité cumulée de -∞ à la valeur Pz (obtenue par somme d’une case de

la colonne de droite et d’une case de la ligne du haut). C’est donc la fonction de répartition de la loi normale

réduite F(z) = P(z< Pz ).

Pour Pz <0, on applique les relations F(-z)=1-F(z) et P1P zz −=

Exemple. Pour Pz =1.96, la probabilité cumulée est F=0.975 donc associée à 9750z . .

Pour Pz =-1.96, on a F=1-0.975=0.025 ce qui correspond bien à 025097501 zz .. =− .

Page 27: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 27

Ce tableau donne la valeur de Pz dont la probabilité P d’être dépassée est donnée par la somme des

contenus des cases correspondantes de la première ligne et de la première colonne. Dans un test, on obtient ainsi, pour un risque choisi (P), la valeur limite pour z calculé.

Exemple : pour la probabilité P=0.9+0.075=0.975 d’être dépassée, la valeur limite est z=1.96. Pour une probabilité inférieure à 0.5, on utilise les mêmes relations que ci-dessus. Exemple : pour la probabilité P=0.025=1-0.975 d’être dépassée, la valeur limite est z=-1.96.

Page 28: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

28 infos

Loi de Student.

Ce tableau donne la valeur limite de t pour le degré de liberté (ddl) et la probabilité d’être dépassée choisie (proba) pour un test bilatéral.

Exemple : la valeur t=4.03 a 1% de chance d’être dépassée si le nombre de degrés de liberté est 5.

Page 29: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 29

Ce tableau donne la probabilité (en %) que la valeur de t soit dépassée pour le nombre de degrés de liberté donné, dans l’hypothèse d’un test bilatéral. Les probabilités comprises entre 1 et 5 sont mises en évidence (en gras sur fond grisé). Par exemple, pour ddl=8, la valeur t=2.5 a 3.7% d'être dépassée.

Page 30: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

30 infos

Loi du CHI2.

Ce tableau donne la valeur limite du coefficient 2χ pour le degré de liberté et la probabilité d’être

dépassée choisie.

Page 31: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 31

Abaque permettant d’évaluer la probabilité d’être dépassée pour une valeur du coefficient 2χ calculé et le

degré de liberté donné.

Loi du CHI2

0

10

20

30

40

50

60

0 10 20 30ddl

chi2

20%

1%

5%

10%

0,1%

0,5%

Page 32: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

32 infos

Loi de Snedecor.

Donne la valeur de F( 1ν , 2ν ) qui possède 5% de chances d’être dépassée, en fonction des degrés de

liberté 1ν et 2ν (du numérateur 1ν et du dénominateur 2ν dans les comparaisons de variance). Si F<1, on

utilise la relation),(

),(21

12F

1F

νννν = .

Page 33: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 33

Page 34: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

34 infos

P=1%

Page 35: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 35

Page 36: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

36 infos

Comparaison de deux étendues.

Donne la valeur de ),( 21e nnF qui possède 5% de chances d’être dépassée, en fonction des tailles des

échantillos 1n et 2n pour la comparaisons des étendues 2

1eF ∆

∆= . Si eF <1, on utilise la relation

),(),(

21e12e

nnF

1nnF = .

Page 37: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 37

Loi binomiale.

Cas particulier utilisable dans le test des signes. Ces tableaux donnent la probabilité (en %) de ne pas être dépassée en fonction de la taille de l’échantillon

(nombre total de signes + et -) et de la somme minimum pour chaque signe. Les probabilités entre 1 et 5% sont mises en évidence (gras sur fond grisé)

Page 38: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

38 infos

Page 39: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 39

Test de Wilcoxon Mann Whitney.

Le tableau donne pour deux échantillons de tailles 1n et 2n ≥ 1n l’encadrement pour la somme des rangs

1nW de l'échantillon 1n qui permette d’accepter l’hypothèse 0H (les deux échantillons ne sont pas

significativement différents) aux risques donnés p% (test bilatéral).

Ex:si 1n =5, 2n =8,

P(S<=23)=P(S>=47)=9,4/2=4,7%

P(23<S<47)=1-p=90,6%

Si la taille des échantillons est plus grande, la quantité σ

µ−= 1nW

Z suit une loi normale, avec

2

1nnn 211 )( ++=µ et

12

1nnnn 21212 )( ++=σ

Page 40: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

40 infos

Test de Wilcoxon.

Il porte sur les W somme des rangs des différences d’un signe donné pour deux échantillons appariés présentant m différences non nulles.

Le tableau donne la probabilité P, en %, que la somme soit d’un côté de l’intervalle donné.

Exemple: si m=8, on a P(W≤3)=P(W≥33)=2%. Si 3<W<33, on peut donc accepter l’hypothèse 0H (les

deux échantillons ne sont significativement différents) au risque 2*2=4% (bilatéral).

Si la taille des échantillons est plus grande, la quantité σ

µ−= +W

Z suit une loi normale.

avec4

1mm )( +=µ et 24

1m21mm2 ))(( ++=σ

m W p(%) m W p(%)

5 15---0 3,1 9 42---3 1

14---1 6,2 41---4 1,4

6 21---0 1,6 40---5 2

20---1 3 39---6 2,7

19---2 4,7 38---7 3,7

7 27---1 1,6 37---8 4,9

26---2 2,3 10 50---5 1

25---3 3,9 49---6 1,4

8 34---2 1,3 48---7 1,9

33---3 2 47---8 2,4

32---4 2,7 46---9 3,2

31---5 3,9 45--10 4,2

Page 41: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 41

Test des corrélations des rangs de Spearman

Cette table donne, pour un risque choisi (test à 2 issues) et la taille n de l’échantillon, la valeur limite du coefficient de corrélation des rangs de Spearman. Si la valeur absolue expérimentale r est inférieure à la valeur tabulée, on accepte l’hypothèse de l’absence de corrélation.

Pour n>20, on calcule la valeur :

2r1

2nrt

−−= qui suit une loi de Student à n-2 degrés de liberté.

Page 42: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

42 infos

Test de Kolmogorov-Smirnov.

On donne la valeur maximum de la différence D entre les lois de répartition théorique et expérimentale pour le risque choisi et le nombre de différences calculées (colonne de gauche).

Pour n>20, on calcule la quantité nDK = . On accepte la normalité si K est inférieur à la valeur

tabulée en fonction du risque.

20% 10% 5% 2% 1%

1,08 1,225 1,36 1,52 1,63

Valeurs de K en fonction du risque

Page 43: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 43

Test du carré des différences successives.

Donne les valeurs de αa telles que P(a> αa )=α pour α<10% Pour obtenir βa telle que P(a< βa )=β, effectuer les transformations suivantes : βa ⇒ 2- βa

Par exemple, pour n=10, on trouve que la valeur a=1.626 a 1% de chances d'être dépassée. Cela signifie que la valeur a=2-1.626=0.374 possède 1% de chances de ne pas être dépassée.

Page 44: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

44 infos

Test des signes.

Donne les pourcentages d'occurrence d'un nombre de suites pour une taille d'échantillon (première

colonne) et le pourcentage cumulé (deuxième colonne).

Exemple : pour un échantillon de taille 12, le nombre de suites N=5 possède 4.5% de chance d'être

trouvé. On a également P(N<5)=0.8% et P(N≤5)=5.3%

Page 45: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 45

Test de Cochran.

Donne, au risque 5%, la valeur critique pour ν nombre de degrés de liberté et m nombre d’échantillons.

Page 46: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

46 infos

Page 47: Roger JOURNEAUX Traitements des mesures · Vous trouvez ci-dessous un certain nombre d'informations sur les classeurs Excel® ainsi que des tables statistiques. ... Test de Cochran

infos 47