Comparaison d'une distribution observée à une distribution théorique

1

Comparaison d'une distribution observée à une distribution théorique

• Situation du problème :– Les éléments :

• Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique

• 1 variable qualitative définissant des classes (ou quantitative mise en classes). On a la fréquence (nombre) de sujets appartenant à chaque classe.

• 1 distribution théorique soit empirique soit suivant une loi de probabilité théorique concernant les mêmes classes.

• On aboutit à une table dans laquelle pour chaque classe, on a l’effectif observé et l’effectif théorique correspondant à ce que l’on aurait observé si le caractère étudié suivait la distribution théorique.

– La question :• La distribution observée peut-elle être considérée

comme conforme à la distribution théorique ?

• Les écarts constatés entre valeurs observées et théoriques peuvent - ils être attribués au hasard ?

2


• Hypothèses :– Hypothèse nulle :

• Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique.

– Hypothèse alternative• La distribution observée ne suit pas la

loi de probabilité théorique considérée.

• Eléments nécessaires au calcul– Table de contingence

Classe A B C DEffectif O1 O2 O3 O4

ObservéEffectifThéorique T1 T2 T3 T4

3


• Statistique :– Khi 2 “d’adéquation”

• Degré de liberté : – Nombre de classes - 1 - Nombre de

paramètres estimés de la loi théorique (si nécessaire).

• Conditions d’application– Tous les effectifs théoriques doivent être

supérieurs à 5.– Si les conditions ne sont pas remplies, il

faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes.

– Sous H0, on estime les effectifs théoriques de chaque case de la table de contingence

– Pour chaque case on utilise la probabilité théorique s'y rattachant multipliée par l'effectif observé total.

– Par exemple en cas de loi de distribution (loi normale par exemple) on calcule d'abord la probabilité d'être dans l'intervalle (Bi-Bs) de chaque classe puis l'effectif théorique. Ainsi, la probabilité d'être dans l'intervalle [ -infini; moyenne] est de 0,5. Celle d'être dans l'intervalle [-infini; moyenne - 1,96* écart type] est de 0,025...

– On calcule ainsi les différents effectifs théoriques en fonction de la loi de probabilité utilisée.

4


• Khi 2 “d’adéquation”– Calcul pour chaque case des effectifs

théoriques

– Condition d'application : tous les effectifs théoriques doivent être supérieurs à 5 sinon regroupement

– Calcul du Khi 2

Khi2 = (0-T)

T

2

1

p

p = Nombre de classes après regroupement

DDL = p -1 - Nombre de paramètres estimés

• Si Khi2 > Khi2 alpha => rejet de HO : la distribution

n'est pas conforme à la distribution théorique.

Recherche du degré de signification p.

• Sinon rien ne permet de dire que la distribution

observée n'est pas conforme à la distribution

théorique => H0 acceptée mais attention au risque ß

– Décision :

5


• Exemple 1 :–Dans un essai thérapeutique, on a testé un médicament sur 200 patients. Les résultats ont été notés en bons, moyens et mauvais. On a obtenu les pourcentages de bons résultats suivants :

45% de bons résultats, 15% de résultats moyens et 40% de mauvais résultats

Dans la littérature ce traitement donne 75% de bons résultats, 22% de résultats moyens et 3% de résultats mauvais. Les résultats observés sont-ils conformes à ceux de la littérature?

•H0 : Les résultats sont conformes

•H1 : Les résultats ne sont pas conformes

Table de contingence

Bons Moyens Mauvais Total

Obs. 90 (0,45*200) 30 80 200

Théo 150 44 6 200

Khi2=(90-150)

150

2(30-44)

30

2(80 - 6)

6

2

2+ + = 941,12

La distribution n'est pas conforme à la distribution observée dans la littérature. Les résultats obtenus sont statistiquement moins bons que ceux de la littérature.Remarque : le calcul d'un seul des termes du khi 2 (le dernier par exemple) permet de rejeter H0.

DDL = 2; Khi20,001 =13,82 => p<0,001

6


• Exemple 2 :Sur 300 étudiants en médecine, la moyenne de la taille est de 1,75m avec un écart type estimé de 0,1m. Ces deux paramètres sont estimés à partir des données de cet échantillon. Vous avez observé 8 étudiants avec une taille inférieure à 1,55m; 40 avec une taille entre 1,55 et 1,65; 102 avec une taille entre 1,65 et 1,75 et 150 avec une taille supérieure à 1,75m

La distribution de la taille des étudiants en médecine peut elle être considérée comme suivant une loi normale ?

Moyenne estimée = 1,75 - Écart type estimé = 0,1

< 1,55 1,55 - 1,65 1,65 - 1,175 > 1,75 TotalObservé 8 40 102 150 300Probabilité 0,025 0,135 0,34 0,5si Loi NormaleEffectif Théo 7,5 40,5 102 150 300

Terme du Khi 2 0,033 0,006 0,000 0,000

Khi 2 = 0,040 DDL = 4 - 1 - 2 = 1Khi2 < 3,84 P > 0,05La distribution observée ne diffère pas de manière statistiquement significative d'une loi normale de paramètre 1,75; 0,1

Documents

Comparaison d'une distribution observée à une distribution théorique