Upload
quiana
View
45
Download
0
Embed Size (px)
DESCRIPTION
Comparaison d'une distribution observée à une distribution théorique. Situation du problème : Les éléments : Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique - PowerPoint PPT Presentation
Citation preview
1
Comparaison d'une distribution observée à une distribution théorique
• Situation du problème :– Les éléments :
• Généralisation de la comparaison d’un pourcentage observé à un pourcentage théorique
• 1 variable qualitative définissant des classes (ou quantitative mise en classes). On a la fréquence (nombre) de sujets appartenant à chaque classe.
• 1 distribution théorique soit empirique soit suivant une loi de probabilité théorique concernant les mêmes classes.
• On aboutit à une table dans laquelle pour chaque classe, on a l’effectif observé et l’effectif théorique correspondant à ce que l’on aurait observé si le caractère étudié suivait la distribution théorique.
– La question :• La distribution observée peut-elle être considérée
comme conforme à la distribution théorique ?
• Les écarts constatés entre valeurs observées et théoriques peuvent - ils être attribués au hasard ?
2
Comparaison d'une distribution observée à une distribution théorique
• Hypothèses :– Hypothèse nulle :
• Les écarts constatés entre les effectifs observés et théoriques sont le fait du hasard. La distribution observée suit la loi de probabilité théorique.
– Hypothèse alternative• La distribution observée ne suit pas la
loi de probabilité théorique considérée.
• Eléments nécessaires au calcul– Table de contingence
Classe A B C DEffectif O1 O2 O3 O4
ObservéEffectifThéorique T1 T2 T3 T4
3
Comparaison d'une distribution observée à une distribution théorique
• Statistique :– Khi 2 “d’adéquation”
• Degré de liberté : – Nombre de classes - 1 - Nombre de
paramètres estimés de la loi théorique (si nécessaire).
• Conditions d’application– Tous les effectifs théoriques doivent être
supérieurs à 5.– Si les conditions ne sont pas remplies, il
faut, quand cela est possible, regrouper logiquement des classes ou prendre d’autres méthodes.
– Sous H0, on estime les effectifs théoriques de chaque case de la table de contingence
– Pour chaque case on utilise la probabilité théorique s'y rattachant multipliée par l'effectif observé total.
– Par exemple en cas de loi de distribution (loi normale par exemple) on calcule d'abord la probabilité d'être dans l'intervalle (Bi-Bs) de chaque classe puis l'effectif théorique. Ainsi, la probabilité d'être dans l'intervalle [ -infini; moyenne] est de 0,5. Celle d'être dans l'intervalle [-infini; moyenne - 1,96* écart type] est de 0,025...
– On calcule ainsi les différents effectifs théoriques en fonction de la loi de probabilité utilisée.
4
Comparaison d'une distribution observée à une distribution théorique
• Khi 2 “d’adéquation”– Calcul pour chaque case des effectifs
théoriques
– Condition d'application : tous les effectifs théoriques doivent être supérieurs à 5 sinon regroupement
– Calcul du Khi 2
Khi2 = (0-T)
T
2
1
p
p = Nombre de classes après regroupement
DDL = p -1 - Nombre de paramètres estimés
• Si Khi2 > Khi2 alpha => rejet de HO : la distribution
n'est pas conforme à la distribution théorique.
Recherche du degré de signification p.
• Sinon rien ne permet de dire que la distribution
observée n'est pas conforme à la distribution
théorique => H0 acceptée mais attention au risque ß
– Décision :
5
Comparaison d'une distribution observée à une distribution théorique
• Exemple 1 :–Dans un essai thérapeutique, on a testé un médicament sur 200 patients. Les résultats ont été notés en bons, moyens et mauvais. On a obtenu les pourcentages de bons résultats suivants :
45% de bons résultats, 15% de résultats moyens et 40% de mauvais résultats
Dans la littérature ce traitement donne 75% de bons résultats, 22% de résultats moyens et 3% de résultats mauvais. Les résultats observés sont-ils conformes à ceux de la littérature?
•H0 : Les résultats sont conformes
•H1 : Les résultats ne sont pas conformes
Table de contingence
Bons Moyens Mauvais Total
Obs. 90 (0,45*200) 30 80 200
Théo 150 44 6 200
Khi2=(90-150)
150
2(30-44)
30
2(80 - 6)
6
2
2+ + = 941,12
La distribution n'est pas conforme à la distribution observée dans la littérature. Les résultats obtenus sont statistiquement moins bons que ceux de la littérature.Remarque : le calcul d'un seul des termes du khi 2 (le dernier par exemple) permet de rejeter H0.
DDL = 2; Khi20,001 =13,82 => p<0,001
6
Comparaison d'une distribution observée à une distribution théorique
• Exemple 2 :Sur 300 étudiants en médecine, la moyenne de la taille est de 1,75m avec un écart type estimé de 0,1m. Ces deux paramètres sont estimés à partir des données de cet échantillon. Vous avez observé 8 étudiants avec une taille inférieure à 1,55m; 40 avec une taille entre 1,55 et 1,65; 102 avec une taille entre 1,65 et 1,75 et 150 avec une taille supérieure à 1,75m
La distribution de la taille des étudiants en médecine peut elle être considérée comme suivant une loi normale ?
Moyenne estimée = 1,75 - Écart type estimé = 0,1
< 1,55 1,55 - 1,65 1,65 - 1,175 > 1,75 TotalObservé 8 40 102 150 300Probabilité 0,025 0,135 0,34 0,5si Loi NormaleEffectif Théo 7,5 40,5 102 150 300
Terme du Khi 2 0,033 0,006 0,000 0,000
Khi 2 = 0,040 DDL = 4 - 1 - 2 = 1Khi2 < 3,84 P > 0,05La distribution observée ne diffère pas de manière statistiquement significative d'une loi normale de paramètre 1,75; 0,1