74
TP – Formation Statistique de base Parties 4 et 5 09-10/03/2020 Nathalie Vialaneix, Sandrine Laguerre

TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

TP – Formation Statistique de base

Parties 4 et 5

09-10/03/2020

Nathalie Vialaneix, Sandrine Laguerre

Page 2: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 4 : Statistiques inférentielles(tests)

Page 3: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 4.1 : Variables quantitatives

Page 4: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

TO DO

• Trouver la moyenne de C14

Page 5: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 6: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 7: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Intervalle de confiance d’une variable quantitative

La moyenne de C14 est-elle significativement différente de 1?

Page 8: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

L’intervalle de confiance à 95% contient la valeur 1P-value NS à 5% => on ne peut pas rejeter l’hypothèse nulle d’égalité de la moyenne de C14 à 1

Page 9: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Comparaison de moyenne pour 2 échantillons indépendants

Page 10: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Les moyennes de C14 diffèrent t-elles selon le genotype?

Test paramétrique : t-test

Page 11: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 12: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value NS à 5% => on ne peut pas rejeter l’hypothèse nulle d’égalité des moyennes de C14 selon le genotype

Page 13: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Les médianes de C14 diffèrent t-elles selon le genotype?

Test non paramétrique : test de Wilcoxon bivarié

Page 14: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 15: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value très significative => on rejette l’hypothèse nulle d’égalité des 2 médianes

Les tests paramétrique et non paramétrique ne sont pas cohérent => on va tester les conditions d’application du t-test

Page 16: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

TO DO

• Représenter la distribution en fonction du génotype

Page 17: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 18: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 19: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Normalité?

Page 20: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test de normalité

Page 21: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value très significative => on rejette l’hypothèse nulle de normalité

Page 22: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test d’égalité des variances dans les 2 groupes comparés

Page 23: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 24: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value significative => on rejette l’hypothèse nulle d’égalité des 2 variances

Page 25: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Comparaison de moyenne pour 2 échantillons appariés

Page 26: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

TO DO

• Quelles sont les moyennes de ACAT1 et ACAT2?• Que signifie un test de comparaison de moyenne

pour échantillons appariés entre ces 2 variables?

Page 27: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 28: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 29: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

T test apparié (test paramétrique)

Page 30: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 31: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Les 2 moyennes étaient proches (-065 et -0,77) et pourtant, P-value significative => on rejette l’hypothèse nulle d’égalité des 2 moyennes

Page 32: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test de Wilcoxon apparié (non paramétrique)

Page 33: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 34: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Les 2 moyennes étaient proches (-065 et -0,77) et pourtant, pour le test non paramétrique également p-value significative => on rejette l’hypothèse nulle d’égalité des 2 moyennes

Page 35: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

TO DO

• Vérifier la normalité de ces 2 variables

Page 36: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Histogramme

Page 37: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 38: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 39: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

p-value NS => on ne peut pas rejeter l’hypothèse nulle de normalité de ACAT1

Page 40: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

p-value NS => on ne peut pas rejeter l’hypothèse nulle de normalité de ACAT1

Page 41: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 4.2 : Variables qualitatives

Page 42: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test d’indépendance entre 2 variables qualitativesEst-ce qu’être au dessus ou au dessous de la médiane pour C14 est corrélé à diet?

Discrétisation de la variable C14 par rapport à la médiane

Page 43: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 44: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test d’indépendance du Chi-2

Page 45: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 46: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Les conditions d’application du test du Chi2 d’indépendance ne sont pas remplies

Page 47: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test exact de Fisher

Page 48: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value significative => on rejette l’hypothèse nulle d’indépendance des 2 distributions

Page 49: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 5 : Modèle linéaire

Page 50: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 5.1 : Régression linéaire et corrélation entre 2 variables

quantitatives

Page 51: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Matrice de corrélation

Page 52: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 53: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Test de corrélation

Page 54: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

P-value très significative => on rejette l’hypothèse nulle de corrélation = 0

Page 55: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Régression linéaire

Page 56: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 57: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 58: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Graphes de diagnostic du modèle linéaire

Page 59: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

1) Les résidus doivent être distribués aléatoirement (pas de tendance à prendre des valeurs différentes selon Y, la dispersion doit être constante)

2) Normalité? : quantiles distribution empirique versus quantiles loi normale (doit être proche d’une droite)

3) Homoscédasticité4) Points d’influence

1 2

3 4

Page 60: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 5.2 : ANOVA, relation entre une variable qualitative et une variable

quantitative

Page 61: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

ANOVA à 1 facteur

Page 62: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 63: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 64: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

ANOVA à plusieurs facteurs

Page 65: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 66: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Partie 5.3 : modèle linéaire

Page 67: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Modèle linéaire

Page 68: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 69: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 70: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 71: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 72: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065

Modèle linéaire généralisé

Page 73: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065
Page 74: TP Formation Statistique de base - Nathalie Vialaneix · pour échantillons appariés entre ces 2 variables? T test apparié (test paramétrique) Les 2 moyennes étaient proches (-065