22
1 Séminaire en écologie et analyse de données Cours III Article 1 et Stat II: comparaison de moyennes BIO 3500 – Hiver 2017 23 janvier Au jour d’en ce jour Travail de session Discussion article 1 Stats II – test de t Sujet de recherche (équipe de 3-4) Doit être un sujet scientifique en écologie (écologie des populations, écologie comportementale, évolution, écologie, aménagement et conservation de la faune et de la flore, éco-toxicologie, etc.) Exemples: La variation de la population du Lynx au Québec est-elle due à la variation de la population de sa proie préférée, le lièvre d'Amérique? Activités saisonnières et sélection d'habitat par la tortue ponctuée (Clemmys guttata). L'influence du ratio azote : phosphore sur la prolifération de cyanobactéries dans les lacs. Comparaison entre les méthodes chimiques et biologiques pour le contrôle des populations de Capnodis tenebrionis, un coléoptère s’attaquant aux arbres fruitiers. Adaptation du mélèze laricin au pH acide des tourbières. Effet de la diversité floristique des jardins sur la diversité des abeilles sauvages en ville. Travail de session: les étapes 1) Résumé du sujet de recherche et envoi de l’article cible (20 février) 2) Exposés oraux am et pm (3 avril formatif; 10 avril évaluatif). Réservez vous la date du 24 avril am et pm pour compléter les oraux au besoin. 3) Rapport de recherche (24 avril) Résumé du sujet de recherche Le 20 février, vous devez me remettre un résumé d’une demi à une page sur le sujet de votre recherche (par courriel).Vous devez également me faire parvenir une version pdf de votre article cible. J’approuverai ou non le sujet et l’article cible et vous ferai parvenir la decision et des commentaires par courriel. Nom de fichier: ResumeRapport_Boivin_Trump_Gretzky.pdf Rapport de recherche DATE DE REMISE: le 24 avril en format électronique + l’article cible FORMAT: Le travail doit être fait à l'ordinateur et m'être remis par courriel. Il doit respecter le format suivant : 12 points, police régulière (ligne simple) Marges de 2.5 cm tout autour Respectez les maximums spécifiés: soyez direct, économe et efficace! Vous devez avoir fait approuver votre sujet Modifications: Si après le début de vos recherches vous rencontrez des difficultés et aimeriez modifier votre sujet (le rendre plus pointu ou plus général), vous pouvez le faire sans problème (pas besoin d'approbation – assurez-vous que l’article cible est bel et bien un article de recherche). Si par contre vous désirez changer de sujet totalement, vous devrez faire approuver le nouveau sujet avant le 14 mars. Commencez vos recherches tôt pour ne pas avoir de surprises!

BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

1

Séminaire en écologie et analyse de données

Cours III Article 1 et Stat II: comparaison de moyennes

BIO 3500 – Hiver 201723 janvier

Au jour d’en ce jour Travail de session Discussion article 1 Stats II – test de t

Sujet de recherche (équipe de 3-4) Doit être un sujet scientifique en écologie (écologie des populations, écologie comportementale, évolution, écologie, aménagement et conservation de la faune et de la flore, éco-toxicologie, etc.) Exemples:

La variation de la population du Lynx au Québec est-elle due à la variation de la population de sa proie préférée, le lièvre d'Amérique? Activités saisonnières et sélection d'habitat par la tortue ponctuée (Clemmys guttata). L'influence du ratio azote : phosphore sur la prolifération de cyanobactéries dans les lacs. Comparaison entre les méthodes chimiques et biologiques pour le contrôle des populations de Capnodis tenebrionis, un coléoptère s’attaquant aux arbres fruitiers. Adaptation du mélèze laricin au pH acide des tourbières. Effet de la diversité floristique des jardins sur la diversité des abeilles sauvages en ville.

Travail de session: les étapes 1) Résumé du sujet de recherche et envoi de l’article cible

(20 février)

2) Exposés oraux am et pm (3 avril formatif; 10 avrilévaluatif). Réservez vous la date du 24 avril am et pm pour compléter les oraux au besoin.

3) Rapport de recherche (24 avril)

Résumé du sujet de recherche Le 20 février, vous devez me remettre un résumé d’une demi à

une page sur le sujet de votre recherche (par courriel).Vousdevez également me faire parvenir une version pdf de votrearticle cible. J’approuverai ou non le sujet et l’article cible et vous ferai parvenir la decision et des commentaires par courriel.

Nom de fichier: ResumeRapport_Boivin_Trump_Gretzky.pdf

Rapport de recherche DATE DE REMISE: le 24 avril en format électronique + l’article cible FORMAT: Le travail doit être fait à l'ordinateur et m'être remis par courriel. Il doit respecter le format suivant :

12 points, police régulière (ligne simple) Marges de 2.5 cm tout autour Respectez les maximums spécifiés: soyez direct, économe et efficace!

Vous devez avoir fait approuver votre sujet Modifications: Si après le début de vos recherches vous rencontrez des difficultés et aimeriez modifier votre sujet (le rendre plus pointu ou plus général), vous pouvez le faire sans problème (pas besoin d'approbation –assurez-vous que l’article cible est bel et bien un article de recherche). Si par contre vous désirez changer de sujet totalement, vous devrez faire approuver le nouveau sujet avant le 14 mars.

Commencez vos recherches tôt pour ne pas avoir de surprises!

Page 2: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

2

Rapport de recherche Sections du travail:1. Présentation (1er page)2. Description (résumé) du sujet (½-1 page)3. Synthèse de l'article-cible (1 page)4. Critique de l'article-cible (1 page)5. Références6. Copie de l'article-cible

PrésentationPremière page : Noms et codes permanents des étudiants. Sujet de recherche.

2. RésuméDeuxième page Résumez en 1 page maximum le sujet de recherche Décrire le sujet choisi. Pourquoi est-ce un sujet important en écologie ? Résumez les grandes lignes de la littérature choisie dans son

ensemble (pas un article après l'autre). Soulevez les arguments principaux et les oppositions s'il y en

a. Citez les articles, minimum de 5 références sur le sujet dont 3

articles de recherche!

Sections 3 et 4 Choisir 1 article-cible parmi vos 3 (ou 4-5) dans votre liste

bibliographique (le même doit être utilisé pour les sections 3 et 4).

L'article-cible doit être un article de recherche : ne pas utiliser les articles de type 'commentaire' ou 'note brève' ou 'synthèse‘ ou autres comme article-cible (par contre ce type d'article peut figurer dans votre liste).

Si votre article cible n’est pas un article de recherche, unepénalité de 40% vous sera attribuée.

L'article-cible doit être récent (2000 ou plus).

Synthèse de l'article-cibleTroisième page (une page)Répondez dans vos mots (pas de plagiat directement de l'article) aux questions suivantes (pour votre article-cible seulement)a. Quelle est la problématique traitée dans l'article? (ce qui n'est pas connu et que l'article vise à examiner) b. Selon les auteurs, pourquoi est-il important de faire cette étude? (justification de l'étude)c. Quelles sont les étapes principales des méthodes utilisées pour examiner cette problématique? (ce que les auteurs ont fait dans cette étude, mais sans entrer dans les détails)d. Quel est le résultat principal de cette étude : expliquez ce qui est maintenant connu qui ne l'était pas avant.

Critique de l'article-cibleQuatrième page (1 à 1½ page)Pour chacune des sections suivantes, donnez soit une critique positive ou négative par rapport à ce que l'on a vu et verra en classe à propos de la fonction de chaque partie d'un article de recherche.Ne vous contentez pas de répéter de qui a été décrit en classe à propos de la fonction de chaque partie, mais expliquez pourquoi vous trouvez que votre commentaire rapporte un point fort ou faible en faisant référence directement au contenu de l'article-cible.a. Titreb. Résuméc. Introductiond. Méthodes (seulement les méthodes d’échantillonnage; croyez-vous qu’il peut y avoir un biais?)e. Résultats, incluant la partie statistiquef. Discussion

Page 3: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

3

Bibliographie Liste bibliographique de 5 références (minimum) portant sur votre sujet, dont au moins 3 articles provenant d'un périodique avec comité de lecture (français ou anglais). Le but est d'obtenir des références qui traitent toutes du même sujet.

Évaluation (20%)4% Présentation du sujet de recherche8% Synthèse de l'article-cible : 2 points par question6% Critique de l'article-cible : 1 point par section2% Liste bibliographique :

La liste bibliographique inclut le bon nombre et type de documents. Les documents portent bien sur le sujet de recherche choisi par l'étudiant. Le format des citations respecte celui demandé et est exempt d'erreurs.

Total = 20% de la note finale pour ce cours

Orale Vous utiliserez l'ensemble de vos articles lors de votre

exposé oral en fin de session.

Celui-ci ne doit pas être une répétition de votre travail écrit!

Exposé oral; directives générales Format: vous devez préparer un exposé oral de 15 minutes ainsi qu’une présentation « Powerpoint » (ou autre) pour l’accompagner. Il y aura une période de questions par la suite. Vous serez évalués sur la clarté de votre présentation et votre maîtrise du sujet (capacité à répondre aux questions).

Exposé oral; directives généralesStructure:

1) Introduction sur votre sujet (du général au particulier) 2) Résumé des 3 articles de votre travail écrit: pour chacun… la problématique et justification les méthodes les résultats et conclusions principales

3) Synthèse des avancées liées aux 3 articles et conclusion. Vous confrontez les résultats des 3 articles en contrastant leurs différences et/ou ressemblances Prises ensembles, comment ces études ont permis d’avancer les connaissances sur votre sujet?

Exposé oral; directives générales Vous ferez l’oral deux fois. La première fois sera formative (mais vous devrez participer!): 3 avril (amet pm). La deuxième fois sera évaluative: 10 avril (am et pm)! En pm, les présentations se feront au SB-R440 Pourquoi? Parce que présenter de la science ne se réussit souvent pas du premier coup. Réservez votre date du 24 avril pour compléter les oraux si nécessaire.

Page 4: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

4

Évaluation (Orale – 20%) 5% Qualité de la présentation graphique

Je ne vous demande pas d'être des artistes, mais d'être clair! 15% Présentation du sujet de recherche

Intro/mise en contexte: 3% Résumé de chacun des 3 articles: 3% chaque Synthèse des 3 articles et ouverture: 3%

Des pénalités s’appliqueront si les membres ne participent pas de façon équivalente (-3/20). Également, de façon individuel, des pénalités s’appliqueront si vous n’êtes pas présent à TOUTES les présentations formatives ET évaluatives (-4/20). Votre participation est importante. Je m’attend à ce que tous démontrent qu’ils suivent en posant des questions et donnant des commentaires Total = 20% de la note finale pour ce cours

Power point Évitez les animations – problèmes de compatibilité

entre les ordinateurs Dupliquez plutôt les diapositives.

Power point Balance espace/information: ne pas trop charger les diapositives. Le texte devrait se lire rapidement et devrait accompagner l'information orale, pas la remplacer. Attention de ne pas utiliser tout l'espace sur les diapositives; le texte au bas de l'écran peut être difficile à voir pour les gens assis derrière. Taille de police: ne pas utiliser plus petit que 20 points.

Power point Choix de couleurs et animations: la sobriété est de mise. Les couleurs rouge et verte peuvent être difficiles à distinguer pour plusieurs personnes. Nombre de diapositives: environ une par minute

Au jour d’en ce jour Travail de session Discussion article 1 Stats II – test de t

Article 1 Vous m’avez envoyé les résumés par courriel? Vous l’avez lu? Vous l’avez compris? Vous vous êtes endormi?

Page 5: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

5

Perturbation Perturbation: Évènement qui détruit/tue une partie

de la biomasse

Primaire: La vie repart à zéro. Des idées?

Secondaire: Il reste des organismes vivants. Des idées?

Perturbation Perturbation: Évènement qui détruit/tue une partie

de la biomasse

Primaire: La vie repart à zéro. Ex. Éruption volcanique, feu très intense, retrait d’un

glacier

Secondaire: Il reste des organismes vivants. Ex. Épidémie d’insecte, feu de faible intensité, chablis,

coupe forestière

Perturbation Tordeuse des bourgeons de l’épinette (Choristoneura

fumiferana)Mange principalement du sapin!

Perturbation - tordeuse Dernière épidémie (1966-1992) -> ~200 millions

de m3 de bois, ce qu’on extrait en 8 ans, ~ 50 milliards de kg de bois! En papier de toilette, cela représente la quantité

utilisée par la population du Québec en 500 ans…

Perturbation - tordeuse

source: journallehavre.ca, https://www.youtube.com/watch?v=lqQqtTI850o

CPRS! Coupe avec protection de la régénération et des

sols Protège les jeunes arbres lors de la coupe

Page 6: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

6

CPRS! L’industrie ne veut pas les feuillus intolérants

CPRS! Feuille d’ombre vs feuille de lumière Pétiole plus long, plus pâle, plus mince D’autres éléments liés au maintien hydrique

Discussion de l’article En groupe de 3-4, 20-30 minutes: Questions sur le contenu de l’article Quelle est la question de recherche? Quelle est l’hypothèse? En quoi est-elle différente de ce qui a été fait avant? Quelles sont les réponses obtenues? Avez-vous trouvé l’article bien écrit? Les figures bien faites? Qu’est-ce que vous n’avez pas compris? Aidez vous à

comprendre! Des points qui pourraient remettre les résultats en cause

Au jour d’en ce jour Travail de session Discussion article 1 Stats II – test de t

Objectifs des stastiques

Si ces 200 poissons ont été mesurés dans un lac, que peut-on dire à propos des poissons

de ce lac?Mais on ne les a pas tous

mesurés...

Distribution des poids de 200 poissons du lac à Deux Étages

Page 7: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

7

Objectifs des statistiques Statistiques descriptives: décrire un ensemble de

données sous forme: de graphiques, de tableaux de fréquence, de

moyennes, médianes, modes, variances

Statistiques inférentielles: inférer l’état d’une population à partir des résultats obtenus sur un échantillon Impliquent des tests d’hypothèses BASÉES SUR LES PROBABILITÉS

Probabilité Qu’est-ce qu’une probabilité?

Probabilité La probabilité d’un événement (ou valeur) est une mesure de la chance de voir cet événement se réaliserdésignée par p (ou P) un événement impossible p = 0 un événement certain p = 1

À noter: plus le nombre d’observations est grand, plus la probabilité observée (empirique) se rapprochera de sa réelle probabilité (espérance)

Probabilité Espérance/probabilité aux cartes: Jeu classique de 52 cartes Une carte précise (ex. 8 de pic)? Une sorte (ex. trèfle)? Une couleur? Joker? N’importe quel carte?

Probabilité Jouons à pile ou face! Statistique binomiale (pas à l’examen)

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée Si la probabilité est très faible : je rejette l’hypothèse

Mêmes étapes pour tous les types de tests

Page 8: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

8

Test t La plus simple des statistiques inférentielles Sert à comparer Une moyenne à une moyenne théorique Est-ce que le brassin 10b de Guinness a un pourcentage

d’alcool de 5.2%? Deux moyennes Est-ce que les hommes et les femmes ont la même taille?

Deux moyennes non-indépendantes (échantillons appariés) Est-ce que l’on est plus où moins endormis après un cours de

stats qu’avant?

Test t S’applique lorsque l’on tente de déterminer l’effet

d’une variable explicative (nominale contenant une ou deux catégories) sur une variable numérique. Ex: Est-ce que la longévité des femmes diffère entre

Rosemont et Villeray? Ex: Est-ce que le taux d’homicide diffère entre les villes

de grandes tailles aux USA et en Russie?Pour ces 2 exemples: Quels sont les variables explicatives

et réponses, les observations, les échantillons et les populations statistiques?

Qui est Student? William Gossett Statisticien de Guinness

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée Si la probabilité est très faible : je rejette l’hypothèse

Mêmes étapes pour tous les types de tests

Hypothèse nulle (H0): Hypothèse du statut quoMaintenue jusqu’à preuve du contraire Hypothèse d’égalité dans la majorité des cas

Hypothèse alternative (H1): Hypothèse qu’on voudrait démontrer (dans la majorité des cas) Acceptation conditionnelle au rejet de H0 Seule alternative possible à H0

1- Poser une hypothèse Hypothèse nulle (H0): Ex. H0: μ= 22 Hypothèse alternative (H1): Ex. H1: μ ≠ 22

NOTE: les hypothèses sous formes mathématiques s’écrivent avec les symboles des populations, non pas des échantillons.

1- Poser une hypothèse

Page 9: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

9

Pour le test de t, l’hypothèse peut être: Bilatérale: pas de direction dans la différence attendue Unilatérale: direction dans la différence attendue IMPORTANT: un test unilatéral permet de découvrir une

relation dans une seule direction

1- Poser une hypothèse Définir notre question: Les hommes et les femmes

adultes ont-ils la même taille?

Quelles sont les variables explicative et réponse, les observations, l’échantillon et la population statistique?

Les hypothèses? Unilatérales ou bilatérales?

Test de t de comparaison de deux moyennes!

1- Poser une hypothèse

Définir notre question: Les hommes et les femmes adultes ont-ils la même taille?

Hypothèse nulle: Les hommes et les femmes ont la même taille en moyenne

H0 : µf = µmHypothèse alternative: Les hommes et les femmes

n’ont pas la même taille en moyenneH1 : µf ≠ µm

1- Poser une hypothèse (bilatérale) Définir notre question: Les hommes sont-ils plus

grands que les femmes? Les hypothèses? Unilatérales ou bilatérales?

1- Poser une hypothèse

Définir notre question: Les hommes sont-ils plus grands que les femmes?

Hypothèse nulle: Les hommes sont plus petits ou de la même taille que les femmes

H0 :Hypothèse alternative: Les hommes sont plus grands

que les femmesH1 :

1- Poser une hypothèse (unilatérale) Définir notre question: Est-ce que le brassin de

Guinness no. 10b a un taux d’alcool de 4.2% alc/vol?

Quelles sont les variables explicative et réponse, les observations, l’échantillon et la population statistique?

Les hypothèses? Unilatérales ou bilatérales?

Test de t de comparaison à une moyenne théorique!

1- Poser une hypothèse

Page 10: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

10

Définir notre question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol?

Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol

H0 :Hypothèse alternative: Le brassin de Guinness no. 10b

n’a pas un taux d’alcool de 4.2% alc/volH1 :

1- Poser une hypothèse (bilatérale) Définir notre question: Est-on plus endormi après un

cours de stats sur les tests de t qu’avant le cours? Quelles sont les variables explicative et réponse, les

observations, l’échantillon et la population statistique?

Les hypothèses? Unilatérales ou bilatérales?

Test de t de comparaisons de deux moyennes appariées!

1- Poser une hypothèse

Définir notre question: Est-on plus endormi après un cours de stats sur les tests de t qu’avant le cours?

Hypothèse nulle: Les étudiants sont endormis de façon égale ou moindre après qu’avant un cours de stats sur le test t

H0 :Hypothèse alternative: Les étudiants sont plus endormis

après qu’avant un cours de stats sur le test tH1 :

1- Poser une hypothèse (unilatérale) En équipe, trouver une question de recherche et poser

des hypothèses pour les situations suivantes: Test de comparaison de deux moyennes. Test de comparaison d’une moyenne à une valeur

théorique. Test de comparaison de moyennes appariées.

Faites moi venir à votre table pour confirmer si çafonctionne.

1- Poser une hypothèse

1b- Déterminer le seuil d’acceptabilité L’erreur α (type I) La probabilité de se tromper en rejetant H0 -> celle-ci ne

sera jamais zéro!

En écologie: α=0.05 (convention), α=0.01, α=0.001 Ça dépend de la question! Il faut se souvenir de ce que

signifie ce seuil et ne pas l’appliquer bêtement ex: p=0.051 vs p=0.049

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée

Si la probabilité est très faible : je rejette l’hypothèse

Page 11: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

11

2- Récolter des observations Notre échantillon à partir duquel on va devoir inférer

(d’où le nom de statistique inférentielle) l’état de la population!

Il doit être le plus représentatif de la population possible (non-biaisé, aléatoire, etc...)

2- Récolter des observations Pour le test de t, on a besoin de déterminer/calculer à

partir de(s) l’échantillon(s) n = nombre (s) d’observations s = écart-type (s) X = moyenne (s)

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée

Si la probabilité est très faible : je rejette l’hypothèse

3- Déduire la distribution de l’hypothèse À partir de H0 et de l’information contenue dans

l’échantillon on construit la distribution théorique permettant de calculer les probabilités

La distribution théorique représente toutes les évènements que l’on peut observé si H0 est vrai et permet de calculer la probabilité de chacun de ces évènements

3- Déduire la distribution de l’hypothèse Dans le cas du test de t: À partir de l’écart-type (s) et

de la taille de l’échantillon (n), on peut bâtir la distribution des moyennes attendues compte tenu de H0

Notez que l’écart-type de l’échantillon (s) est une estimation de l’écart-type de la population (σ)

3- Déduire la distribution de l’hypothèse

Page 12: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

12

Définir notre question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol?

Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol

H0 :Hypothèse alternative: Le brassin de Guinness no. 10b

n’a pas un taux d’alcool de 4.2% alc/volH1 :

3- Déduire la distribution de l’hypothèse

Si H0 : Et si l’on connaît l’écart-type (tel qu’estimé à partir

de l’échantillon) et la taille de l’échantillon, on peut bâtir la distribution.

3- Déduire la distribution de l’hypothèse

1-Crée une population virtuelle de taille infinie (ici 1 000 000) possédant une moyenne égale à celle de H0 et possédant l’écart-type tel qu’estimé à partir de l’échantillon. Ex:

3- Déduire la distribution de l’hypothèse

3- Déduire la distribution de l’hypothèse

n=10

n=200

2-Échantillonner cette distribution une infinité de fois (ici 100 000) en utilisant le même « n » que la taille de l’échantillon

Moyenne des moyennes = moyenne de la populationIndépendamment de n

3- Déduire la distribution de l’hypothèse

n=10

n=200

La taille de l’échantillon augmente la précision de l’estimation de la moyenne (plus faible écart-type de l’estimation des moyennes)

3- Déduire la distribution de l’hypothèse

n=10

n=200

s=0.063

s=0.014

Page 13: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

13

La taille de l’échantillon augmente la précision de l’estimation de la moyenne (plus faible écart-type de l’estimation des moyennes)

3- Déduire la distribution de l’hypothèse

n=10

n=200

s=0.063

s=0.014

3- Déduire la distribution de l’hypothèse

n=10

n=200

s=0.063

s=0.014

Et ça fonctionne même si la distribution dans la population originale est asymétrique

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée

Si la probabilité est très faible : je rejette l’hypothèse

La distribution t est symétriqueMais sa forme exacte dépend de la taille de

l'échantillon (n) Elle est plus aplatie que la distribution normale

À mesure que la taille de échantillon augmente,la distribution t tend à se confondre avec la distribution normale

4- Calculer la probabilité

La loi de Student (distribution de t) nous permet une estimation non-biaiséé (i.e. juste) des probabilités d’une loi normale à partir des estimations de μ et σ.

Une distribution normale correspond à la distribution de probabilité d’une variable dont la courbe est parfaitement symétrique, unimodale et en forme de cloche.

Elle est caractérisée complètement par 2 paramètres: sa moyenne sa variance ou écart-type

4- Calculer la probabilité

moyenne contient 95% des données

des données sont contenues par 3 écarts-types

4- Calculer la probabilitéComme la distribution de t est une approximation de la loi

normale, il est facile de calculer la probabilité

Page 14: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

14

Concernant la loi normale: Les raisons qui expliquent son rôle central sont bien plus historiques et mathématiques que biologiques. Il y a très peu de variables en ecologie qui soient

distribuées normalement.Cependant, la distribution des moyennes tend

vers la normalité.

4- Calculer la probabilité 4- Calculer la probabilitéH0 =

Probable?

4- Calculer la probabilitéH0 =Probable? Non, plus la moyenne observée est loin de la moyenne théorique de la population

(H0), plus la probabilité que l’échantillon provienne d’une telle population est faible

1. Calculer la valeur de la statistique t = signal / bruit = différence entre les groupes

variabilité entre les groupes

4- Calculer la probabilité

1. Calculer la valeur de la statistique t = signal / bruit = différence entre les groupes

variabilité entre les groupes 2. Calculer la probabilité (p) à partir de la

statistique (t) et du nombre de dégrés de liberté (k) Jadis/naguère: à partir d’une table De nos jours: un ordinateur le fait à votre place!

Degré de liberté (k) -> k influence la valeur de p k = n-1

4- Calculer la probabilité La probabilité est obtenue sous le format Ex: p=0.01 ou p=0.53 p représente la probabilité de se tromper en rejetant

H0 pour H1 Autrement dit, c’est le probabilité que H0 soit vrai en

rejetant H0

Le seuil alpha (α), tel que décidé à l’étape 1, représente la probabilité maximale de se tromper que l’on est prêt à accepter (seuil d’acceptabilité)

4- Calculer la probabilité

Page 15: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

15

4- Calculer la probabilité Jadis/naguère: Déterminer la valeur de t critique à

l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral

4- Calculer la probabilité Jadis/naguère: Déterminer la valeur de t critique à

l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral

tcrit= 2.306

4- Calculer la probabilité Jadis/naguère: Déterminer la valeur de t critique à

l’aide d’une table de t ex: k=8 , alpha=0.05, test bilatéral unilatéral

tcrit= 2.306tcrit= 1.895

4- Calculer la probabilité

BilatéralUnilatéraltcrit= 1.895 tcrit= 2.306tcrit= -2.306

4- Calculer la probabilité Jadis/naguère: Déterminer la valeur de t critique à

l’aide d’une table de t ex: k=11 , alpha=0.01, test unilatéral

tcrit= ?

4- Calculer la probabilité Jadis/naguère: Déterminer la valeur de t critique à

l’aide d’une table de t ex: k=11 , alpha=0.01, test unilatéral

tcrit= 2.718

Page 16: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

16

4- Calculer la probabilité Jadis/naguère: Déterminer p à partir de la valeur de

t calculée ex: k=9 , t = 5.7, test bilatéral

p<0.001

4- Calculer la probabilité Jadis/naguère: Déterminer p à partir de la valeur de

t calculée ex: k=3 , t = 2.78, test unilatéral

p=??

4- Calculer la probabilité Jadis/naguère: Déterminer p à partir de la valeur de

t calculée ex: k=3 , t = 2.78, test unilatéral

p=0.05

Les étapes du test d’hypothèses1) Poser une hypothèse à vérifier2) Récolter des observations 3) Déduire la distribution de l’hypothèse4) Calculer la probabilité d’obtenir ces observations si l’hypothèse posée est correcte 5) Tirer une conclusion sur l’hypothèse posée en fonction de la probabilité calculée

Si la probabilité est très faible : je rejette l’hypothèse

5-Tirer une conclusion De nos jours: Est-ce que la probabilité calculée (p) est

inférieure au seuil α ? Si oui, on rejette H0 Si non, on ne rejette pas H0

α (p) est la probabilité de se tromper en rejettant H0

5-Tirer une conclusion Jadis/naguère (et à l’examen): Est-ce que la valeur

de t calculée (t) est supérieur au t critique? Si oui, on rejette H0 Si non, on ne rejette pas H0

Si t calculé est supérieur au t critique, automatiquement le p calculé est inférieur au seuil alpha

Page 17: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

17

Test t - des exemples Sert à comparer Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons

appariés)

k = n-1

Question: Est-ce que le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol? α= 0.05

Hypothèse nulle: Le brassin de Guinness no. 10b a un taux d’alcool de 4.2% alc/vol

H0 :Hypothèse alternative: Le brassin de Guinness no. 10b

n’a pas un taux d’alcool de 4.2% alc/volH1 :

Ex.1 : Guinness

Observation: 4.2%, 4.7%, 4.3%, 4.5%, 4.3% n=? k=? x=4.4% s=0.2%

Ex.1 : Guinness Observation: 4.2%, 4.7%, 4.3%, 4.5%, 4.3% n=5 k=4 (n-1) x=4.4% s=0.2%

Ex.1 : Guinness

Ex.1 : Guinness

ex: k=4 , alpha=0.05, test bilatéral

tcrit= 2.776

t = 2.236 tcrit= 2.776

On rejette H0?

Ex.1 : Guinness

Page 18: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

18

t = 2.236 tcrit= 2.776

On rejette H0? NON!Et si on augmentait le n?

Ex.1 : Guinness Test t - des exemples Sert à comparer Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons

appariés)

k = n-2

Définir notre question: Les hommes et les femmes adultes ont-ils la même taille? α= 0.05

Hypothèse nulle: Les hommes et les femmes ont la même taille en moyenne

H0 :Hypothèse alternative: Les hommes et les femmes

n’ont pas la même taille en moyenneH1 :

ex.2: Tailles hommes vs femmes Définir notre question: Les hommes adultes sont-ils

plus grands que les femmes? α= 0.05Hypothèse nulle: Les hommes sont plus petits ou de la

même taille que les femmesH0 :Hypothèse alternative: Les hommes sont plus grands

que les femmesH1 :

ex.2: Tailles hommes vs femmes

Observation f (m): 1.65, 1.57, 1.77, 1.69 Observation m (m): 1.67, 1.79, 1.83, 1.87 nf=4 ; nm=4 k=6 (n-2 pour les comparaisons de deux moyennes) xf=1.67m ; xm= 1.79m sf=0.0833m ; sm=0.0864m

ex.2: Tailles hommes vs femmes nf=4 ; nm=4 xf=1.67m ; xm= 1.79m sf=0.0833m ; sm=0.0864m

ex.2: Tailles hommes vs femmes

Page 19: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

19

ex: k=6 , alpha=0.05, test bi et unilatéraltcrit_u= -1.943tcrit_b= 2.447

ex.2: Tailles hommes vs femmes t = -2 tcrit_u=-1.943 tcrit_b=2.447

ex.2: Tailles hommes vs femmes

0-1.943-2.447 2.447

-2

t = -2 tcrit_u=-1.943 rejette H0 tcrit_b=2.447 non-rejet H0

ex.2: Tailles hommes vs femmes

0-1.943-2.447 2.447

-2

Test t - des exemples Sert à comparer Une moyenne à une moyenne théorique Deux moyennes Deux moyennes non-indépendantes (échantillons

appariés)

Écart-type des différencesk = n-1

Définir notre question: Est-on plus endormi après un cours de stats sur les tests de t qu’avant le cours?

Hypothèse nulle: Les étudiants sont endormis de façon égale ou moindre après qu’avant un cours de stats sur le test t

H0 :Hypothèse alternative: Les étudiants sont plus endormis

après qu’avant un cours de stats sur le test tH1 :

ex.3: Avant/après statsSommeil: avant – après = différenceex.3: Avant/après stats

2343244

5342546

-3001-30-2

Page 20: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

20

Sommeil: avant – après = différenceex.3: Avant/après stats

2343244

5342546

-3001-30-2

D= -7/7 = -1s=1.633

n=7 D=-1 s=1.633

ex.3: Avant/après stats

t=-1.62, k=6 p=0.075, on ne rejette pas H0

ex.3: Avant/après stats

Conditions d’application Conditions d’application:

1) Indépendance des échantillons2) Échantillons aléatoires simples 3) Normalité de la distribution4) Égalité des variances

Récapitulatif Pose nos hypothèses (H0 et H1), test bilatéral ou

unilatéral? Détermine la valeur t critique en fonction du seuil α Calcul t pour notre échantillon Compare le t calculé au t critique Prend une décision statistique de rejeter H0 ou non

Page 21: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

21

Décisions statistiques Nous ne pouvons pas dire si H0 est vrai ou faux. Nous pouvons seulement dire avec quelle

probabilité les observations dans un échantillon sont compatibles avec l’hypothèse nulle.

Il y a toujours un risque d’erreur.

Décisions statistiques Les tests statistiques sont des outils puissants

et importants, mais ils peuvent amener à des erreurs dans une conclusion parce qu'ils sont basés sur des échantillons et non sur des populations entières.

Erreur du type 1 (α)La probabilité de rejeter H0 quand

H0 est vraie.Souvent en écologie on fixe α à 0,05

Erreur du type II (β) La probabilité de ne pas rejeter H0quand H1 est vraie.

En générale on ne peut pas fixer β dans un test. Il varie selon l’effectif, la variance et la différence entre H0 et H1.

Deux types d’erreurs lors d’une décision statistique

le processus décisionnel du test d’hypothèse

Réalité (inconnu)Décision Ho vrai Ho fausseRejet de Ho Erreur de première

espèce (type I)P=α

Décision correctePuissance statistique

Non-rejet de Ho Décision correcteP=1- α

Erreur de seconde espèce

(type II)

Puissance d’un testProbabilité de rejeter H0 quand H1 est

vraie

Puissance =1 - β

Page 22: BIO3500 Cours 3 - Article 1, Stat2 [Mode de compatibilité]fredboivin.weebly.com/.../9/3/...6_diapos_par_page.pdf · 5dssruw gh uhfkhufkh 6hfwlrqv gx wudydlo 3upvhqwdwlrq hu sdjh

22

Activité Groupes de 5 ou 6 (voisins proches) Donner un cas où l’on peut utiliser un test d’hypothèses de comparaison de moyennes De quel type de test s’agit-il? Donner vos hypothèses nulles et alternatives S’agit-il d’un test unilatéral ou bilatéral? Que concluez-vous si la valeur de t dépasse le t critique?

Vous avez dix minutes go!