12
TUTORAT SANTE PARIS-SACLAY 02/11/2021 1 CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - ÉPIDÉMIOLOGIE Ce document est réalisé sous l’entière responsabilité du Tutorat Santé Paris-Saclay avec l’aval des professeurs de l’université. Il ne constitue en aucun cas une référence opposable aux examens officiels.

CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

1

CARNETS DU TUTO

BIOSTATISTIQUES

COURS N°12 - ÉPIDÉMIOLOGIE

Ce document est réalisé sous l’entière responsabilité du Tutorat Santé Paris-Saclay avec l’aval des professeurs de l’université. Il ne constitue en aucun cas une référence opposable aux examens officiels.

Page 2: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

2

Table des matières I- Définition 3

II- Les différents types d’épidémiologie 4

2. Épidémiologie explicative 5

2.1. Expérimentation 5

2.3. Enquêtes cas-témoins 8

III- Test de lien statistique entre l’exposition et la maladie 11

Page 3: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

3

I- Définition

L’épidémiologie est l’étude de l’état de santé de la population humaine et de ses déterminants (c’est-

à-dire l’identification des causes des problèmes de santé de la population), et son application à la lutte contre les

problèmes de santé.

On distingue l’épidémiologie descriptive qui consiste à recueillir les informations provenant de la

population. On relève les informations concernant le nombre de cas, les caractéristiques d’une maladie.

Il s’agit d’une photographie de la population à un instant t. On est donc dans un concept d’observation et non de

recherche de compréhension des causes et conséquences de la maladie.

On a également l’épidémiologie explicative qui consiste à rechercher les facteurs causaux ou les

facteurs de risques d’une maladie (facteurs qui augmentent la probabilité d’avoir la maladie) en vue de

développer une solution.

On recherche des liens entre l’existence de ces facteurs de risques et l’apparition de la maladie.

(On en trouve une troisième, l’épidémiologie évaluative, qui ne sera pas traitée ici.)

Selon l’objectif ou les contraintes que l’épidémiologiste se sera fixé(es), l’échantillonnage sera différent. La

différence majeure entre les méthodes d’échantillonnage est la chronologie. Soit on décide de suivre un patient au

cours du temps (études prospectives), soit on décide de l’interroger sur son passé (études rétrospectives).

La méthode d’analyse et la conclusion seront ainsi différentes en fonction de la méthode d’échantillonnage utilisée.

(Face à un énoncé d’exercice, il est donc important de déterminer de quels types d’études épidémiologiques il s’agit

pour pouvoir tirer la bonne conclusion.)

Page 4: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

4

II- Les différents types d’épidémiologie

1. Épidémiologie descriptive

L’épidémiologie descriptive permet de décrire l’état de santé d’une population à un temps donné.

On va échantillonner et recueillir différentes informations pour pouvoir observer une partie de la population à un instant

t. On réalise une enquête transversale (à travers la population).

● Échantillonner : prendre au hasard un certain nombre d’individus dans une même population ; c’est

l’inclusion des sujets, le choix des personnes qui vont faire partie de l’étude.

● On va recueillir 2 types d’informations : l’état de chaque personne par rapport à la maladie (malade ou

non malade) et l’exposition ou non à un facteur (facteurs environnementaux…).

Ces résultats obtenus vont être répertoriés dans un tableau de contingence :

E+ E−

M+ a b

M− c d

M+ : Personnes malades ; E+ : Personnes exposées ; M- : Personnes non-malades ; E- : Personnes non exposées

Ces informations vont nous permettre d’estimer la prévalence (pr) ou fréquence d’une maladie dans la population : pr

=𝑎+𝑏

𝑎+𝑏+𝑐+𝑑

On peut également estimer l’incidence (in), qui est le nombre de nouveaux cas apparus sur un intervalle de temps

donné.

À partir de l’incidence on détermine un taux d’incidence qui est le nombre de nouveaux cas apparus pendant un temps

donné rapporté à la taille de la population.

L’enquête transversale (sans biais d’échantillonnage) permet d’estimer la prévalence ou l’incidence d’une maladie.

Des études transversales sont réalisées en permanence par un organisme : le Réseau Sentinelle. Il s’agit d’une

collaboration entre environ 1300 médecins et chercheurs partout en France. Cela permet d’obtenir des données

épidémiologiques en temps réel (une semaine de retard au maximum) sur l’ensemble de la population ; et permet

par exemple de tenir le corps médical au courant de l’avancée des potentielles vagues de grippe ou toute infection

circulante. Les médecins renseignent une base de données nationale où ils indiquent tous les nouveaux cas de

chacune des maladies étudiées dans le réseau sentinelle (comparaison de l’épidémie par région…). La prise en

charge des patients est donc améliorée grâce à cette base de données actualisées en permanence. On peut ainsi

suivre la prévalence et l’incidence d’une maladie au cours du temps. Chaque médecin peut y avoir accès.

Avantages de l’enquête transversale :

● Rapidité : on n’a pas besoin de suivi et on a tout de suite les résultats.

● Échantillons représentatifs de la population sans biais d’échantillonnage. Ils permettent ainsi l’estimation

sur la population de la prévalence et de l’incidence (ils permettent d’estimer la proportion de population

exposée à un facteur de risque quelconque).

● Possibilité de comparer entre elles des populations (de différentes régions, pays…).

Page 5: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

5

Inconvénients :

● Ne sont pas adaptées aux situations rares : aux maladies rares, expositions rares car on a peu d’individus

(on ne peut pas prendre toute la population), et donc l’estimation ne peut pas être faite sur la population.

● L’absence de chronologie (depuis quand les personnes exposées sont-elles malades ?). Il n’y a pas de suivi

dans le temps (difficultés à conclure sur le rôle d’un facteur dans l’apparition de la maladie).

2. Épidémiologie explicative Il existe trois grandes méthodes d’épidémiologie explicative qui permettent de rechercher la cause d’une maladie et

d’analyser l’association entre des facteurs d’exposition ou de risque (ou des traitements) et la présence de la maladie.

2.1. Expérimentation On constitue aléatoirement 2 groupes (ou plus) dont l’un sera traité donc, exposé aux facteurs (E+) et l’autre

sera un groupe témoin, non exposé aux facteurs (ou placebo) (E-). Ces deux groupes étant issus d’une même population

homogène, ont les mêmes caractéristiques (pas de différence à priori). On peut donc supposer qu’il n’y a aucune

différence entre les deux groupes à part le traitement qui lui est donné. Cette étude permet alors de conclure que la

différence de proportion de malades qui sera observée entre les deux groupes exposés/non exposés est due au

traitement appliqué.

On dit d’une étude qu’elle est menée « en simple aveugle » quand seuls les sujets ne savent pas ce qu’ils

reçoivent (facteur étudié ou placebo).

On dit d’une étude qu’elle est en « double aveugle » lorsque ni les sujets ni les expérimentateurs chargés d’administrer

le facteur ne savent ce que les participants reçoivent.

Une étude est dite « idéale » lorsqu’elle est en simple ou double aveugle. Cela permet d’éviter tous les facteurs

psychologiques qui pourraient influencer le résultat.

Au moment de la constitution des groupes, tous les participants sont sains. Après un certain temps t, on compte

le nombre de malades dans chacun des groupes.

Expérimentation américaine sur la poliomyélite : en 1954, la fondation pour la paralysie infantile américaine a

financé une expérimentation en double aveugle sur des enfants de 5 à 8 ans qui n’avaient à priori pas été en contact

avec la maladie (pas d’anticorps antipolio). Elle a été menée par un professeur qui avait proposé un vaccin anti-

poliomyélite. Trois groupes d’enfants ont été réalisés (campagnes de publicité pour que les familles amènent leurs

enfants pour participer à cette étude), près de 2 millions ont participé à l’étude et ont été suivi pendant un an, dont 650

000 ont reçu le vaccin, 750 000 ont reçu un placebo et 430 000 n’ont rien reçu. Après 1 an, on estime que le vaccin a

été efficace de 60 à 95% selon la souche du virus.

Page 6: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

6

À t0, on inclut les individus dans l’expérience. Puis on fait un tableau de contingence pour analyser l’expérience.

Avantages :

● Établissement du lien de causalité entre maladie et facteur. C’est la seule situation où l’on peut conclure

sur la causalité : car la seule différence, au départ, entre les individus est l’exposition qui est contrôler par

l’expérimentateur.

● Leur bonne adaptation aux facteurs d’expositions rares (on peut sur représenter un facteur par rapport

à sa prévalence dans la population car on contrôle l’exposition).

Inconvénient :

● Expérimentation sur l’humain limitée par les règles d’éthique, besoin de l’accord du patient.

2.2. Cohortes prospectives Attention : ces études ne peuvent mettre en évidence que des liens statistiques et non des liens de causalité.

Enquêtes de cohortes prospectives : suivi d’une cohorte (= groupe de personnes) au cours du temps (observation)

L’objectif : comparer l’incidence de la maladie de t0 à t entre personnes exposés et non exposés au facteur de risque.

On commence par inclure à un instant t0 des personnes dans la cohorte, on peut relever la présence d’exposition(s) ;

puis on va les suivre dans le temps (et on pourra relever l’évolution des expositions) et à un instant t on va observer si

les personnes présentent ou non la maladie, et on va essayer de relier cela à la présence d’expositions dans la vie des

personnes (tableau de contingence). L’inclusion peut être aléatoire mais elle peut aussi concerner une exposition

spécifique ; on choisit comment on échantillonne (en générale on inclut des personne non malades).

On peut échantillonner parmi les exposés d’une part et parmi les non exposés d’autre part.

Objectif : Comparer le nombre de personnes qui sont tomber malade entre t0 et t entre les personnes exposées et non

exposées à un ou plusieurs facteurs de risques.

Pour comparer les taux d’incidence : test d’homogénéité vu dans cours du chi-deux.

L’exemple d’une cohorte célèbre : l’E3N développée en 1990 avec 100 000 femmes de l’éducation nationale (d’au

moins 40 ans) via la MGEN (Mutuelle Générale de l’Éducation Nationale). Après avoir suivi ces femmes, leurs conjoints

et/ou enfants ont participé et permis de faire plus d’études. C’est un exemple de cohorte réussie et utile, notamment

parce que l’inclusion et le recueil d’information se font au travers de la mutuelle (qui a donc accès directement à tous

les actes de soins).

Une autre cohorte très importante : The European Prospective Investigation into Cancer and Nutrition (EPIC) qui est

focalisée sur l’apparition des cancers.

Ou encore les cohortes de nouveau-nés avec lesquelles il est facile d’échantillonner aléatoirement la population

(dans les maternités). Paris et l’université Paris Descartes ont fait une étude de cohortes sur 4000 nouveau-nés en

Page 7: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

7

2002 dans 5 maternités parisiennes (suivis pendant 8 ans pour évaluer la relation entre leur santé respiratoire/leurs

allergies et leur mode/cadre de vie).

Les cohortes de prématurés sont utiles pour voir les conséquences du fait d’être prématuré et de leurs traitements, sur

leur état de santé au cours de leurs premières années de vie

Dans les cohortes, ce qui intéresse les épidémiologistes c’est un paramètre particulier qu’on appelle le Risque R.

Le Risque R : probabilité de contracter la maladie au cours d’une période d’étude. Soit Re+ parmi les personnes exposées

et Re- parmi les personnes non-exposées.

E+ E−

M+ a b

M− c d

Estimée par rapport aux données du tableau de contingence.

. On peut calculer ces risques sur deux échantillons distincts « exposés » d’une part et « non-exposés » d’autre part. On

peut aussi calculer à partir d’un même échantillon en séparant les sujets exposés et non exposés.

On peut calculer ce paramètre aussi dans l’expérimentation.

Aides de l’équipe du tuto à la compréhension :

Voici les probabilités correspondant à ce que nous cherchons, pour vous aider à mieux visualiser comment on en arrive

à ces résultats :

𝑅𝐸+ = 𝑃𝐸+(M+) = 𝑃(𝐸+ ∩ 𝑀+)

𝑃(𝐸+) =

𝑎

𝑎+𝑐

𝑅𝐸− = 𝑃𝐸−(M+) = 𝑃(𝐸− ∩ 𝑀+)

𝑃(𝐸−) =

𝑏

𝑏+𝑑

Risque relatif RR : comparaison du risque de maladie des personnes exposées par rapport au risque des personnes

non exposées.

Selon la valeur de RR, l’interprétation est différente :

● Si RR = 1 ; il n’y a pas de lien entre l’exposition et la maladie. ● Si RR < 1 ; l’exposition est un facteur de protection potentiel contre la maladie. ● Si RR > 1 ; l’exposition est un facteur de risque potentiel de la maladie.

Page 8: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

8

On peut seulement parler de facteur potentiel car ici on peut seulement suggérer un lien statistique et non un lien de

causalité.

Le RR est le rapport des proportions de malades des échantillons E+ et E-, et il permet d’estimer une proportion dans

la population.

Chaque risque est compris entre 0 et 1 puisque c’est une proportion. Le RR étant un rapport de de ces deux valeurs

comprises entre 0 et 1 peut prendre une valeur allant de 0 à +∞ (positif).

La formule du RR nous aide à comprendre l’interprétation du résultat :

● Si la probabilité d’apparition de la maladie est la même parmi les E+ et les E-, c’est-à-dire si la proportion de

malades observés est la même dans ces deux groupes, alors le rapport des deux est égal à 1. On peut conclure

qu’il n’y a pas de lien entre l’exposition et la maladie.

● S’il est > 1, cela signifie que la proportion de malades chez les exposés est supérieure à celle des non exposés.

L’exposition peut être interprétée comme un facteur de risque de la maladie.

● Au contraire, si le RR est < 1, la proportion de malades chez les exposés est inférieure à celle des non exposés

donc l’exposition peut être interprétée comme un facteur de protection.

Avantages :

● Le fait qu’elles permettent de calculer le risque relatif RR.

● Leur adaptation possible aux expositions rares (on choisit les personnes exposées ou non exposées avec un

biais volontaire d’échantillonnage). E+ sera surreprésenté lors de l’échantillonnage. (2 cohortes différentes)

Inconvénients :

● Pas adaptées pour les maladies rares. Il y a toujours plus de non-malades que de malades. Pour avoir une

puissance statistique on doit prendre des grandes cohortes ce qui n’est pas compatible avec les maladies

rares.

● La difficulté pour les médecins de recruter un grand nombre de personnes en bonne santé pour ces

cohortes (la majorité des personnes qu’un médecin voit sont malades d’une chose ou d’une autre, et peuvent

donc ne pas être conforme aux critères d’inclusion).

● Le coût et la durée (long). ● Le phénomène de perte de vue dû aux participants qui quittent la cohorte pour une raison ou pour une autre

(décès, changement de mutuelle).

● Si le processus d’inclusion est biaisé (expositions rares), on ne peut pas estimer la fréquence d’exposition dans

la population. Dans ce cas, il faut faire attention aux énoncés des exercices.

2.3. Enquêtes cas-témoins

Ces enquêtes servent également à suggérer un lien statistique et non un lien de causalité. Elles sont très

utilisées par les médecins et épidémiologistes.

Étude cas-témoins = Inclure des personnes (au temps t=0) dans l’étude selon qu’elles soient malades ou non. En

général, les malades sont plus rares que les non-malades, il faut donc échantillonner séparément les cas (malades)

des témoins (non-malades). On s'assure dès le début de l’étude qu’il y a suffisamment de malades pour avoir des

Page 9: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

9

résultats statistiques intéressants. L’inclusion se fait donc après la déclaration ou non de la maladie, on connaît l’état

du patient à t=0.

Finalement, on va recueillir des informations rétrospectives sur leur exposition dans le passé.

Exemple : avez-vous été exposé au tabagisme passif dans les 10 dernières années ?

Objectif : Mettre en relation l’exposition et la maladie. Comparer la proportion de personnes exposées et non exposées

entre malades et non-malades. Avons-nous dans les deux échantillons la même quantité de personnes exposées ou

non ?

Lors de l’échantillonnage, on inclut un groupe de « cas » (malades) représentatif de la population M+. On recueille les

informations en rapport avec leur potentielle exposition.

On crée ensuite le groupe témoin, en incluant des personnes de la population des non malades (M-). Ce groupe témoin

peut être représentatif de la population non-malade. Mais dans la plupart des études il est rendu le plus similaire

possible au groupe « cas » mise à part le fait que les sujets ne sont pas malades. Il est composé de personnes qui

ressemblent aux malades (même sexe, âge, taille, poids, métiers etc.).

Ici, l’échantillonnage n’est pas représentatif de la proportion M+/M- dans la population (on choisit le nombre de cas

et témoins au départ).

On ne peut plus estimer la proportion de malades (prévalence) ni les risques, ni le risque relatif.

On va donc à la place calculer l’Odds Ratio, ou ratio des côtes (OR).

Un Odds ou une côte est la probabilité de survenue d’un événement relativement à sa non survenue (rapport de la

probabilité de A sur la probabilité de 𝐴). C’est la proportion d’exposés relativement à la proportion de non-exposés.

E+ E−

M+ a b

M− c d

Parmi les malades, « a » correspond aux sujets exposés et « b » sujets non-exposés. Donc la côte est la proportion

d’exposé 𝑎

𝑎+𝑏 sur la proportion d’être non-exposé

𝑏

𝑎+𝑏 .

En simplifiant, on obtient la cote M+ égale à 𝑎

𝑏.

Avec le même raisonnement pour les non-malades, la proportion d’exposé 𝑐

𝑐+𝑑 sur la proportion d’être non-exposé

𝑑

𝑐+𝑑

,on obtient la cote M- égale à 𝑐

𝑑

Ainsi pour comparer l’exposition entre malades et non malades, on va calculer le ratio de cote ou Odds Ratio, c’est-à-

dire la côte de malades sur la côte de non malades.

Page 10: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

10

Selon la valeur de OR, l’interprétation est différente :

● Si OR = 1 ; il n’y a pas de lien entre l’exposition et la maladie

● Si OR > 1 ; l’exposition est un facteur de risque potentiel (plus d’exposés chez les malades)

● Si OR < 1 ; l’exposition est un facteur protecteur potentiel (plus d’exposés chez les non-malades)

Si on trouve par exemple OR > 1 cela se traduit par 𝑎𝑑 > 1. Autrement dit, la proportion des 𝑏𝑐 exposés chez les malades

sur les non exposés chez les malades, est supérieure à la proportion des exposés chez les non malades sur les non

exposés chez les non malades. L’exposition est donc un facteur de risque de la maladie.

L’Odds Ratio s’interprète donc comme le Risque Relatif. En revanche, OR ne dépend pas de la proportion de malades

dans la population ni de la prévalence de la maladie.

D’autre part, lorsque la maladie est rare, a et b vont être petits devant c et d. Donc (a+c) est environ égal à c. Idem pour

(b+d) qui est alors environ égal à d. Dans ce cas-là, RR = =𝑎(𝑏+𝑑)

𝑏(𝑎+𝑐) est environ égal à

𝑎𝑑

𝑏𝑐

La formule du risque relatif (RR) peut donc être bien approximée par celle de l’Odds Ratio (OR) : OR donne une bonne

approximation de RR dans le cas d’une maladie rare.

Avantages :

● Adapté aux maladies rares, M+ surreprésenté par l’échantillonnage.

● L’absence de suivi et donc gain de temps.

Inconvénients :

● L’impossibilité de calculer la prévalence de la maladie et le risque relatif.

● L’inadaptation aux facteurs d’exposition rares.

● La difficulté d’avoir un groupe témoin représentatif de la population des malades (une personne non

malade mais avec les mêmes caractéristiques qu’un malade).

● Le biais de mémoire, lié au recueil rétrospectif des informations sur l’exposition : les malades ont tendance à

se souvenir mieux et à surestimer leur exposition tandis que c’est le contraire pour les non-malades, ce qui peut

conduire à une surestimation du risque. C’est simplement lié au fait qu’un malade aura tendance à se

questionner et à s'identifier temporellement quand sa maladie a débuté. Il sera alors plus apte à se souvenir de

détails auxquels il a déjà pensé en essayant d’identifier la cause de sa maladie. Souvent les malades se

souviennent mieux des facteurs auxquels ils ont été exposés que les non malades. S’en suit une augmentation

de « d » et conduira à une surévaluation du lien entre l’exposition et la maladie (car OR = ad/bc). Le biais de

mémoire est donc un défaut de méthode d’étude qui a tendance à surévaluer.

/ ! \ On peut calculer des Odds M et des OR dans les études de cohortes, cas-témoins et expérimentation ! Toutefois,

on ne s’en sert pas quand on peut calculer les RE et RR.

De plus, on peut calculer des RE et RR dans toutes les études où l’échantillonnage ne biaise pas les proportions

M+ et M-, soit cohortes, expérimentation, SAUF les études cas-témoins (qui offrent un échantillonnage biaisé des M+

et M- car on les a choisi en fonction de s’ils sont malades ou non, ainsi l’échantillon n’est pas représentatif de la

population) où on utilise donc seulement les Odds M et OR.

Page 11: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

11

III- Test de lien statistique entre l’exposition et la maladie

On se demande s’il existe un lien statistique entre l’exposition et la maladie.

Pour savoir s’il existe une relation entre l’exposition et la maladie, il est nécessaire de faire un test

statistique pour conclure. Avec ce test on va, soit comparer les proportions des exposées et non-exposés dans

les études cas-témoin (dans lesquelles on a la proportion de malades et de non malades) ; soit comparer les

proportions des malades et non-malades lors d’une cohorte (dans laquelle on a la proportion d’exposés et de

non exposés). La méthode de test a été vue avec le test de Chi-deux et le tableau de contingence.

Nos hypothèses seront :

● H0 :

● Il n’y a pas de relation (pas de lien statistique) entre l’exposition et la maladie dans la population.

● E et M sont indépendants. ● RR ou OR =1 dans la population.

● H1 : ● Il y a une relation (un lien statistique) entre l’exposition et la maladie dans la population.

● E et M ne sont pas indépendants.

● RR ou OR ≠1 dans la population.

Pour conclure un lien statistique, il est nécessaire de faire un TEST statistique, on ne peut pas conclure en observant

des données d’échantillon !

On peut poser des hypothèses avec un potentiel lien entre la maladie et l’exposition, mais l’établissement d’un lien

statistique doit être précédé d’un test.

On utilisera un test du Chi-deux !!! (Soit de comparaison d’échantillons si on a plusieurs échantillons soit

d’indépendance si on a un seul échantillon).

C’est à savoir, le test à utiliser pour conclure en épidémiologie c’est le chi-deux, il peut donc y avoir des exos combinés.

Attention à l’interprétation ! Seule l’expérimentation permet d’établir un lien de causalité. Les études cas-témoin

et cohortes ne permettent que de suggérer un lien statistique suite à un test de chi-deux.

Donc un facteur de risque ou de protection n’équivaut pas à un lien de causalité. Ce sont des suppositions.

Il existe un lien de causalité si on prouve que le facteur d’exposition induit une augmentation de la maladie, ou que

le facteur de protection induit une diminution de l’apparition de la maladie.

Il n’est pas possible d’avoir un lien de causalité avec les enquêtes cas-témoin ou encore cohorte.

Uniquement par l’étude d’expérimentation.

Un lien de causalité est différent du lien statistique. Deux facteurs peuvent être liés seulement de manière

statistique, sans causalité. Ils se nomment facteurs de confusions. Si l’on fait une étude on trouvera un lien statistique

et non de causalité. Souvent ces deux facteurs sont liés entre eux par un troisième qui lui est la réelle cause !

Par exemple, existe-t-il un lien statistique entre « avoir les dents jaunes » et « avoir un cancer du poumon » ? (Les

personnes avec un cancer du poumon ont tendance à avoir les dents plus jaunes que le reste de la population, et) On

peut conclure que les deux soient liés (rejet de H0 donc non indépendants donc il existe un lien statistique), mais

Page 12: CARNETS DU TUTO BIOSTATISTIQUES COURS N°12 - …

TUTORAT SANTE PARIS-SACLAY 02/11/2021

12

aucune de ces deux manifestations n’est la cause de l’autre. En effet, la consommation de tabac est une des causes

de l’un et de l’autre. Ces facteurs sont des conséquences d’une même cause et se nomment facteurs de confusion. Ils

sont tous les deux causés par un troisième facteur réellement aggravant. Mais ces deux facteurs ne sont liés entre eux

que par ce facteur tiers et sont donc source de confusion (d’où le nom). Pour simplifier les calculs et parce qu’on a

seulement accès à la table de cette loi, il sera intéressant d’utiliser la loi normale centrée réduite.

ERRATA Si cette page est vide tant mieux, le document ne comporte pas d’erreurs connues. Si vous en

trouvez une, rapportez-la sur le forum du site https://www.tsps.fr/ !