9
90-60-0207-A Mesure des performances et méthode de valorisation des tests biologiques H. Delacour, S. Mouline, F. Ceppa Les analyses biologiques occupent une part de plus en plus importante dans le raisonnement médical. Survenant après une étape d’analyse clinique de la situation, leur prescription doit s’appuyer sur différents critères : la disponibilité des tests, leur coût, mais surtout la qualité de l’information qu’ils peuvent apporter. Cette information, donc l’intérêt de leur prescription, est fonction de leur validité, c’est-à-dire de leur capacité à différencier les personnes atteintes de la maladie de celles qui en sont indemnes. Différents indices permettent d’apprécier la validité d’un test : la sensibilité, la spécificité, les valeurs prédictives et les rapports de vraisemblance. Cet article présente leur signification et leur intérêt dans la démarche diagnostique. © 2013 Elsevier Masson SAS. Tous droits réservés. Mots-clés : Sensibilité ; Spécificité ; Valeurs prédictives ; Rapport de vraisemblance ; Test diagnostique ; Interprétation Plan Introduction 1 Test biologique et raisonnement médical 1 Principes de l’évaluation de la validité d’un test diagnostique 2 Sensibilité et spécificité 2 Définitions 2 Influence de la valeur seuil 3 Valeurs prédictives positives et négatives 4 Définitions 4 Influence de la prévalence de la maladie 5 Rapports de vraisemblance (« likelihood ratio ») 5 Définitions 5 Calcul de la probabilité post-test de la maladie 5 Conclusion 7 Introduction Pour l’orienter dans sa démarche diagnostique, le médecin a fré- quemment recours à la prescription d’examens biologiques. Selon une étude réalisée aux États-Unis en 2005, ces examens, qui repré- sentent moins de 2 % des dépenses de santé, influencent 60 à 80 % des décisions médicales [1] . Ces chiffres expliquent le dyna- misme de la recherche et du développement dans le domaine du diagnostic in vitro et l’apparition régulière de nouveaux tests diag- nostiques. Le médecin doit choisir au sein d’un panel d’analyses, le(s) test(s) le(s) plus adapté(s) à la situation clinique. Ce choix est fonction de différents critères : la disponibilité du test, son coût et surtout la qualité de l’information qu’il peut apporter. Cette information, donc l’intérêt de leur prescription, est fonction de leur validité, c’est-à-dire de leur capacité à différencier les per- sonnes atteintes de la maladie de celles qui en sont indemnes. Différents indices permettent d’apprécier la validité d’un test : la sensibilité, la spécificité, les valeurs prédictives et les rapports de vraisemblances. Quelle est leur signification ? Quelles informa- tions apportent-ils au médecin ? Test biologique et raisonnement médical En pratique, le problème qui se pose au médecin est d’évaluer chez un patient la probabilité d’être malade ou non. Il part d’une suspicion clinique de la présence ou non de la maladie (pro- babilité prétest). Si cette probabilité prétest est suffisante pour affirmer la présence de la maladie, la réalisation d’un test bio- logique est inutile. Dans le cas inverse, la prescription d’examens complémentaires, dont des tests biologiques, est indiquée. La réa- lisation d’un examen biologique n’est utile que si son résultat est capable de modifier la probabilité prétest jusqu’à un seuil de décision médicale (probabilité post-test). Si cette probabilité est supérieure au seuil d’affirmation de la maladie, la maladie est avérée et une prise en charge adéquate est instaurée. Si elle est inférieure au seuil d’exclusion de la maladie, l’hypothèse diag- nostique est infirmée. Si la probabilité post-test est comprise entre ces deux seuils (zone d’indécision), la réalisation d’examens sup- plémentaires est nécessaire pour aboutir à une décision clinique (Fig. 1) [2] . Cette approche du raisonnement médical implique : de posséder des seuils décisionnels, définis en fonction de la gravité de la maladie et du rapport bénéfices/risques de la thé- rapeutique ; EMC - Biologie médicale 1 Volume 8 > n 1 > mars 2013 http://dx.doi.org/10.1016/S2211-9698(13)57794-6

Mesure des performances et méthode de valorisation des tests biologiques

  • Upload
    f

  • View
    219

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Mesure des performances et méthode de valorisation des tests biologiques

� 90-60-0207-A

Mesure des performances et méthodede valorisation des tests biologiques

H. Delacour, S. Mouline, F. Ceppa

Les analyses biologiques occupent une part de plus en plus importante dans le raisonnement médical.Survenant après une étape d’analyse clinique de la situation, leur prescription doit s’appuyer sur différentscritères : la disponibilité des tests, leur coût, mais surtout la qualité de l’information qu’ils peuvent apporter.Cette information, donc l’intérêt de leur prescription, est fonction de leur validité, c’est-à-dire de leurcapacité à différencier les personnes atteintes de la maladie de celles qui en sont indemnes. Différentsindices permettent d’apprécier la validité d’un test : la sensibilité, la spécificité, les valeurs prédictiveset les rapports de vraisemblance. Cet article présente leur signification et leur intérêt dans la démarchediagnostique.© 2013 Elsevier Masson SAS. Tous droits réservés.

Mots-clés : Sensibilité ; Spécificité ; Valeurs prédictives ; Rapport de vraisemblance ; Test diagnostique ;Interprétation

Plan

■ Introduction 1■ Test biologique et raisonnement médical 1■ Principes de l’évaluation de la validité d’un test diagnostique 2■ Sensibilité et spécificité 2

Définitions 2Influence de la valeur seuil 3

■ Valeurs prédictives positives et négatives 4Définitions 4Influence de la prévalence de la maladie 5

■ Rapports de vraisemblance (« likelihood ratio ») 5Définitions 5Calcul de la probabilité post-test de la maladie 5

■ Conclusion 7

� IntroductionPour l’orienter dans sa démarche diagnostique, le médecin a fré-

quemment recours à la prescription d’examens biologiques. Selonune étude réalisée aux États-Unis en 2005, ces examens, qui repré-sentent moins de 2 % des dépenses de santé, influencent 60 à80 % des décisions médicales [1]. Ces chiffres expliquent le dyna-misme de la recherche et du développement dans le domaine dudiagnostic in vitro et l’apparition régulière de nouveaux tests diag-nostiques. Le médecin doit choisir au sein d’un panel d’analyses,le(s) test(s) le(s) plus adapté(s) à la situation clinique. Ce choix estfonction de différents critères : la disponibilité du test, son coûtet surtout la qualité de l’information qu’il peut apporter. Cetteinformation, donc l’intérêt de leur prescription, est fonction de

leur validité, c’est-à-dire de leur capacité à différencier les per-sonnes atteintes de la maladie de celles qui en sont indemnes.Différents indices permettent d’apprécier la validité d’un test : lasensibilité, la spécificité, les valeurs prédictives et les rapports devraisemblances. Quelle est leur signification ? Quelles informa-tions apportent-ils au médecin ?

� Test biologique et raisonnementmédical

En pratique, le problème qui se pose au médecin est d’évaluerchez un patient la probabilité d’être malade ou non. Il part d’unesuspicion clinique de la présence ou non de la maladie (pro-babilité prétest). Si cette probabilité prétest est suffisante pouraffirmer la présence de la maladie, la réalisation d’un test bio-logique est inutile. Dans le cas inverse, la prescription d’examenscomplémentaires, dont des tests biologiques, est indiquée. La réa-lisation d’un examen biologique n’est utile que si son résultatest capable de modifier la probabilité prétest jusqu’à un seuil dedécision médicale (probabilité post-test). Si cette probabilité estsupérieure au seuil d’affirmation de la maladie, la maladie estavérée et une prise en charge adéquate est instaurée. Si elle estinférieure au seuil d’exclusion de la maladie, l’hypothèse diag-nostique est infirmée. Si la probabilité post-test est comprise entreces deux seuils (zone d’indécision), la réalisation d’examens sup-plémentaires est nécessaire pour aboutir à une décision clinique(Fig. 1) [2].

Cette approche du raisonnement médical implique :• de posséder des seuils décisionnels, définis en fonction de la

gravité de la maladie et du rapport bénéfices/risques de la thé-rapeutique ;

EMC - Biologie médicale 1Volume 8 > n◦1 > mars 2013http://dx.doi.org/10.1016/S2211-9698(13)57794-6

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 2: Mesure des performances et méthode de valorisation des tests biologiques

90-60-0207-A � Mesure des performances et méthode de valorisation des tests biologiques

Figure 1. Place du test biologique dans leraisonnement médical. La prescription d’unexamen biologique ne doit survenir qu’aprèsanalyse clinique de la situation au cours delaquelle le médecin évalue la probabilité de laprésence de la maladie (probabilité prétest). Letest ne sera utile que s’il apporte une infor-mation capable après calcul de la probabilitépost-test d’aider à la prise de décision (inter-vention, abstention ou prescription d’examenscomplémentaires). + : résultat du test positif ; − :résultat du test négatif.

• d’estimer une probabilité prétest, sur la base de l’expérience dumédecin ou à l’aide des données de la littérature (prévalence dela maladie dans la population, système de score clinique, etc.) ;

• d’apprécier une probabilité post-test, en s’appuyant sur lesindices reflétant la validité du test, dont la déterminationconstitue une étape clé dans le processus d’évaluation d’un testbiologique.

� Principes de l’évaluationde la validité d’un testdiagnostique

Différents référentiels méthodologiques sont disponibles dansla littérature, le plus fréquemment utilisé étant le référentiel STAn-dards for the Reporting of Diagnostic accuracy studies (STARD) [3–6].Schématiquement, l’évaluation de la validité d’un test biologiqueconsiste à réaliser le test évalué dans un échantillon de sujetsreprésentatif de la population d’intérêt et à comparer les résul-tats obtenus à ceux observés avec un test de référence, permettantde classer les sujets en malades et indemnes de la maladie. Le testde référence est le meilleur test ou la meilleure combinaison detests disponibles pour déterminer la présence ou l’absence de lamaladie. Il est nommé gold standard s’il s’agit d’un test parfait,capable d’identifier, sans erreur, les patients malades des patientsnon malades [7].

Les sujets sont classés en malades (M+) ou indemnes de la mala-die (M−) selon le résultat du test de référence et en positifs (R+)ou négatifs (R−) en fonction du résultat du test évalué. Les sujetstestés se répartissent en quatre catégories :• les vrais positifs (VP) : sujets malades avec un résultat positif

(M+/R+) ;• les vrais négatifs (VN) : sujets indemnes de la maladie avec un

résultat négatif (M−/R−) ;• les faux positifs (FP) : sujets indemnes de la maladie avec un

résultat positif (M−/R+) ;• les faux négatifs (FN) : sujets malades avec un résultat négatif

(M+/R−).

Ces informations, résumées dans un tableau de contingence(Tableau 1), permettent de calculer les différents indices évaluantles performances diagnostiques du test.

� Sensibilité et spécificitéDéfinitions

La sensibilité et la spécificité sont deux caractéristiques intrin-sèques d’un test : elles ne sont pas influencées par la prévalencede la maladie dans la population d’étude.

La sensibilité (Se) mesure la capacité d’un test à bien identifierles malades. Elle correspond à la probabilité d’observer un testpositif chez un sujet malade. Elle est exprimée par la proportionde vrais positifs chez les sujets malades, soit :

Se = VPVP + FN

Une sensibilité égale à 0,8 signifie que le test est positif chez80 % des malades. Une sensibilité élevée est requise lorsqu’il estdangereux de ne pas diagnostiquer une maladie, car elle permetde limiter le nombre de faux négatifs. Un test sensible est trèsinformatif lorsque son résultat est négatif : il permet au médecind’exclure la maladie, le nombre de faux négatifs étant faible.

La spécificité (Sp) mesure la capacité d’un test à bien identifierles sujets indemnes de la maladie. Elle correspond à la probabilitéd’avoir un test négatif chez un sujet sain. Elle est exprimée parla proportion de vrais négatifs chez les sujets indemnes de lamaladie, soit :

Sp = VNVN + FP

Une spécificité égale à 0,8 signifie que le test est négatif chez80 % des sujets indemnes de la maladie. Une spécificité élevée estrequise lorsqu’il est dangereux de diagnostiquer à tort une mala-die, car elle permet de limiter le nombre de faux positifs. Un testspécifique est très informatif quand son résultat est positif : il per-met de confirmer une hypothèse diagnostique, le nombre de fauxpositifs étant faible.

Tableau 1.Tableau de contingence d’un échantillon de n sujets classés en fonction de leur état de santé selon un test de référence et le test évalué.

Test de référence Total

Malades (M+) Indemnes de la maladie (M−)

Test évalué Résultat positif (R+) Vrais positifs (VP) Faux positifs (FP) VP + FP

Résultat négatif (R−) Faux négatifs (FN) Vrais négatifs (VN) FN + VN

Total VP + FN FP + VN N

2 EMC - Biologie médicale

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 3: Mesure des performances et méthode de valorisation des tests biologiques

Mesure des performances et méthode de valorisation des tests biologiques � 90-60-0207-A

Tableau 2.Évaluation de la validité de la détection des anticorps anti-PF4 à l’aide du test ID-PaGIA (Diamed®) dans le diagnostic de thrombopénie induite par l’héparinede type II (TIH) [8].

Thrombopénie induite par l’héparine a Total

Positive Négative

Détection des anticorpsanti-PF4 (test ID-PaGIA)

Positive 21 1 22

Négative 16 175 191

Total 37 176 213

a Diagnostic de TIH posé à l’aide d’un test de libération de la sérotonine radiomarquée.

La sensibilité et la spécificité étant déterminées à partir d’unéchantillon de sujets, il est indispensable de les exprimer avecleur intervalle de confiance. Par convention, des intervalles deconfiance à 95 % (IC 95 %) sont retenus et peuvent être calculés àl’aide des formules suivantes :

IC95 % Se : Se ± 1,96 × √(Se × (1 − Se)/M+)

IC95 % Sp : Sp ± 1,96 × √(Sp × (1 − Sp)/M−)

L’exemple suivant illustre le calcul de ces deux indices.L’objectif du travail est d’évaluer la sensibilité et la spécificitéde la détection des anticorps anti-PF4 à l’aide du test ID-PaGIA(Diamed®) dans le diagnostic de thrombopénie induite parl’héparine de type II (TIH). Pour ce faire, ce test a été réaliséchez 213 patients suspects de TIH [8]. Les résultats de l’étudesont présentés dans le Tableau 2. L’application des formulesprécédentes permet de calculer la sensibilité et la spécificité dutest :

Se = VPVP + FN

= 2121 + 16

= 0, 57

Sp = VNVN + FP

= 175175 + 1

= 0, 99

“ Point important

Caractéristiques intrinsèques d’un test, la sensibilité etla spécificité sont indépendantes de la prévalence de lamaladie recherchée au sein de la population d’étude. Lasensibilité correspond à la probabilité d’observer un testpositif chez un sujet malade et la spécificité correspondà la probabilité d’observer un test négatif chez un sujetindemne de la maladie.

Influence de la valeur seuilVariations de la sensibilité et de la spécificitéen fonction de la valeur seuil

Quand un test conduit à des résultats quantitatifs continus, casde la majorité des tests biologiques, il est nécessaire de définir unevaleur seuil (ou cut off) permettant de classer le résultat du test ennégatif (R−) ou positif (R+). Le choix de cette valeur seuil influencela sensibilité et la spécificité du test.

Dans le cas hypothétique d’un test parfait, les distributions desrésultats des sujets malades et des sujets indemnes de la maladiene se superposent pas (Fig. 2). La valeur seuil optimale du testest située entre ces deux distributions. Tous les sujets sont classéscorrectement à l’aide du test : la sensibilité et la spécificité du testsont égales à 1.

Cependant, pour la majorité des tests, les distributions des résul-tats des sujets malades et indemnes de la maladie présentent unezone de chevauchement (Fig. 3). Tout choix d’une valeur seuilconduit à des erreurs de classification : certains sujets maladessont classés indemnes de la maladie (faux négatifs), d’autres sontclassés malades alors qu’ils ne le sont pas (faux positifs). Comme

Figure 2. Distribution des résultats dans le cas d’un test parfaitementdiscriminant en fonction du caractère malade ou non malade des sujets.La valeur seuil optimale du test (S) se situe entre les deux distributions : lasensibilité et la spécificité du test sont égales à 1.

Figure 3. Distribution des résultats dans le cas d’un test « réel » enfonction du caractère malade ou non malade des sujets. Une zone dechevauchement des deux distributions est observée (A). Quelle que soitla valeur seuil choisie, des erreurs de classifications sont observées (B).

mentionné à la Figure 3, à la valeur seuil S1, le risque de fauxnégatifs est éliminé. Tous les sujets malades ont un test positif :la sensibilité du test est égale à 1. En contrepartie, une fractiondes sujets indemnes de la maladie a un test positif : la spécificitédu test est abaissée. À l’inverse, à la valeur seuil S3, le risque defaux positif est écarté : la spécificité est de 1. Parallèlement, des

EMC - Biologie médicale 3

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 4: Mesure des performances et méthode de valorisation des tests biologiques

90-60-0207-A � Mesure des performances et méthode de valorisation des tests biologiques

Figure 4. Courbe receiver operating characteristic (ROC) : principes (A,B). La courbe ROC est une représentation graphique de la relation existante entresensibilité et spécificité pour toutes les valeurs seuils possibles. Pour une valeur seuil élevée, tous les sujets sont classés R− (point S1): la résultante sur la courbeROC est le point situé au coin inférieur gauche (Se = 0 et Sp = 1). Toute diminution du seuil entraîne une augmentation de la sensibilité et une diminution dela spécificité (points S2, S3 et S4). À l’extrême, pour une valeur seuil très basse, tous les sujets sont classés R+ : la résultante est le point situé au coin supérieurdroit (point S5). La diagonale bleue représente un test « d’apport nul ».

faux négatifs sont observés : la sensibilité est abaissée. Ainsi, sen-sibilité et spécificité varient inversement : la sensibilité diminuealors que la spécificité augmente avec l’augmentation de la valeurseuil (dans le cas où un sujet malade présente un résultat supérieurà celui d’un sujet indemne de la maladie). Dans le cas d’un testdit « inversé » (sujet malade avec un résultat inférieur à celui d’unsujet indemne de la maladie), le contraire est observé : la sensibilitéaugmente avec l’augmentation de la valeur seuil et la spécificitédiminue. Comment dès lors choisir la valeur seuil la plus adap-tée ? La courbe receiver operating characterisitic (ROC) constitue unoutil de choix pour répondre à cette interrogation.

Détermination de la valeur seuil optimale :la courbe « receiver operating characterisitic »

Utilisé dans le domaine médical depuis les années 1960, lacourbe ROC est la représentation graphique de la relation exis-tante entre la sensibilité et la spécificité d’un test à toutes lesvaleurs seuils possibles (Fig. 4) [9]. L’ordonnée correspond à la sen-sibilité, l’abscisse à la quantité (1 – spécificité). Son élaborationnécessite l’utilisation de logiciels spécialisés tels que SPSSTM ouRockitTM. Les principes régissant la construction d’une courbeROC sont présentés dans l’article de Zweig et al. [10].

Dans le cas d’un test parfait, comme schématisé à la Figure 2,la courbe ROC passe par le point de coordonnées {0;1} (Sp = 1,Se = 1), l’aire sous la courbe ROC (ASC) associée est égale à 1.À l’inverse, si les distributions des résultats des sujets malades etdes sujets indemnes de la maladie se superposent parfaitement, lasensibilité est égale à la quantité (1 – spécificité) pour toutes lesvaleurs du test. La courbe ROC résultante est une diagonale reliantl’extrémité inférieure gauche à l’extrémité supérieure droite dugraphique, l’ASC est égale à 0,5. Le test est dit « d’apport nul ».L’étude de l’ASC permet d’évaluer l’intérêt diagnostique d’un test.On distingue les tests « d’apport nul » (ASC = 0,5), « peu informa-tifs (0,5 < ASC < 0,7), « moyennement informatifs » (0,7 ≤ ASC <0,9), « très informatifs » (0,9 ≤ ASC < 1) et « parfaits » (ASC = 1).Le même raisonnement peut être mené avec un test inversé, lesvaleurs seuils des ASC étant 0,5 ; 0,3 ; 0,1 et 0. La déterminationde l’ASC et de son intervalle de confiance sont effectuées automa-tiquement par les logiciels statistiques précédemment cités.

Intuitivement, la valeur seuil optimale d’un test peut êtreidentifiée comme étant le point de la courbe ROC le plus éloi-gné de la diagonale représentant le test dit « d’apport nul ».

Cependant, cette approche ne prend pas en compte différentscritères épidémiologiques et socioéconomiques pouvant influersur le choix de la valeur seuil. En effet, celle-ci est fonction del’objectif assigné au test, de la prévalence de la maladie et dedifférents critères médicoéconomiques (coût du traitement et deses effets indésirables, etc.). Pour tenir compte de ces différentséléments, le choix de la valeur seuil peut s’effectuer à l’aide de laformule de calcul suivante :

T = (1 − p)p

× CFP − CVN

CFN + CVP

où CVP, CVN, CFP, CFN sont les coûts associés respectivement à unsujet classé vrai positif, vrai négatif, faux positif et faux négatif,p est la prévalence de la maladie dans la population et T est lapente de la tangente à la courbe ROC à la valeur seuil optimale dutest [11]. La Figure 5 illustre le choix d’une valeur seuil à l’aide desdeux méthodes présentées.

La tendance actuelle est d’affecter deux seuils à un test diagnos-tique donné : un seuil avec une bonne sensibilité pour renforcerl’exclusion d’une hypothèse diagnostique et un seuil avec unebonne spécificité pour renforcer son affirmation.

Cependant, la sensibilité et la spécificité ne permettent pasde répondre à la question implicitement posée par le clinicienlorsqu’il prescrit un test biologique : le patient est-il malade ouindemne de la maladie ? En d’autres termes : quelle est la proba-bilité que le patient soit malade si le test est positif et qu’il soitindemne de la maladie si le test est négatif ? Les valeurs prédictivesprocurent cette information.

� Valeurs prédictives positiveset négativesDéfinitions

La valeur prédictive positive (VPP) correspond à la probabilitéd’être malade quand le test est positif. C’est la proportion depersonnes réellement malades parmi celles qui ont un test positif,soit :

VPP = VPVP + FP

4 EMC - Biologie médicale

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 5: Mesure des performances et méthode de valorisation des tests biologiques

Mesure des performances et méthode de valorisation des tests biologiques � 90-60-0207-A

Figure 5. Choix d’une valeur seuil optimale à l’aide d’une courbe recei-ver operating characteristic (ROC). La valeur seuil 1 (sensibilité = 0,79 etspécificité = 0,71) est obtenue en recherchant le point de la courbe le pluséloigné de la diagonale représentant le test « d’apport nul ». La valeur seuil2 (sensibilité = 0,43 et spécificité = 0,93) prend en compte des donnéesépidémiologiques (prévalence de la maladie = 0,25) et médicoécono-miques (CFP = CFN et CVP = CVN). La pente de la tangente à la courbeROC, à cette valeur seuil du test, est égale à 3. Ce choix de valeur seuilprivilégie la spécificité au détriment de la sensibilité [11].

Plus cette valeur est proche de 1, plus le patient a de risqued’être malade en cas de test positif, le nombre de faux positifsétant faible. Une VPP de 0,8 signifie qu’un patient avec un testpositif a 80 % de risque d’être malade.

La valeur prédictive négative (VPN) correspond à la probabilitéd’être indemne de la maladie quand le test est négatif. C’est laproportion de patients indemnes de la maladie parmi ceux quiont un test négatif, soit :

VPN = VNVN + FN

Plus cette valeur est proche de 1, plus le patient a de chanced’être indemne de la maladie si le test est négatif. Une VPN de0,8 signifie qu’un patient avec un test négatif a 80 % de chancesd’être indemne de la maladie.

Comme pour la sensibilité et la spécificité, les valeurs prédictivesdoivent être exprimées avec leurs intervalles de confiance :

IC 95 % VPP : VPP ± 1,96 × √(VPP × (1 – VPP)/R+)

et IC 95 % VPN : VPN ± 1,96 × √(VPN × (1 – VPN)/R−)

“ Point important

Les valeurs prédictives d’un test sont fonction de la pré-valence de la maladie recherchée au sein de la populationd’étude. Plus la prévalence de la maladie est élevée, plusla valeur prédictive positive est élevée et plus la valeurprédictive négative est faible.

Influence de la prévalence de la maladieLa principale caractéristique des valeurs prédictives est d’être

fonction de la sensibilité et de la spécificité du test ainsi que dela prévalence de la maladie (p). Leur formule de calcul peut êtreexprimée en fonction de ces trois paramètres :

VPP = Se × p

(Se × p) + (1 − Sp) × (1 − p)

VPN = Sp × (1 − p)Sp × (1 − p) + (1 − Se) × p

Pour une prévalence de la maladie donnée, la VPP dépend essen-tiellement du terme (1 – Sp) et la VPN du terme (1 – Se) placés audénominateur des deux formules de calcul. La VPP augmente avecla spécificité du test, soit avec l’augmentation de la valeur seuil dutest et la VPN avec la sensibilité du test, soit une diminution de lavaleur seuil du test. De même, il est possible de calculer les valeursprédictives en fonction de la prévalence de la maladie pour unesensibilité et une spécificité fixées. Plus la prévalence de la maladieest élevée dans une population, plus la VPP tend vers 1 et la VPNvers 0. À l’inverse, plus la prévalence est basse et plus la VPP tendvers 0 et la VPN vers 1.

En pratique, cela signifie que les valeurs prédictives observéesdans une population d’étude ne pourront être transposées dansune autre population où la prévalence de la maladie est diffé-rente. D’une manière générale, la VPP chute et la VPN augmentequand un test initialement développé dans une population où laprévalence de la maladie est élevée (cas d’un service spécialisé)est appliqué dans une population où la prévalence est plus faible(population générale par exemple). Pour pallier cette « instabilité »des valeurs prédicitives en fonction de la prévalence de la mala-die, de nombreux auteurs préconisent l’utilisation des rapports devraisemblance.

� Rapports de vraisemblance(« likelihood ratio »)Définitions

Les rapports de vraisemblance (RV), ou likelihood ratio, sont unautre mode d’expression des caractéristiques intrinsèques d’untest. Ils estiment le rapport entre la probabilité d’avoir un testpositif (ou négatif) chez les sujets malades et celle d’avoir un testpositif (ou négatif) chez les sujets sains. Calculés à partir de la sen-sibilité et de la spécificité du test, ils sont donc indépendants dela prévalence de la maladie dans la population.

Le rapport de vraisemblance positif (L) est égal au taux de testspositifs chez les malades (soit la sensibilité) sur le taux de testspositifs chez les non-malades (soit [1 – spécificité]) :

L = Sensibilité(1 − spécificité )

Il quantifie le gain diagnostique d’un test positif, la probabilitéd’être malade est L fois plus élevée lorsque le test est positif.

Le rapport de vraisemblance négatif (�) est égal au taux de testsnégatifs chez les malades (soit [1 – sensibilité]) sur le taux de testsnégatifs chez les sujets sains (soit la spécificité) :

λ = (1 − sensibilité )Spécificité

Il quantifie le gain diagnostique d’un test négatif, la probabilitéd’être indemne est � fois plus élevée lorsque le test est négatif.

La détermination des intervalles de confiance associés à cesdeux indices nécessite l’utilisation de logiciels statistiques.

Plus le rapport de vraisemblance positif est élevé et plus le rap-port de vraisemblance négatif est faible, plus le gain diagnostiquedu test est important (Tableau 3) [12].

Calcul de la probabilité post-testde la maladie

L’un des principaux intérêts des rapports de vraisemblance estqu’ils permettent de calculer la probabilité post-test de la maladiepar application du théorème de Bayes, donc de répondre à la

EMC - Biologie médicale 5

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 6: Mesure des performances et méthode de valorisation des tests biologiques

90-60-0207-A � Mesure des performances et méthode de valorisation des tests biologiques

“ Point important

Indépendants de la prévalence de la maladie, les rapportsde vraisemblance positif et négatif permettent de calculerla probabilité post-test d’une maladie via le théorème deBayes. Plus le rapport de vraisemblance positif est élevéet plus le rapport de vraisemblance négatif est faible, plusl’intérêt diagnostique d’un test est élevé.

question du clinicien : quelle est la probabilité que le patient soitmalade si le test est positif ou sain si le test est négatif ? Les rap-ports de vraisemblance étant indépendants de la prévalence dela maladie dans la population, ce calcul est transposable d’unepopulation à une autre.

Le théorème de Bayes introduit la notion de cote (ou odd) [13].L’odd est le rapport de la probabilité qu’un événement se produisesur celle qu’il ne se produise pas, soit :

Odd = p

(1 − p)

Un odd d’être malade égal à 10 signifie que le risque d’êtremalade est 10 fois supérieur à celui de ne pas l’être.

Le théorème de Bayes stipule que l’odd post-test est égal auproduit de l’odd prétest par le rapport de vraisemblance du test,soit :

Odd post-test = odd prétest × rapport de vraisemblance

Le passage de l’odd post-test à la probabilité post-test s’effectueà l’aide de la formule :

Probabilité post-test = Odd post-testOdd post-test + 1

Tableau 3.Apport diagnostique d’un test en fonction de la valeur des rapports devraisemblance positif et négatif.

Rapport devraisemblance positif

Rapport devraisemblance négatif

Apportdiagnostique

> 10 < 0,1 Très fort

5–10 0,1–0,2 Fort

2–5 0,2–0,5 Modéré

1–2 0,5–1 Faible

1 1 Nul

Les variations entre probabilité prétest et probabilité post-testobservées sont fonction de la valeur du rapport de vraisemblance.Des rapports de vraisemblance positifs supérieurs à 10 et desrapports de vraisemblance négatifs inférieurs à 0,1 donnent géné-ralement des variations importantes de la probabilité, permettantle plus souvent de confirmer ou d’exclure la maladie. À l’inverse,des rapports de vraisemblance positifs de 2 à 5 et négatifs de 0,2à 0,5 donnent des variations minimes de la probabilité prétest(Tableau 4).

L’application du théorème de Bayes permet égalementd’intégrer l’ensemble des résultats des tests biologiques réaliséspour un patient. Ainsi, l’odd post-test final est obtenu en multi-pliant simplement l’odd prétest par les rapports de vraisemblancedes différents tests effectués, soit :

Odd post-test = odd prétest × RV test 1 × RV test 2 × RV test 3, etc.

Les résultats des différents tests biologiques ne sont doncpas exploités séparément, mais associés afin d’agréger leur per-formance diagnostique. Si cette approche peut paraître « trèsmathématique », elle est réalisée de manière intuitive chaque jourpar le médecin. L’interprétation des résultats d’un test reposesur des notions de concordance ou de discordance entre la cli-nique et le résultat. En cas de concordance et si les performancesdiagnostiques du test sont suffisantes, la décision d’interventionou d’abstention peut être prise. En cas de discordance et/ousi les performances diagnostiques du test sont insuffisantes,d’autre(s) test(s) est(sont) nécessaire(s) pour aboutir à une déci-sion clinique. L’application du théorème de Bayes formalisecette approche et permet un calcul « objectif » de la probabilitépost-test.

Sa mise en œuvre, relativement fastidieuse avec les conversionsde probabilité en odds et inversement, est facilitée par l’utilisationdu nomogramme de Fagan comme l’illustre la Figure 6 ou parcelle de logiciels pour ordinateur de poche tel que le logiciel Med-Calc [14].

L’exemple suivant illustre l’application pratique des rapports devraisemblances. Une femme de 68 ans est hospitalisée en chirurgieorthopédique pour fracture du col du fémur. La numération-formule sanguine réalisée à son admission est sans particularité(thrombocytes : 250 000 × 106/l). Une héparinothérapie prophy-lactique est instaurée (héparinate de calcium, 150 UI/kg par jouren trois injections sous-cutanées) suite à l’intervention chirur-gicale. Six jours après l’opération, la patiente développe unethrombose du membre supérieure gauche. La numération pla-quettaire réalisée objective une chute brutale des thrombocytesà 90 000 × 106/l. La recherche d’anticorps anti-PF4 réalisée àl’aide de la technique ID-PaGIA (Diamed®) est négative. Unequestion se pose au clinicien : le diagnostic de TIH peut-il êtreécarté ?

Pour répondre à cette interrogation, il peut s’appuyer sur lesrapports de vraisemblance et la démarche présentée à la Figure 1 :

Tableau 4.Probabilités post-test obtenues avec différents couples de probabilité prétest et de rapports de vraisemblance positifs. Si une probabilité post-test de 90 %est requise pour affirmer la maladie, seule la prescription d’un test présentant un rapport de vraisemblance positif de 10 permettra d’atteindre ce seuil pourune probabilité prétest moyenne. Ce seuil ne sera pas atteint avec un test possédant un rapport de vraisemblance positif de 1,5 même avec une probabilitéprétest forte : la prescription de ce test de manière isolée a donc un intérêt limité.

Probabilité prétest (%) L Probabilité post-test (%) Conséquences cliniques a

20 (faible) 1,5 27 Incertitude diagnostique → examen(s) complémentaire(s) nécessaire(s)

5 56

10 71

50 (moyenne) 1,5 60 Incertitude diagnostique → examen(s) complémentaire(s) nécessaire(s)

5 83

10 91 Affirmation de la maladie → intervention

80 (forte) 1,5 86 Incertitude diagnostique → examen(s) complémentaire(s) nécessaire(s)

5 95 Affirmation de la maladie → intervention thérapeutique

10 96

L : rapport de vraisemblance positif.a Seuil d’affirmation de la maladie : probabilité post-test supérieure à 90 %.

6 EMC - Biologie médicale

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 7: Mesure des performances et méthode de valorisation des tests biologiques

Mesure des performances et méthode de valorisation des tests biologiques � 90-60-0207-A

Figure 6. Nomogramme de Fagan. Il permet un calcul rapidede la probabilité post-test en fonction de la probabilité prétestet du rapport de vraisemblance d’un test. En tracant une droitequi part de la probabilité prétest et qui passe par le rapport devraisemblance du test, on peut lire la probabilité post-test dela maladie [14].

• évaluation de la probabilité prétest : en appliquant la règle des« 4T » de Warkentin [15], il définit une probabilité clinique de laTIH (probabilité prétest) d’environ 80 % (score de 7) ;

• évaluation de la probabilité post-test : à l’aide des données issuesdu travail de Pouplard et al. (Tableau 2) et des formules précé-demment énoncées, il calcule la probabilité post-test de la TIH :17 % ;

• comparaison aux seuils décisionnels et décision médicale : la pro-babilité post-test reste trop élevée pour que le clinicien puisserejeter le diagnostic de TIH : l’héparinothérapie doit être stop-pée, un traitement alternatif instauré (danaparoïde sodiqueou lépirudine) et des tests complémentaires réalisés (recherched’anticorps anti-PF4 à l’aide d’une autre technique immuno-logique, test d’agrégation plaquettaire). Chez cette patiente, lediagnostic de TIH a été retenu, le test d’agrégation plaquettaireétant positif et la numération plaquettaire se normalisant aprèsinstauration de danaparoïde sodique.Cet exemple démontre l’importance du contexte clinique dans

l’interprétation d’un test biologique. En effet, la seule prise encompte du résultat brut aurait conduit à un diagnostic erroné(absence de TIH) aux conséquences tragiques pour la patiente.Si cette intégration des données cliniques se fait normalement demanière intuitive par le médecin, l’application du théorème deBayes et des rapports de vraisemblance la rend obligatoire.

� ConclusionLa prescription d’un examen biologique n’est utile que si

l’information qu’il procure vient conforter un raisonnementmédical construit sur l’analyse de la situation clinique. Pour

choisir le test le plus adapté, le clinicien peut s’appuyer sur lesindices reflétant les performances diagnostiques du test. Ceux-ci sont complémentaires. La sensibilité et la spécificité mesurentla capacité du test à distinguer correctement les malades et lesnon-malades alors que les valeurs prédictives positives et néga-tives permettent d’évaluer la probabilité que le patient soit maladeou sain en fonction des résultats du test. Les rapports de vrai-semblance, quant à eux, combinent ces deux informations etpermettent de s’affranchir des variations des valeurs prédictives enfonction de la prévalence de la maladie. En pratique courante, unchoix raisonné des tests prescrits sur la base de ces indices limitela prescription d’examens inutiles, sources d’un gaspillage de res-sources et d’augmentation de la probabilité d’erreur médicale.

� Références[1] The value of diagnostic: innovation, adoption and diffusion into health

care. The Lewin Group; 2005, http://www.advamed.org/publicdocs/thevalueofdiagnostic.pdf.

[2] Taboulet P. Marqueurs biologiques aux urgences. EMC (Elsevier Mas-son SAS, Paris), Médecine d’urgence, 25-030-F-10, 2007.

[3] Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, GlasziouPP, Irwig LM, et al. Standards for reporting of diagnosticaccuracy. The STARD statement for reporting studies of diag-nostic accuracy: explanation and elaboration. Clin Chem 2003;49:7–18.

[4] Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The deve-lopment of QUADAS: a tool for the quality assessment of studies ofdiagnostic accuracy included in systematic reviews. BMC Med ResMethodol 2003;3:25.

EMC - Biologie médicale 7

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 8: Mesure des performances et méthode de valorisation des tests biologiques

90-60-0207-A � Mesure des performances et méthode de valorisation des tests biologiques

[5] Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Impro-ving the quality of reports of meta-analyses of randomised controlledtrials: the QUOROM statement. Quality of reporting of meta-analyses.Lancet 1999;354:1896–900.

[6] Stroup DF, Berlin JA, Morton SC, Olkin I, Williamson GD, RennieD, et al. Meta-analysis of observational studies in epidemiology: aproposal for reporting. JAMA 2000;283:2008–12.

[7] Knottnerus JA, van Weel C, Muris JW. Evaluation of diagnostic pro-cedures. Br Med J 2002;324:477–80.

[8] Pouplard C, Gueret P, Fouassier M, Ternisien C, Trossaert M, RéginaS, et al. Prospective evaluation of the “4Ts” score and particle gelimmunoassay specific to heparin/PF4 for the diagnosis of heparin-induced thrombocytopenia. J Thromb Haemost 2007;5:1373–9.

[9] Lusted LB. Decision-making studies in patient management. N Engl JMed 1971;284:416–24.

[10] Zweig MH, Campbell G. Receiver-operating characteristic (ROC)plots: a fundamental evaluation tool in clinical medicine. Clin Chem1993;39:561–77.

[11] Greiner M, Pfeiffer D, Smith RD. Principles and practical applicationof the receiver-operating characteristic analysis for diagnostic tests.Prev Vet Med 2000;45:23–41.

[12] Nendaz MR, Perrier A. Théorème de Bayes et rapports de vraisem-blance. Rev Mal Respir 2004;21:394–7.

[13] Bayes T. An essay towards solving a problem in the doctrine of chances.Philos Trans R Soc Lond 1763;53:370–418.

[14] Fagan TJ. Nomogram for Bayes theorem. N Engl J Med 1975;293:257.

[15] Warkentin TE, Heddle NM. Laboratory diagnosis of immune heparin-induced thrombocytopenia. Curr Hematol Rep 2003;2:148–57.

Pour en savoir plusGrenier B. Choisir un test diagnostique. EMC (Elsevier Masson SAS, Paris),

AKOS Encyclopédie Pratique de Médecine, 1-0050, 2002, 5p.Delacour H, Servonnet A, Perrot A, Vigezzi JF, Ramirez JM. La courbe

ROC (receiver operating characteristic) : principes et applications enbiologie clinique. Ann Biol Clin 2005;63:145–54.

Hellmich M, Lehmacher W. A ruler for interpreting diagnostic test results.Methods Inf Med 2005;44;124–6.

Pewsner D, Bleuer JP, Bucher HC, Battaglia M, Jüni P, Egger M. Sur la voiede l’intuition ? Théorème de Bayes et diagnostic en médecine générale.Partie I. Forum Med Suisse 2001;3:41–5.

Pewsner D, Bleuer JP, Bucher HC, Battaglia M, Jüni P, Egger M. Sur la voiede l’intuition ? Théorème de Bayes et diagnostic en médecine générale.Partie II. Forum Med Suisse 2001;3:46–52.

H. Delacour ([email protected]).Fédération de biologie clinique, Hôpital d’instruction des Armées Bégin, 69, avenue de Paris, 94163 Saint-Mandé cedex, France.

S. Mouline.Service de bactériologie, Hôpital militaire d’instruction Mohamed V, Rabat, Maroc.

F. Ceppa.Fédération de biologie clinique, Hôpital d’instruction des Armées Bégin, 69, avenue de Paris, 94163 Saint-Mandé cedex, France.

Toute référence à cet article doit porter la mention : Delacour H, Mouline S, Ceppa F. Mesure des performances et méthode de valorisation des tests biologiques.EMC - Biologie médicale 2013;8(1):1-8 [Article 90-60-0207-A].

Disponibles sur www.em-consulte.com

Arbresdécisionnels

Iconographiessupplémentaires

Vidéos/Animations

Documentslégaux

Informationau patient

Informationssupplémentaires

Auto-évaluations

Casclinique

8 EMC - Biologie médicale

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)

Page 9: Mesure des performances et méthode de valorisation des tests biologiques

Cet article comporte également le contenu multimédia suivant, accessible en ligne sur em-consulte.com et

em-premium.com :

1 autoévaluation

Cliquez ici

© 2013 Elsevier Masson SAS. Tous droits réservés. - Document téléchargé le 29/04/2013 par UNIVERSITE LAVAL - (338842)