2
était en moyenne de 33 (écart-type 20) ; 833 lésions ont été décrites, 61 lésions observées sur 41 patients avaient une indication de biopsie. Cinq patients avaient au moins une lésion cancéreuse, 9 patients avaient refusé la biopsie. L’accord sur les indications de biopsier au moins une lésion après LI + AF était de 96,1 % avec un coefficient Kappa de 0,88 [0,80 ;0,97]. Après LI seule, l’accord était de 93,3 %, avec un Kappa de 0,78 [0,67 ;0,90]. Pour l’exactitude diagnostique, le TVPR était de 1, le TFPR de 1,15 et le rapport de 0,87, inférieur à 1. L’analyse de sensibilité de reclassement des lésions non biopsiées ne modifiait pas ces résultats. En considérant la lésion comme unité statistique, les résultats étaient similaires. Parmi les quatre patients avec une lésion cancéreuse dépistée par le senior, 3 n’ont pas pu bénéficier d’un traitement. Conclusions.L’examen combinant LI et AF montre une bonne reproducti- bilité inter-observateurs. Cependant, les quatre biopsies supplémentaires réalisées suite à l’examen AF ne correspondaient pas à des lésions cancéreuses. L’AF ne semble pas apporter de gain majeur à l’examen en LI seule. Néanmoins, du fait de la prévalence des cancers dépistés grâce à un examen LI, cette étude confirme l’intérêt d’un dépistage simple dans cette population à risque. http://dx.doi.org/10.1016/j.respe.2013.12.039 C-17 Identification de deux phénotypes de vitiligo : analyse en classes latentes d’une série de 700 patients K. Ezzedine a , A. Le Thuaut b , T. Jouary a , F. Ballanger a , A. Taïeb a , S. Bastuji-Garin b a CHU de Bordeaux, Bordeaux, France b LIC EA4393, université Paris Est Créteil (UPEC), Assistance publiqueHôpitaux de Paris, Créteil, France Introduction.Le vitiligo non segmentaire (VNS) est une maladie dermato- logique chronique qui affecte 0,5 à 1 % de la population et altère la qualité de vie en raison de son caractère affichant. L’évolution est très variable et la physiopathologie complexe non encore élucidée. Notre objectif était d’identifier différents phénotypes de VNS susceptibles d’expliquer l’hétérogé- néité de cette maladie. Population et me ´thode.Tous les cas incidents de VNS consultant dans le centre de référence entre 2007 et 2012 (hôpital Saint-André, Bordeaux) ont été prospectivement inclus. Les données cliniques ont été recueillies à l’aide du questionnaire de la « Vitiligo Europeen Task Force ». Une analyse en classes latentes (ACL) a été réalisée afin d’identifier des sous-groupes homogènes de patients. Des modèles de deux à huit classes ont été testés, le bayesian information criterion (BIC) a permis de retenir le modèle le plus parcimonieux. Les caractéristiques démographiques, la localisation des lésions, l’activité de la maladie et les facteurs déclenchants ont été comparés entre les classes. Re ´sultats.Au total, 700 patients (62 % de femmes) ont été analysés, l’âge médian était de 32 ans (IQR : 1445) à l’inclusion et de 18 ans (IQR : 832) au début de la maladie. Les localisations très corrélées à la surface cutanée atteinte n’ont pas été retenues dans le modèle. Un modèle à deux classes a été retenu (BIC = 3735,2). La classe latente 1 (CL1), qui comprenait 37 % de la population, était caractérisée par un début précoce (< 12 ans, prob- abilité = 0,91), la présence de repigmentation (0,60), de phénomène de Koebner (0,47), d’halo nævus (0,43), canitie (0,43), et d’antécédent familial de vitiligo (0,40). À l’inverse la CL2 (63 % de la population) était caractérisée par un début plus tardif de la maladie, i.e. après la puberté (probabilité = 0,93), et une moindre probabilité d’halo nævus (0,16). La prévalence de la dermatite atopique (13,2 % vs 4,9 %, p < 0,001), de maladies auto-immunes (16,8 % vs 11,0 %, p = 0,03), de maladie thyroïdienne (38,6 % vs 23,9 %, p < 0,001) et d’antécédents familiaux de maladie auto immune (41,5 % vs 24,6 %, p < 0,001) était significativement plus importante parmi les patients de la CL1. Conclusion.Cette classification empirique nous a permis d’identifier deux phénotypes distincts de VNS, elle pourrait contribuer à améliorer la compréhension de la pathogénie de la maladie et permettre de constituer des groupes homogènes de patients pour les essais cliniques à venir. http://dx.doi.org/10.1016/j.respe.2013.12.040 C-18 La méthode mixte appliquée à la recherche clinique : l’exemple d’une étude Famiréa sur la fin de vie en réanimation N. Kentish-Barnes, E. Azoulay Hôpital Saint-Louis, APHP, Paris, France Introduction.La complexité des situations rencontrées dans les pratiques médicales et paramédicales invite aujourd’hui les chercheurs à se tourner vers d’autres méthodes de recherche que celles traditionnellement mobilisées dans la recherche biomédicale. Les méthodologies qualitatives, développées par les sciences humaines, permettent d’enrichir les projets de recherche, à la fois dans leur construction, leurs données et leurs résultats. Pour explorer les atouts de la méthodologie mixte, nous nous appuierons sur une étude du groupe Famiréa portant sur l’expérience de la fin de vie en réanimation des médecins, des infirmiers et des proches de patients. Mate ´riel et me ´thodes.Une méthodologie en six phases, design explicatif : étude pilote et analyse de la littérature. Étude pilote par observation et par entretiens auprès de médecins et d’infirmiers sur la fin de vie en réanimation et auprès de familles de patients. Analyse thématique des entretiens. Analyse de la littérature. Construction d’une échelle permettant d’évaluer la qualité perc ¸ue du déroulement de la fin de vie en réanimation : échelle CAESAR ; étude quantitative par questionnaire (échelle CAESAR) auprès des médecins, des infirmiers et des proches ; étude qualitative par entretiens auprès de 15 familles ayant perdu un proche en réanimation et auprès de 15 médecins et 15 infirmiers de réanimation ; analyse statistique des questionnaires, validation de l’échelle CAESAR ; analyse thématique des entretiens ; mise en commun des résultats : les résultats de la partie qualitative devant permettre d’enrichir et de mieux comprendre les résultats de la partie quantitative. Re ´sultats.L’étude est en cours : 592 patients décédés ont été inclus dans 48 services de réanimation et 545 proches ont complété l’échelle Caesar par téléphone un mois après le décès. La validation de l’échelle est en cours, ainsi que l’analyse des questionnaires médecins, infirmiers et proches. Entretiens en cours : à ce jour, entretiens réalisés auprès de 15 infirmiers, de 5 proches et de 5 médecins. Conclusion.La fin de vie est un objet de recherche complexe. Cette complexité implique que l’on ne peut pas étudier une petite partie du système de fac ¸on isolée. Les méthodes mixtes constituent une option méthodologique permettant de développer une compréhension plus fine et plus riche des phénomènes étudiés, notamment du vécu des acteurs concernés. Le chercheur doit développer un design de recherche « qui fonctionne » et opter pour une approche dite « pragmatique ». En d’autres termes, il doit chercher à collecter des données qui lui permettront de répondre à sa question de recherche : données issues de l’approche quantitative, avec l’échelle CAESAR, permettant de donner un score au vécu de la fin de vie et données issues de l’approche qualitative, par entretiens, permettant une analyse fine de l’expérience de chacun. Au final, la méthodologie mixte doit permettre, à partir d’une question, de développer deux paradigmes de recherche et deux méthodes pour obtenir un résultat. Cette approche permet d’appréhender les faits de manière globalisante et contextualisée. http://dx.doi.org/10.1016/j.respe.2013.12.041 C-19 Utilisation des modèles issus de la théorie de réponse à l’item pour la détermination de la différence minimale cliniquement pertinente d’un questionnaire A. Rouquette a , M. Blanchin b , V. Sébille b , F. Guillemin c , S. Côté d , B. Falissard a , J.-B. Hardouin b a Unité Inserm U669, santé mentale et santé publique, Paris, France b EA 4275, SPHERE, biostatistique, pharmacoépidémiologie et mesures subjectives en santé, Nantes, France c EA 4360 APEMAC, Inserm CIC-EC CIE6, Nancy, France d Groupe de recherche sur l’inadaptation psychosociale de l’enfant, Montréal, Québec, Canada EPI-CLIN 2013 / Revue d’E ´ pide ´miologie et de Sante ´ Publique 62S (2014) S37S46 S44

Utilisation des modèles issus de la théorie de réponse à l’item pour la détermination de la différence minimale cliniquement pertinente d’un questionnaire

  • Upload
    j-b

  • View
    214

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Utilisation des modèles issus de la théorie de réponse à l’item pour la détermination de la différence minimale cliniquement pertinente d’un questionnaire

était en moyenne de 33 (écart-type 20) ; 833 lésions ont été décrites, 61 lésionsobservées sur 41 patients avaient une indication de biopsie. Cinq patientsavaient au moins une lésion cancéreuse, 9 patients avaient refusé la biopsie.L’accord sur les indications de biopsier au moins une lésion après LI + AF étaitde 96,1 % avec un coefficient Kappa de 0,88 [0,80 ;0,97]. Après LI seule,l’accord était de 93,3 %, avec un Kappa de 0,78 [0,67 ;0,90]. Pour l’exactitudediagnostique, le TVPR était de 1, le TFPR de 1,15 et le rapport de 0,87, inférieurà 1. L’analyse de sensibilité de reclassement des lésions non biopsiées nemodifiait pas ces résultats. En considérant la lésion comme unité statistique, lesrésultats étaient similaires. Parmi les quatre patients avec une lésion cancéreusedépistée par le senior, 3 n’ont pas pu bénéficier d’un traitement.Conclusions.– L’examen combinant LI et AF montre une bonne reproducti-bilité inter-observateurs. Cependant, les quatre biopsies supplémentairesréalisées suite à l’examen AF ne correspondaient pas à des lésionscancéreuses. L’AF ne semble pas apporter de gain majeur à l’examen en LIseule. Néanmoins, du fait de la prévalence des cancers dépistés grâce à unexamen LI, cette étude confirme l’intérêt d’un dépistage simple dans cettepopulation à risque.

http://dx.doi.org/10.1016/j.respe.2013.12.039

C-17

Identification de deux phénotypes de vitiligo :analyse en classes latentes d’une série de700 patientsK. Ezzedine a, A. Le Thuaut b, T. Jouary a, F. Ballanger a, A. Taïeb a,S. Bastuji-Garin b

a CHU de Bordeaux, Bordeaux, Franceb LIC EA4393, université Paris Est Créteil (UPEC), Assistance publique–

Hôpitaux de Paris, Créteil, France

Introduction.– Le vitiligo non segmentaire (VNS) est une maladie dermato-logique chronique qui affecte 0,5 à 1 % de la population et altère la qualité de vieen raison de son caractère affichant. L’évolution est très variable et laphysiopathologie complexe non encore élucidée. Notre objectif étaitd’identifier différents phénotypes de VNS susceptibles d’expliquer l’hétérogé-néité de cette maladie.Population et methode.– Tous les cas incidents de VNS consultant dans le centrede référence entre 2007 et 2012 (hôpital Saint-André, Bordeaux) ont étéprospectivement inclus. Les données cliniques ont été recueillies à l’aide duquestionnaire de la « Vitiligo Europeen Task Force ». Une analyse en classeslatentes (ACL) a été réalisée afin d’identifier des sous-groupes homogènes depatients. Des modèles de deux à huit classes ont été testés, le bayesian

information criterion (BIC) a permis de retenir le modèle le plus parcimonieux.Les caractéristiques démographiques, la localisation des lésions, l’activité de lamaladie et les facteurs déclenchants ont été comparés entre les classes.Resultats.– Au total, 700 patients (62 % de femmes) ont été analysés, l’âgemédian était de 32 ans (IQR : 14–45) à l’inclusion et de 18 ans (IQR : 8–32) audébut de la maladie. Les localisations très corrélées à la surface cutanée atteinten’ont pas été retenues dans le modèle. Un modèle à deux classes a été retenu(BIC = �3735,2). La classe latente 1 (CL1), qui comprenait 37 % de lapopulation, était caractérisée par un début précoce (< 12 ans, prob-abilité = 0,91), la présence de repigmentation (0,60), de phénomène deKoebner (0,47), d’halo nævus (0,43), canitie (0,43), et d’antécédent familialde vitiligo (0,40). À l’inverse la CL2 (63 % de la population) étaitcaractérisée par un début plus tardif de la maladie, i.e. après la puberté(probabilité = 0,93), et une moindre probabilité d’halo nævus (0,16). Laprévalence de la dermatite atopique (13,2 % vs 4,9 %, p < 0,001), demaladies auto-immunes (16,8 % vs 11,0 %, p = 0,03), de maladiethyroïdienne (38,6 % vs 23,9 %, p < 0,001) et d’antécédents familiaux demaladie auto immune (41,5 % vs 24,6 %, p < 0,001) était significativementplus importante parmi les patients de la CL1.Conclusion.– Cette classification empirique nous a permis d’identifier deuxphénotypes distincts de VNS, elle pourrait contribuer à améliorer lacompréhension de la pathogénie de la maladie et permettre de constituer desgroupes homogènes de patients pour les essais cliniques à venir.

http://dx.doi.org/10.1016/j.respe.2013.12.040

C-18

La méthode mixte appliquée à la rechercheclinique : l’exemple d’une étude Famiréa sur la finde vie en réanimationN. Kentish-Barnes, E. AzoulayHôpital Saint-Louis, AP–HP, Paris, France

Introduction.– La complexité des situations rencontrées dans les pratiquesmédicales et paramédicales invite aujourd’hui les chercheurs à se tourner versd’autres méthodes de recherche que celles traditionnellement mobilisées dans larecherche biomédicale. Les méthodologies qualitatives, développées par lessciences humaines, permettent d’enrichir les projets de recherche, à la fois dansleur construction, leurs données et leurs résultats. Pour explorer les atouts de laméthodologie mixte, nous nous appuierons sur une étude du groupe Famiréaportant sur l’expérience de la fin de vie en réanimation – des médecins, desinfirmiers et des proches de patients.Materiel et methodes.– Une méthodologie en six phases, design explicatif :– étude pilote et analyse de la littérature. Étude pilote par observation et parentretiens auprès de médecins et d’infirmiers sur la fin de vie en réanimation etauprès de familles de patients. Analyse thématique des entretiens. Analyse de lalittérature. Construction d’une échelle permettant d’évaluer la qualité percue dudéroulement de la fin de vie en réanimation : échelle CAESAR ;– étude quantitative par questionnaire (échelle CAESAR) auprès des médecins,des infirmiers et des proches ;– étude qualitative par entretiens auprès de 15 familles ayant perdu un proche enréanimation et auprès de 15 médecins et 15 infirmiers de réanimation ;– analyse statistique des questionnaires, validation de l’échelle CAESAR ;– analyse thématique des entretiens ;– mise en commun des résultats : les résultats de la partie qualitative devantpermettre d’enrichir et de mieux comprendre les résultats de la partie quantitative.Resultats.– L’étude est en cours : 592 patients décédés ont été inclus dans48 services de réanimation et 545 proches ont complété l’échelle Caesar partéléphone un mois après le décès. La validation de l’échelle est en cours, ainsi quel’analyse des questionnaires médecins, infirmiers et proches. Entretiens en cours :à ce jour, entretiens réalisés auprès de 15 infirmiers, de 5 proches et de 5 médecins.Conclusion.– La fin de vie est un objet de recherche complexe. Cette complexitéimplique que l’on ne peut pas étudier une petite partie du système de faconisolée. Les méthodes mixtes constituent une option méthodologique permettantde développer une compréhension plus fine et plus riche des phénomènesétudiés, notamment du vécu des acteurs concernés. Le chercheur doitdévelopper un design de recherche « qui fonctionne » et opter pour uneapproche dite « pragmatique ». En d’autres termes, il doit chercher à collecterdes données qui lui permettront de répondre à sa question de recherche :données issues de l’approche quantitative, avec l’échelle CAESAR, permettantde donner un score au vécu de la fin de vie et données issues de l’approchequalitative, par entretiens, permettant une analyse fine de l’expérience dechacun. Au final, la méthodologie mixte doit permettre, à partir d’une question,de développer deux paradigmes de recherche et deux méthodes pour obtenir unrésultat. Cette approche permet d’appréhender les faits de manière globalisanteet contextualisée.

http://dx.doi.org/10.1016/j.respe.2013.12.041

C-19

Utilisation des modèles issus de la théorie deréponse à l’item pour la détermination de ladifférence minimale cliniquement pertinente d’unquestionnaireA. Rouquette a, M. Blanchin b, V. Sébille b, F. Guillemin c, S. Côté d,B. Falissard a, J.-B. Hardouin b

a Unité Inserm U669, santé mentale et santé publique, Paris, Franceb EA 4275, SPHERE, biostatistique, pharmacoépidémiologie et mesuressubjectives en santé, Nantes, Francec EA 4360 APEMAC, Inserm CIC-EC CIE6, Nancy, Franced Groupe de recherche sur l’inadaptation psychosociale de l’enfant, Montréal,Québec, Canada

EPI-CLIN 2013 / Revue d’Epidemiologie et de Sante Publique 62S (2014) S37–S46S44

Page 2: Utilisation des modèles issus de la théorie de réponse à l’item pour la détermination de la différence minimale cliniquement pertinente d’un questionnaire

Introduction.– La différence minimale cliniquement pertinente (MCID) d’unquestionnaire est définie comme « la plus petite différence de score, dans ledomaine d’intérêt, que le patient percoit comme bénéfique et qui conduit, enl’absence d’effet secondaire et de coût excessif, à une modification de la prise encharge du patient ». Elle est utilisée pour interpréter le changement vécu par unsujet sur le domaine évalué par le questionnaire entre deux temps et lecaractériser comme étant ou non cliniquement pertinent. La méthode dujugement global est actuellement recommandée pour déterminer la MCID. Elleconsiste à comparer l’évolution du score obtenu à un questionnaire par lesindividus d’une cohorte entre deux temps à un critère externe : le jugementglobal par les sujets eux-mêmes de l’évolution du concept mesuré par lequestionnaire. Une des critiques de cette méthode est qu’elle mène à une valeurde MCID différente selon le score initial des sujets de la cohorte. En fonction dela valeur obtenue, un changement vécu par un même sujet sera donc caractérisédifféremment, ce qui peut entraîner, en pratique clinique, une prise en chargeinadaptée des patients. Une des origines évoquées à ce phénomène concerne lesqualités du score comme échelle de mesure : simple somme des réponses auxitems, le score n’est pas nécessairement une mesure d’intervalle. Dans la théoriede réponse à l’item (IRT), la mesure du concept évalué par le questionnaire, leTrait latent (TL), est une mesure d’intervalle. Un modèle statistique issu del’IRT peut donc permettre de déterminer la MCID sur une échelle d’intervalle etainsi éviter le phénomène de dépendance au score initial.Objectif .– Comparer les sensibilité (Se), spécificité (Sp) et valeurs prédictives(VP) de la MCID déterminée classiquement (MCID-Sc) ou à l’aide d’un modèleIRT (MCID-TL), pour classer les sujets selon la pertinence clinique duchangement vécu.Materiel et methodes.– Les MCID-Sc et MCID-TL de la sous-échelle Santégénérale (SG) du questionnaire SF36 ont été déterminées sur une cohorte de1170 patients à l’aide de la méthode du jugement global et d’un modèle IRT dela famille de Rasch. Une MCID-ScBS », définie en fonction du score initial dessujets a aussi été déterminée. Les Se, Sp et VP de chaque MCID ont étécalculées, dans les cas d’une amélioration ou d’une détérioration de la SG, enutilisant le critère externe de jugement global comme gold standard.Resultats.– L’amplitude des MCID-Sc et MCID-TL étaient inférieures pourl’amélioration (1,58 points de score et 0,08 unités sur l’échelle du TLrespectivement) par rapport à la détérioration de la SG (�7,91 points de score et�0,48 unités sur l’échelle du TL). Les Se, Sp et VP étaient similaires pour laMCID-TL et la MCID-Sc cependant, lorsque le score initial des sujets était prisen compte dans la définition de la MCID (MCID-ScBS), les Se, Sp, et VPétaient systématiquement plus élevées.Conclusions.– Dans les conditions de cette étude, déterminer la MCID surl’échelle du TL ne semble pas avantageux par rapport à sa détermination surl’échelle du score. Par ailleurs, les meilleures valeurs de Se, Sp et VP retrouvéespour la MCID-ScBS permettent d’appuyer les recommandations récentes surl’intégration du score initial des sujets dans la définition de la MCID.

http://dx.doi.org/10.1016/j.respe.2013.12.042

C-20

Méta-analyse de données combinant des études dedesigns différents : évaluation des performances dumodèle mixte pour méta-analyse sur donnéeslongitudinalesC. Ferdynus a, L. Huiart a, R. Giorgi b

a Unité de soutien méthodologique, CHU de la Réunion, Saint-Denis, LaRéunion, Franceb Inserm U912 (SESSTIM), Marseille, France

Introduction.– Certaines méta-analyses doivent inclure des études épidémio-logiques de designs différents et ainsi combiner les résultats issus d’étudestransversales et longitudinales. Dans une étude de pharmaco-épidémiologieportant sur l’observance aux traitements anti-hormonaux dans le cancer du seinnous avons été confrontés au problème d’avoir à combiner des résultats issusd’études de grandes cohortes en bases de données et d’études transversales. Deplus, et comme cela peut souvent être le cas, il n’était pas possible de reconstruireles données individuelles pour chacune des études et ce, notamment, en raison del’absence d’information sur la distribution des censures dans les études de

cohortes. Dans ce travail, nous évaluons par simulations, sur données agrégées, laperformance du modèle mixte pour méta-analyse sur données longitudinales,permettant de synthétiser les résultats de différentes études.Materiel et methodes.– Nous avons simulé les probabilités d’arrêt detraitements anti-hormonaux issues d’études transversales et de cohorte pendantles cinq premières années de traitement. Les résultats de chaque étude étaientsynthétisés comme dans une méta-analyse. Nous avons testé plusieursscénarios, en faisant varier le nombre d’études dans chaque méta-analyse, laprobabilité d’arrêt de traitement, la proportion de censures et la variance inter-étude. Chaque scénario était simulé 1000 fois de manière indépendante. Nousavons évalué les performances du modèle mixte pour méta-analyse sur donnéeslongitudinales en prenant comme variable dépendante le log(-log) de laprobabilité d’arrêt de traitement au cours du temps. Le biais et l’erreurquadratique moyenne (EQM) étaient estimés pour chaque scénario.Resultats.– Lorsque la variance inter-étude était faible et la proportion de perdus devue était de 10 %, le biais d’estimation du log(-log) de la probabilité d’arrêt était de�0,01 (EQM = 0,01). Lorsque lavariance inter-étude était grande et la proportion deperdus de vue était de 75 %, le biais était de�0,12 (EQM = 0,06). Ceci représentaitau maximum une différence de�2,7 % entre la valeur réelle et la valeur estimée parle modèle. Le modèle avait tendance à sous-estimer la variance inter-étude, avec unbiais variant de �0,01 (EQM = 0,003) à �0,28 (EQM = 0,18).Conclusions.– L’utilisation de modèles mixtes pour données longitudinalespermet d’obtenir des résultats robustes de méta-analyses combinant des étudesde designs différents en l’absence de connaissance sur la distribution descensures. Ces résultats restent robustes même lorsque la variance inter-étude etla proportion de perdus de vue sont importantes. Ces modèles peuvent ainsi êtreutilisés pour les méta-analyses des mesures de l’observance aux traitementsanti-hormonaux dans le cancer du sein.

http://dx.doi.org/10.1016/j.respe.2013.12.043

C-21

Le Titanic revu par régression optimisée (ROP),une nouvelle méthode de régression nonparamétrique combinée à une classificationJ.-M. Nguyen, A. Gaultier, D. AntonioliU892-CNRS6299, CHU de Nantes, Saint-Sébastien-sur-Loire, France

Introduction.– La régression logistique est considérée comme la méthode deréférence pour identifier des facteurs associés à un état binaire, mais ne permetpas d’effectuer de manière directe, une classification des individus. Nous avonsdéveloppé une nouvelle approche de régression non paramétrique permettant àla fois de classer les sujets et de construire un score risque pour chaque individu.Materiel et methodes.– Les données publiques concernant les naufragés duTitanic ont été utilisées. La méthode d’échantillon test 50 %–50 % répétée5000 fois a été utilisée. L’index de Youden et le score de Brier ont été utilisés.Les témoignages existant sur les naufragés sur le site « TitanicaEncyclopaedia » ont été utilisés pour vérifier les prédictions de notre modèle,en particulier les faux positifs et faux négatifs.Resultats.– Chaque patient a été classé dans un cluster et identifié par unscore de risque à l’intérieur de ce cluster. Chaque cluster a été défini par plusieurssystèmes d’équations. Plusieurs clusters ont été identifiés, correspondant à dessous-groupes pour lesquels les facteurs de pronostic n’avaient pas le même poids.Dans 81 % (82 %) des cas, les index de Youden (score de Brier) de l’échantillon devalidation sont strictement identiques entre les deux méthodes. Dans 6 % (5,4 %)des cas, l’index de Youden de la régression logistique est meilleur que le modèleROP, alors que dans 13 % (12,6 %) des cas, l’index de Youden (score de Brier) dumodèle ROP est « meilleur » que celui de la régression logistique. La moyenne des948 (899) différences non nulles des index de Youden (score de Brier) est de0,0154 (0,004) en faveur du modèle ROP. Les témoignages historiques, quand ilsexistent, ont pu expliquer la situation des passagers mal classés par notre modèle.Conclusions.– ROP présente des performances de diagnostic et de robustesseau moins équivalentes à la régression logistique, sinon meilleures.L’utilisation des données du Titanic présente la particularité de pouvoirvérifier les hypothèses notamment sur les mal classés, grâce aux témoignagescollectés par le site « Titanica Encyclopaedia ». Les erreurs de classificationmesurées par le score de Brier, ne sont en réalité, qu’apparentes et dépendantes

EPI-CLIN 2013 / Revue d’Epidemiologie et de Sante Publique 62S (2014) S37–S46 S45