Upload
sebastien-wilfart
View
64
Download
0
Embed Size (px)
Citation preview
PROBLEMATIQUE DE
L’IDENTIFICATION BACTERIENNE
Cours d’aide à la décision médicale
Année 2010-2011
WILFART SEBASTIEN
MASTER 2 INFO
Introduction – Les entérobactéries (1)
Famille de bactéries pathogènes ou non
ayant des caractéristiques biochimiques
communes et dont l’habitat est le tube
digestif de l’homme ou celui des animaux.
Escherichia coli Salmonella
Introduction – Les entérobactéries (1)
Escherichia
Shigella
Serrata
Enterobacter
Citrobacter
Salmonella
KlebsiellaProteus
Providencia
Yersinia
Morganella
Introduction – Les entérobactéries (2)
L’identification des bactéries est réalisée à
l’aide de micro-tests biochimiques prêts à
l’emploi.
+ - + - + - + - - + - + + + + + + + + +
+ - + - + - + - - + - + + + + + + + + +
+ - + - + - + - - + - + + + + + + + + +
5 2 1 5 7 6 3
Méthode probabiliste - Introduction
Introduction – Les entérobactéries (3)
PROCESSUS D’IDENTIFICATION
Organisme
inconnu u
Kits de microtubes
Informations de classification
Modèle
d’identification
Proposition
d’identification
Fiabilité de la
proposition
Tests additionnelsFormulation de
l’identification
OUI NON
Introduction – Les entérobactéries (4)
MODELE D’IDENTIFICATION
Afin de choisir parmi plusieurs bactéries celle(s) qui
ressemble(nt) le plus à un germe inconnu prélevé
sur un individu présumé malade, on peut avoir
recours:
• à la méthode dichotomique
arbres de décision
• à la méthode probabiliste
approche bayésienne +
maximum de vraisemblance
Méthode des arbres de décision (1)
Méthode reposant sur la construction d’un
arbre binaire tel que:
- chaque sommet représente un test
biochimique à résultat binaire
- chaque feuille représente une bactérie
potentielle (ou un groupe de bactéries)
Méthode des arbres de décision (2)
HY-ENTEROTEST
Méthode des arbres de décision (3)
HY-ENTEROTEST
Méthode des arbres de décision (4)
HY-ENTEROTEST
5%
17%
11%
1%
Méthode probabiliste - Introduction
Méthode basée sur l’utilisation d’une matrice
donnant pour chaque bactérie identifiable,
sa probabilité de réaction positive à chaque
test.
Méthode probabiliste - Introduction
Méthode probabiliste – Introduction (1)
Soient:
• u le germe inconnu à identifier
• n tests biochimiques t1, t2, ... , tn
T = t1, t2, ..., tn
• m espèces identifiables b1, b2, ... , bm
B = b1, b2, ... , bm
R(u) = ensemble des résultats des tests de T
réalisés sur le germe inconnu u
Méthode probabiliste – Introduction (2)
P(biR(u)) = probabilité a posteriori de bi
P(bi) = probabilité a priori de bi
P(R(u)bi) = probabilité qu’une souche de la bactérie
bi B donne l’ensemble des résultats R(u) obtenus
pour le germe u
Méthode probabiliste – Théorème de Bayes
P(biR(u)) = probabilité a posteriori de bi
P(bi) = probabilité a priori de bi
P(R(u)bi) = probabilité qu’une souche de la bactérie
bi B donne l’ensemble des résultats R(u) obtenus
pour le germe u
Par le théorème de Bayes:
m
k
kk
iii
buRPbP
buRPbPuRbP
1
)|)(().(
)|)(().())(|(
Règle de décision de Bayes:
Méthode probabiliste - Théorème de Bayes
))(|(max))(|( 1
* uRbPuRbP imi
Règle de décision de Bayes:
Qui est équivalente à:
Méthode probabiliste - Règle de Bayes
))(|(max))(|( 1
* uRbPuRbP imi
)}|)(().({max))(|( 1
*
iimi buRPbPuRbP
Méthode probabiliste – Règle de Bayes
)}|)(().({max))(|( 1
*
iimi buRPbPuRbP
Méthode probabiliste – Règle de Bayes
Les probabilités a priori P(bi) ne pouvant
être connues avec exactitude, elles sont
supposées constantes.
)}|)(().({max))(|( 1
*
iimi buRPbPuRbP
Méthode probabiliste – Règle de Bayes
Les probabilités a priori P(bi) ne pouvant
être connues avec exactitude, elles sont
supposées constantes.
Comment calculer les P(R(u)|bi)?
)}|)(().({max))(|( 1
*
iimi buRPbPuRbP
Méthode probabiliste – Règle de Bayes
Les probabilités a priori P(bi) ne pouvant
être connues avec exactitude, elles sont
supposées constantes.
Comment calculer les P(R(u)|bi)?
Méthode du maximum de vraisemblance
)}|)(().({max))(|( 1
*
iimi buRPbPuRbP
Méthode probabiliste – MLE
L(R(u)bi) = vraisemblance de l’hypothèse
« le germe inconnu u est la bactérie bi B »
par rapport aux résultats R(u)
L(R(u)bi) ≈ P(R(u)bi)
Méthode probabiliste – MLE
Soit: Ni souches bien identifiées de la bactérie bi
Nik souches positives au test tk T
La vraisemblance d’une réaction positive au
test tk, pour une souche de l’espèce bi :
1)(0
iN
ikN
ib
kX
Méthode probabiliste – MLE
Soit: R(bi) = r1, r2, ... , rn
La vraisemblance des résultats R(bi), pour une
souche de l’espèce bi
kk r
iki
r
kii bXbXbbRL 1
Méthode probabiliste – MLE
Soit un germe inconnu u.
On pose:
Dès lors:
,ive pour u est positk
quand ri
bk
Xi
buk
Y ,
,ive pour u est négatquand rb kikX
ibu
kY 1,
m
k
iki buYbuRL1
),()|)((
Principe du maximum de vraisemblance
Choisir b* comme la (les) bactéries(s)
représentative(s) du germe u telle(s) que:
Méthode probabiliste – MLE
)}|)(({max)|)(( 1
*
imi buRLbuRL
Méthode probabiliste – Exemple
EXEMPLE- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}
Xk(bi) Mobilité H2S Indole Urée ONPG Gaz
P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86
P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93
Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99
Samonella 0.95 0.86 0.03 0.00 0.02 0.92
L(R(u) P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597
L(R(u) P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015
L(R(u) Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0
L(R(u) Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0
Méthode probabiliste – Exemple
Xk(bi) Mobilité H2S Indole Urée ONPG Gaz
P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86
P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93
Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99
Samonella 0.95 0.86 0.03 0.00 0.02 0.92
L(R(u) P. vulgaris) = 0.95 x 0.83 x 0.89 x 0.99 x (1.00 – 0) x 0.86 = 0.597
L(R(u) P. mirabilis) = 0.96 x 0.83 x 0.02 x 0.99 x (1.00 – 0) x 0.93 = 0.015
L(R(u) Edwardsiella) = 0.98 x 0.94 x 1.00 x 0 x (1.00 – 0) x 0.99 = 0
L(R(u) Salmonella) = 0.95 x 0.86 x 0.03 x 0 x (1 – 0.98) x 0.92 = 0
Méthode probabiliste – Exemple
Xk(bi) Mobilité H2S Indole Urée ONPG Gaz
P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86
P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93
Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99
Samonella 0.95 0.86 0.03 0.00 0.02 0.92
Normalisation des vraisemblances
Choisir b* comme la (les) bactéries(s)
représentative(s) du germe u telle(s) que:
Méthode probabiliste – Normalisation et seuil
m
k
k
ii
buRL
buRLuRbL
1
)|)((
)|)(())(|(
**
1
* ))(|())}(|({max))(|( suRbLetuRbLuRbL imi
Méthode probabiliste – Exemple 1
EXEMPLE 1- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = {mobilité (+), H2S (+), Indole (+), Urée (+), ONPG (–), Gaz (+)}
Xk(bi) Mobilité H2S Indole Urée ONPG Gaz
P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86
P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93
Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99
Samonella 0.95 0.86 0.03 0.00 0.02 0.92
EXEMPLE 1
L(R(u) P. vulgaris) = 0.597
L(R(u) P. mirabilis) = 0.015
L(R(u) Edwardsielle) = 0
L(R(u) Salmonella) = 0
__________
TOTAL 0,612
L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975
L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025
L(Edwardsielle|R(u)) = 0 / 0,612 = 0
L(Salmonella|R(u)) = 0 / 0,612 = 0
__________
TOTAL 1
Méthode probabiliste – Exemple 1
EXEMPLE 1
L(R(u) P. vulgaris) = 0.597
L(R(u) P. mirabilis) = 0.015
L(R(u) Edwardsielle) = 0
L(R(u) Salmonella) = 0
__________
TOTAL 0,612
L(P. vulgaris|R(u)) = 0.597 / 0,612 = 0,975
L(P. mirabilis|R(u)) = 0.015 / 0,612 = 0,025
L(Edwardsielle|R(u)) = 0 / 0,612 = 0
L(Salmonella|R(u)) = 0 / 0,612 = 0
__________
TOTAL 1
Méthode probabiliste – Exemple 1
Méthode probabiliste – Exemple 2
EXEMPLE 2- T = {Mobilité, H2S, Indole, Urée, ONPG, Gaz}
- B = {Prot. vulgaris, Prot. mirabilis, Edwardsiella, Salmonella}
- un germe inconnu u de profil R(u)
- R(u) = {mobilité (+), H2S (+), Indole (-), Urée (+), ONPG (–), Gaz (+)}
Xk(bi) Mobilité H2S Indole Urée ONPG Gaz
P. vulgaris 0.95 0.83 0.89 0.99 0.00 0.86
P. mirabilis 0.96 0.83 0.02 0.99 0.00 0.93
Edwardsiella 0.98 0.94 1.00 0.00 0.00 0.99
Samonella 0.95 0.86 0.03 0.00 0.02 0.92
EXEMPLE 2
L(R(u) P. vulgaris) = 0.074
L(R(u) P. mirabilis) = 0.719
L(R(u) Edwardsielle) = 0
L(R(u) Salmonella) = 0
__________
TOTAL 0,793
L(P. vulgaris|R(u)) = 0.074 / 0,793 = 0,093
L(P. mirabilis|R(u)) = 0.719 / 0,793 = 0,907
L(Edwardsielle|R(u)) = 0 / 0,793 = 0
L(Salmonella|R(u)) = 0 / 0,793 = 0
__________
TOTAL 1
Méthode probabiliste – Exemple 2