43
Choix de modèle pour les champs de Gibbs Aude GRELAUD Champs de Gibbs Méthodes sans vraisemblance ABC-MC Simulations Application au choix d’une prédiction de structure Références Une méthode ABC de choix de modèle pour les champs de Gibbs Application à la prédiction de structure 3D de protéine Aude GRELAUD †‡ , Jean-Michel MARIN * , Christian P. ROBERT , François RODOLPHE , Jean-François TALY Unité Mathématique, Informatique et Génome, INRA * I3M, Université Montpellier 2 Cérémade, Université Paris Dauphine Laboratoire de Statistique, CREST-INSEE Applibugs, 4 juin 2009

Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Une méthode ABC de choix de modèle pour leschamps de Gibbs

Application à la prédiction de structure 3D deprotéine

Aude GRELAUD†‡�, Jean-Michel MARIN ∗� , Christian P.ROBERT‡� , François RODOLPHE† , Jean-François TALY†

† Unité Mathématique, Informatique et Génome, INRA∗ I3M, Université Montpellier 2

‡ Cérémade, Université Paris Dauphine� Laboratoire de Statistique, CREST-INSEE

Applibugs, 4 juin 2009

Page 2: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Problème de départ

• Comment choisir la “meilleure” prédiction de structure 3Dpour une protéine donnée ?

• Information disponible : séquence d’AAs + prédictions destructure.

Page 3: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Problème de départ

• Comment choisir la “meilleure” prédiction de structure 3Dpour une protéine donnée ?

• Information disponible : séquence d’AAs + prédictions destructure.

•Propriété à utiliser : AAs encontact dans la structure 3D ontdes propriétés simulaires.

Page 4: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Comment faire ?

• Problème de choix de modèle

• Quels modèles ?• Chaque AA appartient à une catégorie k ∈ 1..K• Etat d’un AA ne dépend que de l’état de ses voisins :

# Champ markovien

Page 5: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Comment faire ?

• Problème de choix de modèle

• Quels modèles ?• Chaque AA appartient à une catégorie k ∈ 1..K• Etat d’un AA ne dépend que de l’état de ses voisins :

# Champ markovien

Mais...

• Modèles difficiles à utiliser car vraisemblance connue à uneconstante multiplicative près ...

• Complique d’autant plus le choix de modèle ! ! !

Page 6: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 7: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Définition des champs de Gibbs

Modèle statistique de vraisemblance :

f (x|θ) =1

Zθexp{θT S(x)} ,

où :

• x ∈ X ⊂Rn,

• S(·) fonction de potentiel, à valeur dans Rp,

• θ ∈ Rp paramètre d’échelle associé au modèle,

• Zθ = ∑x∈X exp{θT S(x)} constante de normalisation.

Page 8: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Définition des champs de Gibbs

Modèle statistique de vraisemblance :

f (x|θ) =1

Zθexp{θT S(x)} ,

où :

• x ∈ X ⊂Rn,

• S(·) fonction de potentiel, à valeur dans Rp,

• θ ∈ Rp paramètre d’échelle associé au modèle,

• Zθ = ∑x∈X exp{θT S(x)} constante de normalisation.

# Zθ non disponible en général.

Page 9: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Un exemple intéressant

• Pour modéliser une dépendance spatiale entre les données(épidémiologie, image...)

• Modèle de Potts :

S(x) = ∑i∼i ′

I{xi =xi′},

où i∼i ′ signifie que i et i ′ sont voisins.

Page 10: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Sélection de modèle

1 voisinage←→ 1 potentiel←→1 modèle

où :

• Sm(·) fonction de potentiel du modèle m,

• θm paramètre d’échelle associé au modèle m,

• Zm,θm constante de normalisation.

Page 11: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Modélisation

On se place dans un cadre bayésien :

• Vraisemblance :(x|θm,m)∼ fm(x|θm,m)

• Distributions a priori :

• m ∼ π(m)• (θm|m)∼ πm(θm)

# Objectif : distribution a posteriori de m, P(M = m|x).

Page 12: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Critère de sélection : Bayes factor

BFm0/m1(x) =

P(M = m0|x)

P(M = m1|x)

/π(m0)

π(m1)

=

R

fm0(x|θm0 ,m0)π0(θ0)dθ0R

fm1(x|θm1 ,m1)π1(θ1)dθ1.

Interprétation :

• Si BFm0/m1(x) > 1, l’évidence est plus forte en faveur du

modèle m0,

• Si BFm0/m1(x) < 1, l’évidence est plus forte en faveur du

modèle m1.

Page 13: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Ici,

BFm0/m1(x) =

R

exp{θT0S0(x)}/Zθ0,0π0(θ0)dθ0

R

exp{θT1S1(x)}/Zθ1,1π1(θ1)dθ1

,

# calcul direct impossible,# méthodes MCMC non applicables,

=⇒ Utilisation d’une méthode sans vraisemblance.

Page 14: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 15: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Idée

• Données qui se "ressemblent" correspondent à des valeursproches pour les paramètres.

• Ne pas savoir calculer la vraisemblance ne veut pas dire nepas savoir simuler selon le modèle.

A définir :

• Comment choisir les valeurs des paramètres utilisés poursimuler ?

• Comment décider que 2 jeux de données se ressemblentsuffisament ?

Page 16: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Exact rejection sampling

1 Générer θ∗ suivant le prior π(.).

2 Générer x∗ suivant f (·|θ∗).

3 Accepter θ∗ si x∗ = x0.

Résultat :

• Etapes 1 et 2 : Simulation d’un couple (θ∗,x∗) de densitéπ(θ∗)f (x∗|θ∗) ∝ π(θ∗|x∗).

• On accepte si x∗ = x0 : θ∗ exactement de densité π(θ|x0).

Limite : Taux d’acceptation petit, voir nul dans le cas continu !

Page 17: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

ε-tolerance rejection sampling

1 Générer θ∗ suivant le prior π(.).

2 Générer x∗ suivant f (·|θ∗).

3 Accepter θ∗ si ρ(x∗,x0) < ε.

Résultat :(θ1∗, · · · ,θ∗n) de densité π(θ|ρ(x∗,x0) < ε).

# Si ε est suffisamment petit, bonne approximation de π(θ|x0).(En pratique q1% sur les distances)

Limite : Comment définir ρ quand x de grande dimension ?

Page 18: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Approximate BayesianComputation (ABC)

Soit T un vecteur de statistiques résumées :

1 Générer θ∗ suivant le prior π(.).

2 Générer x∗ suivant f (·|θ∗).

3 Accepter θ∗ si ρ(T (x0),T (x∗)) < ε.

Résultat :(θ1∗, · · · ,θ∗n) de densité π(θ|ρ(T (x∗),T (x0)) < ε).

# Si ε est suffisamment petit, et T bien choisie, bonneapproximation de π(θ|x0).

# Comment choisir T ?

Page 19: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Choix de T

• dim(T )≥ 1,

• T bon résumé de x,

• Idéal : statistique exhaustive.

# Si T est exhaustive et ε = 0 : ABC exact car

π(θ|ρ(T (x∗),T (x0)) = 0) = π(θ|x∗ = x0)

Page 20: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 21: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Algorithme ABC-MCApproximate Bayesian Computation Model Choice

0 Générer m∗ suivant π(M = m).

1 Générer θ∗m∗ suivant πm∗(·).

2 Générer x∗suivant fm∗(·|θ∗m∗).3 Accepter (θ∗m∗ ,m∗) si ρ(T (x0),T (x∗)) < ε.

Résultat :(m∗,θm∗) de distribution π{(m,θm)|ρ(T (x0),T (x∗)) < ε

}.

Page 22: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Estimation du Bayes factor

• Approximation de Monte Carlo de P(M = m|x0) :

P̂(M = m|x0) = ]{mi∗ = m}/

N .

• Estimateur du BF correspondant :

BFm0/m1(x0) =

P̂(M = m0|x0)

P̂(M = m1|x0)×

π(M = m1)

π(M = m0)

=]{mi∗ = m0}

]{mi∗ = m1}×

π(M = m1)

π(M = m0).

• En pratique, on utilise :

B̂F m0/m1(x0) =

1+ ]{mi∗ = m0}

1+ ]{mi∗ = m1}×

π(M = m1)

π(M = m0).

Page 23: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Application aux champs de Gibbs

Choix de la statistique résumée T :

• Sm : statistique exhaustive pour θm,

• S = (S1, · · · ,SM) : statistique exhaustive pour (θ1, · · · ,θM),

P(X = x|S(x) = s,M = m) =1

n(S(x))

= P(X = x|S(x) = s)

avec n(S(x)) = ]{x̃ ∈ X : S(x̃) = S(x)} .

# (S1, · · · ,SM) exhaustive pour m.

# T = (S1, · · · ,SM).

Page 24: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 25: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Modèles

• M0 : cas iid, Bernouilli(p)

• f0(X |θ0,m = 0) = 1Zθ0,0

exp(θ0 ∑i 1{xi=1})

• p =exp(θ0)

1+exp(θ0)

• S0(x) = ∑i 1{xi=1}

• M1 : Chaîne de Markov de matrice de transition P

• f (X |θ,1) =exp(2θ1 ∑n−1

i=1 1{xi =xi+1})

2(1+exp(2θ1))n−1

• P =

(exp(2θ1)

1+exp(2θ1)1

1+exp(2θ1)1

1+exp(2θ1)exp(2θ1)

1+exp(2θ1)

)

• S1(x) = ∑n−1i=1 1{xi=xi+1}

Page 26: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

En pratique

Choix des priors :

• modèles équiprobables a priori,

• uniforme pour les paramètres.

Statistique résumée :

T = (∑i 1{xi=1},∑n−1i=1 1{xi=xi+1}),

# statistique exhaustive pour (m,θ0,θ1).

Page 27: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Résultats

0.0 0.2 0.4 0.6 0.8 1.0

0.00.2

0.40.6

0.81.0

P(M=0|x)

P(M=0

|x)^

0.0 0.2 0.4 0.6 0.8 1.0

0.00.2

0.40.6

0.81.0

P(M=0|x)

P(M=0

|x)^

Figure: (left) Comparaison de la vraie valeur P(M = 0|x0) à

P̂(M = 0|x0) sur 2 000 séquences simulées et en utilisant unéchantillon de 4.106 propositions. La ligne rouge correspond à ladiagonale. (droite) Même comparaison en utilisant un seuil εcorrespondant au quantile à 1% des distances.

Page 28: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Résultats (2)

−40 −20 0 10

−50

5

BF01

BF̂01

−40 −20 0 10

−10

−50

510

BF01

BF̂01

Figure: (left) Comparaison de la vraie valeur BF0/1 à B̂F0/1 sur 2 000

séquences simulées et en utilisant un échantillon de 4.106 propositions.La ligne rouge correspond à la diagonale. (droite) Même comparaison enutilisant un seuil ε correspondant au quantile à 1% des distances.

Page 29: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Résultats, cas exact

m = 1 m = 1 m = 1 m = 1 m = 0 m = 0 m = 0 m = 0dec. fort sub. faible faible sub. fort dec.

m = 1, dec. 778 9 0 0 0 0 0 0m = 1, fort 2 79 0 0 0 0 0 0m = 1, sub. 0 7 53 0 0 0 0 0m = 1, faible 0 0 2 63 0 7 0 0m = 0, faible 0 0 0 22 103 7 0 0m = 0, sub. 0 0 0 0 1 103 23 0m = 0, fort 0 0 0 0 0 5 177 6m = 0, dec. 0 0 0 0 0 0 13 547

Comparaison de la vraie valeur de BF0/1 avec son estimation B̂F0/1 sur 2 000 séquences

simulées et en utilisant un échantillon de 4.106 propositions. Les catégories correspondent

à l’échelle de Jeffrey.

Page 30: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Résultats , ε = q1%

m = 1 m = 1 m = 1 m = 1 m = 0 m = 0 m = 0 m = 0dec. fort sub. faible faible sub. fort dec.

m = 1, dec. 740 39 5 2 0 0 1 0m = 1, fort 0 64 14 2 1 0 0 0m = 1, sub. 0 0 39 19 2 0 0 0m = 1, faible 0 0 0 61 3 0 1 0m = 0, faible 0 0 0 2 128 2 0 0m = 0, sub. 0 0 0 0 2 123 1 1m = 0, fort 0 0 0 0 0 26 161 1m = 0, dec. 0 0 0 0 0 0 71 489

Comparaison de la vraie valeur de BF0/1 avec son estimation B̂F0/1 sur 2 000 séquences

simulées et en utilisant un échantillon de 4.106 propositions. Les catégories correspondent

à l’échelle de Jeffrey.

Page 31: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 32: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Comment déterminer la structure3D d’une protéine ?

• Expérimental :• Cristallographie par rayon X,• Spectroscopie par résonance magnétique nucléaire,• Cryomicroscopie.

# Délicat et coûteux.

• Méthodes automatiques :• Basées sur les structures de protéines connues : méthodes

par homologie ou par reconnaissance des repliements(Protein Threading),

• Basées sur d’autres données ( propriétés physico-chimiquesdes atomes par exemple) : méthodes ab initio et de novo.

# Besoin d’un critère de choix entre les candidats.

Page 33: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Idée du travail

• AAS en contact dans la structure 3D ont souvent despropriétés biochimiques similaires.

• Ici : utilisation de l’hydrophobicité (2 catégories).

Page 34: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Modélisation statistique duproblème

• x = (x1, · · · ,xn) avec ∀i ∈ 1, · · · ,n, xi ∈ 1, · · · ,K

Page 35: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Modélisation statistique duproblème

• x = (x1, · · · ,xn) avec ∀i ∈ 1, · · · ,n, xi ∈ 1, · · · ,K

• Chaque structure définit un graphe de voisinage :

V1

V2

Page 36: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

• A chaque structure on associe un champs de Gibbs :

# Problème de choix de modèle

Page 37: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

• A chaque structure on associe un champs de Gibbs :

# Problème de choix de modèle

• Quel est la structure de voisinage la plus adéquate ?

V1

V2

Page 38: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Jeu de données étudié

Protéine de Thermotoga maritima

• Structure native (NS)

• 4 structures candidates proposées par FROST

Page 39: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Résultats

FROST score B̂FNS/.

1i5nA (ST1, Similaire) 75.3→ Ok 1.341ls1A1 (ST2, Similaire) 8.9→ ? 1.221jr8A (ST3, ? ) 8.9→ ? 2.421s7oA (DT, non similaire) 7.8→ ? ? 2.76

FROST score : qualité de l’alignement de la séquence étudiée sur la structure candidate.

> 9 : bon alignement, < 7 mauvais.

# Distingue mieux les structures similaires des non similaires queFROST.

Page 40: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Conclusion

• ABC permet de faire du choix de modèle sans utiliser lavraisemblance.

• Champs de Gibbs : statistique exhaustive disponible, pas deperte d’efficacité.

• Application biologique : tester d’autres propriétés.

• Réseaux : autre type de champs de Gibbs à explorer...

Page 41: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

1 Champs de Gibbs

2 Méthodes sans vraisemblance

3 ABC-MC

4 Simulations

5 Application au choix d’une prédiction de structure

6 Références

Page 42: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Références ABC

J. K. Pritchard, M. T. Seielstad, A. Perez-Lezaun, M. W.Feldman,Population growth of human Y chromosomes : a study of Ychromosome microsatellites,Mol. Biol. Evol. 16 (1999) 1791–1798.

M. Beaumont, W. Zhang, D. Balding,Approximate Bayesian Computation in population genetics,Genetics 162 (2002) 2025–2035.

A. Grelaud, C.P. Robert, J.-M. Marin, F. Rodolphe, J.-F. Taly,ABC methods for model choice in Gibbs random fields,arXiv :0807.2767, (2008).

Page 43: Une méthode ABC de choix de modèle pour les champs de Gibbs …genome.jouy.inra.fr/applibugs/applibugs.09_06_04.grelaud.pdf · 2009. 6. 19. · GRELAUD Champs de Gibbs Méthodes

Choix demodèle pour les

champs deGibbs

AudeGRELAUD

Champs deGibbs

Méthodes sansvraisemblance

ABC-MC

Simulations

Application auchoix d’uneprédiction destructure

Références

Autres références

B.P. Carlin, S. Chib,Bayesian model choice via Markov chain Monte Carlomethods,J. Royal Statist. Society Series B. 57 (1995) 473–484.

N. Cressie,Statistics for Spatial Data, revised edition,Wiley Series in Probability and Statistics, New York, 1993.