10
Un modèle de croissance de l’embryon sous contrainte de l’environnement Marc Girondot, Université Paris Sud No<ons qui seront vues: ? Maximum de vraisemblance ? AIC, Akaike weight, sélec<on de modèle ? Equa<on différen<elle ? Approxima<on par la méthode de Runge?KuMa Croissance de l’embryon Pensez à observer et interpréter les observa<ons 0 200 400 600 800 1000 1200 0 5 10 15 20 25 30 35 40 45 50 Masse en mg Temps en jours x 1000 Œufs placés dans un incubateur à 25 °C. L’œuf est ouvert et l’embryon pesé à différents temps. Comment modéliser ces données ? Croissance de l’embryon Pensez à observer et interpréter les observa<ons Régression linéaire ? Des masses néga<ves sont aMendues à la ponte ! y = 37,516x ? 821,67 R² = 0,84877 0 200 400 600 800 1000 1200 0 5 10 15 20 25 30 35 40 45 50 Masse en mg Temps en jours x 1000 Croissance de l’embryon Une infinité de solu<ons… Laquelle choisir ? y = 0,0121x 2,9674 R² = 0,85428 0 200 400 600 800 1000 1200 0 10 20 30 40 50 Masse en mg Temps en jours x 1000 y = 0,4652x 2 + 5,7871x ? 291,07 R² = 0,85503 0 200 400 600 800 1000 1200 0 10 20 30 40 50 Masse en mg Temps en jours x 1000 y = 0,001x 6 ? 0,2039x 5 + 16,934x 4 ? 741,88x 3 + 18089x 2 ? 232779x + 1E+06 R² = 0,90067 0 200 400 600 800 1000 1200 0 10 20 30 40 50 Masse en mg Temps en jours x 1000 ???

Un#modèle#de#croissance#de# Croissance#de…max2.ese.u-psud.fr/epc/conservation/Sfax/7-AIC.pdf · • Estimer un paramètre par la méthode du maximum de vraisemblance, c'est proposer

  • Upload
    ngothu

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Un#modèle#de#croissance#de#l’embryon#sous#contrainte#de#

l’environnement#

Marc#Girondot,#Université#Paris#Sud#

No<ons#qui#seront#vues:#?  Maximum#de#vraisemblance#?  AIC,#Akaike#weight,#sélec<on#de#modèle#?  Equa<on#différen<elle#?  Approxima<on#par#la#méthode#de#Runge?KuMa#

Croissance#de#l’embryon#

•  Pensez#à#observer#et#interpréter#les#observa<ons#

0#

200#

400#

600#

800#

1000#

1200#

0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

Œufs#placés#dans#un#incubateur#à#25#°C.#L’œuf#est#ouvert#et#l’embryon#pesé#à#différents#temps.#

Comment%modéliser%ces%données%?%

Croissance#de#l’embryon#

•  Pensez#à#observer#et#interpréter#les#observa<ons#

Régression#linéaire#?#Des#masses#néga<ves#sont#aMendues#à#la#ponte#!#

y#=#37,516x#?#821,67#R²#=#0,84877#

0#

200#

400#

600#

800#

1000#

1200#

0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

Croissance#de#l’embryon#

•  Une#infinité#de#solu<ons…#Laquelle#choisir#?#

y#=#0,0121x2,9674#R²#=#0,85428#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#Masse%en%mg%

Temps%en%jours%x%1000%

y#=#0,4652x2#+#5,7871x#?#291,07#R²#=#0,85503#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

y#=#0,001x6#?#0,2039x5#+#16,934x4#?#741,88x3#+#18089x2#?#232779x#+#1E+06#R²#=#0,90067#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

???#

Croissance#de#l’embryon#

•  Test#de#la#qualité#de#l’ajustement#

y#=#0,0121x2,9674#R²#=#0,85428#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

y#=#0,4652x2#+#5,7871x#?#291,07#R²#=#0,85503#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

y#=#0,001x6#?#0,2039x5#+#16,934x4#?#741,88x3#+#18089x2#?#232779x#+#1E+06#R²#=#0,90067#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

y#=#37,516x#?#821,67#R²#=#0,84877#

0#200#400#600#800#

1000#1200#

0# 10# 20# 30# 40# 50#

Masse%en%mg%

Temps%en%jours%x%1000%

Qualité#d’un#ajustement#•  L’ajustement#d’une#courbe#théorique#sur#un#ensemble#d’observa<ons#se#fait#selon#un#critère#de#minimisa<on,#par#exemple#les#moindres?carrés.#

•  Mais#comment#savoir#qu’un#ajustement#est#meilleur#qu’un#autre#?#–  Il#est#meilleur#car#le#critère#d’ajustement#est#plus#faible;#

– Mais#la#valeur#du#critère#d’ajustement#est#dépendante#du#nombre#de#paramètres#dans#le#modèle.#•  Si#on#a#autant#de#paramètres#que#d’observa<on,#l’ajustement#sera#parfait#!#

Le#rasoir#d’Ockam#•  Le#rasoir#d'Ockham#est#un#principe##de#raisonnement#philosophique##entrant#dans#les#concepts#de##ra<onalisme.#Son#nom#vient#du##philosophe#franciscain#Guillaume##d'Ockham#(XIVe#siècle).#On#le#trouve#également#appelé#principe#de#simplicité,#principe#d'économie#ou#principe#de#parcimonie#(en#la<n#lex#parsimoniae).#

!Pluralitas!non!est!ponenda!sine!necessitate!«#Les#mul<ples#ne#doivent#pas#être#u<lisés#sans#nécessité.#»#

Qualité#d’un#ajustement#

•  On#va#donc#chercher#u<liser#un#critère#de#meilleur#ajustement#mais#en#pénalisant#par#le#nombre#de#paramètres#u<lisés#dans#le#modèle.#

Exemple#classique#de#sur?paramétrisa<on#pour#l’explica<on#du#mouvement#des#planètes#par#Ptolémée#Le#cercle#est#considéré#comme#le#mouvement#parfait.#

U<lisa<on#de#la#vraisemblance#(likelihood)#

Soit d un jeu de données observées et m un modèle:!L(m; d) represente la vraisemblance des données observées

d dans le modèle m et P(d|m) la probabilité d’observer les données d dans le modèle m. La propriété d’une vraisemblance est que L(m;d) # P(d|m) avec une constante de proportionnalité arbitraire .!

La différence entre des approches probabilistes et par vraisemblance est qu’alors que l’approche probabiliste considère les données pour une hypothèse donnée et fixée, la vraisemblance recherche l’hypothèse qui décrit au mieux les données.!

Maximum#de#vraisemblance#•  Utilisation du maximum de vraisemblance pour

déterminer les paramètres d’une distribution.!•  Etant donné un échantillon observé d et une loi de

probabilité Pθ, la vraisemblance quantifie la probabilité que les observations proviennent effectivement d'un échantillon (théorique) de la loi Pθ.!

•  Estimer un paramètre par la méthode du maximum de vraisemblance, c'est proposer comme valeur de ce paramètre celle qui rend maximale la vraisemblance, à savoir la probabilité d'observer les données comme réalisation d'un échantillon de la loi Pθ.!

Comparer#des#modèles#

Soit m1 et m2, deux modèles avec p1 et p2 paramètres ajustés sur un jeu de données d et ayant pour vraisemblance L1 et L2, on va définir la statistique AIC comme étant:!

AIC=-2 ln L + 2 p!!Akaike, H. 1974. A new look at the statistical model identification. IEEE Transactions on Automatic Control

19:716-723.!

Entre deux modèles, on choisira celui donc l’AIC (Akaike Information Criterion) est le plus faible: meilleur ajustement mais pas trop de paramètres.!

!

Comparer#des#modèles#

L’AIC n’est pas un test au sens de la théorie des tests.!On peut convertir l’AIC en une statistique qui

représente la probabilité que ce soit réellement le meilleur modèle parmi ceux testés.!

C’est l’Akaike weight:!!

exp(− 12(AIC − AICmin))

exp(− 12(AIC − AICmin))∑

Selon#une#loi#normale#ou#de#Gauss?Laplace#

•  Soit#une#loi#normale#N(µ,#σ)#•  La#vraisemblance#d’une#observa<on#Yi#<rée#dans#ceMe#loi#normale#est##

L{Yi;m} =1

σ 2πexp −

Yi −µ( )2

2σ 2

%

& ' '

(

) * *

−LnL{Yi;m} = ln σ( ) +12ln 2π( ) +

Yi −µ( )2

2σ 2

Soit#un#échan<llon#de#k#points#

−LnL{Y;m} = k ln σ( ) +12ln 2π( )

%

& '

(

) * +

Yi −µ( )2

2σ 2i=1

k

Notez#que#le#premier#terme#est#une#constante#qui#ne#dépend#pas#des#observa<ons.#Le#second#terme#est#une#somme#des#moindres#carrés#pondérés#par#la#variance.#

Vraisemblance#des#modèles#Modèle a+bx a*x^b a+bx+cx^2 a+bx+cx^2+dx^3+ex^4+fx5

-Ln L 323,2090915 324,1257675 322,196357 320,1976205

AIC 652,4181829 654,2515349 652,392714 654,3952411

Akaike weight 0,35909409 0,143582309 0,363696195 0,133627406

En#terme#d’AIC,#le#meilleur#modèle#est#le#polynôme#du#second#degré.#Il#y#a#36,3%#de#chance#que#ce#soit#réellement#le#meilleur#modèle#parmi#ceux?testés.#Mais#la#droite#a#aussi#35,9%#de#chance#d’être#le#meilleur#modèle#!##

Mais…#

?200#

0#

200#

400#

600#

800#

1000#

1200#

0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#

Masse#

Masse#obs#

Jours#

Masse#en#mg#

Retour#aux#observa<ons#

•  Manipulez#et#transformez#les#données#

0#

1#

2#

3#

4#

5#

6#

7#

8#

0# 10# 20# 30# 40# 50# 60# 70#

ln%M

asses%(mg)%

Temps%en%min%x%1000%

Modèle#de#croissance#

•  Modèle#exponen<el:#m=m0*exp(rm*t)#

0!200!400!600!800!

1000!1200!1400!1600!

0! 20! 40! 60! 80!

Mas

ses e

n m

g!

TIme in min*1000!

0!1!2!3!4!5!6!7!8!

0! 20! 40! 60! 80!

ln M

asse

s in

mg!

TIme in min*1000!

Modèle#de#croissance#

•  Modèle#exponen<el:#m=m0*exp(rm*t)#

0#

5000#

10000#

15000#

20000#

25000#

30000#

35000#

40000#

45000#

0# 20# 40# 60# 80# 100# 120# 140# 160#

Masse%en%g%

Temps%en%jours%

Modèle#

Series2#

Il#faut#trouver#un#modèle#qui#arrête#la#croissance#exponen<elle.#

Différentes équations"• Verhulst P.F. 1838. Notice sur la loi que la population suit dans son accroissement. Correspondance Mathématique et Physique 10:113-121. !• Bertalanffy, L. von 1938. A quantitative theory of organic growth. Hum. Biol., 10 (2): 181-213.!• Gompertz B. 1825. On the nature of the function expressive of the law of human mortality, and on a new mode of determining the value of life contingencies. Philos Trans R Soc Lond [Biol] 115:513-585.!

y = a / (1+exp (b (c-t)) )!

Généralisation de ces courbes dans :"• Richards F.J. 1959. A flexible growth function for empirical use. Journal of Experimental Botany 29:290-300.!

Généralisa<on#Richards F.J. 1959. A flexible growth function for empirical use. Journal of Experimental Botany 29:290-300.!

g = a(1+ b exp(−rt))1/(1−k )

Fonc<on#de#Gompertz#

•  La#fonc<on#de#Gompertz#a#l’avantage#d’avoir#une#dynamique#directement#liée#aux#valeurs#de#paramètres#

Fonc<on#de#Gompertz#

•  x0#est#la#valeur#à#t=0#•  K#est#l’asymptote#

0#

200#

400#

600#

800#

1000#

1200#

1400#

1600#

1800#

0# 20# 40# 60# 80# 100#

a=0,05#

a=0,04#

a=0,06#

a#est#une#mesure#de#la#vitesse#de#la#croissance#

Fonc<on#de#Gompertz#

0#

200#

400#

600#

800#

1000#

1200#

1400#

1600#

1800#

0# 10# 20# 30# 40# 50# 60# 70# 80# 90# 100#

Masse#

Masse#obs#

Modèle a+bx a*x^b a+bx+cx^2 a+bx+cx^2+dx^3+ex^4+fx5 Gompertz

-Ln L 323,2090915 324,1257675 322,196357 320,1976205 319,2892606

AIC 652,4181829 654,2515349 652,392714 654,3952411 646,5785212

Akaike weight 0,046897854 0,018751916 0,047498891 0,017451801 0,869399538

Effet#de#l’environnement#sur#la#croissance#

0#

200#

400#

600#

800#

1000#

1200#

0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#

Masse%en%mg%

Jours%d'incuba?on%

"25°C"#

"28,5°C"#

"30°C"#

Effet#de#l’environnement#sur#la#croissance#

0#

200#

400#

600#

800#

1000#

1200#

1400#

0# 10# 20# 30# 40# 50# 60# 70# 80# 90#

Masse%en%mg%

Jours%d'incuba?on%

"25°C"#

"28,5°C"#

"30°C"#

""#

""#

""#

X0=10?4#

K=1200#

Effet#de#la#température#

0#

0,02#

0,04#

0,06#

0,08#

0,1#

0,12#

20# 22# 24# 26# 28# 30# 32# 34# 36#

a%

Temperature%d'incuba?on%

Effet#de#la#température#sur#les#réac<ons#biologiques#

•  Vous#connaissez#tous#bien#sûr#le#Q10…#

•  On#appelle#Q#10#l'augmenta<on#constatée#de#vitesse#de#réac<on#lorsque#l'on#augmente#la#température#de#10°#C#

rate#=#k#[A]x#[B]y!!•  (S#Arrhenius,#1889)#ln#(k2/k1)#=#(Ea/R)#(1/T1!–!1/T2)#Q10=k2/k1!#Donc#le#Q10#n’est#pas#indépendant#de#T#!#On#oublie#donc#le#Q10#!##

Effet#de#la#température#sur#les#réac<ons#biologiques#

•  Schoolfield,#R.M.,#P.J.#Sharpe,#and#C.E.#Magnuson.#1981.#Non?linear#regression#of#biological#temperature?dependent#rate#models#based#on#absolute#reac<on?rate#theory.#Journal#of#Theore<cal#Biology#88#(4):719?31.#

Autre#espèce#

20 25 30 35

0.0

0.1

0.2

0.3

0.4

0.5

0.6

Temperatures in °C

r*10

000

•  Chez#Care<a!care<a!

Une#incuba<on#réelle# Travailler#en#pas#à#pas#

•  Equa<on#différen<elle#du#modèle#dynamique#de#Gompertz#

On#peut#l’écrire#sous#forme#d’une#rela<on#de#récurrence#si#∆t#?>#0## # # # # #∆x=a#x#ln(K/x)#∆t#

Travailler#en#pas#à#pas#

•  Equa<on#différen<elle#du#modèle#dynamique#de#Gompertz#appliquée#par#différence#

# # # # ##

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50# 60# 70# 80#

Intégré#

Différence#2#

Différence#5#

Différence#1#

Méthode#de#Runge?KuMa#

•  Les#méthodes#de#Runge?KuMa#sont#des#méthodes#d'analyse#numérique#d'approxima<on#de#solu<ons#d'équa<ons#différen<elles.#

•  Elles#ont#été#nommées#ainsi#en#l'honneur#des#mathéma<ciens#Carl#Runge#et#Mar<n#Wilhelm#KuMa#lesquels#élaborèrent#la#méthode#en#1901.#

Principe#de#la#méthode#

•  Soit#une#équa<on#différen<elle#du#premier#ordre#:#dy#=#f(x,y)#dx##

•  La#méthode#RK4#u<lise##plusieurs#points##intermédiaires#pour##calculer#la#valeur##de#yi+1#à#par<r#de#la##valeur#de#yi.##

Applica<on#de#la#méthode#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50# 60# 70# 80#

Intégré#

Différence#2#

Différence#5#

Différence#1#

Runge?KuMa#

Jours#

Masse#en#mg#

Température#variable#

0#

200#

400#

600#

800#

1000#

1200#

0# 10# 20# 30# 40# 50# 60# 70# 80#

Masse%en%mg%

Days%

Avec#a=0.06,#version#intégrée#(bleu)#

Avec#a#moyen=0.06#et#une#approxima<on#par#la#méthode#de#Runge?KuMa#(rouge)#

a#*10000#(en#vert)#