Upload
ngothu
View
214
Download
0
Embed Size (px)
Citation preview
Un#modèle#de#croissance#de#l’embryon#sous#contrainte#de#
l’environnement#
Marc#Girondot,#Université#Paris#Sud#
No<ons#qui#seront#vues:#? Maximum#de#vraisemblance#? AIC,#Akaike#weight,#sélec<on#de#modèle#? Equa<on#différen<elle#? Approxima<on#par#la#méthode#de#Runge?KuMa#
Croissance#de#l’embryon#
• Pensez#à#observer#et#interpréter#les#observa<ons#
0#
200#
400#
600#
800#
1000#
1200#
0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
Œufs#placés#dans#un#incubateur#à#25#°C.#L’œuf#est#ouvert#et#l’embryon#pesé#à#différents#temps.#
Comment%modéliser%ces%données%?%
Croissance#de#l’embryon#
• Pensez#à#observer#et#interpréter#les#observa<ons#
Régression#linéaire#?#Des#masses#néga<ves#sont#aMendues#à#la#ponte#!#
y#=#37,516x#?#821,67#R²#=#0,84877#
0#
200#
400#
600#
800#
1000#
1200#
0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
Croissance#de#l’embryon#
• Une#infinité#de#solu<ons…#Laquelle#choisir#?#
y#=#0,0121x2,9674#R²#=#0,85428#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#Masse%en%mg%
Temps%en%jours%x%1000%
y#=#0,4652x2#+#5,7871x#?#291,07#R²#=#0,85503#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
y#=#0,001x6#?#0,2039x5#+#16,934x4#?#741,88x3#+#18089x2#?#232779x#+#1E+06#R²#=#0,90067#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
???#
Croissance#de#l’embryon#
• Test#de#la#qualité#de#l’ajustement#
y#=#0,0121x2,9674#R²#=#0,85428#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
y#=#0,4652x2#+#5,7871x#?#291,07#R²#=#0,85503#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
y#=#0,001x6#?#0,2039x5#+#16,934x4#?#741,88x3#+#18089x2#?#232779x#+#1E+06#R²#=#0,90067#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
y#=#37,516x#?#821,67#R²#=#0,84877#
0#200#400#600#800#
1000#1200#
0# 10# 20# 30# 40# 50#
Masse%en%mg%
Temps%en%jours%x%1000%
Qualité#d’un#ajustement#• L’ajustement#d’une#courbe#théorique#sur#un#ensemble#d’observa<ons#se#fait#selon#un#critère#de#minimisa<on,#par#exemple#les#moindres?carrés.#
• Mais#comment#savoir#qu’un#ajustement#est#meilleur#qu’un#autre#?#– Il#est#meilleur#car#le#critère#d’ajustement#est#plus#faible;#
– Mais#la#valeur#du#critère#d’ajustement#est#dépendante#du#nombre#de#paramètres#dans#le#modèle.#• Si#on#a#autant#de#paramètres#que#d’observa<on,#l’ajustement#sera#parfait#!#
Le#rasoir#d’Ockam#• Le#rasoir#d'Ockham#est#un#principe##de#raisonnement#philosophique##entrant#dans#les#concepts#de##ra<onalisme.#Son#nom#vient#du##philosophe#franciscain#Guillaume##d'Ockham#(XIVe#siècle).#On#le#trouve#également#appelé#principe#de#simplicité,#principe#d'économie#ou#principe#de#parcimonie#(en#la<n#lex#parsimoniae).#
!Pluralitas!non!est!ponenda!sine!necessitate!«#Les#mul<ples#ne#doivent#pas#être#u<lisés#sans#nécessité.#»#
Qualité#d’un#ajustement#
• On#va#donc#chercher#u<liser#un#critère#de#meilleur#ajustement#mais#en#pénalisant#par#le#nombre#de#paramètres#u<lisés#dans#le#modèle.#
Exemple#classique#de#sur?paramétrisa<on#pour#l’explica<on#du#mouvement#des#planètes#par#Ptolémée#Le#cercle#est#considéré#comme#le#mouvement#parfait.#
U<lisa<on#de#la#vraisemblance#(likelihood)#
Soit d un jeu de données observées et m un modèle:!L(m; d) represente la vraisemblance des données observées
d dans le modèle m et P(d|m) la probabilité d’observer les données d dans le modèle m. La propriété d’une vraisemblance est que L(m;d) # P(d|m) avec une constante de proportionnalité arbitraire .!
La différence entre des approches probabilistes et par vraisemblance est qu’alors que l’approche probabiliste considère les données pour une hypothèse donnée et fixée, la vraisemblance recherche l’hypothèse qui décrit au mieux les données.!
Maximum#de#vraisemblance#• Utilisation du maximum de vraisemblance pour
déterminer les paramètres d’une distribution.!• Etant donné un échantillon observé d et une loi de
probabilité Pθ, la vraisemblance quantifie la probabilité que les observations proviennent effectivement d'un échantillon (théorique) de la loi Pθ.!
• Estimer un paramètre par la méthode du maximum de vraisemblance, c'est proposer comme valeur de ce paramètre celle qui rend maximale la vraisemblance, à savoir la probabilité d'observer les données comme réalisation d'un échantillon de la loi Pθ.!
Comparer#des#modèles#
Soit m1 et m2, deux modèles avec p1 et p2 paramètres ajustés sur un jeu de données d et ayant pour vraisemblance L1 et L2, on va définir la statistique AIC comme étant:!
AIC=-2 ln L + 2 p!!Akaike, H. 1974. A new look at the statistical model identification. IEEE Transactions on Automatic Control
19:716-723.!
Entre deux modèles, on choisira celui donc l’AIC (Akaike Information Criterion) est le plus faible: meilleur ajustement mais pas trop de paramètres.!
!
Comparer#des#modèles#
L’AIC n’est pas un test au sens de la théorie des tests.!On peut convertir l’AIC en une statistique qui
représente la probabilité que ce soit réellement le meilleur modèle parmi ceux testés.!
C’est l’Akaike weight:!!
exp(− 12(AIC − AICmin))
exp(− 12(AIC − AICmin))∑
Selon#une#loi#normale#ou#de#Gauss?Laplace#
• Soit#une#loi#normale#N(µ,#σ)#• La#vraisemblance#d’une#observa<on#Yi#<rée#dans#ceMe#loi#normale#est##
€
L{Yi;m} =1
σ 2πexp −
Yi −µ( )2
2σ 2
%
& ' '
(
) * *
€
−LnL{Yi;m} = ln σ( ) +12ln 2π( ) +
Yi −µ( )2
2σ 2
Soit#un#échan<llon#de#k#points#
€
−LnL{Y;m} = k ln σ( ) +12ln 2π( )
%
& '
(
) * +
Yi −µ( )2
2σ 2i=1
k
∑
Notez#que#le#premier#terme#est#une#constante#qui#ne#dépend#pas#des#observa<ons.#Le#second#terme#est#une#somme#des#moindres#carrés#pondérés#par#la#variance.#
Vraisemblance#des#modèles#Modèle a+bx a*x^b a+bx+cx^2 a+bx+cx^2+dx^3+ex^4+fx5
-Ln L 323,2090915 324,1257675 322,196357 320,1976205
AIC 652,4181829 654,2515349 652,392714 654,3952411
Akaike weight 0,35909409 0,143582309 0,363696195 0,133627406
En#terme#d’AIC,#le#meilleur#modèle#est#le#polynôme#du#second#degré.#Il#y#a#36,3%#de#chance#que#ce#soit#réellement#le#meilleur#modèle#parmi#ceux?testés.#Mais#la#droite#a#aussi#35,9%#de#chance#d’être#le#meilleur#modèle#!##
Mais…#
?200#
0#
200#
400#
600#
800#
1000#
1200#
0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#
Masse#
Masse#obs#
Jours#
Masse#en#mg#
Retour#aux#observa<ons#
• Manipulez#et#transformez#les#données#
0#
1#
2#
3#
4#
5#
6#
7#
8#
0# 10# 20# 30# 40# 50# 60# 70#
ln%M
asses%(mg)%
Temps%en%min%x%1000%
Modèle#de#croissance#
• Modèle#exponen<el:#m=m0*exp(rm*t)#
0!200!400!600!800!
1000!1200!1400!1600!
0! 20! 40! 60! 80!
Mas
ses e
n m
g!
TIme in min*1000!
0!1!2!3!4!5!6!7!8!
0! 20! 40! 60! 80!
ln M
asse
s in
mg!
TIme in min*1000!
Modèle#de#croissance#
• Modèle#exponen<el:#m=m0*exp(rm*t)#
0#
5000#
10000#
15000#
20000#
25000#
30000#
35000#
40000#
45000#
0# 20# 40# 60# 80# 100# 120# 140# 160#
Masse%en%g%
Temps%en%jours%
Modèle#
Series2#
Il#faut#trouver#un#modèle#qui#arrête#la#croissance#exponen<elle.#
Différentes équations"• Verhulst P.F. 1838. Notice sur la loi que la population suit dans son accroissement. Correspondance Mathématique et Physique 10:113-121. !• Bertalanffy, L. von 1938. A quantitative theory of organic growth. Hum. Biol., 10 (2): 181-213.!• Gompertz B. 1825. On the nature of the function expressive of the law of human mortality, and on a new mode of determining the value of life contingencies. Philos Trans R Soc Lond [Biol] 115:513-585.!
y = a / (1+exp (b (c-t)) )!
Généralisation de ces courbes dans :"• Richards F.J. 1959. A flexible growth function for empirical use. Journal of Experimental Botany 29:290-300.!
Généralisa<on#Richards F.J. 1959. A flexible growth function for empirical use. Journal of Experimental Botany 29:290-300.!
g = a(1+ b exp(−rt))1/(1−k )
Fonc<on#de#Gompertz#
• La#fonc<on#de#Gompertz#a#l’avantage#d’avoir#une#dynamique#directement#liée#aux#valeurs#de#paramètres#
Fonc<on#de#Gompertz#
• x0#est#la#valeur#à#t=0#• K#est#l’asymptote#
0#
200#
400#
600#
800#
1000#
1200#
1400#
1600#
1800#
0# 20# 40# 60# 80# 100#
a=0,05#
a=0,04#
a=0,06#
a#est#une#mesure#de#la#vitesse#de#la#croissance#
Fonc<on#de#Gompertz#
0#
200#
400#
600#
800#
1000#
1200#
1400#
1600#
1800#
0# 10# 20# 30# 40# 50# 60# 70# 80# 90# 100#
Masse#
Masse#obs#
Modèle a+bx a*x^b a+bx+cx^2 a+bx+cx^2+dx^3+ex^4+fx5 Gompertz
-Ln L 323,2090915 324,1257675 322,196357 320,1976205 319,2892606
AIC 652,4181829 654,2515349 652,392714 654,3952411 646,5785212
Akaike weight 0,046897854 0,018751916 0,047498891 0,017451801 0,869399538
Effet#de#l’environnement#sur#la#croissance#
0#
200#
400#
600#
800#
1000#
1200#
0# 5# 10# 15# 20# 25# 30# 35# 40# 45# 50#
Masse%en%mg%
Jours%d'incuba?on%
"25°C"#
"28,5°C"#
"30°C"#
Effet#de#l’environnement#sur#la#croissance#
0#
200#
400#
600#
800#
1000#
1200#
1400#
0# 10# 20# 30# 40# 50# 60# 70# 80# 90#
Masse%en%mg%
Jours%d'incuba?on%
"25°C"#
"28,5°C"#
"30°C"#
""#
""#
""#
X0=10?4#
K=1200#
Effet#de#la#température#
0#
0,02#
0,04#
0,06#
0,08#
0,1#
0,12#
20# 22# 24# 26# 28# 30# 32# 34# 36#
a%
Temperature%d'incuba?on%
Effet#de#la#température#sur#les#réac<ons#biologiques#
• Vous#connaissez#tous#bien#sûr#le#Q10…#
• On#appelle#Q#10#l'augmenta<on#constatée#de#vitesse#de#réac<on#lorsque#l'on#augmente#la#température#de#10°#C#
rate#=#k#[A]x#[B]y!!• (S#Arrhenius,#1889)#ln#(k2/k1)#=#(Ea/R)#(1/T1!–!1/T2)#Q10=k2/k1!#Donc#le#Q10#n’est#pas#indépendant#de#T#!#On#oublie#donc#le#Q10#!##
Effet#de#la#température#sur#les#réac<ons#biologiques#
• Schoolfield,#R.M.,#P.J.#Sharpe,#and#C.E.#Magnuson.#1981.#Non?linear#regression#of#biological#temperature?dependent#rate#models#based#on#absolute#reac<on?rate#theory.#Journal#of#Theore<cal#Biology#88#(4):719?31.#
Autre#espèce#
20 25 30 35
0.0
0.1
0.2
0.3
0.4
0.5
0.6
Temperatures in °C
r*10
000
• Chez#Care<a!care<a!
Une#incuba<on#réelle# Travailler#en#pas#à#pas#
• Equa<on#différen<elle#du#modèle#dynamique#de#Gompertz#
On#peut#l’écrire#sous#forme#d’une#rela<on#de#récurrence#si#∆t#?>#0## # # # # #∆x=a#x#ln(K/x)#∆t#
Travailler#en#pas#à#pas#
• Equa<on#différen<elle#du#modèle#dynamique#de#Gompertz#appliquée#par#différence#
# # # # ##
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50# 60# 70# 80#
Intégré#
Différence#2#
Différence#5#
Différence#1#
Méthode#de#Runge?KuMa#
• Les#méthodes#de#Runge?KuMa#sont#des#méthodes#d'analyse#numérique#d'approxima<on#de#solu<ons#d'équa<ons#différen<elles.#
• Elles#ont#été#nommées#ainsi#en#l'honneur#des#mathéma<ciens#Carl#Runge#et#Mar<n#Wilhelm#KuMa#lesquels#élaborèrent#la#méthode#en#1901.#
Principe#de#la#méthode#
• Soit#une#équa<on#différen<elle#du#premier#ordre#:#dy#=#f(x,y)#dx##
• La#méthode#RK4#u<lise##plusieurs#points##intermédiaires#pour##calculer#la#valeur##de#yi+1#à#par<r#de#la##valeur#de#yi.##
Applica<on#de#la#méthode#
0#
200#
400#
600#
800#
1000#
1200#
0# 10# 20# 30# 40# 50# 60# 70# 80#
Intégré#
Différence#2#
Différence#5#
Différence#1#
Runge?KuMa#
Jours#
Masse#en#mg#