35
MAP 311 - X2014 Chapitre 7 Ouvertures Chapitre 7 () MAP 311 - X2014 Ouvertures 1 / 35

MAP 311 - X2014benaych/Cours9-17062015.pdf · 2015. 6. 20. · (MAP 432) Pour d = 1 ou d = 2, la marche aléatoire symétrique (X n) n est récurrente: P(9n 1;X n = 0) = 1: Pour d

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • MAP 311 - X2014

    Chapitre 7

    Ouvertures

    Chapitre 7 () MAP 311 - X2014 Ouvertures 1 / 35

  • Tests statistiques

    Un jeu de pile ou face - deux joueurs: vous et votre meilleur(e) ami(e).Pile: vous lui donnez un euro. Face: il(elle) vous donne un euro.

    Vous jouez 500 fois. Vous donnez 400 euros et vous recevez 100 euros.Une question naturelle: C’est bizarre · · · La pièce est-t-elle truquée???

    Chapitre 7 () MAP 311 - X2014 Ouvertures 2 / 35

  • Comment répondre?

    1er choix - Décider que la pièce est truquée.

    Accuser votre compagnon de jeu d’avoir truqué le jeu.

    Attention: il y a un risque: perdre votre ami.

    2ème choix: Décider que l’on peut accepter que le jeu est équilibré etque vous n’avez pas eu de chances.

    Attention: il y a un risque: être pris pour une andouille.

    Remarque: les deux risques ne sont pas identiques.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 3 / 35

  • Autre exemple: la température à Paris

    Températures observées sur les 10 dernières années au mois de juillet.

    La température moyenne à Paris pour les mois de juillet du XXème siècle estmodélisée par une loi normale N (20,1).

    Peut-on décider que le modèle sur ces dernières années (supposé gaussien)a une moyenne égale ou supérieure à 20◦C? Changement climatique?

    Chapitre 7 () MAP 311 - X2014 Ouvertures 4 / 35

  • Le modèle statistiqueOn considère un échantillon de variables aléatoires indépendantes et demême loi (X1, · · · ,Xn). Nous supposons que la loi des Xi dépend d’unparamètre θ inconnu. Notons Pθ cette loi.

    Soit θ0 une valeur numérique, donnée par le contexte.

    On souhaite décider, au vu des observations si l’on peut accepter l’hypothèse

    H0 : θ = θ0,

    ou au contraire refuser cette hypothèse:

    H1 : θ 6= θ0.

    Deux manières de se tromper:

    • Rejeter H0 (et accepter H1 ), alors que H0 est vraie.• Accepter H0 alors que H0 est fausse ( H1 est vraie).Deux risques à contrôler: un risque de 1ère espèce et un risque de 2ndeespèce.

    Les test sont construits sur le contrôle du risque de 1ère espèce.Chapitre 7 () MAP 311 - X2014 Ouvertures 5 / 35

  • Test de moyenne pour un échantillon gaussienLes variables aléatoires Xi suivent une loi normale N (m, σ2). La varianceσ2 est connue. Le paramètre m est inconnu (voir l’exemple destempératures). Soit m0 ∈ R.

    La question: testerH0 : m = m0,

    contreH1 : m 6= m0.

    On se fixe une valeur α qui va contrôler l’erreur de 1ère espèce (α petit,valeurs standards: 0,1− 0,05− 0,01).

    Remarque fondamentale: Sous Pm0 , nous pouvons exhiber un intervalle deconfiance de m0 de niveau 1− α , (voir Cours 8):

    [X n −cα σ√

    n; X n +

    cα σ√n].

    Pm0(m0 ∈ [X n −cα σ√

    n; X n +

    cα σ√n]) = 1− α.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 6 / 35

  • La région complémentaire de [X n − cα σ√n ; X n +cα σ√

    n ] s’appelle la région derejet de l’hypothèse H0 au seuil α.

    Sur les valeurs observées x1, · · · , xn , nous pouvons calculer la moyenne xn .

    La décision:

    Soit m0 /∈ [xn − cα σ√n ; xn +cα σ√

    n ], et l’on rejette H0 (au niveau α).

    Soit m0 ∈ [xn − cα ∂√n ; xn +cα σ√

    n ], et l’on accepte l’hypothèse H0.

    Contrôle de la deuxième erreur: si E(Xi) = m , elle est donnée par

    Pm(m0 ∈ [X n −cα σ√

    n; X n +

    cα σ√n]) = 1− Pm(m0 /∈ [X n −

    cα σ√n

    ; X n +cα σ√

    n]).

    Les deux risques sont antagonistes. On ne peut que donner un risque β quiminimise le risque de seconde espèce:

    1− β = supm 6=m0

    Pm(m0 /∈ [X n −cα σ√

    n; X n +

    cα σ√n]).

    1− β s’appelle la puissance du test.Chapitre 7 () MAP 311 - X2014 Ouvertures 7 / 35

  • Applications numériques

    Moyenne des températures annuelles des 10 dernières années: x10 = 21,4.Les températures suivent des lois normales avec σ = 1.Nous nous donnons α = 0,1.

    H0 : m = 20,

    contreH1 : m 6= 20.

    Cherchons la région de confiance: cα = 1,645 et 20 + cα√10 = 20,52.

    Comme 21,4 > 20,52 , nous rejettons l’hypothèse H0 au seuil 0,01 etacceptons l’hypothèse d’un changement climatique.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 8 / 35

  • Le cas du pile ou face

    Nous pouvons faire le même raisonnement, mais asymptotiquement: il faut unGRAND échantillon (TCL).

    Dans l’exemple, n = 500 avec 400 Pile et 100 Face.Les variables aléatoires Xi qui valent 1 si on obtient un Face et 0 sinon,suivent des loi de Bernoulli de paramètre m. La variance est proche de 1/4.

    H0 : m = 0,5,

    contreH1 : m 6= 0,5.

    Nous choisissons un seuil α = 0,05, alors cα = 1,96.La borne inférieure de l’intervalle de confiance asymptotique de niveau 1− αobservé vaut donc: 0,5− 2 1,96√

    500= 0,32.

    Ici, x500 = 0,2 < 0,32.

    Nous rejetons l’hypothèse d’avoir une pièce équilibrée, au seuil α.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 9 / 35

  • Processus aléatoires1

    Etude de phénomènes aléatoires qui évoluent au cours du temps.

    Suite de variables aléatoires (Xn)n: décrit l’état à chaque instant n d’unsystème aléatoire défini par récurrence.

    Un exemple fondamental: Chaînes de Markov (Cours MAP 432): La loides états futurs du processus ne dépend du passé que par l’état duprocessus au présent.

    Remarque: les variables aléatoires Xn ne sont pas indépendantes.

    Processus fondamentaux: en Physique, en Biologie , en Informatique, enMathématiques financières...

    1MAP 311, Chapitre 7Chapitre 7 () MAP 311 - X2014 Ouvertures 10 / 35

  • Marche aléatoire

    Soit (Xi)i une suite de variable aléatoires réelles indépendantes et de mêmeloi.

    Définition

    On appelle marche aléatoire la suite (Sn)n définie par

    Sn = S0 +n∑

    i=1

    Xi = Sn−1 + Xn.

    Les variables Sn,n ∈ N sont des variables dépendantes.

    Importance fondamentale: décrire le déplacement d’une particule, ladescendance d’un individu, le cours de la bourse, un déplacement sur le web.

    La marche peut se promener sur un réseau régulier ou sur des graphes pluscomplexes.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 11 / 35

  • Marche aléatoire simple2 sur Zd

    Modélisation d’évolution de particules dans Rd .Un marcheur (sans doute ivre!) se déplace dans Zd .Notons (e1, . . . ,ed ) la base canonique de Rd .

    Sa position à l’instant n: Sn, définie par la relation de récurrencealéatoire:

    S0 = 0 ; Sn+1 = Sn + Xn+1,

    où les v.a. Xi sont indépendantes et de même loi sur

    {e1, . . . ,ed ,−e1, . . . ,−ed}.

    La marche aléatoire est dite symétrique si la loi des Xi est uniforme.

    2MAP 311, Chapitre 7, Section 7.1Chapitre 7 () MAP 311 - X2014 Ouvertures 12 / 35

  • Problème de la ruine d’un joueur3

    Un joueur lance une pièce.Pile avec probabilité p: il reçoit 1 euro de son adversaireFace avec probabilité 1− p: il lui donne un euro.

    Sn: fortune du joueur au nième coup.Xi : v.a. indépendantes, à valeurs dans {−1,+1}, avec

    P(Xi = 1) = p ; P(Xi = −1) = 1− p.

    Fortune initiale du joueur: S0 = k .Fortune initiale de l’adversaire: m − k .Le jeu s’arrête dès que l’un des joueurs est ruiné: barrières absorbantesaux points 0 et m.

    3MAP 311, Chapitre 7, Section 7.1Chapitre 7 () MAP 311 - X2014 Ouvertures 13 / 35

  • Pour S0 = k (fortune initiale), on définit Pk (R) = rk la probabilité del’événement R =“ruine du joueur”.

    On a

    rk = Pk (R|X1 = 1)P(X1 = 1) + Pk (R|X1 = −1)P(X1 = −1),

    soit encore

    rk = p rk+1 + (1− p) rk−1, ∀k ∈ {1, . . . ,m − 1},

    avec les conditions aux bords: r0 = 1, rm = 0. D’où

    p(rk − rk+1) = (1− p)(rk−1 − rk ), ∀k ∈ {1, . . . ,m − 1}.

    Jeu équitable: p = 12

    rk = 1−km.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 14 / 35

  • Jeu non équitable: p 6= 12

    rk − rk+1 =(

    1− pp

    )k(r0 − r1) =

    (1− p

    p

    )k(1− r1).

    Par sommation:

    r0 − rk =k−1∑i=0

    (1− p

    p

    )i(1− r1) =

    1−(

    1−pp

    )k(

    1− 1−pp) (1− r1).

    De plus,

    1 = r0 − rm =1−

    (1−p

    p

    )m(

    1− 1−pp) (1− r1),

    et donc

    Pk (R) = rk =

    (1−p

    p

    )m−(

    1−pp

    )k(

    1−pp

    )m− 1

    .

    Chapitre 7 () MAP 311 - X2014 Ouvertures 15 / 35

  • Adversaire infiniment riche

    Supposons que l’adversaire soit infiniment riche et que le jeu ne s’arrêteque si le joueur est ruiné.

    On fait tendre m vers l’infini.

    Jeu non équitable, p 6= 12 :

    p < 12(⇐⇒ 1−pp > 1

    )=⇒ Pk (R) = 1.

    La ruine est presque-sûrement certaine.

    p > 12(⇐⇒ 1−pp < 1

    )=⇒ Pk (R) =

    (1−p

    p

    )k< 1.

    Avec probabilité 1−(

    1−pp

    )k, le joueur est condamné à toujours jouer.

    Jeu équitable, p = 12 :

    Pk (R) = 1. La ruine est presque-sûrement certaine.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 16 / 35

  • Récurrence de la marche aléatoire sur ZOn considère la marche aléatoire (Sn)n sur Z (le problème du joueur sansbarrière), issue de 0 ( S0 = 0). Soit

    A = {∃ n ≥ 1 : Xn = 0} = { Retour à 0}.

    La marche est dite récurrente si P(A) = 1. ( Sn visite alors tous lespoints de Z infiniment souvent).La marche est dite transiente si P(A) < 1 . ( Sn visite alors chaque pointde Z au plus un nombre fini de fois).

    Proposition

    La marche est transiente pour p 6= 12 et récurrente pour p =12 . Plus

    précisément,

    P(A) = 2 min(p,1− p).

    Chapitre 7 () MAP 311 - X2014 Ouvertures 17 / 35

  • Preuve:

    P(A) = P(A|X1 = 1) p + P(A|X1 = −1) (1− p).

    Mais P(A|X1 = 1) = P1(R) , dans le cas de l’adversaire infiniment riche. D’où

    P(A|X1 = 1) =

    {1 si p ≤ 1/2.1−p

    p si p > 1/2.

    Par symétrie,

    P(A|X1 = −1) =

    {1 si p ≥ 1/2.

    p1−p si p < 1/2.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 18 / 35

  • Récurrence et transience dans Zd

    Question de Polya (1921)4: On considère une marche aléatoire symétriquedans Zd . Le marcheur est-il sûr de revenir à sa position de départ?

    La réponse dépend fortement de la dimension.

    Théorème

    (MAP 432) Pour d = 1 ou d = 2, la marche aléatoire symétrique (Xn)n estrécurrente:

    P(∃ n ≥ 1, Xn = 0) = 1.

    Pour d ≥ 3, elle est transiente:

    P(∃ n ≥ 1, Xn = 0) < 1.

    4Polya (1887-1985) mathématicien hongrois, marches aléatoires sur les graphes et lesgroupes infinis

    Chapitre 7 () MAP 311 - X2014 Ouvertures 19 / 35

  • Processus de branchement5

    Modélisation de la croissance d’une population (cellules, parasites, oursblancs, épidémie).

    Questions: extinction ou persistance d’une population?Dans le cas de la persistance, quelle est la taille de la population enfonction du temps?

    Modélisation:Zn = nombre d’individus d’une population à la nième génération.Chaque individu i = 1, . . . ,Zn engendre Y ni descendants.

    Zn+1 =Zn∑

    i=1

    Y ni .

    5MAP 311, Chapitre 7, Section 7.2.2Chapitre 7 () MAP 311 - X2014 Ouvertures 20 / 35

  • Z0=1

    Z1=2

    Z2=4 Z3=6

    L’arbre généalogique du processus de branchement

    Les individus des générations 0, . . . ,3, lorsque Z0 = 1,Y 01 = 2, Y

    11 = 3, Y

    12 = 1, Y

    21 = 2, Y

    22 = 0,Y

    23 = 1,Y

    24 = 3.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 21 / 35

  • Hypothèse: Les variables aléatoires Y ni sont indépendantes et de même loi(la loi de Y ), de fonction génératrice g.

    E(sY ) = g(s) , ∀s ∈ [0,1].

    Supposons que m = E(Y )

  • Probabilité d’extinction

    On suppose Z0 = 1 .

    SoitA=“Extinction de la population” =

    ⋃n≥0{Zn = 0}

    Comme Zn = 0 =⇒ Z` = 0, ∀` ≥ n,

    P(Extinction de la population) = P(A) = limn→∞ ↑ P(Zn = 0).

    Remarquons que P(Zn = 0) = Gn(0) = pn vérifie la relation derécurrence

    pn+1 = g(pn), p0 = 0.

    Ainsi P(A) est un point fixe de g, c’est-à-dire une solution de

    g(x) = x .

    Nous sommes donc amenés à étudier la fonction g.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 23 / 35

  • Comme Y est de carré intégrable, g(1) = 1 et

    ∀s ∈ [0,1] , g′(s) = E(Y sY−1) , g′′(s) = E(Y (Y − 1) sY−2).

    D’où g : [0,1]→ [0,1] est strictement croissante, convexe et g′(1) = m.

    0 10

    1

    x g(x)

    g(x)

    g2(x)g3(x)

    g′(1) < 1

    0 10

    1

    xg(x)

    g(x)

    g2(x)

    g3(x)

    g′(1) > 1

    v

    v

    La fonction g et ses itérées dans les deux cas m ≤ 1 et m > 1.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 24 / 35

  • Théorème(1) Si m ≤ 1, alors

    P(A) = P( Extinction de la population) = 1.

    La population s’éteint presque-sûrement.

    (2) Si m > 1, alors

    P(A) = P( Extinction de la population) = v < 1,

    avec v unique solution strictement inférieure à 1 de g(x) = x.

    On a persistance avec probabilité strictement positive.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 25 / 35

  • Evolution de la population:

    On aP(Zn 6= 0) ≤ E(Zn) = mn.

    Quand m < 1, (cas sous-critique), la probabilité de non-extinction tend àvitesse exponentielle vers 0.

    Quand m = 1, (cas critique), on a E(Zn) = 1 mais extinctionpresque-sûre.

    Quand m > 1, (cas sur-critique), la taille de la population explose sur Ac

    à vitesse géométrique. On peut montrer que

    Zn/mn −→n→∞ W

    p.s., où W est une v.a. strictement positive sur Ac .

    Chapitre 7 () MAP 311 - X2014 Ouvertures 26 / 35

  • Extinction des baleines noires dans l’Atlantique NordCaswell et al. (1999).

    On peut montrer que si m < 1 et si la population initiale vaut K ,

    P(Zn > 0) ' K mn.

    Nombre de baleines femelles en1994: K = 150 .

    Nombre moyen de petits:m = 0,976.

    On cherche n tel que P(Extinction à l’année n)= 0,99.P( baleines vivantes à l’année n) = 0,01.K mn = 0,01⇐⇒ n = 395.99% de chances de ne plus avoir de baleines en 2389.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 27 / 35

  • Files d’attente6

    Les clients arrivent suivant un flux aléatoire.

    la durée de service est aléatoire.

    Exemples: un serveur à son guichet, une caisse au supermarché, unstandard téléphonique, un canal de transmission, un réseau decommunication.

    Question: Fluidité de l’unité de service (stabilité, taille, engorgement) enfonction du flux d’arrivée et de la durée de service.

    6MAP 311, Chapitre 7, Section 7.3Chapitre 7 () MAP 311 - X2014 Ouvertures 28 / 35

  • Un modèle simple en temps discret

    A chaque instant n, un serveur unique sert le premier client en attentependant une durée 1.

    Yn : nombre de clients se présentant dans l’intervalle ]n − 1,n]. Variablesaléatoires indépendantes, de même loi, intégrables.

    Xn: nombre de clients présents à l’instant n, X0 = 0.

    Xn+1 = (Xn − 1)+ + Yn+1 ,

    avec x+ = max(x ,0).

    Que se passe-t-il pour n grand?Quand y a-t-il engorgement?

    Soit T0 = inf{n ≥ 1,Xn = 0}.

    T0

  • Théorème

    Soit ρ = E(Y1) le nombre moyen de clients par unité de temps. Alors

    ρ ≤ 1 ⇐⇒ P(T0

  • Ainsi, presque-sûrement,lim

    nXn = +∞.

    (2) ρ < 1 =⇒ récurrence:n < T0 =⇒ Xn+1 = (Xn − 1) + Yn+1.

    d’où

    {T0 =∞} ⊂ {∀n ≥ 1, Xn =n∑

    i=1

    Yi − n ≥ 1} ⊂{∀n ≥ 1,

    ∑ni=1 Yin

    − 1 ≥ 1n

    }.

    Or, par la loi des grands nombres,

    limn

    ∑ni=1 Yin

    − 1 = ρ− 1 < 0

    presque-sûrement. D’où

    P(T0 =∞) = 0.

    Chapitre 7 () MAP 311 - X2014 Ouvertures 31 / 35

  • Simulation de fractales

    Xn+1 = A(Yn+1) Xn + B(Yn+1) ∈ Rd

    (Yn)n indépendantes et de même loi, à valeurs dans {1, . . . , k}.

    {A(1), . . . ,A(k)} matrices et {B(1), . . . ,B(k)} vecteurs.

    Les matrices A(i), i = 1, . . . , k , sont des contractions: ‖A(i)‖ < 1.

    Pour k = 1, Xn+1 = A Xn + B.

    Pour k > 1, que se passe-t-il?

    Chapitre 7 () MAP 311 - X2014 Ouvertures 32 / 35

  • Une spirale

    k = 2

    P(Yn = 1) = 0.9 , P(Yn = 2) = 0.1.

    A(1) =(

    0.839 −0.3030.383 0.924

    ),

    A(2) =(−0.161 −0.1360.138 −0.182

    ),

    B(1) =(

    0.232−0.08

    ), B(2) =

    (0.9210.178

    ).

    Chapitre 7 () MAP 311 - X2014 Ouvertures 33 / 35

  • Une feuille

    k = 4

    P(Yn = 1) = 0.01 , P(Yn = 2) = 0.07 , P(Yn = 3) = 0.07 , P(Yn = 4) =0.85.

    Matrices

    A(1) = (0,0;0,0.16) ; B(1) = (0;0),A(2) = (0.2,−0.26;0.23,0.22) ; B(2) = (0;1.6)A(3) = (−0.15,0.28;0.26,0.24) ; B(3) = (0;0.44)A(4) = (0.85,0.04;−0.04,0.85) ; B(4) = (0;1.6).

    Chapitre 7 () MAP 311 - X2014 Ouvertures 34 / 35

  • BON ÉTÉ!!

    Chapitre 7 () MAP 311 - X2014 Ouvertures 35 / 35