34
Chapitre 2 --- Introduction aux Probabilités Les principales lois 1. Notion dexpérience aléatoire Chap 2. Expérience aléatoire Opérations Variables discrètes Lois pour les var. discrètes Variables continues Lois pour les var. continues • Expériences déterministes: obéissant à des lois connues; Expériences aléatoires: Série de résultats imprévisibles (issues); Répétées dans des conditions identiques, exp. ne donne pas forcément le même résultat. Une expérience déterministe pourra être entachée derreurs => résultats répartis autour de la loi étudiée. En environnement: variabilité naturelle + incertitudes liées à la mesure/lobservation expériences donc souvent considérées comme aléatoires. Quelques notions de base: Issue= résultat dune expérience aléatoire • Univers des possibles ou ensemble fondamental Ω = ensemble des issues possibles • Evénement = sous-ensemble de Ω; Evénement élémentaire A = une seule issue • A chaque événement A correspond une probabilité de se réaliser: Ensemble complémentaire à A: Ensemble fondamental: 1 ) ( 0 A P 1 ) ( = Ω P ) ( 1 ) ( A P A P =

--- Introduction aux Probabilités Les principales lois 1. Notion ...sturquet/teaching_data/...Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety,

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Chapitre 2

    ---

    Introduction aux Probabilités Les principales lois

    1.  Notion d’expérience aléatoire

    Chap 2. •  Expérience aléatoire •  Opérations •  Variables discrètes •  Lois pour les var. discrètes •  Variables continues •  Lois pour les var. continues

    •  Expériences déterministes: obéissant à des lois connues; •  Expériences aléatoires:

    Série de résultats imprévisibles (issues); Répétées dans des conditions identiques, exp. ne donne pas forcément le même résultat.

    Une expérience déterministe pourra être entachée d’erreurs => résultats répartis autour de la loi étudiée.

    En environnement: variabilité naturelle + incertitudes liées à la mesure/l’observation è expériences donc souvent considérées comme aléatoires.

    Quelques notions de base:

    •  Issue= résultat d’une expérience aléatoire

    •  Univers des possibles ou ensemble fondamental Ω = ensemble des issues possibles

    •  Evénement = sous-ensemble de Ω; Evénement élémentaire A = une seule issue •  A chaque événement A correspond

    une probabilité de se réaliser:

    Ensemble complémentaire à A:

    Ensemble fondamental:

    1)(0 ≤≤ AP

    1)( =ΩP

    )(1)( APAP −=

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Exemple du jet de dés:

    Ensemble fondamental: { }6,5,4,3,2,1=Ω

    On considère l’événement pour lequel on obtient un chiffre paire:

    { }6,4,2=AProbabilité de cet événement:

    ( )21

    63==AP

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Chap 2. •  Expérience aléatoire •  Opérations •  Variables discrètes •  Lois pour les var. discrètes •  Variables continues •  Lois pour les var. continues

    3.  Variables aléatoires discrètes

    3.1 Cas univarié

    Ω est souvent très grand et on ne s’intéresse pas au détail des événements individuels. On définit alors une variable aléatoire X à partir de l’ensemble des possibles Ω, en associant un nombre réel caractéristique à chaque événement.

    Variable aléatoire discrète: variable aléatoire ne peut prendre qu’un nombre entier de valeurs. Exemple: n lancés d’une pièce: la variable aléatoire X (nombres de faces parmi n épreuves) peut prendre les valeurs 0,1,2….,n. Ici, la variable aléatoire X ne peut prendre qu’un nombre fini ou dénombrable de valeurs.

    Convention: X = variable; x= valeur prise.

    Domaine de définition ou support: ensemble des valeurs de X { }nX xxxD ,...,, 21=Probabilité associée à l’événement X=x: pX =P(X=x)

    Loi de probabilité: relation entre x et P(x).

    1)(

    1)(0

    ==

    ≤=≤

    ∑i

    i

    i

    xXP

    xXP

    Fonction de répartition: F(x) ∈ [0,1]

    ∑≤

    ==≤=xx

    ii

    xXPxXPxF )()()(

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Espérance de X (ou valeur moyenne, moyenne théorique, moyenne en population):

    ∑ ===x

    X xXPxXE )()( µ

    ≠ de la moyenne expérimentale (pour n réalisations):

    ∑=

    ==n

    iixn

    xm0

    1

    Propriétés de l’espérance:

    Si a et b sont deux constantes, et X et Y deux variables aléatoires, alors:

    )()()()()(YEXEYXEbxEabaXE

    +=+

    +=+

    Exemple: si l’on répète indéfiniment un jet de dé, la variable aléatoire X étant le nombre affiché sur le dé, l’espérance de X se calcule comme:

    5,3616

    615

    614

    613

    612

    611)()( =+++++==∑

    xxxPxE

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Variance de X:

    ( )( ) ( ) )()( 222 xPXXEXVARx

    X ∑ −=−== µµσ

    Propriétés de la variance:

    )()(

    )()(

    0)(

    2

    22

    XVarabaXVAR

    XEXVAR

    XVAR

    X

    =+

    −=

    µ

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    3.2 Cas bivarié

    L’expérience est ici décrite par 2 variables aléatoires discrètes. En plus des propriétés statistiques des variables individuelles, il faut alors de tenir compte des propriétés jointes du couple.

    Loi de probabilité jointe du couple (X,Y) X prend valeurs x ∈ domaine de définition DX; X prend valeurs y ∈ domaine de définition DY;

    ),(),( yYxXPyxpXY ===

    1),(),(1 1,

    ====∑∑∑= =∈∈

    n

    i

    m

    jji

    DyDxXY yYxXPyxpYX

    Lois de probabilité marginales de X et Y

    ( ) ( )

    ( ) ( )∑∑

    ∑∑

    =∈

    =∈

    ======

    ======

    n

    ii

    DxXYY

    m

    jj

    DyXYX

    yYxXPyxpyYPyp

    yYxXPyxpxXPxp

    X

    Y

    1

    1

    ,,)()(

    ,,)()(

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Lois de probabilité conditionnelle de Y sachant X=x0 :

    ∑=

    ==

    ==== m

    jjXY

    XY

    yxp

    yxpxXP

    yYxXPxXYP

    10

    0

    0

    00

    ),(

    ),()(),()/(

    Deux variables discrètes aléatoires sont indépendantes si et seulement si:

    00 ,)()/( xyyYPxXYP ∀∀===

    Définition équivalente à la propriété de multiplication des probabilités:

    )()(),( xXPyYPxXyYP =====

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Matrice de variance-covariance permet de résumer les caractéristiques du couple de variables:

    ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛=∑ )(),(

    ),()(, YVarYXCov

    YXCovXVarYX

    Variance d’une combinaison linéaire:

    ),(2)()()(),(2)()()(

    22 YXabCovYVARbXVARabYaXVARYXCovYVARXVARYXVAR

    ++=+

    ++=+

    Espérance d’une distribution bivariée: couple de valeurs

    ( ) )(),(),( YEXEXYE =Si les variables sont indépendantes: )()(),( YEXEXYE =Sinon, on doit tenir compte de la covariance:

    ( )( )( )

    )()()()()(),cov(YEYXEXE

    YEXEXYEXY−−=

    −=

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Chap 2. •  Expérience aléatoire •  Opérations •  Variables discrètes •  Lois pour les var. discrètes •  Variables continues •  Lois pour les var. continues

    4.  Quelques lois pour les variables aléatoires discrètes

    4.1 La loi de Bernouilli

    S’applique dans le cas d’événements binaires, ayant 2 solutions possibles: succès et échec, de probabilités respectives p et q=1-p. On a alors:

    pXE =)()1()( pppqXVAR −==

    Exemple: jet de pièce: Probabilité d’obtenir pile p = q =1/2 Même chose pour probabilité d’avoir un enfant de sexe féminin ou masculin, etc.

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    4.2 Loi Binomiale B(n, p)

    S’applique pour le cas de n épreuves de Bernoulli (2 solutions) indépendantes.

    Exemples: •  Nombre de 6 obtenus en lançant 10 fois un même dé. •  Nombre de graines qui vont germer sur un total de 100 graines semées.

    )1()()(

    )()(

    1

    1

    pnpnpqXVARXVAR

    npXEXE

    n

    ii

    n

    ii

    −===

    ==

    =

    =

    Propriétés:

    ∑=

    =n

    iiXX

    1

    Variable aléatoire X = nombre de d’apparition d’un événement A donné (succès), avec Ω={0,1,2,….,n}.

    A chaque tirage, on peut associer une variable de Bernoulli Xi et donc la variable binomiale est équivalente à:

    Exemple: n lancés d’une pièce non truquée. Variable aléatoire sera le nombre de succès, face par exemple, sur les n lancés.

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    xnxi qpxXP

    −== )(

    xnxxn qpCxXP

    −== )(

    !)!(!xxn

    nCxn −= Où n!=n(n-1)(n-2)(n-3)…1

    Avec 0!=1

    Nombre de combinaisons possibles pour obtenir x succès (X = x):

    L’événement considéré, dont on veut déterminer la probabilité est une suite particulière de x succès, et n-x échec sur les n épreuves. Les épreuves étant indépendantes, et chacune ayant une probabilité p, la probabilité d’obtenir x succès est donc:

    La probabilité d’avoir x succès quel que soit l’ordre des succès et des échecs (combinaisons) est donc:

    Loi de probabilité:

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    La loi binomiale est donc caractérisée par deux paramètres: •  Nombres n d’épreuves de Bernoulli •  Probabilité p de succès d’une épreuve de Bernoulli

    Propriété: Si deux variables indépendantes sont de loi binomiale de même paramètre p, alors leur somme est aussi une loi binomiale. On dit alors que la loi binomiale est fermée sous l’addition. Ainsi:

    2

    1

    XX

    ),(),(

    2

    1

    pnBpnB ),( 21 pnnB +21 XX +

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    4.3 Loi de Poisson

    Cette loi caractérise une variable aléatoire entière ≥ 0 qui satisfait à:

    IRINxx

    xXPx

    ∈∈== − λλλ etoù!

    e)(

    En pratique: s’applique à des événements rares (e.g. comptabilité des accidents, défauts dans une chaîne de production, éruptions volcaniques…) Elle correspond à une succession de lois de Bernoulli avec:

    •  p très faible (p< 0.1) par rapport à n (> 50) •  le produit np tendant vers un nombre fini λ.

    On a alors:

    ∑=

    −− ≈==n

    x

    xnpxnxx

    n xnpqpCxXP

    PpnB

    0 !)(e)(

    )(~),( λou

    Exemples: P(1) P(2) P(5)

    x x x

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Propriétés de P(λ):

    λ=)(XEλ=)(XVAR

    Soient X et Y deux variables aléatoires indépendantes qui suivent des lois de Poisson de paramètres λ et μ, alors X+Y est une variable aléatoire qui suit la loi de Poisson de paramètre λ + μ. Démo:

    µλ

    µ

    λ

    +=+=+=>

    =

    =

    )()()()()(

    YEXEYXEYEXE

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Chap 2. •  Expérience aléatoire •  Opérations •  Variables discrètes •  Lois pour les var. discrètes •  Variables continues •  Lois pour les var. continues

    5.  Les variables aléatoires continues

    5.1 Cas univarié

    Fonction de répartition ou fonction de distribution cumulée:

    IRxxXPxF ∈≤= pour)()(

    Propriétés de cette fonction: •  continue •  croissante : si x1 ≤ x2 alors F(x1) ≤ F(x2) •  ∈ [0 1]

    Fonction de densité de probabilité ou fonction de distribution: Permet de décrire le comportement de la variable de manière détaillée.

    dxxdFxf )()( =

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Exemple:

    )( 21 xXxP ≤≤

    )(xf

    1x 2x

    Cette fonction n’est nulle que pour des valeurs impossibles et vérifie:

    Probabilité sur des intervalles donnés:

    ∫∞−

    =≤=

    2

    d)()()(

    x

    uufxXPxF

    1d)( =∫+∞

    ∞−

    uuf

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    5.2 Cas bivarié

    On définit alors une fonction de densité de probabilité jointe du couple (X,Y), fX,Y sur le domaine de définition DX x DY dans [0,1].

    Propriétés: • 

    •  Densités de probabilités marginales

    1=∫ ∫X YD D

    dxdyyxf ),(

    ∫∫ ===XY DD

    dxyxfdyyxfyfxf ),(),()()(

    •  Densité conditionnelle de Y sachant X=x0, x0 ∈ DX

    ∫==

    YD

    dyyxfyxf

    xfyxfxyf

    ),(),(

    )(),()/(

    0

    0

    0

    00

    •  Si X et Y sont indépendantes: yxyfxfyxf ∀∀= ,)()(),(

    •  Fonction de distribution cumulée:

    IRyIRxyYxXPyxF ∈∈≤≤= ,),(),( pour

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    5.3 Moments d’une distribution

    Paramètres caractéristiques permettant de résumer une distribution: caractérisent la position et la forme de la distribution.

    Moyenne ou espérance

    Propriétés:

    •  E(a)=a avec a constante réelle; •  E(aX+b)=aE(X)+b avec a et b constantes réelles; •  E(X+Y)=E(X)+E(Y) où X et Y sont des variables aléatoires continues. •  E(g(X))=∫ g(x) f(x) dx

    Remarque: Variable centrée è moyenne nulle

    ∫∞

    ∞−= dxxfxXE )()(

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Variance: caractérise la dispersion autour de la moyenne

    ( )[ ]( )∫

    ∞+

    ∞−−=

    −=−=

    dxxfXEX

    XEXEXEXEXVAR

    )()(

    )()()()(2

    222

    Equivalent à l’écart type au carré.

    2)( XXVAR σ=

    Propriétés: •  VAR(a)=0 avec a constante réelle; •  VAR(aX+b)=a2VAR(X) avec a et b constantes réelles; •  VAR(X+Y)=VAR(X)+VAR(Y) où X et Y sont des variables aléatoires continues indépendantes.

    Remarque: Variable réduite è σ =1

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    5.4 Multivariables aléatoires

    Au cours d’une expérience, on peut être amenés à s’intéresser à plusieurs variables simultanément. On définit alors un ensemble de N variables aléatoires:

    (X1, X2, X3, …, XN) Comme pour le cas bivarié, on devra alors définir une densité de probabilité jointe ou une fonction de distribution cumulée:

    IRxIRxxXxXxXPxxxF

    N

    NNN

    ∈∈

    ≤≤≤=

    ,...,),...,,(),...,,(

    1

    221121

    pour

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Chap 2. •  Expérience aléatoire •  Opérations •  Variables discrètes •  Lois pour les var. discrètes •  Variables continues •  Lois pour les var. continues

    6.  Quelques lois de probabilité pour les variables aléatoires continues

    6.1 La loi uniforme

    Densité de probabilité f(x) Fonction de répartition F(x)

    Caractérise une variable aléatoire équiprobable dans un intervalle [a,b].

    ⎪⎩

    ⎪⎨

    >

    ≤≤−

    <

    =

    bx

    bxaab

    axxf

    si

    si

    si

    0

    10

    )(⎪⎩

    ⎪⎨

    >

    ≤≤−

    −<

    =

    bx

    bxaabax

    axxF

    si

    si

    si

    1

    0)(

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    ( )12

    )()()()()(

    221)()(

    22222

    2

    abXEdxxfxXEXEXVAR

    baxab

    dxabxdxxfxXE

    b

    a

    b

    a

    −=−=−=

    +=⎥

    ⎤⎢⎣

    −=

    −==

    ∫∫∞+

    ∞−

    +∞

    ∞−

    Paramètres de la loi uniforme:

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    6.2 La loi exponentielle

    Densité de probabilité f(x) Fonction de répartition F(x)

    La variable X suit une loi exponentielle de paramètre λ si

    xxXPxF λ−=>= e)()(

    xxXPxF λ−−=>= e1)()(⎩⎨⎧

    <

    ≥=

    000e

    )(xx

    xfx

    si

    siλλ ∫

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    C’est une loi typiquement utilisée pour les phénomènes faisant intervenir une durée de vie (radioactivité, réponse des composants électroniques, etc…)

    Paramètres:

    2

    1)(

    1)(

    λ

    λ

    =

    =

    XVAR

    XE

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    6.3 La loi normale

    Densité de probabilité f(x) Fonction de répartition F(x)

    Une variable aléatoire suit une loi normale si sa densité de probabilité est telle que:

    2

    21

    e21)(

    ⎟⎟⎠

    ⎞⎜⎜⎝

    ⎛ −−

    = σπσ

    Xx

    xf

    ),( 2σXN

    2)()(

    σ=

    =

    XVARXXE

    avec

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Changement de variable: Toute variable aléatoire Gaussienne peut se ramener par à une variable aléatoire gaussienne centrée-réduite suivant la loi normale N(0,1), i.e. E(U)=0, σ=1.

    σXxU −=

    ⎟⎠

    ⎞⎜⎝

    ⎛ −

    =2

    21

    e21)(

    uuf

    π

    Propriété d’additivité: Si X1 et X2 sont des variables indépendantes suivant des lois normales alors: ⎟

    ⎟⎠

    ⎞⎜⎜⎝

    ⎛++ 22

    2121 , σσXXN21 XX + suit une loi normale

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Fonction de répartition:

    Si u

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Exemple: Température moyenne d'une ville – Loi normale La température X (en degrés Celsius) dans une ville à un jour donné est une variable de loi

    N(22,4). Calculez:

    a) P(X < 16) b) P(X > 30) c) P( |X-24| < 10) Changement de variable pour utilisation de la loi Normale N(0,1) ⇒  utilisation d’une variable centré réduite.

    a)  P(X 4) = 1 – P(U

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    6.4 La loi du Chi2

    On considère n variables aléatoires indépendantes gaussiennes centrées et réduites Ui. Une variable suivra une loi du Chi2 à n degrés de liberté si elle peut être définie comme:

    223

    22

    21

    2 ... nn UUUU ++++=χ

    Densité de probabilité f(x) Fonction de répartition F(x)

    (k degrés de liberté)

    Paramètres:

    nVARnE

    n

    n

    2)(

    )(2

    2

    =

    =

    χ

    χ

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    La Table donne pour une variable centrée réduite qui suit une loi de Fischer, les fractiles en fonction du nombre de degrés de liberté ν. Ainsi pour une degré de liberté de 30, Pratiquement, ces tables permettent de trouver le fractile ( ici 40,255), si on choisit la probabilité ( ici 0.9).

    0.9 40,255) P( ==230χ

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    6.5 La loi de Student

    Densité de probabilité f(x) Fonction de répartition F(x)

    On considère deux variables aléatoires indépendantes U è N(0,1); X è

    La variable aléatoire suivante suit une loi de Student de degré de liberté n:

    2nχ

    nXUTn =

    Si n à ∞ (n > 30 en pratique), la loi de Student tend vers la loi normale standard (moyenne nulle, écart type égal à 1).

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    Table donnant les valeurs de T ayant la probabilité d’être dépassées: (Attention: il ne s’agit plus de la fonction de répartition)

    Pour un degré de liberté de 10, P(T ≥ 2,228) = 0,05 La fonction de répartition peut alors être déduite: P(T ≤ 2,228) =1− P/2= 0,95

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC

    6.6 La loi de Fisher-Snedecor

    On considère 2 variables indépendantes X1 et X2 suivant des lois du Chi2 de degrés de liberté n et m. La variable aléatoire suivante suit une loi de Fisher-Snedecor:

    mXnX

    Fm

    n

    mn =,

    C’est une loi non-symétrique ayant les propriétés suivantes:

    mnmnmn F

    FFFP,,

    ,,1,,1)(α

    ααα =>= − alors Si

    Cela permet de calculer des probabilités sur les deux ailes de la distribution.

    Densité de probabilité f(x) Fonction de répartition F(x)

  • Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 2) Solène Turquety, LMD/IPSL, UPMC