21
Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf´ erentielle Objectifs Estimation param´ etrique Mod` ele Estimateur Statistique (MA101) Cours 1 ENSTA 1` ere ann´ ee Christine Keribin [email protected] Laboratoire de Math´ ematiques Universit´ e Paris-Sud 2017-2018 1/21

Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Statistique (MA101) Cours 1ENSTA 1ere annee

Christine Keribin

[email protected]

Laboratoire de MathematiquesUniversite Paris-Sud

2017-2018

1/21

Page 2: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Sommaire

Introduction

Estimation parametriqueModeleEstimateur

2/21

Page 3: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Statistique

de stare (etablir en grec) puis status (etat en latin)

I Ensemble de donnees observees

↪→ Population, echantillon, individus, variables

I Activite qui consiste dans leur recueil, traitement etinterpretation

I Discipline mathematique qui fonde l’activite precedente

↪→ theorique : statistique mathematique↪→ methodologique↪→ appliquee : cas pratiques d’etude de jeu de donnees

3/21

Page 4: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Population

I Population = ensemble d’elements appeles unitesstatistiques ou individus sur lesquels on observe une ouplusieurs caracteristiques ou variables

↪→ quantitative (valeur numerique associee a unemesure) : discrete ou continue

↪→ qualitative (attribut ou modalite) : nominale ouordinale

I Si la population est finie de taille N

↪→ etude exhaustive : recensement↪→ si elle n’est pas possible : sondage avec ou sans

remise

I Si la population est infinie, l’echantillonnage avec ousans remise sont identiques

4/21

Page 5: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Un exemple ...

5/21

Page 6: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Statistisque inferentielle

Probabilite/statistique : une difference de point de vue

I Probabilite : etudier les proprietes d’une loi connue

I Statistique : a partir d’un ensemble d’observationsd’une loi inconnue, inferer des proprietes de cette loipour repondre a une question

↪→ definir un modele↪→ resoudre un probleme inverse↪→ construire une variable aleatoire fonction de

l’echantillon (estimateur) qui a de bonnesproprietes

6= Statistique descriptive

6/21

Page 7: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Statistique inferentielle

I estimation : valeur d’un parametre d’interet, ...

I test : comparaison de deux echantillons, ...

I prediction pour une nouvelle unite non encore observee

I classification dans un groupe

↪→ Problematiques :

I choix de l’estimateur, de la procedure de test ?

I fiabilite de l’information obtenue ?

↪→ Outils mathematiques : variables aleatoires, probabilite etstatistique, optimisation

7/21

Page 8: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Demarche statistique

A partir des donnees d’un n-echantillon, deduire -ou inferer-certaines proprietes du modele inconnu

I Acquerir et preparer les donnees

I Definir un modele adapte a la situation observee.

I Estimer les parametres du modele grace auxobservations.

I Verifier l’adequation de l’estimation aux observations.

I Proposer d’autres modeles et choisir le plus adapte a unobjectif donne (interpretation, prediction)

I Utiliser et decider !

Tous les modeles sont faux, mais certains sont plus utilesque d’autres (G. Box)

8/21

Page 9: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

De nombreuses applications

Modelisation aleatoire de situations (complexes) pour

I aider a la comprehension

I prendre des decisions

dans tous les domaines : economique, industriel, sciences duvivant, sciences de la nature, etc

I fiabilite de systemes

I modelisation d’evenements extremes

I prediction de consommation electrique

I systemes de recommandation

I detection d’emotions dans des tweets

I classification automatique d’images

I ...

De la statistique au dataming et a la science des donnees

9/21

Page 10: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Contenu MA101 : Bases de la statistiqueinferentielle

Estimation, Test, Intervalle de confiance

Objectifs

I Definir un modele statistique parametrique

I Construire des estimateurs et en etudier les proprietes(biais, variance, consistance)

I Definir la loi d’une statistique (exacte ou asymptotique)

I Construire un intervalle de confiance d’un parametreunivarie

I Construire un test et savoir en interpreter les resultats

Evaluation

I Note stat : un examen theorique final (seul documentautorise : une feuille de notes personnelles)

I Note finale MA101= (note proba+ note stat)/2

10/21

Page 11: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Bibliographie

C. Keribin.Le poly du cours et le site pedagogique : https://www.math.u-psud.fr/~keribin/EnseignementMA-MA101.htm

J.-F. Delmas.Introduction au calcul des probabilites et a la statistiqueLes Presses de l’ENSTA, 2010.

J-J. Daudin, S. Robin, C. Vuillet.Statistique inferentielle. Idees, demarches, exemples.Presses Universitaires de Rennes, Rennes, 2002.

J. Pages.Statistique generales pour utilisateurs.Presses Universitaires de Rennes, Rennes, 2005.

M. Lejeune.Statistique La theorie et ses applications.Springer, 2010.

11/21

Page 12: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Sommaire

Introduction

Estimation parametriqueModeleEstimateur

12/21

Page 13: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Modele statistique

I Modele : (X n,An, IPnθ , θ ∈ Θ).

↪→ X n espace mesure par une tribu An et une(IPn

θ)θ∈Θ, famille de lois de probabilite

Quand il existe d ∈ IN∗ tel que Θ ⊂ IRd , le modele estdit parametrique

I un n-echantillon i.i.d. X = (X1, . . . ,Xn) comporte nvariables aleatoires independantes (i.) et de meme loi(i.d.) : IPn

θ = IP⊗nθce qui est suppose dans la suite

I Une observation est une variable aleatoire X a valeurdans X n et dont la loi appartient a (IPn

θ)θ∈Θ

I Les donnees sont les realisations (valeurs) x1, . . . , xnprises par l’echantillon X1, . . . ,Xn

13/21

Page 14: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Exemples

I Estimation d’une proportion

Xi ∼i .i .d . B(1, θ)

I Estimation du rendement d’epis de maıs

Xi ∼i .i .d . N (µ, σ2)

14/21

Page 15: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Exemples

I Regression simple : Yi (xi ) ∼i .i .d . N (µ+ βxi , σ2)

I Analyse de la variance : Yi (gi ) ∼i .i .d . N (βgi , σ2)

15/21

Page 16: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Statistique

Resumer les n valeurs de l’echantillon par quelquescaracteristiques simples

DefinitionUne statistique Tn est variable aleatoire, fonction reelle ouvectorielle mesurable de l’echantillon X = (X1, . . . ,Xn), etne dependant pas des caracteristiques de la loi de X

Tn = t(X ) = t(X1, . . . ,Xn)

Elle est entierement calculable a partir des donnees.Exemple !

16/21

Page 17: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Estimateur

Soit θ le parametre d’une loi IPθ, θ ∈ Θ.

DefinitionUn estimateur θ de θ est une statistique a valeurs dans Θ.Cette definition s’etend au cas d’une grandeur ν calculee apartir de la loi IPθ : un estimateur νn de ν(θ) est unestatistique a valeurs dans ν(Θ).

Exemple : Soit X ∼ IPθ. L’estimateur empirique del’esperance µ = IEθ(X ) est

Tn = µ =1

n

n∑i=1

Xi = X

Autres exemples :

Tn = 0 ; Tn = X1 ; Tn =∑[n/2]

i=1 X2i/[n/2].Comment choisir ?

17/21

Page 18: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Biais

Soit νn un estimateur de ν, defini a partir d’un n-echantillonde loi IPθ :

DefinitionLe biais de l’estimateur νn pour estimer ν est defini par

Bθ(νn, ν) = IEθ(νn)− ν

Si Bθ(νn, ν) = 0, alors νn est dit non biaise ou sans biais.

I biais = erreur systematique due au fait que νn fluctueen moyenne autour de IEθ(νn) au lieu de ν

I Il est souhaitable d’utiliser des estimateurs sans biais

I Attention ! : si Tn est un estimateur sans biais de θ,alors ν(Tn) n’est pas forcement un estimateur sans biaisde ν(θ)

18/21

Page 19: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Variance

Soit νn un estimateur de ν(θ), defini a partir d’unn-echantillon de loi IPθ :

DefinitionLe variance de l’estimateur νn de ν est

Var(νn) = IEθ[(νn − IEθ(νn))2]

I variance = fluctuation aleatoire de νn autour de savaleur moyenne

I Il est souhaitable d’utiliser des estimateurs de variancela plus faible possible.

19/21

Page 20: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Risque d’un estimateur

DefinitionLe risque quadratique ou erreur quadratique moyenne del’estimateur νn pour l’estimation de ν est l’esperance de saperte quadratique :

ν 7→ Rθ(νn, ν) = IEθ[(νn − ν)2],

Exemple : Le risque quadratique de l’estimateur empiriquede l’esperance µ est

Rθ(X , µ) = IEθ[(X − µ)2] = Varθ(X ) =σ2

n.

20/21

Page 21: Statistique (MA101) Cours 1 - ENSTA 1ère annéekeribin/MA... · 2018-05-15 · Statistique (MA101) Cours 1 Christine Keribin Introduction Statistisque inf erentielle Objectifs Estimation

Statistique(MA101) Cours 1

Christine Keribin

Introduction

Statistisqueinferentielle

Objectifs

Estimationparametrique

Modele

Estimateur

Decomposition du risque quadratique

Avec la fonction de perte quadratique

Rθ(νn, ν) = IEθ[(νn − ν)2]

= Varθ(νn) + (Bθ(νn, ν))2

DefinitionUn estimateur δ1 de ν(θ) domine l’estimateur δ2 si, pourtout θ ∈ Θ,

Rθ(δ1, ν(θ)) ≤ Rθ(δ2, ν(θ))

cette inegalite est stricte pour au moins une valeur de θ.Un estimateur est admissible s’il n’existe aucun estimateur ledominant.

I Recherche d’estimateurs Uniformement de VarianceMinimale parmi les estimateurs sans Biais

↪→ A suivre dans le cours de 2A !

21/21