21
Statistique Descriptive: mesures dans le cas dynamique

Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

StatistiqueDescriptive: mesures dans le cas dynamique

Page 2: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Contexte

On considère le contexte suivant:● La population P des titres cotés sur le TSX● L’échantillon E est un sous-ensemble de P● On a un ensemble de v.a. { x1, x2, …, xn } qu’on peut

évaluer en fonction du temps sur les objets de l’échantillon et prenant des valeurs dans les ensembles K1, K2, …, Kn

Nous allons introduire les éléments essentiels de la statistique descriptive afin d’étudier la distribution des valeurs des v.a. au sein de l’échantillon

Page 3: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Cas d’étude: valeur en bourse

Population: P = {les titres cotés sur le TSX}Échantillon: E = {NA} = {“Banque Nationale”}

Les v.a. de base pour l’étude:● x: la cote en $CAN● v: le volume de transaction

Ensemble des valeurs des v.a. sur l’échantillon:● x: en tout temps, c’est un nombre réel: x∈ℝ● v: en tout temps, c’est un entier: v∈ℕ

Page 4: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Données des v.a. sur l’échantillon

Valeurs journalières entre le 01 jan et le 15 oct 2015

Référence: http://stockcharts.com

Page 5: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Mesure

Nous allons condidérer des extensions des mesures statiques au cas dynamique

L’idée de base est de calculer les mesures sur un groupe de taille fixe de données consécutives

Puisque la position du groupe est variable, c’est une “fenêtre” d’observation des données et on parle alors de mesure “mobile”

La taille de la fenêtre influe sur la perspective (mesure)

Page 6: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Tendance centrale

On veut représenter toutes les valeurs d’une v.a. qui sont dans la fenêtre d’observation par une seule valeur

Il y a plusieurs façons de le faire, mais elles provoquent toujours une perte d’information

Dans tous les cas, on peut bouger la fenêtre d’une donnée à la fois, ce qui génère une nouvelle série temporelle

Page 7: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Tendance centrale - moyenne simple

La moyenne simple, on moyenne mobile, est la mesure la plus courante (on la note MA pour “moving average”)

C’est la moyenne des données qui apparaissent dans la fenêtre d’observation

Des fenêtres de taille différente donnent des informations différentes et complémentaire sur la tendance de la série temporelle

C’est très utilisé en analyse technique (finance)

Page 8: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Données avec MA 13, 50, 200 jours

Page 9: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Taille de la fenêtre

Fenêtre plus large ⇒ données plus régulièresinterprétation: réaction plus lente au changement

On combine plusieurs moyennes mobiles pour détecter des changements de tendance

Sur l’exemple, à la fin juin la MA 13 a plongée au travers des autres montrant une tendance baissière. Elle a été confirmée en juillet lorsque le MA 50 à traversée la MA 200

Page 10: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Tendance centrale - moyenne exp.

La moyenne exponentielle, on moyenne mobile exponentielle, est une autre mesure de tendance centrale (on la note EMA pour “exponential moving average”)

La fenêtre est remplacé par des poids qui décroissent exponentiellement. On la calcule récursivement:

m0 = x0mi = a*xi + (1-a)*mi-1 , pour i>0

A priori, a est n’importe quel nombre dans entre 0 et 1. Mais on pose souvent, a=1/n, où n est un nombre de jours

Page 11: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Données avec EMA 13, 50, 200 jours

Page 12: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

EMA versus MA

Contrairement à MA, EMA se “rappelle” de toute les données précédentes

Les différentes mesures donnent donc des informations complémentaires

Si on compare les graphes, on observe qu’avec les choix 13, 50 et 200 pour les 2 types de moyennes, EMA donne des signaux plus tardif. C’est l’impact de “trainer” tout l’historique

Page 13: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Dispersion

On veut représenter la dispersion des valeurs d’une v.a. sur E, par une seule valeur

Comme pour la tendance centrale, il y a plusieurs façons de le faire, mais elles provoquent toujours une perte d’information

Page 14: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Mesures de dispersion

Les 2 plus courantes sont basées sur le concept de “fenêtre mobile” de taille fixe, comme pour la MA

L’étendue mobile (R) et l’écart-type mobile (s) se calculent comme dans le cas statique, mais sur les données dans la fenêtre

Ces mesures de dispersion sont très utilisées● en finance : bandes de Bollinger● en industrie : contrôle statistique des procédés

Page 15: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Bandes

En finance comme dans l’industrie, on construit des bandes pour mieux capter des changements anormaux

La structure de la bande est de la forme:b = M ± k*D , k>0

où:● M est une mesure de tendance centrale● D est une mesure de dispersion

Les mesures M et D peuvent être statique ou dynamique

Page 16: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Bandes de Bollinger

En finance, on pose souvent M=MA, D=s

On parle alors des “bandes de Bollinger”

Par exemple, avec une fenêtre de 13 jours et k=2: b = MA ± 2*s

où Ma et s sont calculés dynamiquement sur la fenêtre de 13 données consécutives

Page 17: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Bollinger avec MA et s sur 13 jours

Page 18: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Interprétation des Bollinger

Le retour à la moyenne est un phénomène souvent observé en finance: plus un événement s’écarte de la moyenne, plus grande est la probabilité que le prochain événement soit plus proche

Il est appuyé sur l’observation et renforcé par le comportement des traders (feedback)

Ainsi, lorsqu’on approche des bandes de Bollinger, c’est souvent un signal d’un renversement et d’un retour vers la moyenne

Page 19: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Bandes de contrôle statistique

Dans l’industrie, on pose souvent M=moy, D=R, tous deux calculé sur un échantillon statique

On parle alors des “bandes de contrôle”

Par exemple, avec k=3: b = moy ± 3*R

où moy et R sont calculés sur un échantillon statique correspondant à un système “en contrôle”

Page 20: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Contrôle statistique d’un procédé

Page 21: Statistique - Page principale de Sylvain Boivin - UQACdimsboiv.uqac.ca/STAT/z/descriptive/mesuresT/StatDescriptiveT.pdf · Mesures de dispersion Les 2 plus courantes sont basées

Interprétation

La ligne centrale (moyenne) est une cible à respecter et les bandes indiques une zone de variation acceptable

Typiquement, on contrôle un indice de qualité : ● une déviation systématique de la cible indique un

désajustement ● la déviation nécessite une intervention lorsqu’elle

traverse une bande● si la dispersion s’accroît jusqu’a accrocher les 2

bandes, c’est souvent une forme d’usure ou de manque de rigueur