106
1 Bienvenue à l’Ecole des HEC Nous espérons que le programme correspond à vos attentes, même si dans les cours de 1 ère année vous devez surtout apprendre les techniques utilisées en sciences économiques. Il y a deux groupes de cours en 1ère année: Groupe 1: management, comptabilité, droit, informatique Groupe 2: mathématiques, statistique, économie politique Il faut une moyenne d’au moins 4 pour chaque groupe pour réussir la 1ère année

Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

1

Bienvenue à l’Ecole des HEC

• Nous espérons que le programme correspond à vos attentes, même si dans les cours de 1ère année vous devez surtout apprendre les techniques utilisées en sciences économiques.

• Il y a deux groupes de cours en 1ère année:• Groupe 1: management, comptabilité, droit,

informatique

• Groupe 2: mathématiques, statistique, économie politique

• Il faut une moyenne d’au moins 4 pour chaque groupe pour réussir la 1ère année

Page 2: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

2

Statistique

• Ce cours est dédoublé:• Groupe A: pour les étudiants dont les

noms commencent par les lettres A-K. Dans cette salle de 8h à 10h45.

• Groupe B: pour les étudiants dont les noms commencent par les lettres L-Z. Le mardi dans la salle A (13h15-16h).

Page 3: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

3

HORAIRE EXERCICES

• A-BE: lundi 17-19, 126 (Nef)• BF-CE: vendredi 13-15, 210 (Pol)• CF-DZ: mardi 15-17, 210 (Pol)• E-GO: mardi 17-19, 231 (Nef)• GP-KZ: jeudi 13-15, 410 (Max) • L-MI: mercredi 17-19, 321 (Pol)• MJ-RA: lundi 10-12, 321 (Pol)• RB-ST: lundi 17-19, 122 (Nef)• SU-ZW: jeudi 12-14, 232 (Nef)

Page 4: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

4

Manuels

• Le polycopié pour ce cours est: A. Mattei, Statistique, Lausanne, 2007

• Il fait partie du paquet de première année (160 Fr pour le paquet, 30 Fr pour ce polycopié). En vente au Bureau des polycopiés, Anthropole 2088.

• En anglais: G. Keller, Statistics, Thomson, London, 2005

Page 5: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

5

Calculatrice, logiciels et tables

• Autrefois on utilisait des tables pour calculer des logarithmes ou des probabilités

• Aujourd’hui on utilise au minimum des calculatrices mais le plus souvent des tableurs et des logiciels statistiques

• Dans ce cours on utilisera la TI-83/84, EXCEL et MINITAB

Page 6: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

6En vente au Comité HEC pour environ 160 Fr

Page 7: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

7

Page 8: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

8

Page 9: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

9

Page 10: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

10

Exercices

• Les étudiants sont répartis en 9 groupes pour des séances d’exercices de 2 heures.

• Début des exercices: la semaine prochaine.• Répartition des groupes et horaires: voir le site

internet pour les derniers changements: www.hec.unil.ch/amattei/stat.htm

• Conseil: faire les exercices et réviser régulièrement la matière traitée au cours.

Page 11: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

11

A noter dans votre agenda

• Test 1: mardi 20 novembre 2007• Test 2: mardi 26 février 2008• Test 3: mardi 20 mai 2008• Si la moyenne géométrique des tests est

supérieure à l’examen final, la note sera la moyenne arithmétique de ces deux notes.

• Examen MINITAB: 31 mai 2008. C’est une question de l’examen final.

Page 12: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

12

STATISTIQUE

• Ensemble de données (ex. les statistiques du commerce extérieur)

• Ensemble de techniques mathématiques utilisées pour analyser des données. La statistique est une branche des mathéma-tiques appliquées. Science qui s’occupe de la collecte, de la présentation, de l’analyse, de la déduction et de l’interprétation de données nombreuses.

Page 13: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

13

CHAPITRES

• Statistique descriptive• Théorie des probabilités• Distributions de probabilité• Introduction aux méthodes bayesiennes• Théorie de l’échantillonnage• Théorie statistique de l’estimation• Tests d’hypothèses• Test chi-carré• Analyse de la variance• Ajustement statistique• Séries chronologiques

Page 14: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

14

Importance de la statistique

• Depuis des siècles, les hommes tiennent des statistiques pour toutes sortes de raisons: compter le nombre d’habitants, noter l’importance des récoltes, des températures et des précipitations, enregistrer l’évolution du prix de l’or ou du pain, etc.

• Dans le monde moderne, la statistique est devenu omniprésente. Il ne passe pas un jour sans lire dans la presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le lien entre alimentation et cancer, le degré de couverture des caisses de pension, les indices boursiers ou celui des prix à la consommation.

Page 15: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

15

• Interpréter toutes ces informations n’est pas facile. Très souvent, le public en tire des conclusions fausses ou incomplètes. Par ailleurs, la présentation des statistiques n’est souvent pas neutre. On veut rassurer ou alors impressionner le public. Parfois, l’effet n’est pas voulu mais il est la conséquence d’une présentation lacuneuse ou imprécise. Même si l’on exclut les cas flagrants de manipulation des statistiques, une méconnaissance des techniques conduit souvent à un résultat similaire.

Page 16: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

16

• On a pu dire que la statistique était la forme scientifique du mensonge (c’est le titre d’un ouvrage de Jean-Louis Boursin mais avec un point d’interrogation). On a attribué à un ministre de la reine Victoria (Disraeli) la sentence suivante: il y a trois sortes de mensonges: les simples mensonges, les damnés mensonges et les statistiques.

• En 1954, Darrell Huff publie un petit livre intitulé « Comment mentir avec les statistiques ». Il présente toute une série d’exemples où les statistiques sont biaisées, les conclusions fausse ou l’interprétation est erronée.

Page 17: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

17

• Voici quelques exemples significatifs:• On publie le revenu moyen des licenciés

d’une célèbre université en prenant les résultats d’un questionnaire envoyé aux membres d’une association de gradués.

• On donne la température moyenne sans préciser que cette valeur très agréable est le résultat d’un froid très fort en hiver et d’une chaleur élevée en été (nous verrons qu’il ne suffit pas de donner la moyenne, il faut aussi préciser l’écart-type).

Page 18: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

18

• En changeant l’échelle d’un graphique, on peut faire passer une hausse des dépenses publiques comme insignifiante ou très importante.

• On dit qu’il y a plus d’accidents sur l’autoroute à 7 h. de l’après-midi qu’à 7 h. du matin sans préciser que le trafic est plus important à la fin de l’après-midi.

• On souligne que le risque de décès est plus élevé à New York que dans la marine militaire sans préciser qu’il n’y a pas de soldats âgés.

Page 19: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

19

• Si les étudiants qui fument ont des notes plus basses que ceux qui ne fument pas, il ne faut pas en déduire que la fumée réduit la performance des étudiants (différence entre corrélation et causalité).

• Cinquante ans plus tard, on trouve toujours les mêmes erreurs. Voici quelques exemples de présentations lacuneuses, de conclusions inappropriées ou des erreurs.

Page 20: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

20

EXEMPLES• Interpréter correctement les données est

difficile: décès dus à la chaleur, OMS: 60000 décès dus au soleil, profit de l’UBS, salaire moyen (dictature de la moyenne)

• Les données ne sont pas neutres: impressionner ou rassurer (accidents d’avion ou à la maison, accident de plongée ou de parapente, grippe aviaire, nombre de pauvres: relatif (moins de la moitié du revenu médian) ou absolu (moins de 16000 $)

Page 21: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

21

• Si l’on veut impressionner le public, on prend des chiffres absolus sans mentionner leur signification réelle. Par exemple, on indique que le bénéfice de l’UBS a été de 11.25 milliards de francs en 2006. Parfois on donne le bénéfice par employé (144’000 francs) en oubliant les bureaux, les ordinateurs et les capitaux mis à disposition par les actionnaires.

• Le bénéfice par action (valeur nominale de 10 centimes) de 5.6 francs ne vaut rien dire non plus car il y a des réserves légales et latentes.

• On peut calculer le bénéfice par rapport aux fonds propres (26.5%) ou par rapport à la valeur de l’action (7.5%). C’est moins spectaculaire mais c’est un chiffre qui peut être comparé aux taux d’intérêt des capitaux risqués.

Page 22: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

22

• Lorsqu’on critique l’emprise de l’Etat dans la vie économique, on prend le total des budgets des collectivités publiques et on le compare au produit intérieur brut (31%). Or, ce dernier exprime la valeur ajoutée dans une économie tandis que les dépenses publiques comprennent aussi les achats de biens et services et les transferts. Si l’on prend le volume de la production, la part des budgets publics n’est que d’environ 15%.

Page 23: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

23

• Lorsqu’en 2005 un accident de plongée faisait deux morts, on pouvait lire dans les journaux que ce sport est moins dangereux que l’automobile car il y a plus de morts sur la route que dans le lac.

• Les dangers des différents moyens de transport doivent aussi être mis dans leur juste perspective. Si l’on prend le nombre de décès par passager et par kilomètre parcouru, l’avion est l’un des plus sûrs. Si l’on prend les décès par heure passée dans chaque moyen de transport, la différence est moins grande.

Page 24: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

24

Exemple de discrimination?

• 31% de femmes admises contre 74%

Hommes FemmesPostulé Admis % admis Postulé Admis % admis

Lettres 43 13 30 129 48 37Psychologie 61 7 11 285 60 21Physique 125 119 95 8 8 100Chimie 166 155 93 21 20 95

Total 395 294 74 443 136 31

Page 25: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

25

Exemples

• Erreurs avec les pourcentages (TV, journaux ): variation en pour-cent et variation de points de pourcentage

• Faux calcul des probabilités: mort subite du nourrisson: (1/8500)2=1/ 72.5 millions

• Extrapolations abusives: Les Suisses vont-ils disparaître?: la population de la Suisse, problèmes, perspectives politiques, Berne 1985 (si le taux de fécondité reste à 1.5 enfants par femme, en 2040 la population suisse ne sera que de 4.9 millions d’habitants)

Page 26: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

26

Exemple récent• A la page 12 de L’Hebdo du 23 août 2007 on

pouvait lire ceci:• « 5845 francs, tel est le salaire médian des

Suisses (à ne pas confondre avec le salaire moyen, il indique le salaire perçu par le plus grand nombre d’employés d’un secteur donné). »

• Or, il n’y a peut-être personne avec ce salaire mais en tout cas la majorité des Suisses n’a pas ce salaire (voir la définition de médiane).

Page 27: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

27

Exemples • Selon l’Office USA du recensement, le 17

octobre 2005 à 7h46 la population des Etats-Unis était de 300 millions d’habitants.

• Comment peut-on être si précis si l’on sait que lors du dernier recensement plusieurs millions d’individus n’avaient pas été comptés?

• Il s’agit du résultat d’un modèle utilisé pour prévoir la population.

Page 28: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

28

Exemples

• Les données économiques sont souvent imprécises: estimation peu fiable (données macroéconomiques), omissions volontai-res (fisc, maladies)

• Les sondages sont souvent peu fiables (échantillon trop petit, questions mal posées, cas des non réponses)

Page 29: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

29

• Dans son livre « Précision et incertitude des données économiques », Morgenstern souligne la qualité souvent médiocre des données économiques. En effet, ces données sont souvent le sous-produit des résultats du monde des affaires ou de l’administration publique. Elles n’ont pas été récoltées dans le but d’obtenir une information fiable sur un sujet précis. D’autre part, les agents économiques ont souvent intérêt à donner des informations imprécises pour tromper les concurrents ou pour la crainte du fisc. Parfois la réponse imprécise provient tout simplement d’une incompréhension de la question posée.

Page 30: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

30

• Les données macroéconomiques sont des estimations souvent très approximatives et qui changent fortement lorsqu’on procède à des révisions. Par exemple, l’Office fédéral de la statistique a révisé en 1998 les estimations du produit intérieur brut (PIB). C’est ainsi que l’estimation de l’investissement dans l’équipement a subi des changements très importants, même celle déclarée définitive quelques années auparavant. Par exemple, le montant pour 1980, en valeur nominale, a passé de 13 milliards de francs à 20.2 milliards. En 2003, les logiciels deviennent des biens d’investissements et le chiffre de 1980 passe à 25.4 milliards. Quelle est la valeur effective? Difficile à dire.

• Lorsque vous lisez que le PIB a augmenté de 1.2%, il faut se méfier du chiffre après la virgule et parfois même celui avant la virgule.

Page 31: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

31

Page 32: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

32

Page 33: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

33

Définition de la statistique

• La statistique est la science qui s’occupe de la collecte, de la présentation, de l’analyse et de l’interprétation de données nombreuses.

• Elle étudie les méthodes les plus appropriées pour obtenir toute l’information possible en utilisant ces données.

• Elle tire son nom de l’Etat (status en latin) qui fut le premier à procéder à la collecte d’un nombre important de données (exemple: le recensement).

Page 34: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

34

Applications en management

• Finance: rendement et risque• Comptabilité: audit (« …Nous avons révisé

les postes des comptes annuels en procédant à des analyses et à des examens par sondage »)

• Marketing: sondages, analyses• Ressources humaines: analyses

Page 35: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

35

Applications en économie politique

• Microéconomie: estimations et tests d’hypothèses

• Macroéconomie: modèles économétriques• Econométrie: fondement statistique

Page 36: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

36

TYPES DE DONNEES

• Population: totalité des éléments dont on désire connaître les caractéristiques (X, Y)

• Echantillon: une partie de la population qui nous donne des renseignements plus ou moins fiables selon la méthode choisie (x, y)

• Données quantitatives (ventes, revenus), discrète ou continue

• Données qualitatives (nationalité)

Page 37: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

37

Sources des données

• Entreprises: données souvent confidentielles mais parfois sur internet (utiliser Google)

• Offices de statistique: données macro-économiques, indices statistiques

• Banques nationales: données monétaires• OCDE, FMI: données internationales• Datastream: données financières

Page 38: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

38

Signe de sommation: Σ

• L’indice i est un indice fabriqué ou muet.• On peut écrire, par exemple:

∑=

++=3

1321

ii xxxx

∑∑−=

+=

=1

12

3

1 jj

kk xx

Page 39: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

39

Propriétés

• 1) Multiplication par une constante

• 2) Somme de constantes

∑∑ = ii xx 22

ccccci

33

1

=++=∑=

Page 40: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

40

Propriétés

• 3)

• 4)

• 5)

∑ ∑ ∑+=+ iiii yxyx )(

∑ ∑∑ +=+ iiii ybxabyax )(

2

)1(

1

+=∑=

nni

n

i

Page 41: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

41[ ]222

1

1xnx

ns i −

−= ∑

Page 42: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

42

21=3 X 7=6 X 7/2

=252

Page 43: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

43

Page 44: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

44

Page 45: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

45

Double somme

∑∑ ∑= = =

++=2

1

3

1

2

1321 )(

i j iiiiij xxxx

)()( 232221131211 xxxxxx +++++=

Page 46: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

46

Exemple

• i= pays, t = semestre:

EXPORTATIONS SUISSES EN 2005Pays ind. Autres Total

1 semestre 62.0 14.9 76.92 semestre 63.3 16.7 80.0Total 125.3 31.6 156.9

∑∑==

===2

11

2

1212 3.125; 0.80 ; 3.63

tt

ii xxx

∑∑= =

=2

1

2

1

9.156i t

itx

Page 47: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

47

Propriétés

• 1)

• 2)

• 3)

∑∑ ∑∑= = = =

=2

1

3

1

3

1

2

1i j j iijij xx

∑∑ ∑ ∑= = = =

=2

1

3

1

2

1

3

1i j i jijiiji xaxa

∑∑ ∑∑ ∑ ∑= = = = = =

==2

1

3

1

3

1

2

1

3

1

2

1i j j i j iijjijjijj xaxaxa

Page 48: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

48

Page 49: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

49

Page 50: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

50

PREMIERE PARTIE:STATISTIQUE DESCRIPTIVE

• Les techniques graphiques• Les caractéristiques de tendance centrale• Les caractéristiques de dispersion• Les caractéristiques de forme• Les relations entre les variables• Les indices statistiques

Page 51: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

51

Techniques graphiques

• Branches et feuilles• Diagramme à points• Graphiques en barres• Histogramme• Graphique circulaire• Courbes de fréquence• Courbes cumulatives• La méthode du noyau (kernel)• Graphique semi-logarithmique

Page 52: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

52

Règles pour les graphiques

• Indiquer les échelles des axes• Ne pas couper l’échelle au milieu des axes• Dans un dessin, c’est la surface qui

représente la quantité, pas la hauteur• Attention aux illusions graphiques• Ne pas surcharger le graphique• Voir les exemples d’erreurs

Page 53: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

53

Page 54: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

54

Page 55: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

55

Page 56: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

56

Graphique branche et feuille

• Première visualisation des données• Chiffres divisés en deux parties:• Les branches (ex. les dizaines)• Les feuilles (ex. les unités)• Pas très utile si données disparates

Page 57: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

57

Exemple:

47 61 53 43 46 46 68 48 72 57 48 54 41 63

branche feuille

3

4

5

6

7

Page 58: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

58

Exemple

47: 4 = branche, 7=feuille

3

4

5

6

7

7

47 61 53 43 46 46 68 48 72 57 48 54 41 63

Page 59: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

59

Exemple

3

4

5

6

7

7

3

1

47 61 53 43 46 46 68 48 72 57 48 54 41 63

Page 60: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

60

Exemple

3

4

5

6

7

7 3

3

1

47 61 53 43 46 46 68 48 72 57 48 54 41 63

Page 61: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

61

Exemple

3

4

5

6

7

7 3 6 6

3

1

47 61 53 43 46 46 68 48 72 57 48 54 41 63

Page 62: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

62

Commande MINITAB

• Introduisez les valeurs dans C1• Choisir dans le menu: Graphique et feuilles• Dans variable: sélectionner le vecteur C1• La première colonne donne le nombre

cumulé de valeurs de la plus petite à la médiane. En remontant depuis la dernière ligne jusqu’à la médiane on a aussi le nombre cumulé de valeurs.

• Vous pouvez changer l’unité des feuilles en modifiant l’incrément.

Page 63: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

63

branchefeuille

Page 64: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

64

Page 65: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

65

Le graphique à pointsOn met des points au-dessus des valeursOn peut ainsi voir les fréquences

Page 66: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

66

Commande MINITAB• Introduisez les valeurs dans C1• Choisir dans le menu: Graphique /

Diagramme à points• Dans variables: sélectionner le vecteur C1• Le diagramme à points permet de visualiser

la distribution des données même dans le cas de nombreuses valeurs car un point peut représenter plusieurs valeurs (voir exemple de la distribution des revenus en Suisse).

Page 67: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

67

Page 68: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

68

Graphique en barres

• Dénombrement de données qualitatives• Barres ou tuyaux de même largeur• Ne pas couper les barres• Les barres peuvent être décomposées

Page 69: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

69

Nombre d’étudiants

ZH GE BE UNIL BS SG NE TI LU

0

10000

20000

Université

Som

me

de E

tudi

ants

Nombre d'étudiants

Page 70: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

70

sFEMMES HOMMES

ZH BE GE UNIL BS SG NE TI LU

0

10000

20000

UNIVERSITE

Som

me

de E

TUD

IAN

TS

Nombre d'étudiants

Page 71: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

71

Commande MINITAB• Introduisez les noms des universités dans C1 et le

nombre d’étudiants dans C2• Choisir dans le menu: Graphique / Carte• Dans variable: sélectionner le vecteur C2 pour Y et le

vecteur C1 pour X• Si les barres sont décomposées en hommes et

femmes, mettre le nom dans C1, le sexe dans C2 et le nombre d’étudiants dans C3

• Faire la même chose pour les lignes suivantes.• Sélectionner C3 pour Y et C1 pour X• Dans affichage des données, choisir Groupe et la

variable est C2. Cliquer sur Options, cocher Empiler et mettre à nouveau C2.

Page 72: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

72

Commande EXCEL• Introduire les chiffres sous la forme d’un tableau avec

les noms des universités à la première ligne (en commençant par la colonne B) et le nombre d’étudiants à la deuxième ligne. Vous pouvez écrire Etudiants à la cellule A2.

• Sélectionner les cellules utilisées et cliquez sur l’icône Assistant graphique.

• Choisir Histogramme groupé même s’il ne s’agit pas d’un histogramme mais d’un graphique en barres.

• Si les barres sont décomposées mettre le sexe à la première colonne, à la place d’Etudiants et le nombre correspondant dans les lignes suivantes. Choisir Histogramme empilé.

Page 73: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

73

Page 74: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

74

L’histogramme

• Variable continue• On crée des intervalles de la variable

(faciles à interpréter)• On compte les données qui se trouvent

dans l’intervalle• Ce nombre donne la hauteur• Les rectangles se touchent• Les valeurs qui se trouvent sur la limite

supérieure ne font pas partie de l’intervalle

Page 75: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

75

Nombre d’intervalles

• Le nombre d’intervalles ne doit pas être ni trop petit (peu d’informations sur la structure des données) ni trop grand (allure générale cachée)

• Formule de Sturges. Nombre de classes: k = 1 + 3.3 log(n)

• Largeur des classes: (xmax-xmin)/k

Page 76: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

76

0 10 20 30 40 50 60 70 80

0

10

20

30

40

50

60

points

Effe

ctif

Intervalles trop nombreux

0 10 20 30 40 50 60 70 80

0

10

20

30

40

50

60

points

Effe

ctif

0 20 40 60 80

0

50

100

150

200

250

points

Effe

ctif

Trop peu d'intervalles

Page 77: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

77

.

0 100 200 300 400 500 600 700 800 900 1000

0

500

1000

alimentation

Effe

ctif

DEPENSES HEBDOMADAIRES

Page 78: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

78

0 10 20 30 40 50 60 70 80 90 100

0

10

20

30

40

50

60

70

80

90

100

POINTS

Effe

ctif

TEST 1

Page 79: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

79

Page 80: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

80

Commande MINITAB• Introduire le nombre de points dans C1• Choisir dans le menu: Graphique /

Histogramme• Dans variable: sélectionner le vecteur C1 pour

X• En cliquant sur Options, vous pouvez choisir les

différents types et le nombre d’intervalles

Page 81: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

81

Commande EXCEL

• Introduire les chiffres dans la colonne A.• Choisir Histogramme dans l’utilitaire d’analyse.

• Ecrire la plage d’entrée où les données se trouvent (ex. A1:A20). Cocher la représentation graphique.

• Modifier le graphique car on obtient un graphique en barres. Cliquer sur une barre avec le bouton droit de la souris. Choisir Format de la série de données / Options. Mettre 0 dans Largeur de l’intervalle.

• Vous pouvez choisir les classes en mettant les limites supérieures dans la colonne B et en donnant la plage des classes. Excel considère que la limite supérieure fait partie de la classe.

Page 82: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

82

Le graphique circulaire

• Permet de visualiser la part relative

• Aire proportionnelle aux nombres d’éléments• Angle: 360 x ni/n

• Plusieurs graphiques: surface proportionnelle aux nombre d’éléments. Rayons:

2

1

2

1

n

n

r

r =

Page 83: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

83

BE (12174; 13.1%)

BS ( 9957; 10.7%)

ZH (23832; 25.6%)

LU ( 1771; 1.9%)

NE ( 3595; 3.9%)

SG ( 4661; 5.0%)

TI ( 2023; 2.2%)

UNIL (10452; 11.2%)

FR ( 9937; 10.7%)

GE (14566; 15.7%)

Graphique en secteurs pour UNIVERSITES

Page 84: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

84

Commande MINITAB

• Introduisez les noms des universités dans C1 et le nombre d’étudiants dans C2

• Choisir dans le menu: Graphique / Graphique en secteurs

• Cocher Tracer le tableau• Dans catégories: sélectionner C1 et dans

effectifs prendre C2

Page 85: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

85

Commande EXCEL• Introduire les chiffres sous la forme d’un

tableau avec les noms des universités à la première ligne (en commençant par la colonne B) et le nombre d’étudiants à la deuxième ligne. Vous pouvez écrire Etudiants à la cellule A2.

• Sélectionner les cellules utilisées et cliquer sur l’icône Assistant graphique.

• Choisir Secteurs et cliquer deux fois sur suivant.

• Cliquer sur Etiquettes de données et cocher Nom de catégorie et Valeur. Cliquer ensuite sur Terminer.

Page 86: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

86

Courbe de fréquence

• Relie les sommets d’un histogramme• Ne pas l’utiliser pour calculer les

fréquences pour chaque x mais uniquement pour chaque intervalle

• Pour comparer deux séries, utiliser des fréquences relatives ou une densité (surface = 1)

Page 87: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

87

0 50 100

0

10

20

30

40

50

POINTS

Effe

ctif

TEST 1

Page 88: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

88

0 50 100

0

5

10

test12.05

Pour

cent

age

0 50 100

0.00

0.01

0.02

test12.05

Den

sité

Page 89: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

89

Commande MINITAB

• Introduire le nombre de points dans C1• Choisir dans le menu: Graphique /

Histogramme• Dans variable: sélectionner le vecteur C1 pour

X• Dans affichage de données, mettre Joindre (ou

courbe lissée) à la place de Barre (utilisez la flèche V)

• Mettre Barre en 2 si vous voulez aussi l’histogramme.

Page 90: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

90

Commande EXCEL

• Introduire les chiffres dans la colonne A et les limites supérieures des classes dans la colonne B.

• Choisir Histogramme dans l’utilitaire d’analyse.• Mettre la plage d’entrée et la plage des classes.

Cocher la représentation graphique.

• Modifier le graphique car on obtient un graphique en barres. Cliquer sur une barre avec le bouton droit de la souris. Choisir Format de la série de données / Options. Mettre 0 dans Largeur de l’intervalle.

• Cliquer sur le graphique avec le bouton droit de la souris et choisir Courbes pour type de graphique.

Page 91: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

91

Courbe cumulative (ogive)

• Les fréquences sont cumulées• Pour chaque x, la courbe donne le nombre

de valeurs inférieures ou égale à x• La pente ne peut pas être négative• Fréquences relatives ou densités:

la courbe va de 0 à 1 (100%)

Page 92: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

92

0 50 100

0

100

200

300

400

500

POINTS

Effe

ctifs

cum

ulés

TEST 1

Page 93: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

93

Commande MINITAB

• Introduire le nombre de points dans C1• Choisir dans le menu: Graphique /

Histogramme• Dans variable: sélectionner le vecteur C1 pour

X• Dans affichage de données, mettre Joindre à la

place de Barre (utilisez la flèche V)• Dans Options, choisir Effectif cumulé.

Page 94: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

94

Commande EXCEL

• Introduire les chiffres dans la colonne A et les limites supérieures des classes dans la colonne B.

• Choisir Histogramme dans l’utilitaire d’analyse.• Mettre la plage d’entrée et la plage des classes.

Cocher pourcentage cumulé et représentation graphique.

• Modifier le graphique car on obtient aussi un graphique en barres. Cliquer sur une barre avec le bouton droit de la souris et effacer la série.

Page 95: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

95

Lissage par le noyau (kernel)

• Courbe dessinée par les données, sans forme prédéterminée

• Meilleure estimation de la densité• Chaque donnée est remplacée par une

densité centrée sur cette valeur et avec écart-type h. Les densités sont cumulées et le résultat est normalisé (surface = 1)

• Lissage plus ou moins fort selon le choix de h.

Page 96: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

96

Test 1

10 20 30 40 50 60 70 80 90 100

0.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

Den

sité

10 20 30 40 50 60 70 80 90 100

0.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

Den

sity

Kernel density plot

Page 97: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

97

Différents lissages

10 20 30 40 50 60 70 80 90 100

0.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

DATA

Den

sité

10 20 30 40 50 60 70 80 90 100

0.000

0.005

0.010

0.015

0.020

0.025

0.030

0.035

Den

sity

Red line = Optimum h - 0.4*optimum h

Green line = Optimum h

Blue line = Optimum h + 0.4*optimum h

Kernel density plot

Page 98: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

98

Commande MINITAB

• Introduire le nombre de points dans C1• Dans la fenêtre Session, taper %Kernel C1• Répondre N si vous ne voulez pas modifier

l’étendue des données• Répondre N si vous ne voulez pas

l’histogramme• Répondre N si vous voulez trois courbes avec

différents lissages• Ce programme ne fait pas partie des

commandes MINITAB standard.

Page 99: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

99

Graphique semi-logarithmique

• Lorsqu’on s’intéresse au taux de variation (r)

111

1 11−−−

− =+⇒−=−=t

t

t

t

t

tt

p

pr

p

p

p

ppr

1lnln)1ln( −−=+ tt ppr

Page 100: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

100

Propriétés

• Différence entre deux points=ln(1+r)• Logarithme d’une seule variable• Même pente=même variation en %• Graphique usuel:

même pente = même variation en valeur

Page 101: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

101

Echelle

• arithmétique logarithmique• 0 1• 1 10• 2 100• 3 1000• 4 10000• 5 100000

Page 102: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

102

y=1+0.1 x

y=(1+0.1)x

Page 103: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

103

Page 104: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

104

Page 105: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

105

Page 106: Bienvenue à l’Ecole des HEC · 2007-10-02 · presse ou écouter la radio les résultats d’une enquête statistique, que se soit le nombre d’accidents de la circulation, le

106

9/07: Ln(7262.53)=8.8905

9/05: Ln(5742.41)=8.6556

e(8.8905-8.6556) =1.2647(+26.47%)

2/05-9/05: +29.46%