30
INF L14 INF L14 Initiation aux statistiques Initiation aux statistiques 5 – Tendance centrale

INF L14 Initiation aux statistiques 5 – Tendance centrale

Embed Size (px)

Citation preview

Page 1: INF L14 Initiation aux statistiques 5 – Tendance centrale

INF L14INF L14Initiation aux statistiquesInitiation aux statistiques

5 – Tendance centrale

Page 2: INF L14 Initiation aux statistiques 5 – Tendance centrale

IntroductionIntroduction

Représentations Représentations graphiquesgraphiques renseignent sur la renseignent sur la

forme des forme des distributionsdistributions

ex. tuyaux d’orgueex. tuyaux d’orgue

longueur de prénoms des étudiants

Page 3: INF L14 Initiation aux statistiques 5 – Tendance centrale

IntroductionIntroduction

Mais on a parfois besoin d’indices Mais on a parfois besoin d’indices numériquesnumériques résumer de façon très synthétiquerésumer de façon très synthétique comparer, classercomparer, classer

ex. comparer la longueur des prénomsex. comparer la longueur des prénoms garçons/fillesgarçons/filles évolution au fil des annéesévolution au fil des années

Difficile à faire avec des graphiquesDifficile à faire avec des graphiques

Page 4: INF L14 Initiation aux statistiques 5 – Tendance centrale

IntroductionIntroduction

Divers indices Divers indices possiblespossibles

Le plus simple : Le plus simple : caractériser le caractériser le centrecentre des des distributionsdistributions tendance centraletendance centrale

Où situeriez-vous le "centre" ? A la valeur 6, qui est la plus fréquente ? ou bien plus à droite, par exemple de façon à partager les observations en paquets égaux ? Si oui, où, exactement ? 7, 8, 9 ?

Page 5: INF L14 Initiation aux statistiques 5 – Tendance centrale

ModeMode

ModeMode Valeur qui apparaît Valeur qui apparaît

le plus le plus fréquemment.fréquemment.

Exemples:Exemples: taille de chaussures taille de chaussures

la plus vendue la plus vendue âge normal pour âge normal pour

passer le bac passer le bac

le mode est 6

Page 6: INF L14 Initiation aux statistiques 5 – Tendance centrale

TableurTableur

FonctionFonction =MODE(=MODE(donnéesdonnées))

Données788 036

Mode Formule8 =MODE(A2:A7)

Page 7: INF L14 Initiation aux statistiques 5 – Tendance centrale

TableurTableur

Attention, ne marche pas toujoursAttention, ne marche pas toujours ici toutes les fréquences sont identiquesici toutes les fréquences sont identiques pas de mode ou alors modes pas de mode ou alors modes ex aequoex aequo

A B1 Données2 03 44 6 5 76 17 88 Mode Formule9 #N/A =MODE(A2:A7)

Page 8: INF L14 Initiation aux statistiques 5 – Tendance centrale

Plusieurs modes ?Plusieurs modes ?

Pic principal et Pic principal et pic(s) secondaire(s)pic(s) secondaire(s)

Distributions Distributions bimodales,bimodales, ou ou multimodalesmultimodales

Distance entre construit et barrage (pages Web) (exemples)

Page 9: INF L14 Initiation aux statistiques 5 – Tendance centrale

Plusieurs modes ?Plusieurs modes ?

-1: construit (un) barrage

+3: barrage (a été) construit

+1: barrage construit

Page 10: INF L14 Initiation aux statistiques 5 – Tendance centrale

Données groupéesDonnées groupées

Lorsque les données ont de nombreuses Lorsque les données ont de nombreuses valeursvaleurs on calcule le mode après avoir groupé les on calcule le mode après avoir groupé les

données par intervallesdonnées par intervalles

Exemple, durées des pausesdans un discours (ms)

Page 11: INF L14 Initiation aux statistiques 5 – Tendance centrale

MoyenneMoyenne

La La moyennemoyenne est la mesure de est la mesure de tendance centrale la plus connuetendance centrale la plus connue

Utilisée fréquemment dans la vie Utilisée fréquemment dans la vie courantecourante Exemple :Exemple :

La note finale d'une unité d'enseignement La note finale d'une unité d'enseignement est la moyenne des notes des différents est la moyenne des notes des différents partiels partiels

Page 12: INF L14 Initiation aux statistiques 5 – Tendance centrale

Calcul de la moyenneCalcul de la moyenne

Somme des valeurs divisée Somme des valeurs divisée par le nombre d’individuspar le nombre d’individus

N

XXXm n

...21

N

Xm i

Représentation synthétique

= somme

Page 13: INF L14 Initiation aux statistiques 5 – Tendance centrale

Moyenne : TableurMoyenne : Tableur

FonctionFonction =MOYENNE(=MOYENNE(donnédonné

eses))

A B1 Données2 43 14 2 5 06 77 78 Moyenne Formule9 3,50 =MOYENNE(A2:A7)

Page 14: INF L14 Initiation aux statistiques 5 – Tendance centrale

Analogie physiqueAnalogie physique

La moyenne est le point auquel il faudrait placer un support pour que la "planche" reste en équilibre.

Page 15: INF L14 Initiation aux statistiques 5 – Tendance centrale

Inconvénient de la Inconvénient de la moyennemoyenne

Sensibilité aux valeurs extrêmesSensibilité aux valeurs extrêmes erreurserreurs cas particulierscas particuliers

Page 16: INF L14 Initiation aux statistiques 5 – Tendance centrale

CalculCalcul

Données51 danseuse 152 danseuse 245 danseuse 350 danseuse 451 danseuse 551 danseuse 653 danseuse 749 danseuse 8

235 sumotoriMoyenne Formule

70,78 =MOYENNE(A2:A10)

les danseuses ont de quoi se faire du

sushi

Page 17: INF L14 Initiation aux statistiques 5 – Tendance centrale

Exemple (cours 1)Exemple (cours 1)

On compare deux classes de 10 élèvesOn compare deux classes de 10 élèves

A11111211121113111020

Moy12,2

B1313141312141315120

Moy11,9

Page 18: INF L14 Initiation aux statistiques 5 – Tendance centrale

Oops !Oops !

A11111211121113111020

Moy11,3

B1313141312141315120

Moy13,2

Page 19: INF L14 Initiation aux statistiques 5 – Tendance centrale

MédianeMédiane

La La médianemédiane est la valeur pour est la valeur pour laquelle il y a autant d'observations laquelle il y a autant d'observations à gauche qu'à droite.à gauche qu'à droite.

Pour la calculer,Pour la calculer, on classe les observations par ordre on classe les observations par ordre

croissantcroissant on cherche quelle est la valeur qui on cherche quelle est la valeur qui

divise les observations en deux groupes divise les observations en deux groupes égaux. égaux.

Page 20: INF L14 Initiation aux statistiques 5 – Tendance centrale

ExempleExemple

Page 21: INF L14 Initiation aux statistiques 5 – Tendance centrale

CalculerCalculer

On pourrait faire le calcul à la On pourrait faire le calcul à la mainmain 1) tri1) tri 2) choix de la valeur du milieu2) choix de la valeur du milieu

A B1 Données2 45 danseuse 33 49 danseuse 84 50 danseuse 45 51 danseuse 16 51 danseuse 57 51 danseuse 68 52 danseuse 29 53 danseuse 7

10 235 sumotori

Page 22: INF L14 Initiation aux statistiques 5 – Tendance centrale

Médiane : TableurMédiane : Tableur

FonctionFonction =MEDIANE(=MEDIANE(donnédonné

eses))A B

1 Données2 51 danseuse 13 52 danseuse 24 45 danseuse 35 50 danseuse 46 51 danseuse 57 51 danseuse 68 53 danseuse 79 49 danseuse 8

10 235 sumotori11 Moyenne Formule12 51 =MEDIANE(A2:A10)

Page 23: INF L14 Initiation aux statistiques 5 – Tendance centrale

Nombre pairNombre pair

Cas particulierCas particulier

On prend la moyenne des deux valeurs du milieu (le tableur se débrouille)...

Page 24: INF L14 Initiation aux statistiques 5 – Tendance centrale

ExempleExemple

A11111211121113111020

Moy12,2Med11,0

B1313141312141315120

Moy11,9Med13,0

Page 25: INF L14 Initiation aux statistiques 5 – Tendance centrale

Relation entre les trois Relation entre les trois indicesindices

La relation dépend de la forme la La relation dépend de la forme la distributiondistribution

Distribution symétriqueDistribution symétrique (ou à peu près) (ou à peu près) mode ~ médiane ~ moyennemode ~ médiane ~ moyenne

So ?

Page 26: INF L14 Initiation aux statistiques 5 – Tendance centrale

Distribution asymétriqueDistribution asymétrique Etalée à droiteEtalée à droite

mode < médiane < moyennemode < médiane < moyenne

Iiiik !!!

http://www.faecesoftheworld.co.uk/

Page 27: INF L14 Initiation aux statistiques 5 – Tendance centrale

Distribution Distribution asymétriqueasymétrique Etalée à gaucheEtalée à gauche

mode > médiane > mode > médiane > moyennemoyenne

http://www.faecesoftheworld.co.uk/

Yuuuk !!!

Page 28: INF L14 Initiation aux statistiques 5 – Tendance centrale

Quel indice choisir ?Quel indice choisir ?

ModeMode peu stable, parfois inexistantpeu stable, parfois inexistant

à éviterà éviter MoyenneMoyenne

la force de l’habitudela force de l’habitude ok dans les distributions symétriquesok dans les distributions symétriques

MédianeMédiane Meilleur indice dans les distributions Meilleur indice dans les distributions

asymétriquesasymétriques Très souvent le cas en linguistique !Très souvent le cas en linguistique !

Page 29: INF L14 Initiation aux statistiques 5 – Tendance centrale

Termes à retenirTermes à retenir

Tendance centrale Mode Distribution bimodale,

multimodale Moyenne Médiane Distribution symétrique,

asymétrique

Page 30: INF L14 Initiation aux statistiques 5 – Tendance centrale

Pweeh... all this computer hacking is making me thirsty !