14
Modélisation Nuage de points

Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Embed Size (px)

Citation preview

Page 1: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Modélisation

Nuage de points

Page 2: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Les travaux statistiques sont d’abord et avant tout des travaux d’observations sur des phénomènes, des objets, des populations…

En sciences, l’analyse de données issues d’expériences ou d’études statistiques est un élément essentiel de la recherche.

Tous ces résultats ne correspondent pas toujours à des situations parfaites.

Cependant, une fois qu’un lien est mis en évidence et que son intensité a été mesurée, il devient possible de le modéliser à l’aide d’une fonction.

Page 3: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Exemple:

Pays Taux de mortalité infantile (%)

Angola

Argentine

Bangladesh

Canada

Côte d’Ivoire

Égypte

États-Unis

Haïti

Inde

Mexique

Nicaragua

Pérou

Sierra Lone

Vietman

Espérance de vie (années)

46,5

72,9

58,1

79,0

46,7

66,3

76,7

53,7

62,6

72,2

67,9

68,3

37,2

67,4

12,5

2,2

7,5

0,6

8,7

5,1

0,7

7,1

7,1

3,1

4,3

4,0

17,0

2,9

Les données suivantes proviennent d’un rapport paru en 2 000 qui porte sur le développement dans le monde.

Page 4: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Développement dans le monde

0

Mortalité infantile (%)

4

2

6

10

8

14

12

16

20

18

20 40 60 80 100

Espérance de vie (années)

En reportant dans un plan cartésien, ces données ;

l’espérance de vie, en abscisse,

la mortalité infantile, en ordonnée,

et en plaçant chaque couple,

on obtient une représentation graphique de la situation.

Les points ne sont pas parfaitement alignés, mais une certaine tendance se dessine.

Cette situation s’apparente à une fonction linéaire de variation partielle.

On peut donc modéliser cette situation par une fonction linéaire.

Page 5: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Certains nuages de points ne révèlent rien de particulier.

2

3

4

5

6

7

8

9

10

2 3 4 5 6 7 8

456789

1011121314151617

2 4 6 8

D’autres, au contraire, sont très significatifs.

Page 6: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Plus, il y a de données et plus le nuage est représentatif.

Page 7: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Les nuages de points peuvent prendre plusieurs formes; quand le lien est grand (quand les points sont très rapprochés les uns des autres, on peut les modéliser.

Modélisable par une fonction linéaire.

Modélisable par une fonction inversement proportionnelle.

Modélisable par une fonction constante.

Page 8: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

Âge Taille (cm)

Exemple:

Comment construire un nuage de points

Voici un tableau représentant l’âge et la taille (en cm) d’un échantillon d’adolescents.

Page 9: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

Âge Taille (cm)

Chaque couple de données peut s’écrire comme un couple de coordonnées dans le plan cartésien.

Exemple:

( 11, 142 )

Il s’agit alors d’inscrire chaque couple dans un plan cartésien.

La première coordonnée

( ici, l’âge )

sera représentée

sur l’axe des abscisses.

La deuxième coordonnée

( ici, la taille )

sera représentée

sur l’axe des ordonnées.

Page 10: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

La graduation des axes est importante.

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

L1 L2

Sur un même axe, la distance entre les échelons doit être égale.

Pour une meilleure interprétation, le graphique devrait avoir une forme approximativement carrée.

Page 11: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

L1 L2

Pour déterminer la graduation, calcule en premier l’étendue de chaque distribution ( chaque colonne ).

L1: 16 – 11 = 5

Comme l’étendue est très petite, chaque petit trait vaudra 1.

On commence avec un nombre inférieur à la première donnée et on termine avec un nombre supérieur à la dernière donnée.

donc de 10 à 17

10 11 12 13 14 15 16 17

Remarque:

Comme chaque trait représente une unité et que par rapport à l’origine il y a plusieurs unités qu’on n’utilise pas, il faut penser à mettre ce petit symbole:

Âge

Page 12: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

L1 L2

Pour déterminer la graduation, calcule en premier l’étendue de chaque distribution ( chaque colonne ).

Ici, l’étendue de la distribution est de 180 – 123 donc de 57. On peut donc utiliser 6 intervalles d’une largeur de 10 unités chacun.

L2: - 123 = 57180

120

130

140

150

160

170

Pense à

Taille ( cm )

180

Page 13: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

10 11 12 13 14 15 16 17 Âge

120

130

140

150

160

170Taille ( cm )

180

Nous pouvons maintenant tracer le nuage de points.

1111121212121213

13141414141515151516

13

142123142140160148148140

155155172160157155165165167180

161

L1 L2Répartition d’un échantillon d’adolescents en fonction de l’âge et la taille

Il faut être le plus précis possible.

Remarque:

on inscris alors un 2 à côté du point pour indiquer qu’il y en a 2.

ici, on a 2 fois le couple ( 12 , 148 );

2

2

Page 14: Modélisation Nuage de points. Les travaux statistiques sont dabord et avant tout des travaux dobservations sur des phénomènes, des objets, des populations…

Voilà, le nuage de points est tracé.

10 11 12 13 14 15 16 17 Âge

120

130

140

150

160

170Taille ( cm )

180

Répartition d’un échantillon d’adolescents en fonction de l’âge et la taille

2

2

Ici, le nuage de points est assez dispersé; le lien entre les variables est donc faible et non significatif.