Upload
violette-lucas
View
105
Download
2
Embed Size (px)
Citation preview
1
Chapitre 8: La gestion des donnéesConsulte les pages 366 et 367 pour
les concepts et vocabulaire clés
2
Chapitre 8: Prépare-toi Avant de commencer le chapitre 8, il faut
réviser ces concepts:
1. Représenter des données
2. Les diagrammes à boîte et à moustaches
3. Les mesures de tendance centrale
4. Interpoler et Extrapoler des valeurs
3
8.1: Les diagrammes de dispersion Statistique Canada collectionne et organise
des données pour aider les Canadiens à mieux comprendre leur pays: sa population, ses ressources, son économie, sa société et sa culture.
4
Les diagrammes de dispersion Un diagramme de dispersion est un
diagramme qui permet de représenter graphiquement des couples de données numériques.
Il sert à voir des relations entre deux variables.
5
La droite la mieux ajustée La droite la mieux ajustée est la droite qui
passe par les points représentés dans un diagramme de dispersion ou qui passe le plus près possible de ces points.
6
Une valeur aberrante Une valeur aberrante est une donnée qui
ne suit pas la régularité qui se dégage des autres données.
Cette donnée semble très à l’écart de la plupart des données.
7
Interpoler des valeurs Interpoler des valeurs veut dire
l’estimer des valeurs qui se trouvent entre des données connues.
8
Extrapoler des valeurs Extrapoler des valeurs veut dire
l’estimer des valeurs qui se trouvent à l’extérieur des données connues.
9
Les variables indépendantes Dans une relation, la variable indépendante est
la variable qui détermine la valeur de la variable dépendante.
Par exemple, avec la vitesse, distance/temps, le temps est la variable indépendante parce que la distance le dépend.
D’habitude, la variable indépendante est x
10
Les variables dépendantes Dans une relation, la variable dépendante est la
variable dont la valeur est déterminée par la variable indépendante
Par exemple, avec la vitesse, distance/temps, la distance est la variable dépendante parce que la distance dépend sur le temps pour sa valeur.
D’habitude, la variable dépendante est y
11
Les types des données Il y a deux types: 1. des données
continus
2. des données discrètes
12
Des données continues Si une variable peut représenter n’importe
quel nombre réel, les données sont des données continus.
Quand les données sont rattachées ensemble pour former une droite, cela représente des données continues.
Un exemple des données continus est la température.
13
Des données discrètes Si la variable ne peut pas être n’importe
quel nombre réel (i.e. un nombre décimal), les données sont des données discrètes.
Quand les données ne sont pas rattachées ensemble, cela représente des données discrètes.
Un exemple des données discrètes sont comme le nombre des pages dans un livre.
14
Une corrélation #1 Pour mieux comprendre et mieux organiser
les données, Statistique Canada trace des diagrammes de dispersion pour déterminer une corrélation entre deux variables.
15
Une corrélation #2 Une corrélation est la mesure de la
dispersion des points autour d’une droite dans un diagramme de dispersion (le degré de relation entre deux variables)
16
Les adjectifs d’une corrélation La corrélation entre 2
variables peuvent être:
Forte Faible Positive Négative N’est pas apparente
17
Une corrélation forte Si la plupart des points sont groupés
autour d’une droite, la corrélation est forte.
18
Une corrélation faible Si les points sont dispersés, mais
montrent une tendance générale, la corrélation est faible.
19
La corrélation positive
Une corrélation positive veut dire que la relation entre les variables est positive.
Par exemple, quand la variable indépendante augmente, la variable dépendante augmente alors la pente est positive (elle monte de gauche à droite)
20
La corrélation négative Une corrélation négative veut dire que
la relation entre les variables est négative.
Par exemple, quand la variable indépendante augmente, la variable dépendante diminue alors la pente est négative (elle descend de gauche à droite)
21
Une corrélation n’est pas apparente Si les points sont dispersés et ils ne
montrent pas de tendance générale, il n’y a pas de corrélation ou la corrélation n’est pas apparente.
22
Une relation
Une relation est une régularité entre deux ensembles de nombres.
Une relation = « a relationship »
23
Les types des relations Avec la gestion des
données, il y a 2 types de relations:
Une relation linéaire (elle forme une ligne droite)
Une relation non linéaire (elle ne forme pas de ligne droite)
24
8.2: Analyser des données et faire des prévisions
Pour analyser les données, il est utile à représenter les données à l’aide d’un diagramme de dispersion.
Puis, trace, à vue, la droite la mieux ajustée.
25
La qualité de l’ajustement de la droite
Une grille de corrélation est un guide pour indiquer de la qualité de l’ajustement de ta droite.
26
Une grille de corrélation Corrélation La qualité de l’ajustement
+1 L’ajustement parfait sur une droite de pente positive.
Forte et positive La plupart des points sont groupés autour d’une droite de pente positive.
Faible et positive Les points sont dispersés, mais montrent une tendance générale positive.
0 Aucune relation apparente.
Faible et négative Les points sont dispersés, mais montrent une tendance générale négative.
Forte et négative La plupart des points sont groupés autour d’une droite de pente négative.
-1 L’ajustement parfait sur une droite de pente négative.
27
8.3: Représenter des données Voici 6 types de
représenter des données: (9ième année)
1. Un diagramme de dispersion
2. Un histogramme3. Un diagramme circulaire4. Un diagramme à tiges et
à feuilles5. Un diagramme à boîte et
à moustaches6. Un diagrammes à
bandes
28
Un diagramme à bandes Un diagramme à bandes est un
diagramme qui représente des données à l’aide de bandes horizontales ou verticales.
Il sert à comparer des catégories.
29
Un diagramme circulaire Un diagramme circulaire est un
diagramme qui représente un ensemble de données par un cercle divisé en secteurs.
Il sert à comparer des catégories entre elles et à comparer chaque catégorie à l’ensemble complet.
30
Un diagramme à tiges et à feuilles Un diagramme à tiges et à feuilles
est une façon d’organiser des données numériques qui représente une partie de chaque nombre par une tige et l’autre partie par une feuille.
31
Un histogramme Un histogramme est un diagramme à
bandes juxtaposés qui représente des données groupées par intervalles.
32
Un diagramme à boîte et à moustaches
Un diagramme à boîte et à moustaches est un diagramme qui indique la médiane et l’étendue d’un ensemble de données numériques.
33
Le fonction des diagrammes à boîte et à moustaches
Un diagramme à boîte et à moustaches illustre la dispersion des données autour de la médiane d’un ensemble de données.
34
Le vocabulaire des diagrammes à boîtes et à moustaches La boîte contient ou représente au moins
50% des données. La plus petite valeur et la plus grande se
nomment la valeur minimum et la valeur maximum respectivement.
Le quartile inférieur est la médiane de la moitié inférieure des données.
Le quartile supérieur est la médiane de la moitié supérieure des données.
35
Comment choisir la représentation la plus appropriée
Le diagramme le plus approprié dépend du type de données que tu veux communiquer.
36
Les indices pour choisir la représentation correcte #1
1. Les diagrammes à ligne brisée et les diagrammes de dispersion servent à analyser des tendances.
2. Les histogrammes, les diagrammes à boîte et à moustaches et les diagrammes à tiges et à feuilles servent à analyser l’étendue des données.
37
Les indices pour choisir la représentation correcte #2
3. Les diagrammes à bandes et les diagrammes circulaire servent à comparer des catégories.
38
Les mesures de tendance centrale
Le mesure de tendance centrale est la valeur qui représente le centre d’un ensemble de données.
39
Les types de mesure de tendance centrale
Il y a trois types de mesure de tendance centrale:
1. La moyenne
2. La médiane
3. Le mode
40
La moyenne La moyenne est la somme des valeurs d’un
ensemble divisé par le nombre de valeurs dans l’ensemble.
L’avantage de la moyenne: elle donne des renseignements sur la somme des valeurs.
Le désavantage de la moyenne: les valeur aberrantes ont une incidence sur elle.
41
Le médiane La médiane est la valeur du milieu quand
les données d’un ensemble sont placées par ordre croissant.
L’avantage de la médiane: les valeurs aberrantes ont peu d’incidence sur elle.
Le désavantage de la médiane: elle ne fournit aucun renseignements sur la somme des valeurs.
42
Le mode Le mode est la valeur la plus courante dans
un ensemble de données. L’avantage du mode: il est facile à trouver
dans des tableaux de fréquence, des diagrammes, des diagrammes à bandes ou des histogrammes.
Le désavantage du mode: il peut changer énormément quand il y a ajout de nouvelles données.