11
1 Thème D Séquence 8 Traitement des données Thème D : Les données structurées et leur traitement Séquence 8 : « Traitement des données » Le thème D (Les données structurées et leur traitement) correspond aux deux séquences suivantes : Séquence 7 : À la découverte des données numériques Séquence 8 : Traitement des données Cette séquence nécessite d’avoir traité la séquence 7 au préalable. A. Le programme Les capacités exigibles du BO pour cette séquence sont données ci-dessous. Les autres contenus du thème Les données structurées et leur traitement ont été traités dans la séquence 7. Contenus Capacités attendues du BO traitées dans la séquence 8 Activités / Exercices Données Définir une donnée personnelle. Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées Identifier les différents descripteurs d’un objet. Distinguer la valeur d’une donnée de son descripteur. Utiliser un site de données ouvertes, pour sélectionner et récupérer des données. Séquence 7 Séquence 7 Séquence 7 Activité 1 page 61 Activité 2 page 62 Traitement de données structurées Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables. Activité 2 page 62 Activité 3 page 63 Exercice 1 page 66

Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

1 Thème D Séquence 8 Traitement des données

Thème D : Les données structurées et leur traitement

Séquence 8 : « Traitement des données »

Le thème D (Les données structurées et leur traitement) correspond aux deux séquences suivantes :

● Séquence 7 : À la découverte des données numériques

● Séquence 8 : Traitement des données

Cette séquence nécessite d’avoir traité la séquence 7 au préalable.

A. Le programme

Les capacités exigibles du BO pour cette séquence sont données ci-dessous. Les autres contenus du

thème Les données structurées et leur traitement ont été traités dans la séquence 7.

Contenus Capacités attendues du BO

traitées dans la séquence 8

Activités /

Exercices

Données Définir une donnée personnelle.

Identifier les principaux formats et représentations

de données.

Séquence 7

Exercice 2 page 67

Données structurées

Identifier les différents descripteurs d’un objet.

Distinguer la valeur d’une donnée de son

descripteur.

Utiliser un site de données ouvertes, pour

sélectionner et récupérer des données.

Séquence 7

Séquence 7

Séquence 7

Activité 1 page 61

Activité 2 page 62

Traitement de données

structurées Réaliser des opérations de recherche, filtre, tri ou

calcul sur une ou plusieurs tables.

Activité 2 page 62

Activité 3 page 63

Exercice 1 page 66

Page 2: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

2 Thème D Séquence 8 Traitement des données

B. QCM diagnostic d’ouverture

Ces questions vont instaurer le débat, ou la discussion. Ce sont des questions ouvertes et il y a une

question d’amorçage pour chaque activité et chaque exercice.

Elles sont destinées à faire une évaluation diagnostic en début de séquence et sont disponibles sur

QCMCam et aux formats PDF, PPT et ODP sur le site web :

https://cahier-snt.fr/#!/diagnostic/seq8.

Activité 1 Selon vous, quel service propose un site web open data ? Réponses :

A. Télécharger gratuitement des données numériques publiques. (bonne réponse)

B. Sauvegarder ses données personnelles sur le cloud.

C. Visionner de la vidéo en streaming.

Activité 2 Une application permet de localiser l’emplacement des défibrillateurs cardiaques.

À quoi pourrait-elle servir ? Réponses :

A. Sauver des vies (bonne réponse)

B. Échanger des SMS avec ses amis

C. Partager des photos

Activité 3 Qu'est-ce qu’une base de données ? Réponses :

A. Une base militaire secrète

B. Une application qui permet d'échanger des données

C. Un service de stockage de données brutes (bonne réponse)

Exercice 1 Pour louer une trottinette électrique dans une grande ville afin de se déplacer, il faut :

Réponses :

A. installer une application dédiée. (bonne réponse)

B. arpenter toutes les rues de la ville jusqu’à trouver une trottinette disponible.

C. appeler le 15.

Exercice 2 Jeanne veut afficher sur son site web le nombre d'abonnés à sa chaîne YouTube.

Pour cela, elle doit :

Réponses :

A. récupérer les données de son compte YouTube. (bonne réponse)

B. contacter son fournisseur d’accès à Internet.

C. s’abonner à un maximum de réseaux sociaux.

Page 3: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

3 Thème D Séquence 8 Traitement des données

C. Description des activités

Activité 1 p. 61 (voir la correction à la fin du paragraphe)

Capacités attendues :

● Utiliser un site de données ouvertes, pour sélectionner et récupérer des données.

Cette première activité propose de travailler sur de véritables données brutes issues d’un site Open

data français. Le but de l’activité est d’afficher sur une carte de France les emplacements des stations

de recharge pour véhicules électriques. Le jeu de données mis à disposition sur le site

https://www.data.gouv.fr/ est composé de 10 166 entrées en janvier 2020.

Pour cela, un certain nombre d’étapes doivent être respectées :

1. Se connecter sur le site web https://www.data.gouv.fr/.

2. Trouver la ressource que l’on souhaite analyser, puis la télécharger au format CSV.

3. Nettoyer la base de données en ne gardant que les descripteurs pertinents.

4. Renommer si nécessaire certains descripteurs.

5. Repérer d'éventuelles erreurs d'insertion dans la base de données (il peut toujours y avoir des

erreurs de colonne ou de ligne).

6. Sauvegarder les données ainsi préparées.

7. Afficher quelques emplacements sur l’interface LiveCSVMap développée spécifiquement

pour cette activité et disponible à cette adresse : https://cahier-snt.fr/livecsvmap/ ou sur le site

élève (https://lycee.editions-bordas.fr/cahier-SNT).

Question 8 : il est nécessaire que les valeurs de longitude et de latitude des stations aient pour

descripteur respectivement les noms « longitude » et « latitude ». En effet, l’interface LiveCSVMap a

besoin de ces deux mots clés pour fonctionner et afficher des positions. Il en serait exactement de

même avec un site comme OpenStreetMap ou autre.

Question 12 : Après avoir ouvert les données sauvegardées au format CSV avec le Bloc-notes, il est

facile de copier-coller quelques lignes du fichier CSV dans le module LiveCSVMap : instantanément,

les positions s’affichent sur une carte OpenStreetMap de France. Ce module a été spécialement

développé pour géolocaliser des points sur une carte du monde à l’aide de leurs coordonnées (latitude,

longitude). Aucun login ou mot de passe n'est nécessaire, conformément au RGPD.

Le module LiveCSVMap est entièrement réutilisable pour géolocaliser tout point à la surface de la

Terre, si l’on connaît sa latitude et sa longitude. Une proposition de correction est également

directement disponible dans l’interface LiveCSVMap à l’adresse : https://cahier-

snt.fr/livecsvmap/?csv=s8a1 et dans le site enseignant (https://sciences-numeriques.editions-

bordas.fr/cahier-SNT).

Activité 2 p. 62 (voir la correction à la fin du paragraphe)

Capacités attendues : ● Utiliser un site de données ouvertes, pour sélectionner et récupérer des données.

● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.

Page 4: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

4 Thème D Séquence 8 Traitement des données

Tout en sensibilisant l’élève à l’importance de la formation PSC1 (prévention et secours civiques de

niveau 1), cette activité propose d’effectuer des opérations de filtrage sur des données réelles.

En effet, les données présentées sont de véritables données qui ont été communiquées début 2020 par

l'entreprise Staying Alive. Il s’agit de données issues de quelques villes du département des Pyrénées

Orientales. Le jeu de données mis à disposition est composé de 92 entrées.

L’activité vise à illustrer la présence de défibrillateurs autour de nous, il n’est donc pas nécessaire

d’avoir une base nationale complète, ce qui aurait également alourdi le fichier. Il est bien sûr possible

de travailler avec le jeu de données d’une autre ville ou d’un autre département.

Il a été choisi de travailler dans cette séquence avec le logiciel Calc de la suite OpenOffice, accessible

gratuitement. Pour travailler avec Excel ou un autre tableur, quelques adaptations seront sûrement

nécessaires mais la démarche est la même et les formules de calcul seront très similaires voire

identiques.

Cette activité propose de réaliser les opérations suivantes :

● Préparation de la base de données, selon le modèle de l’activité 1 page 61.

● Trier les données par code postal croissant.

● Filtrer les données pour n'afficher que les données de la ville de Perpignan.

● Compter le nombre de DAE (défibrillateurs) de la ville de Perpignan (au 1er janvier 2020).

Il est possible à tout instant de prolonger l’activité en géolocalisant les DAE sélectionnés aux

étapes précédentes : pour cela copier-coller quelques lignes du fichier CSV exporté, (ou

directement depuis le tableur), dans le module LiveCSVMap Afficher quelques emplacements

sur l’interface LiveCSVMap développée spécifiquement pour cette activité et disponible à

cette adresse : https://cahier-snt.fr/livecsvmap/ ou sur le site élève (https://lycee.editions-

bordas.fr/cahier-SNT). Instantanément, les positions s’affichent sur une carte de France

OpenStreetmap. Attention, si on utilise le copier-coller depuis le tableur, le caractère

séparateur ne sera pas la virgule (comme depuis un fichier CSV) mais le caractère « espace » :

la géolocalisation fonctionnera toujours parfaitement mais aucune virgule ne sera affichée, ce

qui pourrait perturber les élèves.

Une proposition de correction est également directement disponible dans l’interface LiveCSVMap

dans le site enseignant (https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse :

https://cahier-snt.fr/livecsvmap/?csv=s8a2.

Activité 3 p. 63 (voir la correction à la fin du paragraphe)

Capacités attendues :

● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.

Cette activité ludique, très ambitieuse et très motivante, illustre la gestion des animaux d’un zoo à

l’aide d’une base de données composée de trois tables. Chaque table possède des informations

spécifiques et le croisement des données issues de plusieurs tables (2 au maximum dans cette activité)

sera parfois nécessaire pour répondre aux questions posées (c’est le cas à la question B).

Page 5: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

5 Thème D Séquence 8 Traitement des données

L’objectif de l’activité est de répondre aux 4 questions suivantes :

A- Comment s'appellent les loups du zoo ?

B- Boubou est-il herbivore ?

C- Quel animal s’est blessé le 12 mai 2017, et comment ?

D- Quelle est l’espérance de vie d‘une tortue d’eau ?

Le fichier à télécharger base_zoo.odb (disponible dans le site élève https://lycee.editions-

bordas.fr/cahier-SNT) contient les 3 tables nécessaires à l'activité. Pour les mêmes raisons que pour le

tableur Calc, nous avons choisi de travailler avec le logiciel Base de la suite OpenOffice. Notons que

cette base peut tout à fait être mise à jour avec de nouvelles entrées de votre choix : arrivée d’un

nouvel animal au zoo, survenue d'une blessure, nouvelle race d'animal accueillie au zoo qui nécessite

un régime alimentaire très particulier, etc.

Le langage SQL est un des langages les plus connus pour extraire des informations d’une base de

données. Cette activité en propose une initiation simple. Le langage SQL est au programme de la

spécialité NSI de la classe de Terminale. SQL est un langage informatique normalisé. Il requiert

l'utilisation de mots clés qui sont présentés dans l’activité, comme SELECT, FROM, WHERE, etc.

Une requête écrite en langage SQL permet de rechercher, d'ajouter, de modifier ou de supprimer des

données dans la base de données.

Attention, avec le logiciel Base :

● Les mots clés (SELECT, etc.) sont écrit en majuscule pour les mettre en évidence mais ce

n’est pas indispensable.

● Les tables sont écrites entre double apostrophe, par exemple "races".

● Les descripteurs sont écrits entre double apostrophe, par exemple "nom" ou "blessure".

● Les chaînes de caractère sont écrites entre simple apostrophe, par exemple 'Loup' ou encore

'12/05/17'.

Voici les requêtes qui permettent de répondre aux questions C et D :

C- Quel animal s’est blessé le 12 mai 2017, et comment ?

D- Quelle est l’espérance de vie d‘une tortue d’eau ?

Une proposition de correction est également directement disponible dans le site enseignant

(https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse : https://cahier-

snt.fr/res/ressources/base_zoo_correction.odb .

Page 6: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

6 Thème D Séquence 8 Traitement des données

Page 7: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

7 Thème D Séquence 8 Traitement des données

Page 8: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

8 Thème D Séquence 8 Traitement des données

Page 9: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

9 Thème D Séquence 8 Traitement des données

D. Description des exercices

Exercice 1 p. 66 (voir la correction à la fin du paragraphe)

Capacités attendues :

● Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables.

L'objectif de cet exercice est d’effectuer des opérations sur une base de données composée de 1 324

emplacements de trottinette de la ville de Paris.

L’élève pourra ainsi successivement :

1. Télécharger le jeu de données au format CSV (disponible dans le site élève

https://lycee.editions-bordas.fr/cahier-SNT).

2. Sélectionner uniquement les descripteurs pertinents et effacer les autres.

3. Calculer le nombre d’emplacements à Paris à l’aide d’une formule de calcul, qui est donnée.

4. Trouver un critère permettant de sélectionner uniquement les emplacements du 15e

arrondissement.

5. Faire de même avec les emplacements du 15e et du 12e arrondissement (nécessité d’employer

l'opérateur logique AND du langage SQL).

6. Afficher les emplacements souhaités sur une carte OpenStreetmap de la ville de Paris, à l'aide

du module LiveCSVMap.

Une proposition de correction est également directement disponible dans l’interface LiveCSVMap

dans le site enseignant (https://sciences-numeriques.editions-bordas.fr/cahier-SNT) et à l’adresse :

https://cahier-snt.fr/livecsvmap/?csv=s8e1.

Exercice 2 p. 63 (voir la correction à la fin du paragraphe)

Capacités attendues :

● Identifier les principaux formats et représentations de données.

Cet exercice propose de découvrir un format structuré de données incontournable : le format JSON. La

prononciation à la française est /ʒi. sɔn/ ou /dʒej. sɔn/ , ou à l'anglaise /ˈdʒeɪˌsən/ , comme Jason

Bourne.

JSON signifie JavaScript Object Notation.

Ce format structuré utilise un enchaînement d’accolades, de doubles apostrophes comme "item", de

crochets et de virgules.

Ce format est organisé selon le modèle "clé" : "valeur".

Notons bien que l’exploitation informatique d’un tel fichier nécessiterait un algorithme de traitement

performant. Par exemple, en Python, le module json est un des modules les plus connus.

Page 10: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

10 Thème D Séquence 8 Traitement des données

Page 11: Thème D : Les données structurées et leur traitement ...€¦ · Identifier les principaux formats et représentations de données. Séquence 7 Exercice 2 page 67 Données structurées

11 Thème D Séquence 8 Traitement des données

Des QCM d’auto-évaluation sont disponibles pour un travail en autonomie de l’élève

à l’adresse : https://cahier-snt.fr/#!/revision/seq8.

Site web avec toutes les ressources pour les élèves : https://lycee.editions-bordas.fr/cahier-SNT.

Site web pour l’enseignant : https://sciences-numeriques.editions-bordas.fr/cahier-SNT.