25
Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES PROC FREQ – PROC TABULATE M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE Université Paris 1 Panthéon Sorbonne 1

Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

Chapitre 2LES TABLEAUX CROISESSIMPLES ET AVANCES

PROC FREQ – PROC TABULATE

M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE Université Paris 1 Panthéon Sorbonne

1

Page 2: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

Sommaire

2M. WILTHIEN - Applications SAS – 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 3: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

3M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

I – Les tableaux croisés simples- La PROC FREQ

Sommaire

Page 4: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ

➢ 1- La syntaxe

PROC FREQ < options > ;

BY variables ;

TABLES définition des tables à construire

< / options > < OUT=SAS-data-SET > ;

WEIGHT variable ;

RUN;

4M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 5: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ

➢ 2- Les options

DATA= Spécifie la table SAS à utiliser.

COMPRESS Force SAS à mettre ces différents tableaux sur une seule page.

FORMCHAR= Spécifie les caractères à utiliser pour définir les cases des tableaux.

NOPRINT Demande à ce qu’il n’y ait pas d’impression dans la fenêtre SORTIE.

ORDER= Spécifie l’ordre dans lequel doivent apparaître les modalités :

ORDER=DATA Demande à SAS de produire des tableaux dans lesquels les modalités apparaîtront dans l’ordre dans lequel elles apparaissent dans la table.

ORDER=FORMATTED Ordonne les données en fonction des FORMAT.

ORDER=FREQ Ordonne les modalités en ordre décroissant de leur fréquence.

ORDER=INTERNAL Valeur par défaut : les modalités des variables numériques sont présentées dans un ordre croissant (ordre alphabétique pour les variables alphanumériques).

PAGE Produit un tableau par page.

5M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 6: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ

• Exemples : Les tableaux de fréquences simples ou complexes

- Exemple 3.0 : Importer le fichier cinema.csv

- Exemple 3.1 : Sans option ni instruction (hormis l’option data)

- Exemple 3.2 : Sur une seule variable (sexe)

- Exemple 3.3 : Sur un seul croisement (sexe et type)

Ajouter des formats suivants sur les variables Age, cinema et sexe

- Exemple 3.4 : Tableau de fréquences pour les variables age, cinema et sexe.

- Exemple 3.5 : Fréquences des croisements suivants : age et sexe, age et cinema, age et type (trois tableaux différents) Pour cela utiliser les signes : () et/ou *

6M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 7: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ

• Exemples : Les options tableaux de fréquences

- Exemple 3.6 : A l’aide des options correspondantes, retirer les pourcentages colonnes, les pourcentages lignes et les pourcentages indiquant la part dans la population totale, et afficher les fréquences du croisement age et sexe.

A quoi sert l’option NOFREQ ? A quoi sert l’option NOCUM ?

- Exemple 3.7 : A l’aide d’une instruction spécifique, calculer les fréquences du croisement age et cinema, pour les différentes sous-populations de la variable sexe (2 tableaux différents).

- Exemple 3.8 : Sans trier la table au préalable, obtenez le même résultat.

Que remarquez vous ?

- Exemple 3.9 : Creér une table temporaire contenant des valeurs manquantes, que remarquez vous si vous analyser le croisement age*cinema ? Utiliser l’option MISSING dans l’instruction TABLES pour traiter les valeurs manquantes comme des modalités.

7M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 8: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ

• Exemples : Les sorties SAS des tableaux de fréquences et les filtres sur les données

- Exemple 3.10 : A l’aide de l’option OUT= dans l’instruction TABLES, envoyer dans une table SAS le résultat du croisement des variables age et cinema.

Résultat attendu :

- Exemple 3.11 : Dans une même procédure, générer 2 tables de sorties, une pour le croisement type et sexe, et une pour le croisement type et age.

- Exemple 3.12 : A l’aide d’une instruction spécifique, analyser le croisement type*cinema uniquement pour les femmes de moins de 50 ans.

8M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 9: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

I – Les tableaux croisés simples- La PROC FREQ• Exemples : Les graphiques

- Exemple 3.13 : Créer un graphique pour l’age et un graphique pour le cinéma dans une seule procédure, représentant les fréquence d’apparition des modalités

- Exemple 3.14 : Créer un graphique pour le croisement age*cinema

9M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

Page 10: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

10M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

II – Les tableaux croisés avancés - PROC TABULATE

Sommaire

Page 11: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

11M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 1- La syntaxe

PROC TABULATE < liste-option > ;

CLASS liste des variables de classification ;

VAR liste des variables analysées ;

TABLE <<expression-page, > expression-ligne, > expression-colonne < /

liste-option-table >;

BY variables ;

FREQ variable ;

KEYLABEL mot-clé-1='description-1' < ...mot-clé-n='description-n' > ;

WEIGHT variable;

RUN ;

Page 12: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

12M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

• Les options

DATA=table-SAS Spécifie la table utilisée. Si DATA= est omis, SAS utilise la dernière table créée.

FORMAT=w.d Spécifie la largeur des cellules et le nombre de décimales. Si FORMAT= est omis, FORMAT=BEST12.2

MISSING Cette option permet de maintenir dans le tableau l’observation dont la modalité d’une variable de classification est manquante. Une ligne ou une colonne MISSING sera ajoutée.

ORDER=ordre Spécifie l’ordre d’affichage des en-têtes lignes ou colonnes pour les modalités des variables de CLASS.

ORDER=DATA Ordre d’apparition dans les données

ORDER=FORMATTED Ordre selon les FORMAT

ORDER=FREQ Ordre par fréquences décroissantes

ORDER=INTERNAL Ordre selon les valeurs internes (défaut)

Page 13: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

13M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

• Les statistiques générées

CSS

CV

MAX

MEAN

MIN

N

NMISS

PCTN

PCTSUMPRT RANGE STD STDERR SUM SUMWGT USST VAR Variance

Page 14: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

14M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 3- Les structures lignes-colonnes des tableaux(travail sur la table VENTES, à la quelle on va ajouter des formats avant toute manipulation)

- Exemple 4.1.0 : Importer la table VENTES et créer les 4 formats suivants :

- Exemple 4.1.1 : Tableau simple pour la variable region (instructions CLASS et TABLE obligatoires)

- Exemple 4.1.2 : Tableau simple pour la variable region et la variable produit (plusieurs variables en colonnes)

- Exemple 4.1.3 : Tableau croisé pour région et produit (instruction TABLE à modifier)

- Exemple 4.1.4 : Ajouter le croisement taille et produit à la sortie précédente (nouvelles lignes sous les régions)

- Exemple 4.1.5 : Ajouter les croisement des variable région et produit avec la variable client (nouvelles colonnes à côté des produits)

- Exemple 4.1.6 : Pour chaque modalité de la variable REGION, nous souhaitons avoir les différentes modalités de TAILLE, le tout croisé avec le Produit.

Page 15: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

15M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 4- Les variables d’analyse

- Exemple 4.2.1 : Utiliser l’instruction VAR pour définir l’analyse sur les ventes (nombre d’unités de biens vendus) et le chiffre d’affaires, avec une classification par produit.

- Exemple 4.2.2 : Enrichir ce tableau avec une seconde variable de classification CLIENT

- Exemple 4.2.3 : Imbriquer les variables de sorte à obtenir le tableau suivant :

Page 16: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

16M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

- Exemple 4.2.4 : Créer un tableau dans lequel : les produits sont présentés en lignes

et les clients sont présentés en colonnes.

À l’intérieur du tableau, la somme des ventes est indiquée.

- Exemple 4.2.5 : Créer le tableau suivant :

- Exemple 4.2.6 : Créer le tableau final suivant ----------------------> :

Page 17: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

17M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 5- Choix de la statistique éditée dans le tableau

- Exemple 4.3.1 : Editer statistiques MIN, MEAN et MAX pour la variable VENTES pour le croisement de la région par client.

- Exemple 4.3.2 : Sur le même modèle, éditer les statistiques SUM et MEAN pour les ventes. Comment faire apparaitre le résultat avec 2 décimales pour la somme et la moyenne

- Exemple 4.3.3 : Comment obtenir le tableau suivant :

Page 18: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

18M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 6- L’introduction de récapitulatif dans le tableau

Partons de ce tableau :

PROC TABULATE DATA=ventes F=7.;

CLASS region taille produit;

VAR vente ca;

TABLE region*taille, produit*(ca vente);

RUN;

A l’aide du mot ALL :

- Exemple 4.4.1 : Ajouter le total global en bas du tableau.

- Exemple 4.4.2 : Ajouter les sous totaux pour les modalités de région et taille

Page 19: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

19M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

➢ 7- L’introduction de pourcentage dans les tableaux

Options : PCTSUM, REPPCTSUM (pourcentage cellule), COLPCTSUM (pourcentage colonne), ROWPCTSUM (pourcentage ligne)

- Exemple 4.5.1 : A partir du tableau simple suivant, ajouter le pourcentage que représentent les ventes par région et toutes régions confondues.

Page 20: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

II – Les tableaux croisés avancés - PROC TABULATE

20M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

A partir du tableau simple suivant :

- Exemple 4.5.2 : Ajouter les pourcentages lignes (somme en lignes égale à 100)

- Exemple 4.5.3 : Ajouter les pourcentages calculés sur le tableau (pourcentage cellule)

- Autres options : REPPCTN, COLPCTN, ROWPCTN et PAGEPCTN

Page 21: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

21M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

III - EXERCICES

Page 22: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

V – Les exercices

22

• EXERCICE 1 : Tableaux croisés simples

A l’aide d’une seule procédure, créer les 3 sorties suivantes pour la table COLOR

2 sorties HTML : 1 table SAS :

Page 23: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

V – Les exercices

23

• EXERCICE 2 : Graphiques dans les tableaux croisés simples

En plus de l’exercice précédent, ajouter les graphiques suivants à votre procédure.

Page 24: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

V – Les exercices

24M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

• EXERCICE 3 : Tableaux croisés avancés

A l’aide de la PROC TABULATE, générer le tableau suivant à partir de la table ENERGY :

Page 25: Chapitre 2 LES TABLEAUX CROISES SIMPLES ET AVANCES

V – Les exercices

25M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE

Université Paris 1 Panthéon Sorbonne

• EXERCICE 4 : Tableaux croisés avancés

Générer le tableau suivant :

Bonus: Renommer les colonnes pour avoir le tableau suivant :