79
1 Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star........................................................................................................ 1 Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner ................................................................................................. 1 Introduction ............................................................................................................. 1 La question est .................................................................................................... 1 L’idée est ............................................................................................................. 1 Public :................................................................................................................. 2 Présentation du processus : ................................................................................ 2 Projet : ................................................................................................................. 4 Création de la base d’apprentissage....................................................................... 5 Création de la première table intermédiaire....................................................... 16 Création de la table du chiffre d’affaires par produit et par client....................... 24 Création de la table du chiffre d’affaires par mois et par client .......................... 29 Création de la table du chiffre d’affaires par année et par client ........................ 32 Création des colonnes de récence et d’ancienneté ........................................... 36 Création de la colonne Target ........................................................................... 42 Création de la table d’apprentissage ................................................................. 49 Création de la table à scorer ................................................................................. 60 Création d’un modèle de Data Mining ................................................................... 67 Introduction L’objectif général de cette partie est de présenter l’apport de la modélisation pour prédire l’avenir, grâce au Data Mining. La question est : « Comment augmenter les ventes dans la prochaine période creuse ? » L’idée est : Modéliser le profil du client qui achète pendant une période creuse, l’appliquer sur la base de données de l’ensemble des clients et lancer une campagne marketing sur les plus forts potentiels. Cette modélisation sera construite sur et pour, les clients ayant la carte de fidélité Orion Star Gold, client pouvant être relancé par courrier.

Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

1

Le cas Orion Star

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star........................................................................................................ 1 Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner ................................................................................................. 1

Introduction ............................................................................................................. 1 La question est .................................................................................................... 1 L’idée est ............................................................................................................. 1 Public :................................................................................................................. 2 Présentation du processus : ................................................................................ 2 Projet : ................................................................................................................. 4

Création de la base d’apprentissage....................................................................... 5 Création de la première table intermédiaire....................................................... 16 Création de la table du chiffre d’affaires par produit et par client....................... 24 Création de la table du chiffre d’affaires par mois et par client .......................... 29 Création de la table du chiffre d’affaires par année et par client........................ 32 Création des colonnes de récence et d’ancienneté........................................... 36 Création de la colonne Target ........................................................................... 42 Création de la table d’apprentissage ................................................................. 49

Création de la table à scorer ................................................................................. 60 Création d’un modèle de Data Mining................................................................... 67

Introduction L’objectif général de cette partie est de présenter l’apport de la modélisation pour prédire l’avenir, grâce au Data Mining. La question est : « Comment augmenter les ventes dans la prochaine période creuse ? » L’idée est : Modéliser le profil du client qui achète pendant une période creuse, l’appliquer sur la base de données de l’ensemble des clients et lancer une campagne marketing sur les plus forts potentiels. Cette modélisation sera construite sur et pour, les clients ayant la carte de fidélité Orion Star Gold, client pouvant être relancé par courrier.

Page 2: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

2

Public : 1) Pour faire une bonne modélisation, il faut des compétences en : - Informatiques : créer une bonne base de données de Data Mining est un projet beaucoup plus complexe qu’il n’y parait. La modélisation grâce au Data Mining nécessite de très grosses bases de données qu’il faut alimenter par des processus souvent très complexes, stocker et faire vivre. Il est fréquent avec une table de plusieurs millions de transaction et quelques colonnes (3 ~10), de créer une table ayant une seule ligne par client et plusieurs centaines de variables (100 ~ 3000 colonnes). - Statistiques : la modélisation Data Mining utilise massivement des méthodes statistiques et même si la loi des grands nombres facilite largement le processus, elle nécessite des compétences solides en analyse de données. - Métier : Sans la connaissance métier, il est difficile de construire une bonne base de données permettant de faire des modèles performants. Il est primordial d’avoir de l’intuition pour faire de bonne modélisation. C'est-à-dire qu’il est nécessaire d’avoir une vraie culture fonctionnelle pour améliorer la construction des bases de données et pour l’interprétation pratique des résultats. Dans notre cas, la société fictive Orion Star, nous nous concentrerons sur le marketing. Qui mieux qu’une personne du marketing pour rappeler que pour modéliser le comportement d’un client, les variables pertinentes sont souvent récence1, fréquence, montant, âge etc. 2) Etant donné qu’il est rare qu’une seule personne cumule toutes ces compétences, il est fréquent de devoir créer des synergies entre des individus aux univers différents, afin qu’ils travaillent bien ensemble. Ce chapitre s’adresse donc aux trois publics de telle sorte que chacun puisse acquérir un vocabulaire lui permettant une meilleure communication avec les deux autres parties prenantes.

Présentation du processus : Dans le cadre du cas de la société Orion Star, nous somme aujourd’hui le 1 janvier 2003 et l’on souhaiterait modéliser le comportement du client qui achète pendant la prochaine période creuse, c'est-à-dire entre février et mars 2003. Si l’on regarde le chiffre d’affaires total, par mois sur les cinq dernières années, on obtient la courbe suivante :

Courbe du chiffre d’affaires par mois

1 Récence : date depuis le dernier achat.

Page 3: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

3

Globalement, l’activité de la société Orion Star est particulièrement saisonnière avec des sommets l’été et au mois de décembre. Les deux périodes creuses sont février – mars et septembre – octobre – novembre.

La courbe de prévisions des ventes par la méthode d'auto régression pas à pas ci-dessus, nous montre globalement une activité cyclique stable. Remarquons un pic pour l’année 2001 et une petite chute en 2002 mais il n’est pas, après vérification, nécessaire d’introduire un coefficient de proportionnalité pour garder une cohérence chronologique sur l’année à venir, c'est-à-dire que sur les 5 périodes d’historique, rien ne laisse prévoir une hausse ou une baisse significative des ventes. Positionnons-nous un an auparavant, soit au premier janvier 2002, date à laquelle nous connaissons quatre ans d’historique et les ventes sur les mois à venir de février et avril 2002. Nous pouvons alors modéliser le comportement d’un client qui achète dans la prochaine période creuse, le connaissant avec un historique de quatre ans.

Page 4: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

4

Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles, le Data Mart Orion Gold, nous allons maintenant :

1. Créer la base de données d’apprentissage rassemblant un maximum d’information au 1er

janvier 2002, par client : • Cible : est-ce que le client a acheté entre février en mars 2002 • Variables décrivant le client :

i. Sexe ii. Age au premier janvier 2002 iii. Pays iv. Type

• Variables décrivant le comportement d’achat du client du 1er janvier 1998 au 31 décembre 2001 :

i. Quantité de produit achetée en moyenne, par commande, par période de temps, globalement, etc.

ii. Montant des commandes, par période de temps, globalement, etc. iii. Propension à acheter les produits remisés, iv. Type de produit acheté, v. Période d’achat vi. Fréquence des achats vii. Récence des achats viii. Etc.

2. Création de la base de données à scorer, par clients, au 1er janvier 2003. Cette base de

données est quasiment identique à la précédente à la différence qu’il y a • une colonne de moins, la variable cible • L’âge est calculé au 1er janvier 2003 • Et les variables décrivant le comportement d’achat du client, prennent en compte les

quatre ans, du 1er janvier 1999 au 31 décembre 2002. 3. Création de modèle de Data Mining prédictif sur les variables les plus pertinentes 4. Validation, choix du modèle le plus pertinent et calcul du retour sur investissement à priori. 5. Application de ce modèle sur la base de données des clients

Le département « marketing opérationnel » recevra donc une base de données des clients à relancer.

Page 5: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

5

Création de la base d’apprentissage

Ouvrir SAS Enterprise Guide Depuis Démarrer � Programmes � SAS � Enterprise Guide 4

Si cette fenêtre apparaît, sélectionner nouveau projet. Remarque : vous pouvez cocher « ne plus afficher cette fenêtre ».

Si cette fenêtre apparaît, cliquer sur ‘non’ Dans le cadre de ce guide, nous allons utiliser le serveur SAS local.

Page 6: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

6

Bienvenue dans l’application SAS Enterprise Guide. Trois fenêtres principales sont ouvertes par défaut lors de l’ouverture de SAS Enterprise Guide. C’est la fenêtre

• du projet (sur la gauche) qui recense tous les objets du projet • du flux de processus • et celle des tâches (en bas) qui montre l’état d’avancement des tâches.

La fenêtre du projet et celle des tâches peuvent se fermer en cliquant sur ou se rabattre automatiquement si l’on clique sur la punaise qui les fixe. Inversement, si vous souhaitez refixer la fenêtre, cocher la punaise. Si vous avez « perdu » ces fenêtres, dans le menu Affichage, sélectionnez-les. La fenêtre du flux de processus peut être activée en cliquant sur le bouton « conception du processus », (sous le menu « graphique »).

Page 7: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

7

Vous pouvez changer la langue de l’application depuis le menu Outil, dans Options.

Vous ne pouvez sélectionner que les langues dans lesquelles SAS Enterprise Guide a été installé. Ouvrir les tables :

• customer_dim.sas7bdat • order_fact.sas7bdat • product_dim.sas7bdat • time_dim.sas7bdat

Créer la table de synthèse, jointure de ces quatre tables ci-dessus, avec un filtre sur la date ( <= ‘31DEC2001’d) et sélectionner les bonnes colonnes. Ouvrir des données :

Page 8: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

8

Depuis votre poste de travail � répertoire C:\SAS\Orion\Orion_Gold_ssfmt :

Page 9: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

9

Sélectionner les tables Customer_Dim, Order_Fact, Product_Dim et Time_Dim

Créer une requête : Depuis la fenêtre Flux de processus Clique droit sur une table, par exemple sur la table Order_Fact

Cliquer sur « Ajouter des Tables »

Sélectionner depuis le « Projet »

Page 10: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

10

Sélectionner les trois autres tables. Si vous avez créé la requête depuis la table Order_Fact, il faut donc sélectionner les tables Customer_Dim, Protuct_Dim et Time_Dim.

Page 11: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

11

Sélectionner les colonnes comme ci-dessus : ORDER_FACT.Customer_ID CUSTOMER_DIM.Customer_Country CUSTOMER_DIM.Customer_Gender CUSTOMER_DIM.Customer_BirthDate PRODUCT_DIM.Product_Group TIME_DIM.Month_Name TIME_DIM.Year_ID ORDER_FACT.Order_Date ORDER_FACT.Total_Retail_Price ORDER_FACT.CostPrice_Per_Unit ORDER_FACT.Discount ORDER_FACT.Quantity

Page 12: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

12

Dans l’onglet « Filtrer les données »

Glisser la colonne Order_date dans la zone de filtre.

Page 13: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

13

Sélectionner l’opérateur « inférieur ou égal à » Entrer la valeur '31Dec2001'd ou bien 15340, ce qui correspond au nombre de jours entre le premier janvier 1960 et le 31 décembre 2001.

Page 14: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

14

Cette table servira de base à plusieurs requêtes, renommer la « Base » pour plus de lisibilité : Dans ‘Options pour cette requête’,

Changer le nom de la table : cliquer le bouton « Changer ».

Page 15: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

15

Sélectionner la bibliothèque « Work » sur le serveur local. Entrer le nom du fichier « base » Enregistrer OK Exécuter la requête.

Revenir dans la fenêtre Flux de processus.

Page 16: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

16

Création de la première table intermédiaire Clique droit sur la table base � créer une requête

Sélectionner les colonnes : Custommer_ID Customer_Country Customer_Gender Total_retail_price � SUM Total_retail_price � AVG Discount � MAX Discount � AVG

Sélectionner les groupes automatiquement Cliquer sur le bouton « colonnes calculées »

Page 17: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

17

Créer une nouvelle expression

« Non » Calcul de l’âge du client au premier janvier 2002 L’expression de l’âge est une troncature de l’argument (floor) d’une différence de date (dans date et heure) sélectionnez YRDIF. Dans source de données, sélectionnez pour le premier argument la colonne Birth_Date, pour le deuxième argument, 15341, et tapez ‘actual’ pour le dernier. L’expression est donc : FLOOR (YRDIF (BASE.Customer_BirthDate, 15341,'actual')) Soit, en copie d’écran :

Page 18: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

18

Page 19: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

19

Page 20: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

20

Page 21: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

21

OK

Renommer Calculation1 en Age Fermer

Page 22: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

22

Dans les options, changer le nom de la table en « Intermédiaire ».

Sélectionner les lignes distinctes seulement, Exécuter la requête.

Page 23: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

23

Page 24: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

24

Création de la table du chiffre d’affaires par produit et par client Pour créer cette table, depuis la table de base, nous allons créer une table de la somme du chiffre d’affaires par client et par groupe produit, trier par client et par groupe produit. Puis nous allons transposer les produits afin d’avoir une table avec une ligne par client et le chiffre d’affaires par groupe de produit.

Depuis la table base, créer une requête.

Page 25: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

25

Sélectionner les colonnes : Customer_ID Product_Group Total-Retail_Price Sélectionner la somme du chiffre d’affaires Sélectionner les groupes automatiquement

Page 26: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

26

Dans l’onglet « Trier les données » Sélectionner Customer_ID puis Product_Group. Executer

Page 27: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

27

Dans le menu “Données” utiliser la fonction « transposer »

Affecter la somme du chiffre d’affaires à la fonction « transposer les variables ». Affecter le groupe de produit à la fonction « nouveaux noms de colonne » Et Affecter le numéro du client à « grouper l’analyse par »

Page 28: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

28

Désélectionner l’option « utiliser le préfixe ». Exécuter

Nous avons une table avec le chiffre d’affaires par numéro de client en ligne et par groupe de produit en colonne.

Page 29: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

29

Création de la table du chiffre d’affaires par mois et par client

Pour créer cette table, nous allons reprendre le même processus que précédemment ; c'est-à-dire, créer une table de la somme du chiffre d’affaires par numéro de client et par mois et la transposer.

Depuis la table de « base » Créer une requête, de la somme du chiffre d’affaires par mois et par numéro de clients

Page 30: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

30

Trier par numéro de clients et par mois. Exécuter

Transposer la table

Page 31: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

31

Page 32: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

32

Création de la table du chiffre d’affaires par année et par client

Pour créer cette table, nous allons reprendre le même processus que précédemment ; c'est-à-dire, créer une table de la somme du chiffre d’affaires par numéro de client et par année et la transposer.

Depuis la table de « base » Créer une requête, de la somme du chiffre d’affaires par année et par numéro de clients

Page 33: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

33

Trier par numéro de client et par année. Exécuter

Page 34: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

34

Transposer la table

Page 35: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

35

Page 36: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

36

Création des colonnes de récence et d’ancienneté

Créer un nouveau code

Taper le code ci-dessus

Page 37: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

37

Revenir dans la fenêtre du flux de processus et sélectionner le serveur local,

Page 38: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

38

Exécuter le code sur le serveur local

Page 39: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

39

Créer une requête sur la table RECENCE,

Page 40: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

40

Sélectionner les colonnes Customer_ID, récence et ancien, Sélectionner la somme de récence et de ancien Sélectionner les groupes automatiquement Exécuter

Page 41: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

41

Page 42: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

42

Création de la colonne Target

Créer une requête sur la table order_fact

Page 43: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

43

Sélectionner la colonne customer_id Créer une colonne calculée

Nouvelle � Créer une expression

Page 44: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

44

Taper « 1 » OK

Renommer la colonne « Target » Fermer

Page 45: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

45

Page 46: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

46

Dans « filtrer les données », sélectionner la colonne order_date

Page 47: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

47

Créer un filtre de telle sorte que la date soit comprise entre le ‘01Feb2002’d et le ‘30Apr2002’d OK Exécuter la requête

Page 48: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

48

Page 49: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

49

Création de la table d’apprentissage

Depuis la fenêtre du flux de processus, créer une requête sur la table intermédiaire

Page 50: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

50

Ajouter les tables

Depuis le projet

Page 51: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

51

Sélectionner les tables Query_for_recence Query1_for_order_fact Et les trois tables ‘transposées’

Page 52: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

52

Dans l’onglet jointure,

Page 53: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

53

Modifier la jointure entre les tables INTERMEDIAIRE et QUERY1_FOR_ORDER_FACT

Sélectionner toutes les lignes de la table de gauche

Page 54: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

54

Fermer

Page 55: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

55

Sélectionner les colonnes Toutes les colonnes de la table intermédiaire La somme de la récence et de l’ancienneté Pour toutes les tables « transposées » sélectionner toutes les colonnes, sauf les deux

premières, La colonne Target de la table Query1_fro_oder_fact

Page 56: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

56

Renommer toutes les colonnes de tel sorte que leur nom soit un nom qui ne commence pas par un chiffre, soit sans espace et sans caractères spéciaux. Le libellé ne peut contenir de telles choses.

Exemple :

Page 57: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

57

Remarque : Il n’y a alors plus de simple quotte sur le nom. Renommer 2001 en N_1 pour année n moins un 2000 en N_2 1999 en N_3 1998 en N_4

Page 58: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

58

Exécuter

Page 59: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

59

Exporter la table sur l’ordinateur local

Page 60: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

60

Création de la table à scorer

Ouvrir la première requête sur order_fact et modifier le filtre

Filtrer la table sur une date supérieure au ‘01Jan1999’d OK Exécuter la requête

Page 61: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

61

Exécuter la branche à partir de la nouvelle base Il y a des erreurs ! Ouvrir la requête sur la table de base

Page 62: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

62

Modifier l’âge de telle sorte qu’il soit par rapport au premier janvier 2003.

Page 63: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

63

Modifier le code de telle sorte que la récence et l’ancienneté soit par rapport au 31 décembre 2002. Exécuter.

Exécuter la requête qui le suit.

Page 64: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

64

Modifier la requête sur la table intermédiaire

Page 65: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

65

Supprimer les colonnes Target et 1998 (N_4) Renommer dans l’ordre N_3 en N_4, N_2 en N_3, N_1 en N_2, ‘2002’ en N_1 Exécuter la requête

Page 66: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

66

Exporter la table sur l’ordinateur local

Page 67: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

67

Création d’un modèle de Data Mining

Ouvrir SAS 9.1 Dans la fenêtre de gauche, ouvrir les bibliothèques

Créer une nouvelle bibliothèque Clique droit � Nouveau

Page 68: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

68

Donner un nom à la bibliothèque (8 caractères maximum, pas d’espace, pas de caractères spéciaux, ne commençant pas par un chiffre) Sélectionner l’option « Activer au démarrage » Cliquer sur le bouton parcourir

Sélectionner le répertoire Windows où se trouvent les données créée précédemment

OK

Page 69: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

69

Ouvrir la bibliothèque créée en double cliquant dessus.

On doit voir les deux tables orion_train et orion_a_scorer Démarrer SAS Enterprise Miner Solutions � Analyse � Enterprise Miner

Page 70: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

70

Ajouter l’outil « Input data source » L’ouvrir en double cliquant dessus.

Page 71: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

71

Sélectionner la table Orion_train dans la bibliothèque créée

Dans l’onglet « variable », affecter toutes les variables au rôle « Input » Fermer la fenêtre

Page 72: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

72

Ajouter l’outil Replacement. Créer le lien entre la table Orion_train et ce nouvel outil

Page 73: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

73

Dans l’onglet « Default » et dans celui des valeurs constantes, entrer « 0 » pour les valeurs numériques.

Page 74: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

74

Dans l’onglet « interval variables » sélectionner toutes les lignes, Sélectionner la méthode « default constant »

Page 75: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

75

Dans l’onglet « Class Variables » sélectionner les lignes Moyenne_des_remises, Max_des_remises et Target, Sélectionner la méthode « default constant » Fermer la fenêtre

Page 76: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

76

Ajouter l’outil « Data Set Attributes » comme ci-dessus

Page 77: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

77

Dans l’onglet variable, changer le rôle de la variable Customer_ID en ID et celui de la variable Target en Target. Changer le « measurement » de la variable Target en Binary Fermer la fenêtre

Page 78: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

78

Créer le diagramme comme ci-dessus, en changeant les paramètres : Dans le deuxième arbre, sélectionner un arbre avec au maximum 4 branches Dans la régression, sélectionner la méthode de sélection « stepwise » Exécuter le processus

Page 79: Le cas Orion Star Manipulation de données avec …cqcb.mm.free.fr/cours/M2S2/DMDW/SAS/TP Orion.pdf4 Projet : Ayant défini le projet, et connaissant l’ensemble des données disponibles,

79

L’arbre de décision par défaut étant le meilleur,

Créer le diagramme ci-dessus. On obtient dans Insight la liste des clients avec leur probabilité d’acheter dans la prochaine période creuse. On peut alors sélectionner ceux ayant la probabilité la plus forte.