139
Gautier Poupeau [email protected] @lespetitescases http://www.lespetitescases.net Réalisation d’un mashup de données Premier cours

Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Embed Size (px)

Citation preview

Page 1: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Gautier [email protected] @lespetitescaseshttp://www.lespetitescases.net

Réalisation d’un mashup de données

Premier cours

Page 2: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Qu’est-ce-qu’un mashup ?

Tristan Eaton, 4-6 rue du Chevaleret, Paris 13CC-BY https://www.flickr.com/photos/lespetitescases/29003193065/

Un mashup est une œuvre/création originale mise au point à partir de l’assemblage/mise en relation d’œuvres/créations existantes.

Le mot mashup est le plus souvent utilisé pour la musique mais on le retrouve dans les autres arts ainsi que dans le monde numérique lorsqu’on parle de mashup de données.

Page 3: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Objectifs de l’exercice noté

Chaque groupe devra réaliser un mashup de données. Les propositions :

?

Page 4: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

MONUMENTS HISTORIQUESRéutiliser des données en RDF : les mashups

Page 5: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Présentation du projet

• Créer une application à forte valeur ajoutée à partir de sources hétérogènes

• Consolider des données éparses, individuellement faibles pour créer une application riche.

REF DPT COM INSEE TICOPA00078014 10 Aix-en-Othe 10003 Chapelle Saint-AvitPA00078015 10 Aix-en-Othe 10003 Eglise de la NativitéPA00078016 10 Allibaudières 10004 EglisePA00078017 10 Arcis-sur-Aube 10006 Château (ancien)PA00078018 10 Arcis-sur-Aube 10006 EglisePA00078019 10 Arrembécourt 10010 Eglise Saint-EtiennePA00078020 10 Arsonval 10012 EglisePA00078021 10 Auxon 10018 Eglise

REF : PA00088801DPT : 75007ETUD : RecensementimmeublesMHINSEE : 75107TICO : Tour EiffelADRS : Champ-de-MarsSTAT : propriété de la communePPRO : La tour Eiffel : inscription par arrêté du 24 juin AUTR : Eiffel Gustave (maître de l'œuvre)SCLE : 4e quart 19e siècleun fichier .CSV contenant 43 720 enregistrements

de monuments

Objectifs

Source principale

Page 6: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Principes généraux

Maillage et enrichissement avec 6 sources complémentaires : stations de métro, de trains, bases de photos et description de Wikipedia…

Source principale

Sources complémentairesWeb Service degéo localisation

AIFnormalisation et enrichissement

AFSmoteur de recherche

AFS

Application Monuments Historiques

Page 7: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Modèle de données

Page 8: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Création des IHMsLe moteur de recherche pour créer simplement des

applications riches et faciles d’accès

http://labs.antidot.net/widgets/monuments

Page 9: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 10: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 11: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 12: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 13: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 14: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Page 15: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

MUSÉES DE FRANCERéutiliser des données en RDF : les mashups

Page 16: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Présentation du projet

Construire un site agrégeant des informations sur les musées de France

Page 17: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Provenance des jeux de données utilisés

Page 18: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Modèle de données

Musée(data.gouv.fr

)

Musée(data.gouv.fr

)

Musée(MCC)

Musée(MCC)

Musée(Wikidata)Musée

(Wikidata)

Catégo Musée(Commons)

Catégo Musée(Commons)

Musée(BnF)

Musée(BnF)

Livre(BnF)Livre(BnF)

Oeuvre(Wikidata)Oeuvre

(Wikidata)

Artiste(Wikidata)Artiste

(Wikidata)

POI(OSM)POI

(OSM)

Identifiant Museofile

Identifiant Museofile

Nom du musée

Nom du musée

Coordonnées géographiquesCoordonnées

géographiques

Page 19: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Principes généraux d’élaboration

Captation Sémantisation

Alignement Exploitationdu graphe

L’ajout d’un nouveau format d’exposition se limite à l’ajout d’un module dans la chaîne d’exploitation du graphe et à l’écriture du mapping.

Page 20: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Création des IHMsUne page de recherche Une page agrégeant

toutes les données

Page 21: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

PRÉSENTATION DU MASHUP

Page 22: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Jeux de données du mashup

Films sur Wikidata

via sparqlendpoint

Films sur OMDBvia API

Liste des films agréés CNC1996-2015

via data.gouv.fr

Liste des 1er films agréés CNC

2003-2015via data.gouv.fr

Distribution sur Wikidata

via sparqlendpoint

Visa d’exploitationIdentifiant Wikidata

Identifiant Imdb

Titre du film + Année

Page 23: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Développement du Mashup avec Dataiku DSS

DSS (Data Science Studio) est un logiciel édité par la société française Dataiku (http://www.dataiku.com/) qui offre un outil complet pour manipuler des données et les traiter avec des algorithmes de machine learning

Version gratuite et instructions d’installation

http://www.dataiku.com/dss/trynow/

Page 24: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Visualisation du Mashup avec Palladio

Palladio est une application Web du HDALab (http://hdlab.stanford.edu/) de Stanford qui permet de visualiser en quelques clics de souris sous différentes formes (Galerie, Graphe, Carte…) des données historiques en chargeant un ou plusieurs fichiers CSV.

http://hdlab.stanford.edu/palladio/

Page 25: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

RÉCUPÉRATION DES DONNÉES SUR DATA.GOUV.FR

Page 26: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Page d’accueil de data.gouv.fr

Page 27: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Utilisation du moteur de recherche

Page 28: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Liste de résultats de recherche

Page 29: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Premier jeu de données pour le mashup

http://www.data.gouv.fr/fr/datasets/liste-des-films-cinematographiques-agrees/

Page 30: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Second jeu de données pour le mashup

http://www.data.gouv.fr/fr/datasets/liste-des-films-en-premiere-exclusivite/

Page 31: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

CHARGEMENT DES DONNÉES DANS DATAIKU

Page 32: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Page d’accueil de Dataiku

Liste des projets existants

Créer un nouveau projet

Page 33: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Création du projet dans Dataiku

Page 34: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Page d’accueil du projet

Page 35: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Choisir l’origine du jeu de données

Charger un fichier depuis votre disque dur

Page 36: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface de chargement du fichier

Charger le fichier principal du mashup : liste des films agréés CNC 1996-2015 ListeFilmsPremièreExclusivité.xlsx

Page 37: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface de prévisualisation du fichier

Dans ce cas, les données à charger ne sont pas sur la première feuille affichée par défaut.

Les colonnes détectées automatiquement

Format du fichier

Eléments de configuration spécifiques à chaque format

Page 38: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface de prévisualisation du fichier

Ignorer les N premières lignes et indiquer la ligne précédant celle correspondant aux en-têtes de colonnes

Page 39: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface d’exploration du jeu de données

Page 40: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation d’une colonne

Page 41: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Analyse d’une colonne

Page 42: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Regroupement de valeurs proches

Page 43: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Filtrage des données

Page 44: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Liste des jeux de données

Reproduire la procédure en chargeant le fichier : liste des 1er films agréés 2003-2015 production cinématographique - liste des premiers films.xlsx

Page 45: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Affichage du flux de traitement

Les différents types de « recette » de manipulation de données

Page 46: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Synchroniser l’ensemble de données avec un entrepôt de données externe

Page 47: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Préparer les données : nettoyer, rendre cohérent, supprimer des colonnes, rassembler des colonnes…

Page 48: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Mettre au point un échantillon de données

Page 49: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Effectuer une opération d’agrégation : somme, moyenne, min, max, premier, dernier…

Page 50: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Joindre deux ensembles de données : équivalent à un join dans une base de données relationnelle

Page 51: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Séparer un jeu de données

Page 52: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Empiler des jeux de données

Page 53: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Type de recette

Coder une recette avec un langage de programmation : Python, R, Shell, SQL, Scala…

Page 54: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

PRÉPARER LES DONNÉES

Page 55: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface de préparation de données

Ajouter une étapepour traiter les données

Page 56: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Le travail s’effectue sur un échantillon

Quand tous les traitements sont configurés, n’oubliez pas de cliquer sur « Run » pour l’appliquer à tout le jeu de données

Page 57: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Liste des traitements possibles

Page 58: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Filtrer les donnéesFiltrer, repérer ou supprimer des lignes en fonction d’une valeur, d’un intervalle de dates ou de nombres, de la validité de la donnée, de la présence d’une valeur, supprimer des colonnes

Page 59: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Nettoyage de donnéesNormaliser des données de mesure, repérer ou filtrer des données, remplir des cellules vides avec une valeur ou une valeur d’une ligne suivante ou précédente, convertir des nombres…

Page 60: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation de chaînes de caractèresDécouper, transformer (casse, trim, diacritiques, encodage URL, XML…), manipuler une chaîne, exécuter une expression régulière

Page 61: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation de nombresExtraire des nombres, convertir les nombres suivant un format national, convertir une date UNIX, effectuer des opérations entre les valeurs de colonnes, arrondir, convertir une devise

Page 62: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Séparer/extraireSéparer une colonne, extraire avec une expression régulière, séparer une adresse email, extraire une donnée dans une cellule contenant un flux Json

Page 63: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation de logs de serveur WebClasser les user-agent, découper une chaîne HTTP, générer un identifiant de visiteur, trouver le pays d’un internaute à partir de son adresse IP

Page 64: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation des datesAnalyser une chaîne de date, extraire des éléments de date, formater une date, calculer la différence entre deux dates, calcul si le jour est chômé

Page 65: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation de données géographiquesJoindre deux jeux de données par les coordonnées géographiques, géolocaliser (via API externe), changer le système de coordonnées, calculer distance entre deux points, géographie administrative à partir d’une coordonnée géographique…

Page 66: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Enrichir les donnéesEnrichir des données à partir des départements, des codes postaux, jointure entre deux jeux de données, extraire à partir d’une colonne géographique…

Page 67: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Restructurer les donnéesSéparer et générer des lignes, générer des lignes à partir d’un tableau dans une valeur de cellule…

Page 68: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation de longues chaînes Simplifier une chaîne (normalisation, stop words, stemmatisation), « tokeniser » une chaîne, extraire des ngrams, extraire des nombres, compter des occurrences

Page 69: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Jointure de deux jeux de donnéesJointure entre deux jeux de données avec des valeurs de cellules, jointure entre deux jeux de données avec des valeurs approchantes, jointure géographique

Page 70: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Manipulation d’objets complexesExtraire d’un tableau, trier les données d’un tableau, extraire d’un flux Json, concaténer des tableau Json

Page 71: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Exécuter du codeConstruire une formule avec du « pseudo-code », exécuter une fonction python

Page 72: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

DiversConcaténer des colonnes, utiliser une ligne comme en-tête de colonne, copier une colonne, renommer une colonne

Page 73: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

PROBLÈME DE TYPAGEListe_films_2015_1996_CNC

Page 74: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

DSS détecte automatiquement les problèmes de typage

Problème de typage de données

Page 75: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Filtrer les données

Page 76: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

pour sélectionner les données en « erreur »

Page 77: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

et les visualiserDans notre cas, on voit qu’une colonne de type « integer » (entier) contient des valeurs avec des lettres, il est nécessaire de modifier le typage de données.

Page 78: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Modifier le type d’une colonne

Page 79: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Le changement de type a corrigé le problème

Page 80: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

HARMONISER LES VALEURS D’UNE COLONNE

Liste_films_2015_1996_CNC

Page 81: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Analyse des données de la colonne

Page 82: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Répartition des valeurs et valeurs uniques

Page 83: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Regroupement des valeurs proches

Page 84: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Affichage des groupes de valeurs proches

Proposition de valeurs

Sélection des groupes à fusionner

Page 85: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélection des groupes à fusionner

Page 86: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Génération et application d’une étape

Page 87: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

FORMATER DES DATESListe_films_2015_1996_CNC

Page 88: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélectionner le traitement pour analyser les dates

Page 89: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Indiquer le nom de la colonne à traiter

Page 90: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Construire le patron de datesLettre Date ou composant Type de données Exemples

G Era designator Text AD

y Year Year 1996; 96

Y Week year Year 2009; 09

M Month in year Month July; Jul; 07

w Week in year Number 27

W Week in month Number 2

D Day in year Number 189

d Day in month Number 10

F Day of week in month Number 2

E Day name in week Text Tuesday; Tue

uDay number of week (1 = Monday, ..., 7 = Sunday)

Number 1

a Am/pm marker Text PM

H Hour in day (0-23) Number 0

k Hour in day (1-24) Number 24

K Hour in am/pm (0-11) Number 0

h Hour in am/pm (1-12) Number 12

m Minute in hour Number 30

s Second in minute Number 55

S Millisecond Number 978

z Time zone General time zone Pacific Standard Time; PST; GMT-08:00

Z Time zone RFC 822 time zone -0800

X Time zone ISO 8601 time zone -08; -0800; -08:00

Page 91: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Indiquer le patron de la date et générer le résultat dans une nouvelle

colonne

Page 92: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Analyser le résultat du traitement

Certaines lignes sont vides donc le traitement n’a pas fonctionné pour ces lignes

Page 93: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Filtrer pour voir les lignes vides

Le patron est différent pour ces lignes

Page 94: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Ajouter le nouveau patron

Page 95: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Analyser le résultat

Il n’y a plus de ligne vide

Page 96: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Générer le résultat dans la même colonne

Page 97: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Formater la date

Page 98: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Configurer le nouveau patron

Page 99: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

MODIFIER LES VALEURS D’UNE COLONNE

Liste_films_2015_1996_CNC

Page 100: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Analyser les entrées de la colonne

Page 101: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Double-cliquez sur la valeur à modifier

Page 102: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Une nouvelle étape apparaît et s’enrichit au fur et à mesure

Page 103: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Les valeurs sont modifiées dans le tableau

Page 104: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

SUPPRIMER LES ESPACES BLANCS SUPERFLUS

Liste_films_2015_1996_CNC

Page 105: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Certaines colonnes peuvent contenir des espaces blancs en trop

Page 106: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Recherchez le traitement « trim »

Page 107: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélectionnez la colonne à modifier

Page 108: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélectionnez Remove leading/trailing whitespaces

Page 109: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Les espaces blancs superflus sont supprimés

Page 110: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

EXERCICESListe_films_2015_1996_CNC

Page 111: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Effectuez les traitements suivants

• Harmoniser les valeurs de la colonne NATIONALITE• Enlever les espaces entre les slahs de la colonne

NATIONALITE• Harmoniser les valeurs de la colonne DISTRIBUTEUR• Remplacer dans la colonne ART ET ESSAI OUI par true et

NON par false

Penser à sauvegarder !!!

Exécuter sur l’ensemble du jeu de données

Page 112: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

SUPPRIMER DES LIGNES VIDESliste_premiers_films_2015_2003

Page 113: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Repérer les lignes vides

Page 114: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Filtrer pour afficher les lignes vides

Page 115: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Choisir le traitement adapté

Page 116: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Indiquer la ou les colonne(s) à prendre en compte

Page 117: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

AJOUTER UNE COLONNEliste_premiers_films_2015_2003

Page 118: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Choisir le traitement « formula »

Page 119: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Indiquez le nom de la nouvelle colonne

Page 120: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Editez le contenu de la nouvelle colonne

Page 121: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

L’onglet « Reference » indique la liste des fonctions possibles

Page 122: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Dans notre cas, la valeur est toujours la même « true »

Page 123: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

La colonne est créée

Page 124: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

SUPPRIMER UNE COLONNEliste_premiers_films_2015_2003

Page 125: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélectionner le traitement adapté

Page 126: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Indiquer le nom de la colonne à supprimer

Page 127: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

ou des colonnes à supprimer

Page 128: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

EXERCICESliste_premiers_films_2015_2003

Page 129: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Modifier le type de VISA et corriger l’erreur de DEVIS

Page 130: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Le jeu de données est prêt

Le type doit correspondre à celui de l’autre jeu de données pour effectuer la jointure

Page 131: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

RELIER DEUX JEUX DE DONNÉES

Page 132: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélectionner la recette de jointure

Page 133: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Déterminer les jeux de données impliqués

Page 134: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Interface de la recette de jointure

Page 135: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Choix du type de jointure

Page 136: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Choix des colonnes à joindre

Page 137: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélection des colonnes

Attention ! Les champs à joindre doivent avoir être du même type de données !!

Page 138: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Sélection des colonnes à conserver

Exécuter la jointure

Page 139: Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Visualisation du « flow »