21
MTI820 Entrepôts de données et intelligence d’affaires Présentation du cours Hiver 2020 Jean-François Gailleur Département de génie logiciel et des TI MTI820 – C. Desrosiers 1

MTI820 Entrepôts de données et intelligence d’affaires · 2020-02-02 · The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rdEdition, Wiley; –Ralph

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

MTI820 − Entrepôts de données et intelligence d’affaires

Présentation du cours

Hiver 2020

Jean-François Gailleur

Département de génie logiciel et des TI MTI820 – C. Desrosiers 1

Informations de base

Département de génie logiciel et des TI MTI820 – C. Desrosiers 2

Titre: MTI820 – Entrepôts de données et intelligence d’affaires

Chargé de cours: Jean-François Gailleur

Professeur responsable:

Christian Desrosiers

Préalable: Aucun, mais cours de BD recommandé

Crédits: 3

Horaire (cours): Jeudi 18h à 21h30, en salle D-4023

Tutoriel/TP/Projet: 20h à 21-30 Salle A-3326 (a partir de la séance #5)

Contacts• Pour me rejoindre:– Courriel : [email protected]

• Remises:– Courriel : [email protected]– Sujet: Remise: Nom étudiant(s) et nom du TP/Projet

Département de génie logiciel et des TI MTI820 – C. Desrosiers 3

Objectifs du cours

1. Comprendre les concepts de l’intelligence d’affaires et des entrepôts de données, et saisir la différence entre les systèmes transactionnels et les systèmes analytiques;

2. Comprendre les différentes phases d’un projet d’intelligence d’affaires;

3. Appliquer les concepts du cours sur un projet d’intelligence d’affaires au choix.

Département de génie logiciel et des TI MTI820 – C. Desrosiers 4

PlanificationSéance Description Dates

(Hiver 2020)1 Introduction à l’intelligence d’affaires 9 janv. 20202 Cycle de vie d’un projet en intelligence d'affaires 16 janv. 20203 Spécifications informationnelles et l’analyse des besoins 23 janv. 20204 Tutoriel #1 18h à 20h, salle A-3326 30 janv. 20205 Modélisation dimensionnelle des données 6 févr. 20206 Architectures d’entrepôts de données, Tutoriel #2 13 févr. 2020

7 Intégration des données et l’architecture de traitement ETL , Tutoriel #3 20 févr. 2020

8 Implémentation et conception physique, TP #2 27 févr. 20209 Applications d'intelligence d'affaires, TP #2 5 mars 2020

10 Analyse prédictive et forage de données 12 mars 202011 Gouvernance des données 19 mars 202012 Séance libre pour projet 26 mars 202013 Remise projet et Présentations orales 2 avr. 2020

Final Entre le 8 et le 22 Probablement le 9 avr. 2020Département de génie logiciel et des TI MTI820 – C. Desrosiers 5

Références• Manuel (obligatoire):

– Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite (2013). The Data Warehouse Lifecycle Toolkit, 3rd Edition, Wiley.

• Complémentaires:– Ralph Kimball, Margy Ross (2008). The Data Warehouse Toolkit: The Definitive

Guide to Dimensional Modeling, 3rd Edition, Wiley;

– Ralph Kimball, Joe Caserta (2004). The Data Warehouse ETL Toolkit: PraticalTechniques for Extracting, Cleaning, Conforming and Delivering Data, Wiley.

– Lawrence Corr, Jim Stagnitto (2013). Agile Data Warehouse Design, Collaborative Dimensional Modeling, from Whiteboard to Star Schema, Decision 1 Press.

– Efraim Turban, Ramesh Sharda, Dursun Delen, David King (2018). Business Intelligence, Analytics and Data Science: A Managerial Perspective, 4th Edition, Pearson.

Département de génie logiciel et des TI MTI820 – C. Desrosiers 6

Lectures avant le coursSéance Description Lectures Kimball

1 Introduction à l’intelligence d’affaires

2 Cycle de vie d’un projet en intelligence d'affaires ch. 1, 23 Spécifications informationnelles et l’analyse des besoins ch. 3 5 Modélisation dimensionnelle des données ch. 6, 7 6 Architectures d’entrepôts de données ch. 4, 5

7 Intégration des données et l’architecture de traitement ETL ch. 9, 10

8 Implémentation et conception physique ch. 8

9 Applications d'intelligence d'affaires ch. 11, 12

10 Analyse prédictive et forage de données ch. 1111 Gouvernance des données

12 Séance libre pour projet

13 Présentations orales

Département de génie logiciel et des TI MTI820 – C. Desrosiers 7

Copie gratuite du manuel (Books24x7)

• Aller sur le site de la bibliothèque:– http://bibliotheque.etsmtl.ca/

Département de génie logiciel et des TI MTI820 – C. Desrosiers 8

Copie gratuite du manuel (Books24x7)

• Pour configurer le proxy:– www.etsmtl.ca/Bibliotheque/Infos-generales/Renseignements-utiles/Acces-hors-campus

Département de génie logiciel et des TI MTI820 – C. Desrosiers 9

Site Web du cours

Département de génie logiciel et des TI MTI820 – C. Desrosiers 10

Évaluations

Département de génie logiciel et des TI MTI820 – C. Desrosiers 11

Type Pondération

Travail pratique #1 (Remise avant la séance #9, le 5 mars) 10 %

Travail pratique #2 (Remise avant la séance #12, le 26 mars) 10 %

Travail pratique #3 (Remise avant la séance #13, le 2 avril) 5 %

Proposition de projet (Remise avant la séance #6, le 13 février) 5 %

Rapport de projet (Remise avant la séance #13, le 2 avril) 25 %

Présentation orale (séance #13, le 2 avril) 10 %

Examen final (à confirmer, probablement le 9 avril) 35 %

Note: Consultez les barèmes de corrections sur le site du cours pour plus d’information sur l’évaluation des rapports et présentations orales.

Projet de cours

• En équipe de 3 à 4 étudiants

• Données privés et/ou publiques (open data)

• Limitez clairement le scope

• Exemples de sujets:

– La comparaison d’outils d’intelligence d’affaires pour un problème particulier;

– L’application de l’intelligence d’affaires dans un contexte donné (ex : le domaine de la santé, le Web, etc.);

– Le développement d’une application de forage de données ou d’analyse prédictive;

– Une nouvelle tendance de l’intelligence d’affaires (ex : infonuagique, temps-réel, réseaux sociaux, etc.).

Département de génie logiciel et des TI MTI820 – C. Desrosiers 12

Exemples de projets réalisés en 2019

• Système décisionnel de recommandation de logement à Montréal

• Analyse de la criminalité à Denver

• Étude pour l'identification des besoins en gestion des infrastructures de l’aéroport de San-Francisco

• Analyse des impacts socio-demographique sur la réussitescolaire en France

Département de génie logiciel et des TI MTI820 – C. Desrosiers 13

Exemples de projets réalisés en 2018

• Tableau de bord des retards pour un aéroport

• Identifier les emplois en demande à partir des données du site Monster

• Mois et jours les plus populaires de l’utilisation des Bixi à Montréal

Département de génie logiciel et des TI MTI820 – C. Desrosiers 14

Exemples de projets réalisés en 2017

• Étude des solutions d’intelligence d’affaires dématérialisées (cloud business intelligence)

• Solution SSIS pour analyser le trafique de Montréal à partir des données ouvertes

• Application d'intelligence d'affaires pour le sport

• Système de recommandation de films

• IntelliPlaza - Système analytique pour la banque Plaza

• Tableau de bord temps-réel pour mesurer la performance d’un centre de prélèvement et d’analyse à l’Hôpital Juif

Département de génie logiciel et des TI MTI820 – C. Desrosiers 15

Proposition de projet• Au plus tard la séance #6 (13 février 2020)• Document de 5 à 10 pages contenant:

– Une présentation de la problématique et des objectifs du projet;

– Sponsor/client et la valeur commerciale (Business Value);

– Une description détaillée mais concises de la méthodologie proposée pour le projet (ex : données utilisées, étapes de réalisation, outils envisagés, etc.);

– Un calendrier de planification spécifiant les dates des différents jalons et la répartition des tâches;

– Une proposition de table des matières détaillée pour le rapport final;

– Une liste d’au moins cinq (5) références pertinentes au projet.

Département de génie logiciel et des TI MTI820 – C. Desrosiers 16

Présentation orale• Séance #13 du cours (2 avril 2020);• Résume les principaux éléments du projet;• Chaque coéquipier a 5-10 minutes pour présenter sa partie;• Une période de questions de 5 minutes à la fin;• Critères d'évaluation:– La qualité et la pertinence du contenu;– La qualité de la recherche et des références;– La qualité visuelle de la présentation;– L’intérêt suscité dans la classe.

Département de génie logiciel et des TI MTI820 – C. Desrosiers 17

Rapport de projet• Remis à la séance #13 (2 avril 2019)• Document de 20 à 30 pages contenant selon le projet:– Analyse des besoins;– Modèle dimensionnel des données; – Plan d’architecture haut niveau de la solution proposée;– Description des technologies employées;– Revue de littérature pertinente;– Exemples d’utilisation de la solution développée (ex :

captures d’écran, rapports, tableaux de bord, etc.);– Résultats sous forme de tableaux et/ou de graphiques.– etc.

Département de génie logiciel et des TI MTI820 – C. Desrosiers 18

Tutoriels

• Démonstration des outils de la gamme Business Intelligence de Microsoft SQL Server 2016 (SSIS, SSAS et SSRS)

• Basés sur les tutoriels de Microsoft utilisant la base de données Adventure Works

• Réalisés dans la deuxième moitié de la période

– Trois tutoriels, deuxième moitié, séances #6, #7, #8

– Local A-3326 ou à distance (réseau/VPN)

– 9 Machines Virtuelles en plus de celle du chargé de TP

Département de génie logiciel et des TI MTI820 – C. Desrosiers 19

Travaux• En équipe de 3 à 4 étudiants

• Travail pratique 1 – Analyse des besoins et modélisation dimensionnelle pour un cas donné.

– À remettre avant la séance #9 (5 mars).

• Travail pratique 2 – Développement d’un ETL avec l'outil SSIS de SQL Server 2016

– À remettre avant la séance #12 (26 mars).

• Travail pratique 3 – Création de cubes de données et de modèles de forage de données avec

l'outil SSAS de SQL Server 2016.

– À remettre avant la 13ème séance de cours (2 avril).

Département de génie logiciel et des TI MTI820 – C. Desrosiers 20

Politiques et règlements• Plagiat et fraudes:– Le Règlement des études de cycles supérieurs, ch. 8;– Le guide Citer pas plagier.

• Absence à un examen:– Justifier dans les 5 jours ouvrables ou note 0;– Motifs majeurs (ex: maladie certifiée par un billet de

médecin, décès d’un parent immédiat, etc.)• Retards dans les remises:– Retard 0 h < X <= 24 h : perte de 10 %;– Retard 24 h < X <= 48 h : perte de 20 %;– Retard 48 h < X <= 72 h : perte de 30 %;– Retard 72 h < X <= : perte de 100 % .

Département de génie logiciel et des TI MTI820 – C. Desrosiers 21