12
Réinventez votre parcours analytique grâce à la découverte des données en libre-service et à l’analyse prédictive interactive Livre blanc

Bi analytiques prédictives de sas

Embed Size (px)

Citation preview

Page 1: Bi analytiques prédictives de sas

Réinventez votre parcours analytique grâce à la découverte des données en libre-service et à l’analyse prédictive interactive

Livre blanc

Page 2: Bi analytiques prédictives de sas

ContentsDécouverte des données en libre-service et analyse prédictive interactive ......................................................1

Quels sont les véritables besoins de votre entreprise ? ............................................................1

La convergence idéale : SAS® Visual Analytics et SAS® Visual Statistics® ..................................................... 2

Interactivité et convivialité ...................................................2

Exploration et visualisation des données en libre-service ............................................................................2

Analyse descriptive et prédictive performante ..............3

Regroupement dynamique ................................................5

Architecture en mémoire : du traitement par lots à l’analyse prédictive rapide et interactive ..........................5

Multipliez les possibilités de votre entreprise ............6

Analystes marketing .............................................................6

Analystes risques financiers ................................................6

Ingénieurs ...............................................................................6

Un duo efficace pour la modélisation exploratoire en une étape ....................................................................8

Détail du processus ..............................................................8

Récapitulatif des solutions .............................................8

À quoi sert SAS® Visual Analytics? .....................................8

À quoi sert SAS® Visual Statistics? ......................................8

Conclusion ........................................................................9

Page 3: Bi analytiques prédictives de sas

1

Découverte des données en libre-service et analyse prédictive interactive Pourquoi la convergence de l’exploration des données en libre-service et de l’analyse prédictive interactive est-elle si importante ? Quel est son intérêt pour votre entreprise ?

Songez à ce que vous utilisez quotidiennement en libre-service. Des pompes à essence aux distributeurs automatiques en passant par les applications d’échanges boursiers, d’opérations bancaires et d’achat en ligne, tous affichent les mêmes ambitions : être plus pratiques pour les consommateurs et moins coûteux pour les fournisseurs. Chacun choisit ce qu’il veut, quand il en a envie et de manière totalement autonome.

Le principe est le même pour l’exploration des données en libre-service et les outils analytiques à portée de tous. Les utilisateurs veulent explorer eux-mêmes les données et trouver leurs réponses – quand, où et comme bon leur semble – sans devoir demander des données ou des rapports au service informatique. C’est ce que proposent des applications aussi courantes que Fitbit ou l’Apple Watch™. Les utilisateurs sont en quête d’informations qu’ils peuvent rechercher, consulter et utiliser sans l’aide de personne.

Lorsque cette possibilité leur est donnée – qu’il s’agisse de combiner son apport calorique aux résultats d’un programme de fitness prometteur, d’analyser au bureau la chute des ventes hebdomadaires, ou d’étudier un rapport sur un terminal mobile dans un aéroport – ils peuvent alors prendre de meilleures décisions (ne pas prendre de croissant à l’aéroport, par exemple).

Mais il ne s’agit pas simplement de découvrir ce qu’il s’est passé et pour quelles raisons. Il est aussi question d’avenir. L’analyse prédictive interactive ajoutée à la structure organisationnelle de l’entreprise permet aux décideurs et aux utilisateurs des données de tirer des enseignements du passé pour découvrir des informations sur l’avenir.

Par ailleurs, associer l’analyse prédictive interactive à la découverte des données en libre-service permet aux statis-ticiens et autres spécialistes d’explorer les relations entre les données avant de se plonger dans la création et la mise au point de modèles. Ils peuvent tester rapidement différentes données et techniques selon un processus itératif pour repérer le modèle produisant la meilleure réponse. Une fois satisfaits, ils explorent les résultats de la modélisation en collaboration avec des analystes métier, à partir d’un environnement commun. Le meilleur modèle identifié peut ensuite être mis en production ; il suffit de l’intégrer dans des applications opérationnelles et de procéder au scoring de nouvelles données pour produire plus rapidement des informations à valeur ajoutée.

Quels sont les véritables besoins de votre entreprise ? Aujourd’hui, les entreprises continuent de considérer les outils analytiques comme une priorité en matière de technologie. Elles sont en effet de plus en plus nombreuses à prendre conscience que l’analyse – notamment prédictive – est un facteur de croissance et d’innovation, et au final, d’avantage concurrentiel.

Pourtant, malgré les progrès technologiques, nombre d’entre elles ont encore du mal à intégrer l’approche décisionnelle et analytique dans leur culture, en particulier auprès des salariés dépourvus de ces compétences analytiques.

Quels outils leur permettraient de répondre à la demande croissante d’analyses plus rapides et plus précises, d’exploration interactive des données et de véritable business intelligence ? De quoi ont-elles besoin pour mettre la puissance analytique à la portée du plus grand nombre ?

Selon l’analyste Gartner, la convivialité doit être le premier point d’une solution d’exploration et d’analyse de données en libre-service. Une étude Gartner a d’ailleurs révélé que 41 % des entreprises citent ce critère parmi les trois principales caractéris-tiques recherchées au moment de choisir une plate-forme analytique. La convivialité est d’autant plus importante que les

1 Gartner. “Survey Analysis: Customers Rate Their Advanced Analytics Platforms (G00270213) “, 28 Octobre 2014.

Page 4: Bi analytiques prédictives de sas

2

utilisateurs de ces plates-formes ne se limitent plus au groupe restreint des statisticiens et data scientists : différents analystes métier et experts quantitatifs sont concernés, comme des analystes marketing ou financiers, par exemple. 31 % des personnes interrogées attachaient également de l’importance à la rapidité de développement des modèles1.

Ainsi, trois facteurs se dégagent pour les entreprises souhaitant fournir à leurs utilisateurs la valeur contenue dans les données :

Interactivité et convivialité pour les utilisateurs de tous niveaux.

Outils d’analyse prédictive perfor-mants et résultats exploitables.

Architecture capable de gérer les big data et la rapidité requise.

La convergence idéale : SAS® Visual Analytics et SAS® Visual Statistics®

SAS est porteur de bonnes nouvelles. Les fonctionnalités indispensables pour obtenir le nec plus ultra de la découverte des données en libre-service et de l’analyse prédictive sont à présent disponibles. SAS Visual Analytics offre une expérience hautement interactive, associant des outils avancés de visualisa-tion des données à une interface conviviale et une technologie en mémoire rapide. Même les utilisateurs aux profils non tech-niques peuvent analyser eux-mêmes les données, créer des visualisations et partager des résultats de manière dynamique. SAS Visual Statistics est un module complémentaire intégré à SAS Visual Analytics, dont les fonctions de modélisation interac-tive décuplent la puissance d’analyse prédictive.

Ces dernières sont accessibles depuis l’interface utilisateur commune de SAS Visual Analytics. Les utilisateurs peuvent ainsi explorer les données de manière interactive et créer des

modèles à partir d’un seul et même environnement convivial. L’association de ces deux solutions produit une plate-forme aux multiples atouts :

• Interactivité et convivialité.

• Exploration et visualisation des données en libre-service.

• Analyse descriptive et prédictive performante.

• Regroupement dynamique.

• Architecture en mémoire pour des résultats plus rapides.

Examinons de plus près chacune de ces caractéristiques.

Interactivité et convivialité La convivialité comme critère de sélection principal d’une plate-forme analytique avancée n’a rien de surprenant. L’environnement doit en effet être interactif et accessible pour que les non-techniciens puissent explorer les données et trouver leurs réponses eux-mêmes.

SAS Visual Analytics et SAS Visual Statistics partagent la même interface web, ce qui permet de parcourir visuellement les données à la volée, de repérer des schémas, de réaliser des analyses prédictives et d’en tirer rapidement des enseigne-ments. Les puissantes techniques d’apprentissage automatique et de modélisation statistique de SAS sont en outre accessibles par simple « pointer-cliquer ». Ces techniques peuvent être utili-sées pour créer et perfectionner des modèles à partir de données, quel qu’en soit le volume, afin de prévoir des résultats en un temps record, de prendre de meilleures décisions et de cibler les actions.

Grâce aux outils intégrés de création de modèles et de décou-verte visuelle des données, les analystes et data scientists tirent profit de processus de travail ininterrompus en passant rapide-ment de l’hypothèse à la vérification. Ces fonctionnalités améliorent le développement de modèles, la productivité et la précision pratiquement en temps réel.

Exploration et visualisation des données en libre-service SAS Visual Analytics permet aux utilisateurs de découvrir, d’explorer et d’analyser des données stratégiques sans aucune aide, puis de partager à d’autres leurs tableaux et graphiques dynamiques. Ils peuvent ainsi :

• Utiliser des fonctions de représentation graphique automa-tique et des techniques de visualisation des données attray-antes pour découvrir rapidement des relations intéressantes entre les données.

Page 5: Bi analytiques prédictives de sas

3

• Identifier les principales variables et valeurs aberrantes ayant une incidence sur les résultats qu’ils tentent de prévoir.

• Filtrer les données de manière interactive, formater des variables, ajouter des colonnes calculées ad hoc et créer des hiérarchies dynamiques sans structures de données prédéfinies.

Analyse descriptive et prédictive performante SAS Visual Statistics complète parfaitement SAS Visual Analytics avec des fonctions analytiques élaborées. Ce binôme permet de créer des modèles descriptifs et prédictifs de manière inter-active, qui peuvent ensuite être ajustés en quelques secondes dans le but d’identifier celui produisant les meilleurs résultats et ce, pratiquement en temps réel. SAS Visual Analytics peut être utilisé avant de développer des modèles – pour explorer des données – et après – pour analyser les résultats –, ce qui contribue à réduire les temps de latence lors du processus itératif de développement de modèles.

Modélisation descriptive

Les techniques de classification segmentent les données aux caractéristiques similaires pour vous permettre de distinguer des groupes en fonction de leurs particularités (voir Figure 1). Par exemple, la segmentation de marché classe les clients selon

leurs habitudes d’achat afin de déterminer les promotions les plus efficaces. SAS Visual Statistics offre plusieurs moyens d’explorer et d’évaluer visuellement les segments : classification, statistiques descriptives détaillées, coordonnées parallèles et nuages de points. Dans le cas de petites tables, les nuages de points associés à des profils de classe sont superposés. Lorsque les tables sont volumineuses, ce sont les cartes thermiques associées à des profils de classe qui se superposent.

Figure 1: SAS Visual Statistics permet d’explorer et d’évaluer facilement des segments pour ensuite les analyser au moyen de techniques descriptives telles que la classification par la méthode des K-means.

SAS® Visual Analytics peut être utilisé avant de développer des modèles – pour explorer des données – et après – pour analyser les résultats –, ce qui contribue à réduire les temps de latence lors du processus itératif de développement de modèles. .

Page 6: Bi analytiques prédictives de sas

4

Figure 2: Créez des arbres de décision de manière interactive pour partitionner vos données et interpréter des actions.

Figure 3: Établissez des prédictions binaires (réponse positive ou négative, le plus souvent) à l’aide de la régression logistique.

Page 7: Bi analytiques prédictives de sas

5

chaque groupe ou segment sans avoir à trier ni à indexer systé-matiquement les données. Il est ainsi possible de créer des modèles extrêmement précis pour chaque segment ou groupe à la volée, sans traitement supplémentaire.

Architecture en mémoire : du traitement par lots à l’analyse prédictive rapide et interactive Les architectures de traitement par lots traditionnelles ne sont pas conçues pour les traitements analytiques rapides et complexes ou la modification de modèles prédictifs à la volée. Elles ne sont pas non plus prévues pour les multiples balayages de données nécessaires aux tâches analytiques, ce qui pose plusieurs difficultés :

• Les statisticiens, data scientists et autres analystes métier ne peuvent pas expérimenter ni ajuster aisément leurs modèles avec de nouvelles informations de manière à être certains d’avoir produit le meilleur modèle.

• Il leur est impossible de créer rapidement et facilement de nombreux modèles par segments ou par groupes.

• Ils n’obtiennent pas de réponse instantanée lorsqu’ils modi-fient les propriétés de leurs modèles. La création et le test des modèles pour identifier le plus efficace prend beaucoup plus de temps.

Tous ces points sont extrêmement pénalisants à l’ère des big data. Si la découverte d’informations prend trop de temps, vous n’obtenez pas les réponses dont vous avez besoin au moment approprié.

Il vous faut une architecture qui évolue en fonction de vos besoins en données et en puissance de traitement, et qui permette également d’ajuster et d’expérimenter des variables de manière interactive, pratiquement en temps réel. La création de bons modèles est loin d’être simple, et le premier essai est généralement peu concluant. La meilleure stratégie consiste souvent à produire rapidement des résultats relativement satisfai-sants, puis à les ajuster habilement, ce qui n’est toujours pas idéal.

Modélisation prédictive

SAS Visual Statistics facilite la création de modèles analytiques à l’aide de techniques prédictives : régression linéaire, modélisation linéaire généralisée, arbres de décision et régression logistique.

• La régression linéaire permet de déterminer s’il existe une relation entre une variable continue et un jeu de variables de prédiction potentielles, et décrit la nature et les caractéris-tiques de cette relation (le cas échéant). Grâce à cette méthode, vous pouvez établir des prévisions numériques – dépenses d’un client, primes de polices d’assurance, limites de crédit, etc.

• Un modèle linéaire généralisé est une extension d’un modèle linéaire classique, utile lorsque les données ne sont pas distribuées normalement, en cas de fluctuation de la variance des données d’une observation à l’autre, ou si la moyenne des données se limite à un intervalle de valeurs. Les modèles linéaires généralisés intègrent les interactions entre les valeurs de prédiction en cours d’évaluation pour en déterminer les effets sur la variable de réponse.

• Les arbres de décision établissent un partitionnement hiérar-chique des données d’entrée à partir d’une série de règles appliquées à chaque observation. Cette technique d’apprentissage automatique supervisée utilise une approche de création de branches pour modéliser rapide-ment des variables cibles spécifiques ou un résultat (acheter ou ne pas acheter, activité frauduleuse ou non, etc.). Les arbres de décision aident à comprendre comment cibler les bons clients en analysant leurs caractéristiques. (voir Figure 2).

• La régression logistique s’efforce de prévoir la probabilité d’un événement (variable binaire, comme Oui/Non ou 1/0) en se basant sur la relation non linéaire entre une variable de réponse et les effets combinés des variables de prédiction. Elle sert par exemple à prévoir les pannes matérielles, les patients à haut risque ou à faible risque, le taux d’attrition de la clientèle, le caractère frauduleux d’une transaction, etc. (voir Figure 3).

Regroupement dynamique Avec SAS Visual Statistics, de nombreux utilisateurs peuvent créer simultanément des modèles et traiter les résultats de

Figure 2: Créez des arbres de décision de manière interactive pour partitionner vos données et interpréter des actions.

Page 8: Bi analytiques prédictives de sas

Les résultats des modifications apportées aux modèles (ajout de nouvelles variables, élimination des valeurs aberrantes ou changement de rôle des variables, par exemple) sont donc instantanément visibles. Plusieurs utilisateurs peuvent en outre analyser simultanément des données complexes stockées dans des clusters Hadoop, des systèmes de bases de données rela-tionnelles ou des serveurs SAS.

Fort heureusement, la puissance de traitement n’a jamais été aussi abordable. Qui plus est, votre solution SAS réunit traite-ment en mémoire et environnement de développement de modèles itératif et interactif, de sorte que vous pouvez créer et perfectionner des modèles, et tester des scénarios de simula-tion plus facilement et en un temps record.

Grâce aux technologies in-memory, les solutions visuelles de SAS permettent de procéder à une exploration ad hoc rapide et d’identifier visuellement des schémas et relations dans de grandes quantités de données.

Les données et traitements analytiques volumineux sont répartis entre plusieurs processeurs, d’où une rapidité exceptionnelle. Les données sont conservées en mémoire pendant plusieurs sessions afin de produire des résultats quasi instantanés. Inutile d’écrire les données sur disque ou de les déplacer fréquem-ment d’un nœud à l’autre. Elles sont chargées en mémoire une fois pour toutes, ce qui signifie qu’il est également inutile de les recharger à chaque nouvelle tâche ou lorsqu’un autre utilisateur est autorisé à y accéder.

6

Multipliez les possibilités de votre entreprise Analystes marketing • Utilisez SAS Visual Analytics pour tirer des enseignements de l’évolution du chiffre

d’affaires et déterminer les facteurs liés à l’attrition.

• Utilisez SAS Visual Statistics pour identifier les clients susceptibles de passer à la concur-rence au cours des six prochains mois et en comprendre la raison

Analystes risques financiers • Utilisez SAS Visual Analytics pour cerner et décrire les clients qui cessent de payer les

mensualités de leur prêt immobilier.

• Utilisez SAS Visual Statistics pour prévoir le risque lié aux clients en cessation de paiement et estimer les limites de crédit les mieux adaptées à chacun.

Ingénieurs • Utilisez SAS Visual Analytics pour explorer l’efficacité des équipements et rechercher les

facteurs favorisant les pannes matérielles à l’aide d’arbres de décision.

• Utilisez SAS Visual Statistics pour prévoir les défaillances des équipements ou les pannes matérielles à l’aide de la régression logistique ou d’arbres de décision (avec un meilleur contrôle de la croissance et de l’élagage de ces derniers).

Analystes marketing

Analystes des risques financiers

Ingénieurs

Page 9: Bi analytiques prédictives de sas

7

Figure 5: Utilisez les résultats de la modélisation pour créer des visualisations permettant d’analyser les résultats de manière approfondie.

Figure 4: Après avoir créé vos modèles, comparez visuellement les modèles concurrents pour déterminer celui qui produira les meilleurs résultats.

Page 10: Bi analytiques prédictives de sas

8

modifications à vos données ou modèles. Il s’agit d’un processus très interactif et itératif.

4. À ce stade, les data scientists peuvent transmettre des modèles de prévisions ou des résultats et/ou segments aux analystes métier à des fins d’exploration, d’analyse et de profilage dans SAS Visual Analytics (voir Figure 5).

5. Après avoir déterminé le modèle le plus efficace au moyen de la tâche de comparaison de modèles intégrée, vous pouvez aisément l’appliquer à de nouvelles données. Vous obtenez ainsi les renseignements précis dont vous avez besoin pour prendre de meilleures décisions et améliorer vos résultats.

Récapitulatif des solutions À quoi sert SAS® Visual Analytics? • Exploration et visualisation interactives des données.

• Traitement in-memory pour l’analytique en libre-service.

• Résultats accessibles via le web, les applications Microsoft Office, le reporting sur terminaux mobiles et les tableaux de bord.

À quoi sert SAS® Visual Statistics?• Modélisation prédictive interactive et exploratoire.

• Traitement in-memory pour la création, l’amélioration et la comparaison rapides de modèles.

• Segmentation des données et génération de modèles par segments ou par groupes.

Un duo efficace pour la modélisation exploratoire en une étape SAS Visual Analytics et SAS Visual Statistics forment un duo puissant, associant l’exploration et la découverte interactives des données à la création facile et rapide de modèles d’analyse prédictive. Ce duo fonctionne de la manière suivante :

Pour créer des modèles dans SAS Visual Statistics, vous commencez dans SAS Visual Analytics Explorer (les icônes correspondant aux techniques de modélisation prédictive se trouvent dans votre barre d’outils). Vous pouvez aisément y rechercher les différentes variables qui influencent votre variable de réponse, comprendre les relations entre variables, supprimer les valeurs aberrantes ou procéder à des manipula-tions de données et ce, avant de commencer à créer des modèles. Après avoir créé un modèle de base, vous pouvez continuer à l’optimiser, y ajouter des variables, en explorer les prévisions ou les segments, en évaluer la justesse et le comparer à d’autres modèles, le tout avec des résultats très rapides.

Détail du processus 1. Avant de créer des modèles, vous devez déterminer les

prédicteurs nécessaires. SAS Visual Analytics vous aide à identifier visuellement les relations entre les variables, à déceler les interactions inhabituelles et à repérer les valeurs aberrantes ou potentiellement utiles au processus d’élaboration des modèles. Différents graphiques – cartes thermiques, boîtes à moustaches, graphiques à bulles animés, histogrammes et diagrammes de réseau – illustrent les tendances et schémas détectés dans de gros volumes de données.

2. Vous pouvez ensuite utiliser SAS Visual Statistics pour créer, évaluer et finaliser des modèles prédictifs de manière inter-active (sans aucune programmation). Plusieurs utilisateurs peuvent se servir simultanément du même environnement et obtenir des résultats instantanés.

3. Une fois les modèles créés, il est facile de les comparer et de les évaluer selon différentes méthodes statistiques (voir Figure 4). Les diagrammes de lift, les courbes ROC et les taux de mauvaises classifications aident à identifier le modèle le plus performant. Vous pouvez alors revenir en arrière, supprimer les valeurs aberrantes et apporter d’autres

Page 11: Bi analytiques prédictives de sas

9

pour produire les meilleurs résultats – en utilisant des volumes de données sans précédent.

• Décupler la productivité de votre équipe analytique. Plusieurs utilisateurs peuvent personnaliser des modèles rapidement et de façon interactive – en ajoutant ou en modi-fiant des variables, en éliminant les valeurs aberrantes, etc. – tout en observant les effets de ces changements sur les résultats de ces modèles. Quel modèle offre le plus de puis-sance prédictive ? C’est désormais facile à découvrir, et ce processus vous permet en outre de mieux valoriser votre analyse des big data.

Résultat: un environnement de découverte des données et d’analyse prédictive en libre-service, offrant aux décideurs des informations plus précises et une démarche analytique plus simple, au moment où ils en ont besoin, et où qu’ils se trouvent.

☛ Try SAS® Visual Analytics

☛ Try SAS® Visual Statistics

Conclusion Les catégories d’utilisateurs – statisticiens, data scientists, analystes métier, responsables gestion des risques, analystes marketing, et autres – qui ont besoin d’une solution associant exploration des données et reporting en libre-service à des outils analytiques ne cessent d’augmenter. Une solution de ce type offre davantage de souplesse à l’entreprise.

Face à l’importance croissante accordée à l’utilisation des données pour créer de la valeur ajoutée, les entreprises sont de plus en plus nombreuses à vouloir étoffer leur culture analy-tique avec un modèle décisionnel en libre-service. Elles cher-chent à utiliser des outils analytiques toujours plus sophistiqués pour prévoir les résultats d’événements à venir, et ce, au profit du plus grand nombre.

Dès lors, si une interface intuitive conviviale est nécessaire, la puissance sur laquelle elle repose est encore plus importante. SAS Visual Statistics, en association avec SAS Visual Analytics, offre aux statisticiens, data scientists et analystes métier comme aux profils d’utilisateurs non techniques un moyen rapide et agréable d’explorer les données, de créer des modèles prédic-tifs et de les évaluer afin d’identifier le plus efficace. En mettant cette solution au service de votre entreprise, vous pouvez :

Affronter la concurrence avec de précieuses connaissances. Déceler rapidement les informations dissimulées dans de vastes magasins de données. Découvrir et évaluer de nouvelles opportunités qui échapperont à la concurrence. Trouver de nouvelles sources de revenus. Dans la mesure où SAS Visual Analytics est intégré à la solution, les analystes métier et les statisticiens peuvent se servir de puissantes fonctions d’analyse prédictive et d’exploration visuelle pour exploiter les données de manière totalement inédite.

• Exécuter davantage de modèles, plus rapidement et avec précision. Grâce à notre environnement de traitement multi-cœur, cette opération ne prend que quelques minutes. Vous pouvez créer des modèles pour cibler des groupes ou des segments spécifiques, tout en exécutant d’innombrables scénarios. Multipliez aisément les scénarios de simulation et obtenez des réponses rapides. Les modèles optimisés produisent de meilleurs résultats.

• Être réactif grâce au traitement in-memory. Effectuez rapidement des calculs analytiques complexes grâce au moteur en mémoire. Les modélisateurs peuvent rapidement tester de nouvelles idées, s’essayer à différentes techniques de modélisation et perfectionner leurs modèles à la volée

Page 12: Bi analytiques prédictives de sas

10

Pour prendre contact avec votre bureau SAS local, visitez le site : sas.com/offices

SAS Institute s. a. s. – DOMAINE DE GREGY - GREGY-SUR-YERRES - 77257 BRIE COMTE ROBERT - FRANCE

TEL. : +33(0) 1 60 62 11 11 FAX : +33(0) 1 60 62 11 99 www.sas.com/france

SAS et tout autre nom de produit et de service de SAS Institute Inc. sont des marques déposées de SAS Institute Inc. pour les

USA et tous les autres pays. ® indique un dépôt aux USA. Les autres marques et noms de produits sont des marques

déposées de leurs entreprises respectives. Copyright © 2016 SAS Institute Inc. Tous droits réservés. S152228.0316