10
Les apports combinés de TIBCO Statistica et TIBCO Spotfire Sihem MERAH Consultante Solutions Senior TIBCO Spotfire Olivier LEBRET Responsable partenariat et alliances EMEA & APJ TIBCO Statistica INTERVIEW CROISÉE Data Visualisation et plateforme d’analyse prédictive

Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

  • Upload
    ngodat

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

Les apports combinés de TIBCO Statistica et TIBCO Spotfire

Sihem MERAH Consultante Solutions Senior

TIBCO Spotfire

Olivier LEBRET Responsable partenariat

et alliances EMEA & APJ

TIBCO Statistica

INTERVIEW CROISÉE

Data Visualisation et plateforme d’analyse prédictive

Page 2: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

2

Deux spécialistes de la BI échangent leurs points de vue

TIBCO Spotfire, principal moteur de TIBCO Insight

Platform, a toujours été un pionnier de l’exploration de

données et de la data visualisation. La récente intégration

de TIBCO Statistica aux solutions analytiques de TIBCO

ajoute des capacités nouvelles en matière de modélisation

et d’analyse prédictive. Sihem Merah et Olivier Lebret,

spécialistes des solutions analytiques TIBCO, nous

expliquent en quoi l’alliance de ces deux solutions permet

de rendre l’analytique avancée encore plus accessible aux

utilisateurs.

Page 3: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

3

TIBCO Spotfire est l’une des solutions de Business Intelligence les plus performantes du marché. Pourquoi vouloir greffer TIBCO Statistica à cette solution déjà très riche sur le plan fonctionnel ?

Olivier Lebret TIBCO Spotfire et TIBCO Statistica sont

des solutions complémentaires. TIBCO Spotfire se

positionne sur la Business Intelligence – qui est en quelque

sorte la première brique de l’analytique – alors que TIBCO

Statistica se concentre sur la modélisation et l’analyse

prédictive.

Sihem Merah L’apport principal de TIBCO Statistica est

de démocratiser l’accès à la modélisation statistique. On

pouvait déjà réaliser des tâches d’analyse prédictive avec

TIBCO Spotfire, mais cela impliquait nécessairement du

code (R par exemple). En embarquant plus de 16000

fonctions pour créer des flux analytiques sans une seule

ligne de code, TIBCO Statistica apporte une réponse claire

à une question qui a accompagné l’évolution de la data

science et de la modélisation statistique ces dernières

années : « to code or not to code » ?

TIBCO Statistica est une plateforme collaborative d’analyse des données qui intègre de nombreux outils puissants et interactifs pour l’analyse exploratoire et la modélisation des données, dans une interface-utilisateur conviviale.

Quels sont les apports des outils d’analyse statistique ?

Quelle est la contribution croisée de TIBCO Statistica et TIBCO Spotfire ?

Comment démocratiser l’accès au big data ?

Quel est le rôle des citizen data scientists ?

Quel est l’intérêt d’une plateforme analytique pour les projets IoT ?

Réponses à deux voix avec Sihem Merah et Olivier Lebret.

Page 4: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

4

Une organisation qui n’a aucune capacité prédictive est-elle limitée dans ses démarches analytiques ?

O.L Disons qu’elle se prive de l’avantage concurrentiel

qu’apporte une solution d’analytique complète, englobant

BI et modélisation statistique. Ne pas avoir de capacité

prédictive, c’est en quelque sorte rouler en voiture phares

éteints dans le brouillard.

S.M Il faut effectivement souligner l’intérêt des solutions

décisionnelles en tant qu’avantage concurrentiel. Dans le

secteur du retail, par exemple, il est de plus en plus difficile

de se distinguer sur les produits ou les marges. Le succès

d’une entreprise se jouera plutôt sur des aspects tels que

la connaissance client ou l’optimisation des processus

opérationnels.

Avez-vous un exemple concret d’utilisation des capacités prédictives de TIBCO Statistica ?

O.L Prenons l’exemple d’une banque qui cherche à

identifier des paramètres influents en vue d’octroyer des

prêts immobiliers en écartant les dossiers à risque. Grâce à

une série de questions, on définit le profil du futur client et

on évalue sa solvabilité. On va ensuite le rattacher à un

modèle qui a été construit sur les expériences passées afin

de prévenir et limiter les risques d’impayés. Ces modèles

prédictifs sont l’apanage de TIBCO Statistica.

Quels sont les apports des statistiques à la data visualisation ?

S.M La data visualisation permet de prendre une photo

de l’existant et de mieux l’appréhender grâce à des

tableaux de bord et graphiques qui offrent une vision

d’ensemble. D’un autre côté, les analyses statistiques

permettent de construire une projection du futur. Citons le

cas de Vestas, un spécialiste de la gestion des fermes

éoliennes qui a mis à disposition de ses commerciaux une

série d’outils leur permettant de faire des simulations de

rendement énergétique et de s’engager auprès du

prospect au niveau du service.

O.L TIBCO Spotfire est effectivement un outil formidable

pour restituer une information synthétique. Mais l’intérêt

de l’analytique ne s’arrête pas là. Comme Sihem vient de

l’illustrer, tout l’enjeu réside dans la capacité à définir des

modèles afin de prédire des événements avec un maximum

de finesse et à donner du sens à de grosses quantités de

données inutilisables en l’état, afin de prendre des

décisions pertinentes. C’est à ce niveau qu’intervient

TIBCO Statistica.

Mais TIBCO Spotfire permettait déjà de faire des analyses prédictives. Quelle est donc la nouveauté de TIBCO Statistica ?

S.M TIBCO Spotfire embarquait effectivement certaines

procédures d’analyse prédictive et intégrait la possibilité

de coder en R pour faire de l’analyse statistique, grâce à

son moteur TERR. Cependant, il fallait avoir des

connaissances en code relativement poussées pour faire

de l’analyse prédictive. Grâce à TIBCO Statistica, on

accélère le processus de modélisation statistique.

O.L Dans TIBCO Statistica, leader des plateformes

d’analyse prédictive, toutes les procédures sont natives.

Qu’il s’agisse d’analyse descriptive, de data mining ou de

text mining, elles ne nécessitent pas de code. Cela dit, on

peut en créer si on le souhaite en s’appuyant par exemple

sur du langage R ou Python.

TIBCO Statistica offre également la possibilité de créer

des flux analytiques grâce à des fonctionnalités présentes

sous forme d’icônes très simples et accessibles, ce qui

TIBCO Statistica apporte une réponse claire à la question : « to

code or not to code ? »

Tout l’enjeu de l’analytique résidedans la capacité à définir des modèles afin de prédire des événements avec

un maximum de finesse

Page 5: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

5

n’existait pas dans TIBCO Spotfire. On va ainsi définir des

sources de données, des nœuds de transformation des

données ainsi que des nœuds analytiques, le tout

représenté par des icônes. On fera par exemple jouer des

algorithmes différents afin de les comparer et les combiner

jusqu’à obtenir le meilleur modèle. Pour résumer, on utilise

en entrée des données issues de TIBCO Spotfire, on

construit son flux analytique, puis, en sortie, on exporte

des modèles prédictifs dans un format reconnu par TIBCO

Spotfire.

Par ailleurs, TIBCO Statistica possède un ensemble d’outils

de gestion documentaire très populaires dans les

industries règlementées telles que l’ industrie

pharmaceutique ou le milieu bancaire. Ces outils

permettent d’identifier et de suivre l’évolution de

différentes versions des objets, requêtes ou modèles (faire

du versioning) et de les intégrer avec les outils de dataviz

proposés par TIBCO Spotfire.

Comment résumer en quelques mots la contribution croisée de TIBCO Statistica et TIBCO Spotfire ?

O.L L’alliance des deux solutions combine les outils

graphiques de data visualisation et de cartographie

proposés par TIBCO Spotfire avec la puissance d’analyse

prédictive de TIBCO Statistica. Il y a une vraie

complémentarité entre les technologies de BI et d’analyse

prédictive : d’un côté TIBCO Spotfire représente les

données, de l’autre TIBCO Statistica les modélise pour

appuyer la prise de décision.

S.M J’ajouterais que les plateformes BI et analytiques

favorisent l’autonomie de l’entreprise. Prenons l’exemple

de l’un de nos clients qui avait l’habitude de passer par un

cabinet spécialiste de l’audit des processus financiers.

Grâce à TIBCO Spotfire, notre client réalise désormais

cette tâche en interne.

On parle de plus en plus du «citizen data scientist». En quoi consiste ce métier ? Est-il réellement différent du data scientist «classique» ?

O.L Le citizen data scientist est un terme nouveau qu’il

faut effectivement distinguer du data scientist ou

statisticien tel qu’il était défini jusqu’à présent. Ce dernier

cumule plusieurs compétences en modélisation, en

statistique et data mining, en manipulation d’outils tels que

TIBCO Statistica, mais également en informatique. Il doit

être capable de comprendre comment les données sont

structurées et être en mesure de retranscrire l’information

de façon synthétique à des non spécialistes. Il sera très à

l’aise avec des outils comme TIBCO Statistica, tout comme

avec les outils de BI comme TIBCO Spotfire.

Cela dit, tout le monde ne dispose pas de compétences

aussi étendues. C’est là qu’apparaît la frontière entre le

data scientist – qui est capable de coder et de construire

des programmes d’analyses prédictives en R ou en Python

– et le citizen data scientist, qui comprend les tenants et

les aboutissants de l’analyse prédictive mais ne maîtrise

pas forcément les outils de modélisation.

S.M Le citizen data scientist a généralement un profil

métier : sa vision sera plus opérationnelle et axée sur un

champ de compétences bien précis, il aura peut-être

davantage de facilité à prendre du recul par rapport aux

chiffres. D’où l’intérêt de mettre à sa disposition des outils

packagés par des spécialistes pour agréger des données

issues de sources différentes ou les transformer, aspects

qu’il ne maîtrise pas forcément. Grâce à des outils tels que

TIBCO Spotfire et TIBCO Statistica, le citizen data scientist

est en mesure de «faire parler» les données.

Ainsi, un commercial est un citizen data scientist. Dès lors

qu’il utilise une analyse TIBCO Spofire et qu’il cherche à

étendre son champ d’investigation, il se comporte comme

un citizen data scientist. En réalité, tout utilisateur métier

TIBCO Statistica accélère le processusde modélisation statistique

Il y a une vraie complémentarité entre les technologies de BI et

d’analyse prédictive

Page 6: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

qui s’intéresse à l’analytique décisionnelle et qui fait usage

des logiciels d’analytique dans son quotidien est de fait un

citizen data scientist.

Comment TIBCO Spotfire et TIBCO Statistica facilitent le travail des citizen data scientists ? Avez-vous des exemples en situation réelle ?

O.L Les deux outils reposent sur une approche self-

service qui est déterminante dans l’efficacité de

l’écosystème global de Business Intelligence. La démarche

consiste à laisser aux spécialistes le soin de créer les

procédures de transformation de la donnée et les modèles

analytiques. Le citizen data scientist n’a plus qu’à utiliser

ces procédures packagées par les spécialistes afin

d’extraire des données, créer ses propres analyses, ses

tableaux de bord et faire de l’analyse prédictive sans avoir

de connaissances poussées en programmation. Il pourra

par exemple déployer des interfaces permettant de créer

des scénario « What-if » sans faire appel à du code R ou

Python.

Prenons un exemple dans le milieu hospitalier. Une

université de médecine américaine s’appuie sur TIBCO

Statistica pour évaluer les risques de contracter une

maladie nosocomiale. Le suivi a lieu en temps réel, sur la

table d’opération : TIBCO Statistica analyse des variables

et déclenche des alertes lorsque l’évolution d’un indicateur

laisse penser que le patient court le risque de contracter

une maladie nosocomiale.

S.M Concernant la partie visualisation et création de

tableaux de bord, TIBCO Spotfire a toujours été très

simple à manipuler. La plupart des actions se font avec du

drag&drop, on peut très facilement identifier les données

pertinentes. Nous avons également injecté de l’intelligence

artificielle dans la solution, de manière à accompagner

l’utilisateur avec un moteur de recommandation.

Concrètement, cela se traduit par une fenêtre pop-up qui

permet à l’utilisateur de choisir les critères qu’il souhaite

analyser. Après avoir fait son choix, le moteur de

recommandation lui suggère les visualisations les plus

pertinentes. En quelques clics, sans savoir comment créer

un camembert, une visualisation est intégrée.

Le self-service BI entraîne-t-il une redistribution des rôles au sein de la DSI ?

O.L Oui, dans une certaine mesure, car les citizen data

scientists reprennent à leur compte une partie des tâches

habituellement assurées par l’informatique, ce qui va

alléger le travail des SI. Néanmoins, les travaux de

préparation des requêtes par les équipes IT ne vont pas

disparaitre et le rôle de l’informatique sera toujours de

mettre à disposition les bases de données tout en

garantissant la sécurité informatique.

S.M Tout dépend de l’organisation dans laquelle on se

situe. Certaines entreprises ont mis en place une BI

décentralisée – sujet pour lequel TIBCO Spotfire a été

identifié comme numéro 1 par le cabinet Gartner. Dans ce

cas, l’IT ne s’occupe que de la gouvernance, du respect

des processus de production, de l’intégrité et de la

disponibilité des données, etc. D’autres entreprises ont

opté pour un « BI competency center » qui veille à la

bonne adoption des outils de BI au sein de l’entreprise.

Au-delà de la démocratisation de l’analyse prédictive, quels sont les autres apports de la plateforme TIBCO Statistica associée à TIBCO Spotfire ?

O.L La démocratisation des aspects statistiques n’est

effectivement pas le seul enjeu. Vous avez raison

d’employer le mot « plateforme » pour désigner TIBCO

Statistica, car il s’agit d’un écosystème global et pas

simplement quelques procédures d’analyse prédictive

supplémentaires qui viennent se greffer à TIBCO Spotfire.

La plateforme englobe notamment la gestion sécurisée

des rôles. Il est possible de permettre à certains individus

Un commercial peutparfaitement endosser le rôle

de citizen data scientist

6

Page 7: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

ou groupes d’individus de prendre des actions, de créer

des requêtes, de définir des connexions de bases de

données, d’utiliser certains outils analytiques et pas

d’autres.

Ces requêtes, modèles d’analyse, règles, flux analytiques

et espaces de travail sont stockés dans une base de

métadonnées qui est le cœur du système collaboratif de

TIBCO Statistica.

Les analyses de type big data seront-elles facilitées grâce à TIBCO Statistica ?

O.L Oui, et c’est un point important, car l’intérêt d’avoir

un gros volume de données n’est pas de créer des modèles

sur l’intégralité de ces données mais d’être capable de

créer des modèles précis sur des échantillons

représentatifs. TIBCO Statistica met à disposition des

outils très accessibles qui permettent de construire des

échantillons représentatifs sur lesquels on crée des

modèles. Ces modèles sont ensuite utilisés de manière très

fine.

Qu’il s’agisse de déterminer un comportement d’achat ou

un risque, on va utiliser toute la puissance des big data

pour aller dans un niveau très avancé d’analyse prédictive,

sur des groupes d’individus ultra ciblés. L’ère de la

ménagère de moins de 50 ans est révolu. Désormais, on

parle plutôt de la ménagère de moins de 50 ans qui habite

en milieu urbain, qui a deux enfants et qui pratique

le fitness de façon régulière… La précision n’est plus la

même ! TIBCO Statistica contribue ainsi à l’exploitation de

la richesse des données grâce à un moteur de règles

embarqué qui rend accessible au plus grand nombre la

création de modèles prédictifs sur des segments très fins

de la population.

En quoi la solution TIBCO Statistica se distingue-t-elle des autres plateformes d’analytique disponibles sur le marché ?

O.L On pourrait lister de multiples points différenciateurs.

Dans un premier temps, TIBCO Statistica dispose d’un

outil de gestion documentaire adossé à la plateforme, ce

qui est un atout dans les domaines règlementés tels que la

banque ou l’industrie pharmaceutique. Cela permet de

stocker des objets – je pense notamment aux modèles

prédictifs – mais également toutes les versions

développées au cours du temps dans le but de valider

d’anciens modèles sur la base de données nouvelles. Cet

outil de gestion documentaire intègre par ailleurs un

système de signature électronique qui permet de basculer

directement les modèles vers l’environnement de

production.

Il faut également rappeler le caractère ouvert de la

plateforme. TIBCO Statistica permet d’intégrer du code R

ou Python. Son architecture autorise l’intégration de

nombreux langages, ce qui permet de s’appuyer sur des

algorithmes très pointus (par exemple, algorithmia), puis

d’utiliser en sortie du code de déploiement dans de

multiples formats : Java, Java pour MapReduce pour les

problématiques Hadoop, code SAS, code Terradata, etc.

TIBCO Statistica est une plateforme extensive, dont le

langage de programmation n’est pas propriétaire,

contrairement à certaines solutions concurrentes. Pour

conclure, TIBCO Statistica est une véritable plateforme

d’intelligence analytique, avec la plus grande richesse

fonctionnelle du marché.

Quel est l’intérêt de TIBCO Statistica pour les traitements IoT ?

O.L Les avancées technologiques récentes ont vu

littéralement exploser les projets IoT chez nos clients, et

ce n’est certainement qu’un début. La technologie

embarquée dans Statistica permet de créer des modèles

prédictifs sur des volumétries considérables, puis de créer

du code de déploiement (par exemple du code Java, Java

pour MapReduce, Teradata, SAS, C/C++, C#, des

TIBCO Statistica rend accessible les analyses big data grâce à un

moteur de règles embarqué

7

Page 8: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

procédures stockées, etc.). Ces modèles, y compris les

règles métier qu’ils contiennent, sont ensuite acheminés

vers les bases de données, data lakes ou sur des

équipements ou passerelles afin de réaliser du scoring à la

volée, en temps réel, directement au plus près de la

donnée. Ainsi, l’application d’un modèle prédictif et

l’analyse des données directement à l’endroit où les

données sont créées permet de réduire les délais,

l’utilisation de bande passante ainsi que les coûts relatifs

au transfert des données, avec pour conséquence, une

prise de décision plus simple et plus rapide.

Avec l’explosion des projets IoT, l’analytique se déplace en

périphérie du réseau (ce que nous appelons « edge

analytics »), si bien que dans certains cas, il n’est plus

rentable ni même opportun d’acheminer les données vers

un référentiel, une base de données ou un serveur

centralisé. Le potentiel des objets connectés repose sur la

capacité à analyser en temps réel les données d’un

processus spécifique, ce qui est désormais rendu possible

par l’analytique en périphérie. L’intelligence embarquée

dans des véhicules autonomes n’est plus de la science-

fiction. C’est aujourd’hui devenu une réalité !

http://statistica.io/ http://spotfire.tibco.com/fr/

8

Page 9: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

Olivier LEBRET Responsable partenariat et alliances EMEA & APJ

TIBCO Statistica

Sihem MERAH Consultante Solutions Senior

TIBCO Spotfire

Olivier a débuté sa carrière comme traducteur de Statistica avant de prendre

la direction de la filiale française de l’éditeur dont il exercera la responsabilité

pendant plus de 17 ans. Olivier a participé à de nombreux projets autour de

Statistica, en France comme à l’étranger, en appréhendant les diverses facettes du

métier (avant-vente, formateur, support technique, commercial, channel).

Aujourd’hui rattaché à l’équipe avant-vente de TIBCO Software, il continue

à apporter son expertise sur les projets analytiques en temps réel, l’analyse

prédictive, les sujets big data ou l’IoT en conseillant et accompagnant les clients

dans leur stratégie d’innovation autour de l’analytique avancée.

Sihem Merah travaille depuis 6 ans dans le monde de l’analytique et de la business

intelligence. Formatrice pendant 4 ans sur la solution TIBCO Spotfire, elle s’est

passionnée pour ces sujets et a pu voir la solution déployée chez de nombreux

clients. Consultante Solutions Senior depuis maintenant deux ans, elle intervient

dans de nombreux projets de data visualisation, d’analyse prédictive et de machine

learning.

À propos des experts

[email protected]

[email protected]

9

Page 10: Data Visualisation et plateforme d’analyse prédictive · chiffres. D’où l’intérêt de mettre à sa disposition des outils ... TIBCO Spotfire et TIBCO Statistica, le citizen

TIBCO Software France

25 rue Balzac 75008 Paris +33 1 44 51 45 88 www.TIBCO.com

TIBCO Software accompagne les entreprises dans leur transformation digitale en interconnectant les différents éléments de leurs systèmes d’information et en augmentant l’intelligence des décisions basées sur la donnée. Cette combinaison garantit des réponses plus rapides, de meilleures décisions et des actions plus pertinentes. Depuis 20 ans, TIBCO met à la disposition des solutions et services innovants qui s’adressent aux opérationnels, aux développeurs ainsi qu’aux data scientists. Des milliers de clients de par le monde se démarquent en faisant confiance à TIBCO pour concevoir des business modèles innovants et offrir des expériences clients convaincantes. Pour en savoir plus www.TIBCO.com.

© 2017, TIBCO Software Inc. Tous droits réservés. TIBCO, le logo TIBCO, TIBCO Software et TIBCO Spotfire sont des marques commerciales ou des marques déposées de TIBCO Software Inc. ou de ses filiales aux Etats-Unis et/ou dans d’autres pays. Tous les autres noms de produits, d’entreprises et de marques figurant dans ce document appartiennent à leur propriétaire respectif et ne sont mentionnés qu’à des fins d’identification. 02/17