View
214
Download
0
Category
Preview:
Citation preview
Les apports combinés de TIBCO Statistica et TIBCO Spotfire
Sihem MERAH Consultante Solutions Senior
TIBCO Spotfire
Olivier LEBRET Responsable partenariat
et alliances EMEA & APJ
TIBCO Statistica
INTERVIEW CROISÉE
Data Visualisation et plateforme d’analyse prédictive
2
Deux spécialistes de la BI échangent leurs points de vue
TIBCO Spotfire, principal moteur de TIBCO Insight
Platform, a toujours été un pionnier de l’exploration de
données et de la data visualisation. La récente intégration
de TIBCO Statistica aux solutions analytiques de TIBCO
ajoute des capacités nouvelles en matière de modélisation
et d’analyse prédictive. Sihem Merah et Olivier Lebret,
spécialistes des solutions analytiques TIBCO, nous
expliquent en quoi l’alliance de ces deux solutions permet
de rendre l’analytique avancée encore plus accessible aux
utilisateurs.
3
TIBCO Spotfire est l’une des solutions de Business Intelligence les plus performantes du marché. Pourquoi vouloir greffer TIBCO Statistica à cette solution déjà très riche sur le plan fonctionnel ?
Olivier Lebret TIBCO Spotfire et TIBCO Statistica sont
des solutions complémentaires. TIBCO Spotfire se
positionne sur la Business Intelligence – qui est en quelque
sorte la première brique de l’analytique – alors que TIBCO
Statistica se concentre sur la modélisation et l’analyse
prédictive.
Sihem Merah L’apport principal de TIBCO Statistica est
de démocratiser l’accès à la modélisation statistique. On
pouvait déjà réaliser des tâches d’analyse prédictive avec
TIBCO Spotfire, mais cela impliquait nécessairement du
code (R par exemple). En embarquant plus de 16000
fonctions pour créer des flux analytiques sans une seule
ligne de code, TIBCO Statistica apporte une réponse claire
à une question qui a accompagné l’évolution de la data
science et de la modélisation statistique ces dernières
années : « to code or not to code » ?
TIBCO Statistica est une plateforme collaborative d’analyse des données qui intègre de nombreux outils puissants et interactifs pour l’analyse exploratoire et la modélisation des données, dans une interface-utilisateur conviviale.
Quels sont les apports des outils d’analyse statistique ?
Quelle est la contribution croisée de TIBCO Statistica et TIBCO Spotfire ?
Comment démocratiser l’accès au big data ?
Quel est le rôle des citizen data scientists ?
Quel est l’intérêt d’une plateforme analytique pour les projets IoT ?
Réponses à deux voix avec Sihem Merah et Olivier Lebret.
4
Une organisation qui n’a aucune capacité prédictive est-elle limitée dans ses démarches analytiques ?
O.L Disons qu’elle se prive de l’avantage concurrentiel
qu’apporte une solution d’analytique complète, englobant
BI et modélisation statistique. Ne pas avoir de capacité
prédictive, c’est en quelque sorte rouler en voiture phares
éteints dans le brouillard.
S.M Il faut effectivement souligner l’intérêt des solutions
décisionnelles en tant qu’avantage concurrentiel. Dans le
secteur du retail, par exemple, il est de plus en plus difficile
de se distinguer sur les produits ou les marges. Le succès
d’une entreprise se jouera plutôt sur des aspects tels que
la connaissance client ou l’optimisation des processus
opérationnels.
Avez-vous un exemple concret d’utilisation des capacités prédictives de TIBCO Statistica ?
O.L Prenons l’exemple d’une banque qui cherche à
identifier des paramètres influents en vue d’octroyer des
prêts immobiliers en écartant les dossiers à risque. Grâce à
une série de questions, on définit le profil du futur client et
on évalue sa solvabilité. On va ensuite le rattacher à un
modèle qui a été construit sur les expériences passées afin
de prévenir et limiter les risques d’impayés. Ces modèles
prédictifs sont l’apanage de TIBCO Statistica.
Quels sont les apports des statistiques à la data visualisation ?
S.M La data visualisation permet de prendre une photo
de l’existant et de mieux l’appréhender grâce à des
tableaux de bord et graphiques qui offrent une vision
d’ensemble. D’un autre côté, les analyses statistiques
permettent de construire une projection du futur. Citons le
cas de Vestas, un spécialiste de la gestion des fermes
éoliennes qui a mis à disposition de ses commerciaux une
série d’outils leur permettant de faire des simulations de
rendement énergétique et de s’engager auprès du
prospect au niveau du service.
O.L TIBCO Spotfire est effectivement un outil formidable
pour restituer une information synthétique. Mais l’intérêt
de l’analytique ne s’arrête pas là. Comme Sihem vient de
l’illustrer, tout l’enjeu réside dans la capacité à définir des
modèles afin de prédire des événements avec un maximum
de finesse et à donner du sens à de grosses quantités de
données inutilisables en l’état, afin de prendre des
décisions pertinentes. C’est à ce niveau qu’intervient
TIBCO Statistica.
Mais TIBCO Spotfire permettait déjà de faire des analyses prédictives. Quelle est donc la nouveauté de TIBCO Statistica ?
S.M TIBCO Spotfire embarquait effectivement certaines
procédures d’analyse prédictive et intégrait la possibilité
de coder en R pour faire de l’analyse statistique, grâce à
son moteur TERR. Cependant, il fallait avoir des
connaissances en code relativement poussées pour faire
de l’analyse prédictive. Grâce à TIBCO Statistica, on
accélère le processus de modélisation statistique.
O.L Dans TIBCO Statistica, leader des plateformes
d’analyse prédictive, toutes les procédures sont natives.
Qu’il s’agisse d’analyse descriptive, de data mining ou de
text mining, elles ne nécessitent pas de code. Cela dit, on
peut en créer si on le souhaite en s’appuyant par exemple
sur du langage R ou Python.
TIBCO Statistica offre également la possibilité de créer
des flux analytiques grâce à des fonctionnalités présentes
sous forme d’icônes très simples et accessibles, ce qui
TIBCO Statistica apporte une réponse claire à la question : « to
code or not to code ? »
Tout l’enjeu de l’analytique résidedans la capacité à définir des modèles afin de prédire des événements avec
un maximum de finesse
5
n’existait pas dans TIBCO Spotfire. On va ainsi définir des
sources de données, des nœuds de transformation des
données ainsi que des nœuds analytiques, le tout
représenté par des icônes. On fera par exemple jouer des
algorithmes différents afin de les comparer et les combiner
jusqu’à obtenir le meilleur modèle. Pour résumer, on utilise
en entrée des données issues de TIBCO Spotfire, on
construit son flux analytique, puis, en sortie, on exporte
des modèles prédictifs dans un format reconnu par TIBCO
Spotfire.
Par ailleurs, TIBCO Statistica possède un ensemble d’outils
de gestion documentaire très populaires dans les
industries règlementées telles que l’ industrie
pharmaceutique ou le milieu bancaire. Ces outils
permettent d’identifier et de suivre l’évolution de
différentes versions des objets, requêtes ou modèles (faire
du versioning) et de les intégrer avec les outils de dataviz
proposés par TIBCO Spotfire.
Comment résumer en quelques mots la contribution croisée de TIBCO Statistica et TIBCO Spotfire ?
O.L L’alliance des deux solutions combine les outils
graphiques de data visualisation et de cartographie
proposés par TIBCO Spotfire avec la puissance d’analyse
prédictive de TIBCO Statistica. Il y a une vraie
complémentarité entre les technologies de BI et d’analyse
prédictive : d’un côté TIBCO Spotfire représente les
données, de l’autre TIBCO Statistica les modélise pour
appuyer la prise de décision.
S.M J’ajouterais que les plateformes BI et analytiques
favorisent l’autonomie de l’entreprise. Prenons l’exemple
de l’un de nos clients qui avait l’habitude de passer par un
cabinet spécialiste de l’audit des processus financiers.
Grâce à TIBCO Spotfire, notre client réalise désormais
cette tâche en interne.
On parle de plus en plus du «citizen data scientist». En quoi consiste ce métier ? Est-il réellement différent du data scientist «classique» ?
O.L Le citizen data scientist est un terme nouveau qu’il
faut effectivement distinguer du data scientist ou
statisticien tel qu’il était défini jusqu’à présent. Ce dernier
cumule plusieurs compétences en modélisation, en
statistique et data mining, en manipulation d’outils tels que
TIBCO Statistica, mais également en informatique. Il doit
être capable de comprendre comment les données sont
structurées et être en mesure de retranscrire l’information
de façon synthétique à des non spécialistes. Il sera très à
l’aise avec des outils comme TIBCO Statistica, tout comme
avec les outils de BI comme TIBCO Spotfire.
Cela dit, tout le monde ne dispose pas de compétences
aussi étendues. C’est là qu’apparaît la frontière entre le
data scientist – qui est capable de coder et de construire
des programmes d’analyses prédictives en R ou en Python
– et le citizen data scientist, qui comprend les tenants et
les aboutissants de l’analyse prédictive mais ne maîtrise
pas forcément les outils de modélisation.
S.M Le citizen data scientist a généralement un profil
métier : sa vision sera plus opérationnelle et axée sur un
champ de compétences bien précis, il aura peut-être
davantage de facilité à prendre du recul par rapport aux
chiffres. D’où l’intérêt de mettre à sa disposition des outils
packagés par des spécialistes pour agréger des données
issues de sources différentes ou les transformer, aspects
qu’il ne maîtrise pas forcément. Grâce à des outils tels que
TIBCO Spotfire et TIBCO Statistica, le citizen data scientist
est en mesure de «faire parler» les données.
Ainsi, un commercial est un citizen data scientist. Dès lors
qu’il utilise une analyse TIBCO Spofire et qu’il cherche à
étendre son champ d’investigation, il se comporte comme
un citizen data scientist. En réalité, tout utilisateur métier
TIBCO Statistica accélère le processusde modélisation statistique
Il y a une vraie complémentarité entre les technologies de BI et
d’analyse prédictive
qui s’intéresse à l’analytique décisionnelle et qui fait usage
des logiciels d’analytique dans son quotidien est de fait un
citizen data scientist.
Comment TIBCO Spotfire et TIBCO Statistica facilitent le travail des citizen data scientists ? Avez-vous des exemples en situation réelle ?
O.L Les deux outils reposent sur une approche self-
service qui est déterminante dans l’efficacité de
l’écosystème global de Business Intelligence. La démarche
consiste à laisser aux spécialistes le soin de créer les
procédures de transformation de la donnée et les modèles
analytiques. Le citizen data scientist n’a plus qu’à utiliser
ces procédures packagées par les spécialistes afin
d’extraire des données, créer ses propres analyses, ses
tableaux de bord et faire de l’analyse prédictive sans avoir
de connaissances poussées en programmation. Il pourra
par exemple déployer des interfaces permettant de créer
des scénario « What-if » sans faire appel à du code R ou
Python.
Prenons un exemple dans le milieu hospitalier. Une
université de médecine américaine s’appuie sur TIBCO
Statistica pour évaluer les risques de contracter une
maladie nosocomiale. Le suivi a lieu en temps réel, sur la
table d’opération : TIBCO Statistica analyse des variables
et déclenche des alertes lorsque l’évolution d’un indicateur
laisse penser que le patient court le risque de contracter
une maladie nosocomiale.
S.M Concernant la partie visualisation et création de
tableaux de bord, TIBCO Spotfire a toujours été très
simple à manipuler. La plupart des actions se font avec du
drag&drop, on peut très facilement identifier les données
pertinentes. Nous avons également injecté de l’intelligence
artificielle dans la solution, de manière à accompagner
l’utilisateur avec un moteur de recommandation.
Concrètement, cela se traduit par une fenêtre pop-up qui
permet à l’utilisateur de choisir les critères qu’il souhaite
analyser. Après avoir fait son choix, le moteur de
recommandation lui suggère les visualisations les plus
pertinentes. En quelques clics, sans savoir comment créer
un camembert, une visualisation est intégrée.
Le self-service BI entraîne-t-il une redistribution des rôles au sein de la DSI ?
O.L Oui, dans une certaine mesure, car les citizen data
scientists reprennent à leur compte une partie des tâches
habituellement assurées par l’informatique, ce qui va
alléger le travail des SI. Néanmoins, les travaux de
préparation des requêtes par les équipes IT ne vont pas
disparaitre et le rôle de l’informatique sera toujours de
mettre à disposition les bases de données tout en
garantissant la sécurité informatique.
S.M Tout dépend de l’organisation dans laquelle on se
situe. Certaines entreprises ont mis en place une BI
décentralisée – sujet pour lequel TIBCO Spotfire a été
identifié comme numéro 1 par le cabinet Gartner. Dans ce
cas, l’IT ne s’occupe que de la gouvernance, du respect
des processus de production, de l’intégrité et de la
disponibilité des données, etc. D’autres entreprises ont
opté pour un « BI competency center » qui veille à la
bonne adoption des outils de BI au sein de l’entreprise.
Au-delà de la démocratisation de l’analyse prédictive, quels sont les autres apports de la plateforme TIBCO Statistica associée à TIBCO Spotfire ?
O.L La démocratisation des aspects statistiques n’est
effectivement pas le seul enjeu. Vous avez raison
d’employer le mot « plateforme » pour désigner TIBCO
Statistica, car il s’agit d’un écosystème global et pas
simplement quelques procédures d’analyse prédictive
supplémentaires qui viennent se greffer à TIBCO Spotfire.
La plateforme englobe notamment la gestion sécurisée
des rôles. Il est possible de permettre à certains individus
Un commercial peutparfaitement endosser le rôle
de citizen data scientist
6
ou groupes d’individus de prendre des actions, de créer
des requêtes, de définir des connexions de bases de
données, d’utiliser certains outils analytiques et pas
d’autres.
Ces requêtes, modèles d’analyse, règles, flux analytiques
et espaces de travail sont stockés dans une base de
métadonnées qui est le cœur du système collaboratif de
TIBCO Statistica.
Les analyses de type big data seront-elles facilitées grâce à TIBCO Statistica ?
O.L Oui, et c’est un point important, car l’intérêt d’avoir
un gros volume de données n’est pas de créer des modèles
sur l’intégralité de ces données mais d’être capable de
créer des modèles précis sur des échantillons
représentatifs. TIBCO Statistica met à disposition des
outils très accessibles qui permettent de construire des
échantillons représentatifs sur lesquels on crée des
modèles. Ces modèles sont ensuite utilisés de manière très
fine.
Qu’il s’agisse de déterminer un comportement d’achat ou
un risque, on va utiliser toute la puissance des big data
pour aller dans un niveau très avancé d’analyse prédictive,
sur des groupes d’individus ultra ciblés. L’ère de la
ménagère de moins de 50 ans est révolu. Désormais, on
parle plutôt de la ménagère de moins de 50 ans qui habite
en milieu urbain, qui a deux enfants et qui pratique
le fitness de façon régulière… La précision n’est plus la
même ! TIBCO Statistica contribue ainsi à l’exploitation de
la richesse des données grâce à un moteur de règles
embarqué qui rend accessible au plus grand nombre la
création de modèles prédictifs sur des segments très fins
de la population.
En quoi la solution TIBCO Statistica se distingue-t-elle des autres plateformes d’analytique disponibles sur le marché ?
O.L On pourrait lister de multiples points différenciateurs.
Dans un premier temps, TIBCO Statistica dispose d’un
outil de gestion documentaire adossé à la plateforme, ce
qui est un atout dans les domaines règlementés tels que la
banque ou l’industrie pharmaceutique. Cela permet de
stocker des objets – je pense notamment aux modèles
prédictifs – mais également toutes les versions
développées au cours du temps dans le but de valider
d’anciens modèles sur la base de données nouvelles. Cet
outil de gestion documentaire intègre par ailleurs un
système de signature électronique qui permet de basculer
directement les modèles vers l’environnement de
production.
Il faut également rappeler le caractère ouvert de la
plateforme. TIBCO Statistica permet d’intégrer du code R
ou Python. Son architecture autorise l’intégration de
nombreux langages, ce qui permet de s’appuyer sur des
algorithmes très pointus (par exemple, algorithmia), puis
d’utiliser en sortie du code de déploiement dans de
multiples formats : Java, Java pour MapReduce pour les
problématiques Hadoop, code SAS, code Terradata, etc.
TIBCO Statistica est une plateforme extensive, dont le
langage de programmation n’est pas propriétaire,
contrairement à certaines solutions concurrentes. Pour
conclure, TIBCO Statistica est une véritable plateforme
d’intelligence analytique, avec la plus grande richesse
fonctionnelle du marché.
Quel est l’intérêt de TIBCO Statistica pour les traitements IoT ?
O.L Les avancées technologiques récentes ont vu
littéralement exploser les projets IoT chez nos clients, et
ce n’est certainement qu’un début. La technologie
embarquée dans Statistica permet de créer des modèles
prédictifs sur des volumétries considérables, puis de créer
du code de déploiement (par exemple du code Java, Java
pour MapReduce, Teradata, SAS, C/C++, C#, des
TIBCO Statistica rend accessible les analyses big data grâce à un
moteur de règles embarqué
7
procédures stockées, etc.). Ces modèles, y compris les
règles métier qu’ils contiennent, sont ensuite acheminés
vers les bases de données, data lakes ou sur des
équipements ou passerelles afin de réaliser du scoring à la
volée, en temps réel, directement au plus près de la
donnée. Ainsi, l’application d’un modèle prédictif et
l’analyse des données directement à l’endroit où les
données sont créées permet de réduire les délais,
l’utilisation de bande passante ainsi que les coûts relatifs
au transfert des données, avec pour conséquence, une
prise de décision plus simple et plus rapide.
Avec l’explosion des projets IoT, l’analytique se déplace en
périphérie du réseau (ce que nous appelons « edge
analytics »), si bien que dans certains cas, il n’est plus
rentable ni même opportun d’acheminer les données vers
un référentiel, une base de données ou un serveur
centralisé. Le potentiel des objets connectés repose sur la
capacité à analyser en temps réel les données d’un
processus spécifique, ce qui est désormais rendu possible
par l’analytique en périphérie. L’intelligence embarquée
dans des véhicules autonomes n’est plus de la science-
fiction. C’est aujourd’hui devenu une réalité !
http://statistica.io/ http://spotfire.tibco.com/fr/
8
Olivier LEBRET Responsable partenariat et alliances EMEA & APJ
TIBCO Statistica
Sihem MERAH Consultante Solutions Senior
TIBCO Spotfire
Olivier a débuté sa carrière comme traducteur de Statistica avant de prendre
la direction de la filiale française de l’éditeur dont il exercera la responsabilité
pendant plus de 17 ans. Olivier a participé à de nombreux projets autour de
Statistica, en France comme à l’étranger, en appréhendant les diverses facettes du
métier (avant-vente, formateur, support technique, commercial, channel).
Aujourd’hui rattaché à l’équipe avant-vente de TIBCO Software, il continue
à apporter son expertise sur les projets analytiques en temps réel, l’analyse
prédictive, les sujets big data ou l’IoT en conseillant et accompagnant les clients
dans leur stratégie d’innovation autour de l’analytique avancée.
Sihem Merah travaille depuis 6 ans dans le monde de l’analytique et de la business
intelligence. Formatrice pendant 4 ans sur la solution TIBCO Spotfire, elle s’est
passionnée pour ces sujets et a pu voir la solution déployée chez de nombreux
clients. Consultante Solutions Senior depuis maintenant deux ans, elle intervient
dans de nombreux projets de data visualisation, d’analyse prédictive et de machine
learning.
À propos des experts
smerah@tibco.com
olebret@tibco.com
9
TIBCO Software France
25 rue Balzac 75008 Paris +33 1 44 51 45 88 www.TIBCO.com
TIBCO Software accompagne les entreprises dans leur transformation digitale en interconnectant les différents éléments de leurs systèmes d’information et en augmentant l’intelligence des décisions basées sur la donnée. Cette combinaison garantit des réponses plus rapides, de meilleures décisions et des actions plus pertinentes. Depuis 20 ans, TIBCO met à la disposition des solutions et services innovants qui s’adressent aux opérationnels, aux développeurs ainsi qu’aux data scientists. Des milliers de clients de par le monde se démarquent en faisant confiance à TIBCO pour concevoir des business modèles innovants et offrir des expériences clients convaincantes. Pour en savoir plus www.TIBCO.com.
© 2017, TIBCO Software Inc. Tous droits réservés. TIBCO, le logo TIBCO, TIBCO Software et TIBCO Spotfire sont des marques commerciales ou des marques déposées de TIBCO Software Inc. ou de ses filiales aux Etats-Unis et/ou dans d’autres pays. Tous les autres noms de produits, d’entreprises et de marques figurant dans ce document appartiennent à leur propriétaire respectif et ne sont mentionnés qu’à des fins d’identification. 02/17
Recommended