2
Et si le meilleur logiciel de Data Science était gratuit ? Verteego Data Suite est une composition des meilleures briques open source du marché, de la capture de données à la librairie d’analyse prédictive SERVICES Externalisation : nous réalisons les apps prédictives dont rêvent vos équipes Hébergement : cloud public, cloud privé, cloud hybride ou bien votre propre infra Support : de 100€ (5 questions par email) à 500€ mensuels (questions illimitées) par utilisateur Onboarding : formation, setup, configuration, assistance MODULES Made in Verteego : Interface utilisateurs unifiée Echanges de données d’uncomposant à l’autre en streaming Programme d’installation simple, rapide et personnalisable Nettoyez vos données avec OpenRefine Créez des notebooks en Python ou en R pour scripter rapidement vos PoC d’intelligence artificielle avec Jupyter Connectez-vous à vos données au travers des workflows automatisés avec Apache NiFi Créez des modèles prédictifs sur vos données avec H2O Explorez, visualisez et partagez vos données avec Superset

Fiche Produit Verteego Data Suite, mars 2017

Embed Size (px)

Citation preview

Page 1: Fiche Produit Verteego Data Suite, mars 2017

Et si le meilleur logiciel de Data Science était gratuit ?

Verteego Data Suite est une composition des meilleures briques open source

du marché, de la capture de données à la librairie d’analyse prédictive

SERVICES

Externalisation : nous réalisons les apps prédictives dont rêvent vos équipes

Hébergement : cloud public, cloud privé, cloud hybride ou bien votre propre infra

Support : de 100€ (5 questions par email) à 500€ mensuels (questions illimitées) par utilisateur

Onboarding : formation, setup, configuration, assistance

MODULES

Made in Verteego :

• Interface utilisateurs unifiée

• Echanges de données d’uncomposant à l’autre en streaming

• Programme d’installation simple, rapide et personnalisable

Nettoyez vos données avec OpenRefine

Créez des notebooks en Python ou en R pour scripter rapidement vos PoC d’intelligence artificielle avec Jupyter

Connectez-vous à vos données au travers des workflows automatisés avec Apache NiFi

Créez des modèles prédictifs sur vos données avec H2O

Explorez, visualisez et partagez vos données avec Superset

Page 2: Fiche Produit Verteego Data Suite, mars 2017

DATA SUITE : QUESTIONS / RÉPONSES

Pourquoi la Verteego Data Suite ?On voulait donner accès à nos clients, au travers d’une solution best-of-breed, aux meilleures briques tout le long de la chaîne typique de travail d’un data scientist : l’extraction des données, le nettoyage des données, l’analyse et la visualisation, le scripting pour personnali-ser des tâches, du dashboarding collaboratif, et enfin tout un volet prédictif et machine learning.

A qui s’adresse la Verteego Data Suite ?Aux data scientists de métier, aux statisticiens qui ont de bonnes connaissances informatiques, et aux développeurs informatiques à qui nous permettons de réaliser rapidement leurs premiers projets de data science une fois la prise en main de la suite logicielle effective.

Etant donné que Verteego est éditeur de logiciels, pourquoi avez-vous choisi de faire appel à des composants open source plutôt que d’avoir réalisé des développements propriétaires ?Parce qu’aujourd’hui, le marché du Big Data bouge tellement vite qu’entre le moment où l’on pense un produit et le moment où on le met sur le marché dans le logiciel propriétaire, et à moins d’avoir des moyens financiers gigantesques permettant d’imposer un produit comme standard par le marketing, le risque est grand d’être obsolète. Ainsi, en faisant pour nos clients la veille technologique et en choisissant en continu les meilleures briques, selon nous, pour eux, nous leur garantissons d’avoir entre les mains ce qui se fait de mieux.

Quelles sont les réalisations techniques des équipes Produit de Verteego au sein de la Verteego Data Suite ?Outre la veille technologique, Verteego réalise la colonne vertébrale logicielle qui permet aux données de circuler en streaming d’un module à l’autre, le design et la mise en oeuvre d’une interface utilisa-teurs aussi unifiée et homogène que possible entre des composants développés par des communautés différentes, la production de toute la documentation et des programmes d’installation, ainsi que les partenariats avec les fournisseurs de services cloud pour couvrir l’ensemble de la chaîne de valeur - y compris les couches basses.

Quel est l’intérêt de se former à la Verteego Data Suite ?En se formant à la Verteego Data Suite, nos utilisateurs se forment en même temps à quelques uns des composants de Data Science du marché parmi les plus populaires au sein de la communauté mondiale des Data Scientists.

Qu’est-ce que la Data Suite n’est pas ?La Verteego Data Suite n’est par exemple pas une distribution Hadoop. La Verteego Data Suite vient en aval de messageries type Kafka ou des systèmes de stockage des fichiers qui peuvent exister. La Verteego Data Suite se greffe sur ce type de systèmes et ne les propose donc pas à l’installation. Toutefois, la Verteego Data Suite intègre

évidemment une brique d’orchestration des flux de don-nées, nommément Apache NiFi, conçue pour interconnec-ter des applications et gérer des problématiques de data lakes, c’est-à-dire pour agréger différents types de données et les re-travailler de manière à les assembler à un ou plusieurs endroits qui permettent ensuite de réaliser des analyses ou des prédictions. Apache NiFi est le point d’entrée et la colonne vertébrale de la Verteego Data Suite.

Peut-on utiliser R dans la Data Suite ? Peut-on y scripter en Python ?La Verteego Data Suite intègre des capacités à écrire des Notebooks, via la brique Jupyter. On peut faire du R dans la Data Suite et appeler direc-tement les scripts qui ont été faits dans R. La Data Suite permet de gérer tout l’environnement dont a besoin R pour fonctionner. Un kernel pré-installé pour R permet de faire du scripting R. Dans la version installable par défaut de la Data Suite, nous avons intégré R, Python 2, Python 3 et Bash. Il est possible d’y ajouter Scala ou tout autre langage.

La Verteego Data Suite est-elle adaptée aux démarches de Proof-of-Concept (PoC) comme aux projets à même d’être exploités à grande échelle ?Absolument. La Verteego Data Suite est adaptée aux PoC car vous pourrez lancer rapidement vos projets et lancer différentes approches. Et vous n’aurez pas à changer de technologie pour les déployer à grande échelle car les technologies embarquées dans la Data Suite sont rompues aux environnements de production complexes.

Où puis-je installer et héberger la Verteego Data Suite ?Tout d’abord, la Verteego Data Suite se présente sous la forme d’une machine image installable sur les serveurs Verteego ou sur l’infrastructure de nos clients. Aujourd’hui (mars 2017), l’installation est pré-packagée pour la Google Cloud Platform ou alors pour vos propres serveurs UNIX. La Verteego Data Suite est parfaitement installable sur tous types de cloud publics, hybrides ou privés.

www.verteego.com

@verteego_FR [email protected]

8, rue du faubourg poissonnière - 75010 Paris - France

www.linkedin.com/company/verteego

+33 1 47 70 08 90