6
101/109 RUE JEAN JAURES 92300 LEVALLOIS PERRET - 01 41 27 38 38 AVRIL 12 Mensuel OJD : 28143 Surface approx. (cm²) : 2850 N° de page : 42-47 Page 1/6 CORPEVENTS 1711481300501/GLB/MFG/3 Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutes citations BIG DATA OU BIG BROTHER DATA? Autrefois, les systèmes d'analyse de Business Intelligence (BI) ont tenté de classifier les données issues des bases de données. Aujourd'hui, les blogs, les réseaux sociaux et toutes les données non structurées issues de la consumérisation rendent cette logique BI inefficace. La solution passe par le Big Data, parfois indiscret sur la vie privée des consommateurs. T rop de data tuent-elles l'info? En 2012, comment trouver l'information utile détenue par les entreprises de toute taille ? Comment transformer cette information en va- leur ? De plus en plus de voix préconi- sent le Big Data, une approche intelli- gente de la gestion et de l'optimisation des données. Celles-ci deviennent, après traitement, des informations utiles. L'approche Big Data prend en compte une nouvelle génération de data en se basant non plus sur des bases de données mais sur des mo- teurs de recherche et des outils sou- vent open source «L'approche Big Data semble déjà adoptée par une majorité d'entreprises outre-Atlantique », affirme Jean-Yves Pronier, directeur marketing EMC pour la région Europe. Gain prin- cipal :au niveau applicatif, la précision marketing, l'optimisation des process ou de la logistique... Le plus intéres- sant est sans doute la conception de nouveaux services "customisés" pour le client final. En effet, grâce à toutes ces données agrégées et traitées, de nouveaux "business model" émergent et des entreprises se créent ou perfec- tionnent leurs offres. Et, cerise sur le gâteau, toutes les entreprises sont po- tentiellement utilisatrices et concer- nées grâce aux gestions Big Data dé- portées sur des services de cloud com- puting. Production de données et innovations technologiques Selon Henry Verdier, entrepreneur, se- nior advisor de MFG-Labs, président du pôle de compétitivité Cap Digital, deux étapes permettent de comprendre le phénomène Big Data. Un premier point est la production de données : « Aujourd'hui, cela ne coûte pas cher pour une entreprise de récupérer des in-

Page 1/6 BIG DATA OU BIG BROTHER DATA? · PDF fileSelon Henry Verdier , entrepreneur se-nior advisor de MFG-Labs, président du ... rées et 30 % structurées le dataware-house et

  • Upload
    dangbao

  • View
    215

  • Download
    1

Embed Size (px)

Citation preview

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 1/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

BIG DATA OUBIG BROTHERDATA?

Autrefois, les systèmes d'analyse de Business Intelligence(BI) ont tenté de classifier les données issues des basesde données. Aujourd'hui, les blogs, les réseaux sociauxet toutes les données non structurées issuesde la consumérisation rendent cette logique BI inefficace.La solution passe par le Big Data, parfois indiscretsur la vie privée des consommateurs.

Trop de data tuent-ellesl'info? En 2012, commenttrouver l'information utiledétenue par les entreprisesde toute taille ? Comment

transformer cette information en va-leur ? De plus en plus de voix préconi-sent le Big Data, une approche intelli-gente de la gestion et de l'optimisationdes données. Celles-ci deviennent,après traitement, des informationsutiles. L'approche Big Data prend encompte une nouvelle génération dedata en se basant non plus sur desbases de données mais sur des mo-teurs de recherche et des outils sou-

vent open source « L'approche Big Datasemble déjà adoptée par une majoritéd'entreprises outre-Atlantique », affirmeJean-Yves Pronier, directeur marketingEMC pour la région Europe. Gain prin-cipal :au niveau applicatif, la précisionmarketing, l'optimisation des processou de la logistique... Le plus intéres-sant est sans doute la conception denouveaux services "customisés" pourle client final. En effet, grâce à toutesces données agrégées et traitées, denouveaux "business model" émergentet des entreprises se créent ou perfec-tionnent leurs offres. Et, cerise sur legâteau, toutes les entreprises sont po-

tentiellement utilisatrices et concer-nées grâce aux gestions Big Data dé-portées sur des services de cloud com-puting.

Production de donnéeset innovationstechnologiquesSelon Henry Verdier, entrepreneur, se-nior advisor de MFG-Labs, président dupôle de compétitivité Cap Digital, deuxétapes permettent de comprendre lephénomène Big Data. Un premierpoint est la production de données :« Aujourd'hui, cela ne coûte pas cherpour une entreprise de récupérer des in-

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 2/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

formations. placer une puce RFID au lieud'un code-barre sur une palette destinéeau stockage n'entraîne pas une explosiondes coûts. Le prix des systèmes d'infor-mation a également chuté, permettant àtoutes les entreprises d'être équipées demodules de traitement efficaces. Enfin,Internet, avec son potentiel astrono-mique de données gratuites issues desréseaux sociaux, des forums, etc. leur ap-porte une manne d'informations sup-plémentaires. » Un deuxième point estconstitué par les innovations techno-logiques • « Face à l'afflux de données,on a vite compris que l'informa-tique traditionnelle ancrée sur

Les 5 usages du Big Data

Selon l'Institut Mc Kinsey, les BigData peuvent avoir cinq usagesdistincts:

; rendre l'information transparenteet utilisable à n'importe quelmoment;i collecter des informations

i ss» numériques plus précises et"" lées sur tous les domaines

s;s permettre au marketing unesegmentation toujours plus finede la clientèle et des produits ;

• améliorer considérablement la prise de décision des directions ;> assister le développement de nouveaux produits et services par la R&D.

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 3/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

A LIRE

UnderstandingBig DataAntfyltt» lw Ennrpriw CIMIHMtoot) «nd StrtMntog D«t«

UnderstandingBig DataLe livre blanc d'IBMest un ebookgratuit qui met uncontrepoint surl'emphase donnéeau Big Data en2011, unphénomène quipeut se présenteraussi comme unenotion de gestionde tres grandsvolumes. C'est undocument qui faitla part belle al'utilisation desoutils InfoSphere.(ebook de 166pages a téléchargersurlBM.com)

des bases de données n'arriverait'pas à passer à l'échelle et à ab-

sorber ce trop-plein d'informations. Desprogrammes de recherche au milieu desannées 2000 ont mis au point de nou-velles logiques de "compression"des don-nées (comme le Framework MapReduce),de nouvelles philosophies de bases dedonnées, puis de nouvelles logiques detraitement parallèle, facilitées en grandepartie par l'arrivée concomitante ducloud » Autre avantage d'une approcheBig Data, elle revalorise la donnee enla transformant en information utile.Économiquement, il s'agit d'un chan-gement de paradigme • les entreprisesont longtemps travaillé dans uncontexte où produire de la donnéeétait coûteux et elles tendaient à limi-ter cette production. En 2012, la ques-tion est obsolète face à des donnéesabondantes obtenues sans frais (ré-seaux sociaux , blog Internet...). Ducoup, la pertinence réside dans la ma-nipulation et l'exploitation des don-nées, qu'elles soient formatées ou non,internes ou externes à l'entreprise.Contrairement aux bases de donnéestraditionnelles, une approche Big Dataconsiste à employer des solutions lo-gicielles capables de s'adapter à toutesles familles et toutes les catégories dedonnées. Maîs attention ! Le Big Datan'est pas simplement le constat d'unenouvelle volumétrie de données et deleur simple restitution, comme le veu-lent les acteurs de la sauvegarde ou del'archivage , c'est avant tout une solu-tion pour en tirer profit. On l'aura com-pris, l'idée du Big Data est de transfor-mer toutes ces données brutes eninformations exploitables et donc ren-tables pour les entreprises.

Tendances | L'info déluge en

r milliards d'e-mails onyés dans le monde en !

• 40 % des Français sont sur un réseausocial (étude Arcep - Credoc).• 140 millions de tweets sont envoyéschaque jour.fi 30 milliards de documents sontajoutés chaque mois sur Facebook.» 3 millions dè vidéos sont vues par joursurYouTube.» I SO millions de blogs.• 135 millions de comptes Linkedin.• 17 millions de Français possèdentun smartphone.

« 4 % de Français possèdent une tablette numérique, soit 2 millions de personnes.» 63,6 millions de tablettes ont été vendues dans le monde en 2011.a ll existe 6 milliards de téléphones mobiles dans le monde.

Volume, variété, vélocitéÀ écouter les défenseurs d'une ap-proche Big Data, cette solution dépassecelles basées sur les entrepôts de don-nées liées aux techniques de data mi-ning et datawarehouse. Le Big Data ou-vert à toutes les entreprises est avanttout l'enfant récent de l'open source etdu cloud, des technologies encore im-matures dans les années 90 dans ce do-maine. En clair, le Big Data complète lesoutils décisionnels jusqu'ici réservesaux grandes organisations en démo-cratisant l'analyse des données. ChezEMC, qui dispose de sa propre solution"greenplum unified analyse" pour ap-plications Big Data, Jean-Yves Pronier,directeur marketing constate une évo-lution • « Le Big Data traite tous les for-mats. En 2000,30 % des données étaientnon structurées et 70 % structurées enSGBD. En 2012, 70 % sont non structu-rées et 30 % structurées • le dataware-house et les SGBD ne savent traiter queles données structurées. Le Big Data, c'est

Les unités de mesure des quantités de données

I mégaoctet (i,iv/;

I gigaoctet (Go

I téraoctet(To)

I pétaoctet (Po)

I exaoctet(Eo)

I zettaoctet (Zo)

1 yottaoctet (Vo)

= 230 octets

= 240 octets

= 250 octets

= 260 octets

= 270 octets

= 280 octets

= 1 024 Mo = 1 073 741 824 octets

= 1 099 511627 776 octets

= I 125 899 906 842 624 octets

= I 152 921 504 606 846 976 octets

= I 180 591 620 717 411 303 424 octets

= I 208 925 819 614 629 174 706 176 octets

trois mots. volume, variété, vélocité » Ni-colas Chauvet de Logilab explique «Un exemple révélateur est celui d'un sitede rencontre américain qui, grâce à lamise en place d'une architecture de typeBig Data - en utilisant l'écosystème Ama-zon AWS et la solution Elastic MapRe-duce Hadoop - a pu profondément amé-liorer l'algorithme de recommandationde profils amoureux tout en divisant parIOU le coût de calcul quotidien. » PourMouloud Dey, directeur business solu-tion chez SAS, un éditeur de solutionsBusiness Intelligence converti aux BigData, « // n'y a pas une solution applica-tive Big Data. Il faut empiler les coucheset prendre en compte un besoin spéci-fique Si l'informatique de l'entreprise nele permet pas en 24hOO par exemple, uneappli Big Data externalisée s'avère né-cessaire. Le cloud mobilise les ressourceset SAS sait créer le modèle d'optimisationvia des usages métier. Les banques doi-vent monter leur capacité a mesurer lesrisques par rapport aux autorites de ré-glementation. Les PME-PMI qui s'intéres-sent à leur marché et aux données pu-bliques. Les données non structurées nonformatées, souvent textuelles, appar-tiennent au Big Data. C'est vrai que la BigData est un mot que l'on pose sur desanalyses que nous faisions depuis 10ans. » Pour André Gilles, PDG de PolyS-pot, le Big Data, c'est open source sinonrien : « Hadoop gère une SGBD qu'au-cune SGBD ne saurait gérer. Donc on nerepeint pas une offre ancienne, c'est vrai-ment nouveau et, d'ailleurs. Microsoft re-joint les acteurs qui soutiennent le pro-jet Apache Open Source Hadoop. »

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 4/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

Un volume de donnéesqui doubletous les deux ansLes téraoctets sont devenus une valeurde mesure plus que courante au seindes entreprises, y compris dans lesPME, et les pétaoctets s'imposent deplus en plus comme une valeur cou-ramment citée quand ce n'est pas lezettaoctet (on parle d'une échelle devaleur qui explose de mille milliards defois le Go). IDC souligne que près de 2Zo de données ont été créés en 2011.De quoi remplir 57,5 milliards d'iPad.Jusqu'ici, pour faire face à ce déluge dedonnées, les entreprises ont investi.Elles ont payé cher, très cher même,pour stocker, sécuriser et pouvoir ac-céder à toute cette information, valeurpalpable de leur business. Elles ont

aussi investi dans de nombreuses ap-plications, afin de répondre à leurs be-soins métiers. « Mais ces dernières ontaussi créé des silos d'information à tra-vers toute leur organisation. La commu-nication inter-département est bloquée.Du coup, l'entreprise ne sait pas faire, ou

mal, l'inventaire de ce qu'elle a, d'autantque les formats et la nature des donnéesont évolué. Pour elles, l'enjeu est énorme.À quoi bon investir des millions dans unbusiness si l'information créée finit pardisparaître ?» analyse Gilles André. Bref,comment tirer le meilleur parti de cesdonnées en jachère?

Aborder les donnéesdifféremmentL'analyse des métadonnées permet auxentreprises de comprendre la valeur decelles-ci, d'identifier les ensembles dedonnées, de les corréler avec les utili-sateurs, les projets et les propriétaires,de comprendre comment et quand ilsutilisent leurs données, où les stockeret comment les employer pour colla-borer plus efficacement. L'analyse desBig Data commence par leur compré-hension. Pour obtenir une vue d'en-semble de l'environnement des don-nées non structurées, les entreprisesdoivent être en mesure de répondreaux questions les plus basiques concer-nant la gestion, le contrôle et la sécu-rité des données. Qui a accès aux don-nées ? Qui a besoin d'y accéder ?Quelles sont les données utilisées etles données inutilisées ? Précisonsqu'une approche Big Data s'adresse àtoutes les entreprises et peut même fa-voriser les plus petites. Une approcheBig Data permet d'optimiser les coûtsd'exploitation par une réduction mas-sive des infrastructures exigées. Étantbasée sur une architecture exportée etélastique de type cloud, les coûts d'ex-ploitation deviennent fonction des be-soins et utilisations exprimés au jour le

Approche Big Data | Data Scie

ilque, on parle déjà de.'agit plutôt "d'experts e

science des données". Experts, en effet, puisque leurmétier est de faire face à l'extraordinaire complexitéde la ressource, de cette immense nébuleuse enconstante expansion. C'est un métier périlleux car lesdonnées sont partout. L'expert doit être capable depasser au crible un très large éventail d'informations,venues de sources multiples (réseaux sociaux, sitesinnombrables du Web, études économiques, blogs,forums, archives numériques, etc.) avant d'être en

mesure de sélectionner celles qui seront directement utiles à l'entreprise. Il agit en véritable "alchimistede l'information". Une fois les données ainsi rassemblées, stockées et ordonnées, l'expert doit procéder àleur "conditionnement", en utilisant les techniques d'optimisation et de gestion qui en permettront uneexploitation intelligente. Une nouvelle génération de bases de données analytiques va lui faciliter latâche, car leur architecture particulière en fait des "super calculateurs" analytiques super rapides,pouvant traiter des volumes colossaux en un minimum de temps.

(^COMPETENCES RARES

en 2008, p* WS Sam* Ma«»v6toWlraOh*(nB)

174»I

amI

ax»I

to OM,

Qui a les droits d'accèsaux outils du cloud ?

"orman Girard,ianaging Director,'estern Europe de"""* is, expert en

té, souligne laiio-cisité de connaîtreles intervenants et deSuivre les traitementsbpérés : « Pour parvenir àexploiter la puissance desf lg Data, il sera''lécessaire de savoir et

[per les traitements.fenf et quand cette

imité massive dedonnées est utilisée, qui l'utilise, dans quel ordre et ce qu'ellecontient. Mais le Big Data peut aider aussi à la gestion desautorisations d'accès excessives ou périmées qui sontrarement révoquées. Des données deviennent accessibles àdes groupes globaux d'utilisateurs, sans aucune méthodeefficace pour corriger ces accès qui ont un impact sur le coeurde métier de l'entreprise. »

« LE BIG DATA OFFRE UN COÛTDACCÈS TRÈS MODESTE ENSAPPUYANT SUR LE CLOUDCOMPUTING, ON NE PAYE À LADEMANDE QUE QUELQUESHEURES DETEMPS MACHINESPOUR QUELQUES CENTAINESD'EUROS.»

jour par l'entreprise. En outre, la matu-rité et la robustesse des solutions dumarché limitent drastiquement le coûtd'entrée, dans un contexte concurren-tiel par ailleurs propice à l'innovation.Alors que les projets décisionnels tra-ditionnels nécessitent parfois plusieursmois d'intégration et une architecturetechnique lourde, les projets ae BigData offrent donc des ROI particulière-ment élevés. Ils permettent même auxservices marketing d'affiner leurs re-cherches. « Le Big Data offre la possibi-lité à l'entreprise de dépasser le mossmarketing pour entrer de plam-pied dansle personal marketing », explique-t-onchezTalend, un acteur incontournabledu marché Big Data. Ce personal mar-keting peut inquiéter les défenseurs dela vie privée. La puissance d'analyse desoutils Big Data amène au der-nier niveau de cette approche,

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 5/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

Premier congrès Big Data à Paris

Le congrès BIG DATA Paris sera le premierévénement à faire intervenir unesoixantaine d'experts du Big Data pourdécrypter ce phénomène numérique,annonce comme la prochaine révolutionde l'informatique mondiale. Organisées parCorp Events les 20 et 21 mars 2012 à la CitéUniversitaire Internationale, lesconférences se dérouleront dans lesamphithéâtres de la Maison Internationale,

""" f̂fir;- 17 boulevard Jourdan à Paris. «Les- r*"̂ —"3 intervenants seront les représentants des

fournisseurs IT, les éditeurs d'informatiquedécisionnelle, les entreprises utilisatrices,mais aussi les acteurs du Web, consultants,

I: journalistes, chercheurs » précise BlandineLaffargue, l'organisatrice de ces deux

journées inédites de conférences et d'échanges. Pour plus d'informations, vous pouvez consulter le siteInternet du congrès à l'adresse http://www.bigdataparis.com/fr-index.php.

À LIRE

Big Data NowUn nouveau livreédité par O'Reillysur le Big Data,en anglais.http://radar.oreilly.com/2011/09/big-data-now-oreilly-data-ebook.html

>celui de l'analyse et du repor-ting à une étude comporte-

mentale très précise des habitudes desutilisateurs, clients et partenaires. Lineapproche Big Data analyse la relationentre les utilisateurs et les données, leschangements de groupes et de per-missions, les pics d'activité, les donnéesen passe d'être périmées et les don-nées "orphelines".

Une approche sur quatreniveauxAu-delà de l'explosion du volume desdonnées, un autre facteur tout aussiimportant existe en 2012 avec l'émer-gence du cloud Computing avec lequeldonnées et traitements sont déportésdans un nuage de serveurs et de ser-vices gérés par des opérateurs publics,privés ou hybrides. Ces services inté-ressent les TPE-PME qui voient là uneopportunité de bénéficier de servicesmutualisés "comme les grandes entre-prises" à un coût intéressant car "mu-tualisé". En s'appuyant sur les infra-structures de serveurs mises en placepar des opérateurs de cloud compu-ting tel Amazon, les entreprises trou-vent là le premier niveau de service né-cessaire au déploiement de leurapproche Big Data, avec une puissancede calcul pour gérer et rapprocher leursdonnées. N'oublions pas que la valeurdes Big Data se révèle en particulier parle croisement de sources de donnéesdiverses. D'où la nécessité d'utiliser unepile de logiciels dédiés à ces calculs.C'est le deuxième niveau : les données

sont intégrées à un framework logicielApache Open Source tel hadoop(http://hadoop.apache.org/), lui-mêmegéré a un troisième niveau par un "lan-gage" Map reduce qui permet d'inter-roger et de rapprocher les données sé-lectionnées. Le quatrième et dernierniveau est celui très convoité par les ac-teurs du marché Big Data, celui de l'ex-ploitation des données via des appli-cations de traçabilité, reporting delegs, applications marketing customi-sées...

Révéler une informationjusque-là cachéePour résumer, les avantages d'une ap-proche Big Data avancée par les ac-teurs du marché sont avant tout d'offrir

la capacité de fédérer un volume crois-sant de données internes et externes,structurées ou non, et de les analyserafin d'optimiser leur contenu. Rappe-lons que les données non structuréesau sein des entreprises sont en crois-sance exponentielle et deviennent trèsdifficiles à contrôler. Celles-ci englo-bent tous les types de fichiers (docu-ments, images, feuilles de calcul, fi-chiers audio et vidéo) qui sont stockésdans des serveurs de fichiers, des équi-pements NAS et dans des référentielssemi-structures tels que SharePoint.Dans beaucoup de cas, les donnéesnon structurées (tickets de caisse, fac-tures, e-mails, documents bureau-tiques, fichiers PDF, blogs, forums, fluxRSS, contenu généré par les utilisa-teurs) contiennent des calculs et desdonnées métier n'existant nulle part ail-leurs dans l'entreprise et représentantune riche source d'informations. Le butest alors de combiner données struc-turées et non structurées et leurs for-mats (plus de mille formats différents)pour révéler des informations quiétaient difficilement discernables - si-gnaux faibles, apparition de tendances- afin par exemple d'offrir des choix depersonnalisation des services et desproduits pour une nouvelle générationde consommateurs, le "client-des-igners". Ce genre de rapprochementd'informations liées à la géolocalisa-tion, aux habitudes de consommation,à la traçabilité doit se faire dans le res-pect de la législation sur la vie privée.

Quelle sécurité pour les informationstraitées par le Big Data ?

Pour la plupart des personnes interrogsécurité des traitements des informatioData est celle de tous les traitements qui rî -s'effectueront dans le cloud. Pour Fabrice Prugnaud,,Mde la société LogLogic, « une approche consiste à dir* j|qu'il y a des données critiques et que celles-ci ne Ssdoivent pas quitter le périmètre de l'entreprise. Pour "réduire les coûts et augmenter la rapidité dedéploiement, le cloud a été choisi mais est-il vraiment —•bien sécurisé ? En matière de gestion des logs (un t/'ersidu volume total des données des entreprises), H faut ;définir qui accède à mes données et quelle étanchéité:existe sur le contrôle des logs et la possibilité decontrôler les logs présents sur le cloud. » La firme ;

;

LogLogic, spécialisée comme on peut s'en douter ^dans l'analyse des logs, dispose avec LoglogicVS 360 " :

Insight d'un outil qui permet de filtrer tous les évènements qui se déroulent surle système d'information de ses clients. Une génération d'informations qui, àelles seules, nécessitent des analyses permanentes.

101/109 RUE JEAN JAURES92300 LEVALLOIS PERRET - 01 41 27 38 38

AVRIL 12Mensuel

OJD : 28143

Surface approx. (cm²) : 2850N° de page : 42-47

Page 6/6

CORPEVENTS1711481300501/GLB/MFG/3

Eléments de recherche : BIG DATA : congrès sur la santé mobile les 20 et 21/03/12 à la Cité Internationale Universitaire de Paris 14ème, toutescitations

Le vieux réflexesécuritaireLe Big Data c'est aussi à son dernier ni-veau, les applications qui naissent del'analyse des données (structurées etnon structurées), la réponse à unequestion cruciale proche de la e-répu-tation : qu'est ce qu'on dit de moi sur In-ternet ? Que pensent de notre offre lespartenaires, les clients, les concurrents? Mouloud Dey souligne : « Les appli-cations Big Data basées sur des tech-nologies sémantiques et l'agrégationde données fournissent une réponsemoins chère que la technologie desSGBD via un portail qui ne déplace pasles données. Entre les deux approches,la réduction du coût est de facteur 10.Un outil d'indexation simplifie les pro-cess en lisant directement la donnéeen langage naturel. Le Web semantic ade beaux outils mais il faut qu'ils soientutilisés et qu'ils le soient simplementvia une technologie open source. Or,les solutions de la fondation Apachesont gratuites et ennuient beaucoupd'acteurs. » Une architecture sédui-sante mais qui nécessite de confier àun "nuage" des données souvent stra-tégiques, d'où le retour au bon vieuxréflexe sécuritaire ; faut-il réellementconfier ces données aux acteurs ducloud ? Étant donné les volumes et les

techniques d'exploitation, le risque estminime par rapport aux avantages detraitement, qui seraient de toute ma-nière quasiment impossibles à obtenirsans les outils du cloud (lire à ce sujetles interventions de Fabrice Prugnaudde LogLogic dans notre encadré p.45et de Normand Girard de Varonis dansnotre encadré p.46).

IndispensableDernier point : que pèse économique-ment l'approche Big Data ? C'est diffi-cile à dire, d'autant que certains chif-fres très rares intègrent les solutions desauvegarde et de cloud Computing àl'estimation. « Bien que la marché duBig Data soit encore embryonnaire (Imilliard de revenus dans le monde2010 selon plusieurs sources) en théo-rie, les quatre niveaux de la "pile BigData" (infrastructures serveurs encloud, framework propriétaires ouopen source type Hadoop, exploitationet analyse via des requêtes de typeMap reduce et reporting ) rendent déjàde grands services », affirme-t-on chezTalend. Bref, incontournable, tous lesacteurs semblent le dire mais bien peucommentent les conséquences del'usage des outils Big Data pour la vieprivée.Jean Philippe Bichard

«LE BUT EST DE COMBINERDONNÉES STRUCTURÉES ETNON STRUCTURÉES POURRÉVÉLER DES INFORMATIONSQUI ÉTAIENT DIFFICILEMENTDISCERNABLES AFIN PAREXEMPLE D'OFFRIR DES CHOIXDE PERSONNALISATION DESSERVICES ET DES PRODUITS.»

L'inventeur du métier à tisser

Souvent cité comnl'inspirateur de CharlesBabbage, le père del'informatique, leFrançais Joseph-MarieJacquard est connu pouravoir créé les métiers àtisser évolués à la fin du

, XVIIIe siècle. Il revienti sur le devant delà scène"* avec le Big Data. Il a été

plusieurs fois cité lors deconférences sur le sujetpour avoir su exploiter,grâce à des cartes

perforées, des milliers de fils de couleurs différentes etautomatiser des traitements pour créer des tissusoriginaux, à l'instar des traitements qui exploitent à fonddes milliards d'informations différentes et souvent nonstructurées.

Interview

Windows News : D'où viennent vos données ? Êtes-vousconfronté à une problématique de volume avec elles ?Francis Nappez : Nous avons deux types de données :d'une part, des données normalisées sur l'utilisateur, surson comportement dans le site, et, d'autre part, les donnéesqu'il rentre lui-même concernant ses préférences, ses trajetsavenir, etc. Au total, notre site gère 1,6 million d'utilisateurs,soit 10 DOO nouveaux trajets chaque jour sur l'ensemble dela France. C'est beaucoup, d'autant que ces données ontune forte volatilité : les annonces de trajets changent enmoyenne tous les 5 jours. Il faut être capable de proposerde nouveaux services aux utilisateurs qui reviennent fré-quemment.

WN : Qu'est-ce qui vous a convaincu d'envisager uneinfrastructure de type Big Data ?Francis Nappez : Le problème réside en ces termes : ilfaut être capable de gérer un nombre croissant de don-nées sur une même quantité de temps écoulé. Impossiblequand on constate l'ampleur du data déluge ! Nous envi-sageons donc de passer sur une plateforme Map reduce

d atteindre un quasi-temps réenous pensons le différencier du ,une architecture scalable.

WN : Le problème du volume est-il la seule raison ?Francis Nappez : Ce n'est pas la seule raison. Nous comp-tons également développer notre offre de nouveaux ser-vices pour l'utilisateur et le traitement de la donnée entemps réel le permet. Cela relève plutôt de la Business Intel-ligence. En ce qui concerne les services, on peut très bienenvisager que, demain, grâce à la géolocalisation, une per-sonne munie d'un smartphone puisse trouver près de chezelle en quèlques minutes une voiture acceptant le covoitu-rage. Notre objectif sera atteint : rendre l'accès au covoitu-rage le plus simple possible. Autre application dont nousmesurons aujourd'hui les premiers effets : grâce au traite-ment très volumineux des préférences de trajet des utilisa-teurs, nous sommes capables de prévoir finement le traficdu lendemain et des jours à venir. C'est une utilisation révo-lutionnaire du Big Data I

capable de gérer unnombre croissantde données surune même quantitéde temps écoulé.Impossible quandon constatel'ampleur du datadéluge !

Francis Nappez estdirecteur technique

du site covoiturage.fr et del'application mobile Comuto