20
FlashInformatique.epfl.ch p/a EPFL - Domaine IT - Station 8 - CH 1015 Lausanne - tél. +41 21 69 322 11 30.08.2011 7 tout public public averti expert Actualités Que peut faire l’architecte de l’information pour la presse ? N. Meystre 7 Avis de décès de Jahia 4 N. Meystre 8 DIT-info: z L’heure-DIT J. Dousson z Une nouvelle adresse mail pour la sécurité informatique J. Dousson z Nouveau arrivé au DIT Y. Despond z Le DIT vous forme… 9 Dans les coulisses de plan.epfl.ch, version 3D P. Mellier & Fl. Déseneux 10 Le FI fait peau neuve sur le Web J. Dousson & A. Raposo de Barbosa 20 Analyse Netvibes: analyse d’un succès L. Denoréaz 1 Cookies en folies L. Kling 12 HPC dans le Cloud F. Figueras 16 À votre service Nouvelle politique HPC à l’EPFL V. Rezzonico 2 Bienvenue à la coordinatrice CSE D. Rey 2 Agenda Zetta – appel aux articles V. Rezzonico & M. Thiémard 10 Projets AAA de Switch P. Mellier 19 Prochaines parutions No Délai de rédaction Parution Rentrée 16.09.11 8 29.09.11 18.10.11 9 03.11.11 22.11.11 en page 2 Politique HPC à l’EPFL Analyse Netvibes: analyse d’un succès Laurence.Denoreaz@epfl.ch, EPFL – Domaine IT et étudiante ID à HEG-Carouge Feel the collaboration vibes... with Netvibes ! Vous aimez collaborer, et bien, vibrez maintenant... avec Netvibes! Description du service Simplicité, liberté, gratuité sont les maîtres mots pour caractériser le portail Web & Netvibes, un outil de marque-page social. En fait, un outil complet basé sur les tech- nologies du Web 2.0 & et permettant une gestion dynamique de votre vie numérique. Avec plusieurs millions d’utilisateurs à tra- vers le monde entier, répartis dans plus de 150 pays, une communauté très active, qui a traduit l’outil en plus de 70 langues, et la mise à disposition de plus de 260’000 wid- gets & , dont une partie conçus par les uti- lisateurs, le succès de cet outil collaboratif lancé en 2005 ne se dément pas. Que vous soyez simple internaute ou pro- fessionnel de l’information, vous risquez de vous laisser tenter par ce portail personna- lisable et d’aller surfer sur la vague de la mise en ligne facilitée. Ce service va vous permettre de: z créer un espace personnel totalement modulable, privé ou public, tel un site Web; z de synchroniser vos différents comptes (email, réseaux sociaux...) à partir d’une page unique; z d’avoir des informations toujours à jour, par agrégation de flux RSS & ; z de paramétrer une veille (flux RSS ou tableau de bord spécifique); z de gérer votre temps et vos centres d’intérêt, à l’aide de widgets; z et cerise sur le gâteau, d’accéder à votre espace depuis n’importe quel poste connecté sur le Web. L’histoire de Netvibes commence en sep- tembre 2005. À l’origine du concept de tableaux de bord personnalisables, deux jeunes hommes dynamiques et férus d’in- formatique et de nouvelles technologies: Tariq Krim et Florent Frémont. La startup démarre aussi grâce à deux so- ciétés actives dans les fonds d’investisse- ment: Index Venture et Accel Partners. D’abord présente à Paris et Londres, l’entre- prise Netvibes a aussi ouvert un bureau à San Francisco en 2007, pour lui permettre d’être plus proche de ses utilisateurs nord- américains et de renforcer les partenariats avec les autres firmes de la Silicon Valley. De nombreuses distinctions lui ont été octroyées au fil des ans, ce qui assoit son sérieux et sa notoriété. Netvibes est un outil gratuit, mais il est pos- sible à tout un chacun d’avoir un support personnalisé payant via le programme VIP. .. /.. Suite page 4 High-end Serveurs mutualisés Serveurs de faculté ou laboratoire

Flash informatique 2011 - no 7

  • Upload
    epfl

  • View
    221

  • Download
    6

Embed Size (px)

DESCRIPTION

journal informatique de l'Ecole Polytechnique Fédérale de Lausanne du 30 août 2011

Citation preview

Page 1: Flash informatique 2011 - no 7

FlashInformatiqueepflch

pa EPFL - Domaine IT - Station 8 - CH 1015 Lausanne - teacutel +41 21 69 322 11

300820117

tout public public averti expert

ActualiteacutesQue peut faire lrsquoarchitecte de lrsquoinformation

pour la presse N Meystre 7

Avis de deacutecegraves de Jahia 4 N Meystre 8

DIT-info

z Lrsquoheure-DIT J Dousson

z Une nouvelle adresse mail pour la

seacutecuriteacute informatique J Dousson

z Nouveau arriveacute au DIT Y Despond

z Le DIT vous formehellip 9

Dans les coulisses de planepflch

version 3D P Mellier amp Fl Deacuteseneux 10

Le FI fait peau neuve sur le Web

J Dousson amp A Raposo de Barbosa 20

AnalyseNetvibes analyse drsquoun

succegraves L Denoreacuteaz 1

Cookies en folies L Kling 12

HPC dans le Cloud F Figueras 16

Agrave votre serviceNouvelle politique HPC agrave lrsquoEPFL

V Rezzonico 2

Bienvenue agrave la coordinatrice CSE D Rey 2

AgendaZetta ndash appel aux articles

V Rezzonico amp M Thieacutemard 10

Projets AAA de Switch P Mellier 19

Prochaines parutions

No Deacutelai de reacutedaction Parution

Rentreacutee 160911

8 290911 181011

9 031111 221111

en page 2

Politique HPCagrave lrsquoEPFL Analyse

Netvibes analyse drsquoun succegraves LaurenceDenoreazepflch EPFL ndash Domaine IT et eacutetudiante ID agrave HEG-Carouge

Feel the collaboration vibes with Netvibes

Vous aimez collaborer et bien vibrez maintenant avec Netvibes

Description du service

Simpliciteacute liberteacute gratuiteacute sont les maicirctres mots pour caracteacuteriser le portail Web amp Netvibes un outil de marque-page social En fait un outil complet baseacute sur les tech-nologies du Web 20 amp et permettant une gestion dynamique de votre vie numeacuterique Avec plusieurs millions drsquoutilisateurs agrave tra-vers le monde entier reacutepartis dans plus de 150 pays une communauteacute tregraves active qui a traduit lrsquooutil en plus de 70 langues et la mise agrave disposition de plus de 260rsquo000 wid-gets amp dont une partie conccedilus par les uti-lisateurs le succegraves de cet outil collaboratif lanceacute en 2005 ne se deacutement pasQue vous soyez simple internaute ou pro-fessionnel de lrsquoinformation vous risquez de vous laisser tenter par ce portail personna-lisable et drsquoaller surfer sur la vague de la mise en ligne faciliteacutee Ce service va vous permettre dez creacuteer un espace personnel totalement

modulable priveacute ou public tel un site Web

z de synchroniser vos diffeacuterents comptes (email reacuteseaux sociaux) agrave partir drsquoune page unique

z drsquoavoir des informations toujours agrave jour par agreacutegation de flux RSS amp

z de parameacutetrer une veille (flux RSS ou tableau de bord speacutecifique)

z de geacuterer votre temps et vos centres drsquointeacuterecirct agrave lrsquoaide de widgets

z et cerise sur le gacircteau drsquoacceacuteder agrave votre espace depuis nrsquoimporte quel poste connecteacute sur le Web

Lrsquohistoire de Netvibes commence en sep-tembre 2005 Agrave lrsquoorigine du concept de tableaux de bord personnalisables deux jeunes hommes dynamiques et feacuterus drsquoin-formatique et de nouvelles technologies Tariq Krim et Florent FreacutemontLa startup deacutemarre aussi gracircce agrave deux so-cieacuteteacutes actives dans les fonds drsquoinvestisse-ment Index Venture et Accel Partners Drsquoabord preacutesente agrave Paris et Londres lrsquoentre-prise Netvibes a aussi ouvert un bureau agrave San Francisco en 2007 pour lui permettre drsquoecirctre plus proche de ses utilisateurs nord-ameacutericains et de renforcer les partenariats avec les autres firmes de la Silicon ValleyDe nombreuses distinctions lui ont eacuteteacute octroyeacutees au fil des ans ce qui assoit son seacuterieux et sa notorieacuteteacuteNetvibes est un outil gratuit mais il est pos-sible agrave tout un chacun drsquoavoir un support personnaliseacute payant via le programme VIP

Suite page 4

High-end

Serveurs mutualiseacutes

Serveurs de faculteacute ou laboratoire

2 flash informatique 30 aoucirct 2011 - Ndeg 7

Nouvelle politique HPC agrave lrsquoEPFLVittoriaRezzonicoeplfch EPFL coordinatrice CSEHPC

Agrave lrsquoEPFL trois types drsquoinformatique font appel de faccedilon tregraves im-portante agrave des serveurs de calculz lrsquoinformatique administrative (bureautique)z la recherche dans les domaines Informatique et Communicationsz le calcul comme support agrave la science et agrave lrsquoingeacutenierie (Com-

putational Science and Engineering CSE)

Informatique

Science ampIngeacutenierie

Administra-tion

RechercheIampC

fig1 ndash les trois cateacutegories de lrsquoinformatique en milieu universitaire

Un sondage a eacuteteacute effectueacute agrave lrsquoEPFL durant lrsquoeacuteteacute 2010 pour mesurer lrsquoimpact du CSE dans la recherche Il en a deacutecouleacute que le CSE est un pilier de la recherche avec agrave peu pregraves un millier drsquoutilisateurs des grands investissements en argent pour des usages disparates mais avec une base commune tregraves similaire Le CSE est une discipline transversale elle ne connaicirct pas les frontiegraveres entre les faculteacutes Pour ces raisons lrsquoEPFL a deacutecideacute drsquoy accorder une importance ma-jeure Cette volonteacute srsquoest concreacutetiseacutee deacutejagrave en 2009 par la creacuteation drsquoun master en CSE et du consortium CADMOS [1] qui a permis de renforcer la recherche en CSE en financcedilant des nouvelles chairesLe 6 deacutecembre 2010 en plus de la nomination drsquoun coordinateur du CSE agrave lrsquoeacutechelle de lrsquoEPFL la Direction de notre Eacutecole a accepteacute les propositions suivantesz une hieacuterarchie du CSE agrave trois niveauxz avec trois modes drsquoutilisationz avec une participation financiegravere des laboratoires

Agrave votre service

Bienvenue agrave la coordinatrice CSEDidierReyepflch coordinateur des systegravemes drsquoinformation

Au vu de lrsquoimportance que prend le Computational Science amp Engineering dans la recherche et du nombre de chercheurs concerneacutes agrave lrsquoEPFL la Direction de lrsquoEPFL a mis sur pied une politique CSE ambitieuse doteacutee de moyens financiers et a deacutecideacute dans ce cadre la creacuteation drsquoun nouveau poste de coordinatrice CSE que Vicky Rezzonico assume depuis le 1er aoucirct 2011 Personne de contact pour toute question tout problegraveme ou toute demande dans le domaine du CSE agrave lrsquoEPFL la coordinatrice CSE jouera un rocircle central entre les utilisateurs et les ressources de calcul agrave disposition de lrsquoEPFL sur le campus ou ailleurs ndash par exemple au CSCS elle animera aussi la communauteacute active dans le CSE agrave lrsquoEPFL et srsquoemploiera agrave optimiser lrsquoutilisation des ressourcesDeacutejagrave bien connue de la faculteacute SB pour la mise en œuvre de SuperB et de la communauteacute CSE par son implication dans le HPC-Tech Vicky Rezzonico va deacutebuter son activiteacute de coordinatrice en faisant le tour de tous les laboratoires de lrsquoEPFL concerneacutes par le CSE pour preacutesenter la nouvelle poli-tique deacutecideacutee par la Direction de lrsquoEPFL ainsi que les moyens qui sont mis en place pour supporter la politique elle pren-dra aussi connaissance en deacutetail de tous les besoins Nous vous remercions drsquoavance de lui reacuteserver un bon accueil et de lui faire part de vos expeacuteriences et besoins Ces informations seront preacutecieuses pour que la politique CSE et les ressources mises en œuvre agrave lrsquoEPFL soient adeacutequates et optimalesNous souhaitons pleine reacuteussite agrave Vicky dans cette nouvelle fonction qui sera cleacute pour le deacuteveloppement et le succegraves du CSE agrave lrsquoEPFL n

ImpressumRevue consacreacutee aux technologies de lrsquoinformation eacutediteacutee par le Domaine IT de lrsquoEPFL (DIT) Les articles nrsquoengagent que leurs auteurs sauf ceux qui concernent de faccedilon eacutevidente des prestations officielles (sous la responsabiliteacute du DIT ou drsquoautres entiteacutes) Toute reproduction mecircme par-tielle nrsquoest autoriseacutee qursquoavec lrsquoaccord de la reacutedaction et des auteurs

Reacutedacteur en chefJacqueline Dousson fiepflchMise en page amp graphisme Appoline Raposo de BarbosaComiteacute de reacutedactionJean-Daniel Bonjour Patrice Fumasoli Laurent Kling Julia Paolini Franccedilois Roulet Christophe Salzmann Richard Timsit amp Predrag Viceic

Impression Atelier de Reprographie EPFLTirage 4000 exemplairesAdresse Web FlashInformatiqueepflchAdresse Domaine IT EPFLStation 8 CH-1015 LausanneTeacuteleacutephone +41 21 69 32246 amp 32247Abonnement au FI par e-mail agrave fi-subscribelistesepflch

3330 aoucirct 2011 - Ndeg 7

Les infrastructures pour le CSE

La communauteacute de lrsquoEPFL a accegraves agrave trois types drsquoinfrastructure

eacutequipements de test et deacuteveloppementCes eacutequipements petits sont la proprieacuteteacute des laboratoires lesquels pour en ameacuteliorer lrsquoefficaciteacute peuvent se regrouper pour partager les frais La valeur maximale drsquoun cluster rentrant dans cette cateacute-gorie est fixeacutee agrave 50rsquo000 CHF

eacutequipements mutualiseacutes au niveau centralIl srsquoagit des clusters centraux (Callisto Antares Jupiter etc) Ces machines offrent toute une palette de services qui reacutepondent aux besoins de la communauteacute Leur planification se fait en concerta-tion avec les laboratoires inteacuteresseacutes

eacutequipements high-endParmi ces eacutequipements on compte le Blue GeneP mis agrave disposi-tion par le consortium CADMOS ainsi que les supercalculateurs des institutions partenaires comme le CSCS [2] Avant de tenter lrsquoaccegraves agrave ces eacutequipements il est raisonnable de faire ses preuves sur des machines plus petites ideacutealement dans notre cas sur les clusters mutualiseacutes

High-end

Serveurs mutualiseacutes

Serveurs de faculteacute ou laboratoire

fig 2 ndash hieacuterarchie des infrastructures pour le CSE

Modes drsquoutilisation

Lrsquoaccegraves aux eacutequipements high-end est compeacutetitif crsquoest-agrave-dire qursquoil est neacutecessaire de reacutediger un dossier qui va ecirctre analyseacute par une commission Les projets seront soumis agrave une seacutelection

Pour ce qui concerne les eacutequipements mutualiseacutes les utilisateurs auront deux choixachat semestriel de parts de la machine (location)Les laboratoires achegravetent chaque semestre une part de la machine selon un certain tarif [3] Les achats doivent donc ecirctre anticipeacutesachat de nœuds en utilisation exclusive (coproprieacuteteacute)Certains laboratoires expriment le deacutesir drsquoavoir leurs nœuds Ce mode de fonctionnement leur permet drsquoavoir accegraves immeacutediat agrave une portion de la machine pour toute la dureacutee de vie du mateacuteriel Lorsque leur portion nrsquoest pas utiliseacutee le temps de calcul est mis agrave disposition de la communauteacuteDans les deux cas lrsquoEPFL fournitz les administrateurs systegravemez lrsquoeacutelectriciteacute les locaux et le refroidissement

z les racks la connectiviteacute et les frontalesz du stockage agrave haute performance (home scratch)z des nœuds de test et des serveurs de visualisationLes laboratoires ne paient donc que les nœuds de calcul

Mutualisation = optimisation des ressources

La plupart des besoins se concentrant sur un nombre limiteacute de solutions malgreacute la diversiteacute des domaines abordeacutes des infras-tructures mutualiseacutees performantes devraient satisfaire la plus grande partie des utilisateurs du CSE au sein de lrsquoEPFL Lrsquoapproche mutualiseacutee permet une utilisation plus efficace des ressources si on considegravere le coucirct total de possession (TCO) en tenant compte des infrastructures ainsi que des ressources hu-maines Pour ce qui concerne les infrastructures on ameacuteliore lrsquoefficaciteacute eacutenergeacutetique et la redondance en utilisant des techno-logies agrave la pointe et des salles machine adapteacutees Du cocircteacute res-sources humaines on optimise la reacutepartition des tacircches entre les acteurs du HPC (gestionnaires drsquoinfrastructure administrateurs systegraveme experts applicatifs chercheurs) Une gestion coordonneacutee des ressources humaines amegravene en bonus plus de transparence sur lrsquoutilisation de ces ressources permettant ainsi de mieux anti-ciper les eacutevolutions neacutecessaires Elle permettra aussi de creacuteer une communauteacute multidisciplinaire favorisant ainsi les projets com-muns et lrsquoeacutechange drsquoexpeacuteriences Une rationalisation des ressources mettra agrave niveau les grandes dispariteacutes existant entre drsquoune part les laboratoires qui sont bien eacutetablis dans le CSE et qui disposent deacutejagrave des moyens et connais-sances neacutecessaires et drsquoautre part les laboratoires qui aujourdrsquohui deacutebutent dans le CSE et pour qui lrsquoaccegraves agrave de tels moyens et connaissances nrsquoest pas simpleAfin de rendre un eacuteventuel passage aux serveurs mutualiseacutes le plus agreacuteable possible il est neacutecessaire en premier lieu de faci-liter lrsquoaccegraves agrave lrsquoinformation et le partage drsquoexpeacuteriences dans les domaines Pour cela le coordinateur CSE est agrave votre serviceLe rocircle du coordinateur CSE sera eacutegalement de mettre sur pied un reacuteseau de speacutecialistes inteacutegreacutes dans les groupes de recherche afin drsquoaider agrave lrsquooptimisation des applications (paralleacutelisation) Lrsquooptimi-sation des codes repreacutesente un eacutenorme potentiel de gain de temps pour les chercheurs et drsquoeacuteconomie drsquoeacutenergie dans la perspective du green computing

Inteacuteresseacute

Dans les semaines qui suivent vous pouvez vous attendre agrave une visite de ma part vous pouvez aussi prendre les devants et me contacter directement Je me ferai un plaisir de discuter avec vous de vos sujets de recherche et besoins et je me reacutejouis de vous aider agrave vous orienter dans le paysage CSE de lrsquoEPFL

Reacutefeacuterences

[1] wwwcadmosorg[2] wwwcscsch[3] hpc-ditepflchintranetfinancing_rulesphp n

Nouvelle politique HPC agrave lrsquoEPFL

4 flash informatique44 30 aoucirct 2011 - Ndeg 7flash informatique

Ou encore pour les entreprises un service cibleacute par projet avec NFE (Netvibes For Entreprise) Et pour une gestion moins lourde un prix par tableau de bord avec NPD (Netvibes Premium Dashboard)Des documents tregraves complets deacutecrivant les conditions geacuteneacuterales et une politique de confidentialiteacute deacutefinissent les regravegles et le com-portement agrave adopter sur ce service les aspects juridiques du trai-tement des donneacutees personnelles et leur dureacutee de conservation les droits de proprieacuteteacute les responsabiliteacutes et les garantiesUn blog (blognetvibescomfr) donne des informations sur toute lrsquoactualiteacute du service (pannes nouveauteacutes trucs et astuces)Pour le cocircteacute mode drsquoemploi une FAQ (faqnetvibescomfr) est disponible et le manuel en anglais (faqnetvibescomdownloadsNetvibes-User_Guidepdf) destineacute aux utilisateurs sous format pdf est tregraves clair

Deacutemarrer avec Netvibes

Pour creacuteer votre page deux chemins sont agrave disposition1 Il suffit drsquoaller sur le site (wwwnetvibescomfr) drsquoecirctre titulaire

drsquoune adresse email valable (attention cette adresse sera votre nom drsquoutilisateur) et de creacuteer son compte en cliquant sur Creacuteer un compte en haut agrave droite de lrsquoeacutecran

2 Depuis la page drsquoaccueil de Netvibes il est possible de choisir un nom de tableau de bord (dashboard) puis de cliquer sur lrsquoonglet Dashboard it au centre de lrsquoeacutecran

Une fenecirctre srsquoouvre et vous propose diffeacuterentes images pour personnaliser votre tableau de bord Apregraves avoir fait votre seacute-lection l faudra cliquer sur Crsquoest fait Vous arrivez directe-ment sur une page avec le titre de votre tableau de bord Pour creacuteer votre compte il faut alors cliquer sur Inscription

Un message sera envoyeacute agrave votre adresse email Il faudra confirmer lrsquoactivation du compte en cliquant sur le lien confirm my email address Agrave tout moment il est possible de mettre agrave jour son profil Mais attention car un changement de nom drsquoutilisateur va chan-ger le nom et lrsquourl de votre page publique si elle existe

Les tableaux de bord (dashboard)

Dashboard est le nom de votre page de base sur Netvibes Vous allez pouvoir remplir cette page gracircce agrave la collection de widgets agrave disposition soit par un clic soit par glisser-deacuteposer (drag and drop) et organiser vos informations par centre drsquointeacuterecirct en multi-pliant les dashboards et leur contenuIl est possible drsquoavoir plusieurs dashboards priveacutes pour le mecircme compte mais un seul dashboard public est autoriseacute Une large seacutelection de dashboards preacutedeacutefinis est agrave disposition sur le site Il est possible drsquoen creacuteer des nouveaux via le menu correspondant (Dashboards --gt Nouveau)

Votre premiegravere page

Votre compte est creacuteeacute et vous vous ecirctes authentifieacute sur le site votre premiegravere page brute srsquoaffiche Elle est reacutepartie en plusieurs zonesz titrez barre de recherche Googlez seacuterie horizontale drsquoonglets (il est possible drsquoen ajouter drsquoautres

de les supprimer et de les reacuteorganiserz trois colonnes de base modifiables de une agrave quatre colonnes

selon vos souhaitsz dans ces colonnes des zones (boicirctes) agrave remplir gracircce aux wid-

gets et aux flux RSSMaintenant vous pouvez commencer agrave personnaliser votre page depuis Ajouter du contenu en haut agrave gauche de votre fenecirctre par le champ de recherche libre en explorant les diffeacuterentes cateacute-gories ou en seacutelectionnant les widgets essentiels Crsquoest aussi agrave cet

Netvibes analyse drsquoun succegraves

Suite de la premiegravere page

exemple de page creacuteeacutee en quelques minutes

5530 aoucirct 2011 - Ndeg 7

endroit que vous pourrez importer des flux RSS Chaque widget et chaque flux peuvent ecirctre deacuteplaceacutes eacutediteacutes ou supprimeacutesSi besoin un assistant virtuel peut vous aider Il vous indique com-ment proceacuteder avec les fonctions de base

Page priveacuteepublique

Apregraves vous ecirctre enregistreacute vous arrivez sur votre page priveacuteeLa gestion de vos pages priveacuteespubliques se fait agrave partir du menu Dashboards en haut de votre eacutecran

Les pages priveacutees et la page publique srsquoalimentent de la mecircme maniegraverePour activer sa page publique il faut cliquer sur lrsquoonglet Dash-boards et choisir Activer ma page publique dans le menu deacuteroulant Cette activation se fait en trois eacutetapesz informations personnelles (nom complet type de compte

sexe et date de naissance ndash il est possible de ne pas afficher la date de naissance publiquement) pour son profil public

z choix de lrsquoadresse publique (url)z informations sur la page publique (titre description cateacutegorie

et mot-cleacute)Il est possible de deacutesactiver sa page publique Le contenu restera identique mais ne sera plus accessible publiquement

Lrsquoeacutecosystegraveme de Netvibes

Ce reacutepertoire vous offre la possibiliteacute de rechercher le widget dont vous avez besoin la page publique qui peut vous inteacuteresser ou le thegraveme que vous souhaitez afficher ainsi que creacuteer et soumettre un nouveau widget ou thegraveme

Outil de veille

Pour faire de Netvibes votre outil de veille vous pouvez en plus de lrsquoagreacutegation de flux RSS passer par la creacuteation drsquoun tableau de bord speacutecifique depuis le menu deacuteroulant DashboardUne fenecirctre srsquoouvre qui vous permet drsquoentrer un mot-cleacute sur la theacutematique agrave surveiller

Puis une autre fenecirctre apparaicirct avec des suggestions de thegravemesEnsuite le tableau de bord est creacuteeacute avec des onglets configureacutes en relation avec le thegraveme de votre veille Pour que cette derniegravere soit vraiment performante il faudra la parameacutetrer la personnaliser lrsquoanalyser et la mettre agrave jour en fonction de lrsquoeacutevolution de vos besoins

Mobile Netvibes

Il est neacutecessaire drsquoecirctre deacutejagrave titulaire drsquoun compte sur Netvibes car on ne peut pas le creacuteer agrave partir de la version mobile Deux versions sont agrave disposition des utilisateurs suivant le modegravele de teacuteleacutephone une pour les smartphones (iPad iPhone et Android) et une autre pour les teacuteleacutephones portables classiques Un seul point drsquoaccegraves mobilenetvibescom qui sait repeacuterer votre type drsquoappareilAttention la version mobile est disponible uniquement en lecture Il existe certaines restrictions z pas drsquoaccegraves aux dashboards publicsz pas de modification des paramegravetres de votre tableau de bord

ni de son contenuz pas drsquoajoutcreacuteation de tableau de bord onglet widgetCertains widgets ne sont pas disponibles sur les versions mobileVous en trouvez la liste dans la FAQ correspondante (faqnetvibescomfrversions_mobiles)Selon les informations de Netvibes les widgets Mail et Twitter seront bientocirct disponibles sur votre mobile

Les plus de Netvibes

z Deacutemarrage rapide creacuteation du compte et de la premiegravere pagez Prise en main aiseacutee des diverses fonctionnaliteacutes de lrsquooutil

(ajout de flux et de widgets mise en page personnalisation de la page)

z Pas de publiciteacutez Agrave partir de nrsquoimporte quel poste de travail vous aurez accegraves

agrave toutes les informations que vous aurez inteacutegreacute sur votre page Netvibes par exemple e-mail calendrier meacuteteacuteo flux comptes sur les reacuteseaux sociaux photos) sans avoir besoin drsquoaller consulter chaque site ou page seacutepareacutement

z En seacutelectionnant un widget on voit sur quelles autres plates-formes on le trouve aussi De mecircme on peut le partager et donner son avis Des statistiques sont disponibles (nombre drsquoinstallations sur quel portail) Ainsi que le report de pro-blegraveme commentaire ou promotion du produit

z Netvibes peut aussi servir de reacuteseau social Il est possible drsquoavoir des amis preacutesents aussi sur ce portail

z La suppression de son compte se fait facilement ce qui nrsquoest pas forceacutement eacutevident sur drsquoautres portails

Et les moins

z Certains widgets sont buggeacutes donc grosse deacuteception au mo-ment de lrsquoinstallation Drsquoautres widgets sont plutocirct compli-queacutes agrave installer car il faut passer par un site alternatif

z Les deacutelais pour la mise agrave jour ou lrsquoactivation des flux RSS est signaleacutee par de nombreux utilisateurs

z Selon certains professionnels de la documentation la veille nrsquoest forceacutement aussi optimale que sur drsquoautres portails La situation ideacuteale serait de coupler plusieurs outils

Quelques portails inteacuteressants

De nombreux particuliers ainsi qursquoun certain nombre drsquoinstitu-tions et drsquoentreprises ont opteacute pour une visibiliteacute sur Netvibes

Netvibes analyse drsquoun succegraves

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 2: Flash informatique 2011 - no 7

2 flash informatique 30 aoucirct 2011 - Ndeg 7

Nouvelle politique HPC agrave lrsquoEPFLVittoriaRezzonicoeplfch EPFL coordinatrice CSEHPC

Agrave lrsquoEPFL trois types drsquoinformatique font appel de faccedilon tregraves im-portante agrave des serveurs de calculz lrsquoinformatique administrative (bureautique)z la recherche dans les domaines Informatique et Communicationsz le calcul comme support agrave la science et agrave lrsquoingeacutenierie (Com-

putational Science and Engineering CSE)

Informatique

Science ampIngeacutenierie

Administra-tion

RechercheIampC

fig1 ndash les trois cateacutegories de lrsquoinformatique en milieu universitaire

Un sondage a eacuteteacute effectueacute agrave lrsquoEPFL durant lrsquoeacuteteacute 2010 pour mesurer lrsquoimpact du CSE dans la recherche Il en a deacutecouleacute que le CSE est un pilier de la recherche avec agrave peu pregraves un millier drsquoutilisateurs des grands investissements en argent pour des usages disparates mais avec une base commune tregraves similaire Le CSE est une discipline transversale elle ne connaicirct pas les frontiegraveres entre les faculteacutes Pour ces raisons lrsquoEPFL a deacutecideacute drsquoy accorder une importance ma-jeure Cette volonteacute srsquoest concreacutetiseacutee deacutejagrave en 2009 par la creacuteation drsquoun master en CSE et du consortium CADMOS [1] qui a permis de renforcer la recherche en CSE en financcedilant des nouvelles chairesLe 6 deacutecembre 2010 en plus de la nomination drsquoun coordinateur du CSE agrave lrsquoeacutechelle de lrsquoEPFL la Direction de notre Eacutecole a accepteacute les propositions suivantesz une hieacuterarchie du CSE agrave trois niveauxz avec trois modes drsquoutilisationz avec une participation financiegravere des laboratoires

Agrave votre service

Bienvenue agrave la coordinatrice CSEDidierReyepflch coordinateur des systegravemes drsquoinformation

Au vu de lrsquoimportance que prend le Computational Science amp Engineering dans la recherche et du nombre de chercheurs concerneacutes agrave lrsquoEPFL la Direction de lrsquoEPFL a mis sur pied une politique CSE ambitieuse doteacutee de moyens financiers et a deacutecideacute dans ce cadre la creacuteation drsquoun nouveau poste de coordinatrice CSE que Vicky Rezzonico assume depuis le 1er aoucirct 2011 Personne de contact pour toute question tout problegraveme ou toute demande dans le domaine du CSE agrave lrsquoEPFL la coordinatrice CSE jouera un rocircle central entre les utilisateurs et les ressources de calcul agrave disposition de lrsquoEPFL sur le campus ou ailleurs ndash par exemple au CSCS elle animera aussi la communauteacute active dans le CSE agrave lrsquoEPFL et srsquoemploiera agrave optimiser lrsquoutilisation des ressourcesDeacutejagrave bien connue de la faculteacute SB pour la mise en œuvre de SuperB et de la communauteacute CSE par son implication dans le HPC-Tech Vicky Rezzonico va deacutebuter son activiteacute de coordinatrice en faisant le tour de tous les laboratoires de lrsquoEPFL concerneacutes par le CSE pour preacutesenter la nouvelle poli-tique deacutecideacutee par la Direction de lrsquoEPFL ainsi que les moyens qui sont mis en place pour supporter la politique elle pren-dra aussi connaissance en deacutetail de tous les besoins Nous vous remercions drsquoavance de lui reacuteserver un bon accueil et de lui faire part de vos expeacuteriences et besoins Ces informations seront preacutecieuses pour que la politique CSE et les ressources mises en œuvre agrave lrsquoEPFL soient adeacutequates et optimalesNous souhaitons pleine reacuteussite agrave Vicky dans cette nouvelle fonction qui sera cleacute pour le deacuteveloppement et le succegraves du CSE agrave lrsquoEPFL n

ImpressumRevue consacreacutee aux technologies de lrsquoinformation eacutediteacutee par le Domaine IT de lrsquoEPFL (DIT) Les articles nrsquoengagent que leurs auteurs sauf ceux qui concernent de faccedilon eacutevidente des prestations officielles (sous la responsabiliteacute du DIT ou drsquoautres entiteacutes) Toute reproduction mecircme par-tielle nrsquoest autoriseacutee qursquoavec lrsquoaccord de la reacutedaction et des auteurs

Reacutedacteur en chefJacqueline Dousson fiepflchMise en page amp graphisme Appoline Raposo de BarbosaComiteacute de reacutedactionJean-Daniel Bonjour Patrice Fumasoli Laurent Kling Julia Paolini Franccedilois Roulet Christophe Salzmann Richard Timsit amp Predrag Viceic

Impression Atelier de Reprographie EPFLTirage 4000 exemplairesAdresse Web FlashInformatiqueepflchAdresse Domaine IT EPFLStation 8 CH-1015 LausanneTeacuteleacutephone +41 21 69 32246 amp 32247Abonnement au FI par e-mail agrave fi-subscribelistesepflch

3330 aoucirct 2011 - Ndeg 7

Les infrastructures pour le CSE

La communauteacute de lrsquoEPFL a accegraves agrave trois types drsquoinfrastructure

eacutequipements de test et deacuteveloppementCes eacutequipements petits sont la proprieacuteteacute des laboratoires lesquels pour en ameacuteliorer lrsquoefficaciteacute peuvent se regrouper pour partager les frais La valeur maximale drsquoun cluster rentrant dans cette cateacute-gorie est fixeacutee agrave 50rsquo000 CHF

eacutequipements mutualiseacutes au niveau centralIl srsquoagit des clusters centraux (Callisto Antares Jupiter etc) Ces machines offrent toute une palette de services qui reacutepondent aux besoins de la communauteacute Leur planification se fait en concerta-tion avec les laboratoires inteacuteresseacutes

eacutequipements high-endParmi ces eacutequipements on compte le Blue GeneP mis agrave disposi-tion par le consortium CADMOS ainsi que les supercalculateurs des institutions partenaires comme le CSCS [2] Avant de tenter lrsquoaccegraves agrave ces eacutequipements il est raisonnable de faire ses preuves sur des machines plus petites ideacutealement dans notre cas sur les clusters mutualiseacutes

High-end

Serveurs mutualiseacutes

Serveurs de faculteacute ou laboratoire

fig 2 ndash hieacuterarchie des infrastructures pour le CSE

Modes drsquoutilisation

Lrsquoaccegraves aux eacutequipements high-end est compeacutetitif crsquoest-agrave-dire qursquoil est neacutecessaire de reacutediger un dossier qui va ecirctre analyseacute par une commission Les projets seront soumis agrave une seacutelection

Pour ce qui concerne les eacutequipements mutualiseacutes les utilisateurs auront deux choixachat semestriel de parts de la machine (location)Les laboratoires achegravetent chaque semestre une part de la machine selon un certain tarif [3] Les achats doivent donc ecirctre anticipeacutesachat de nœuds en utilisation exclusive (coproprieacuteteacute)Certains laboratoires expriment le deacutesir drsquoavoir leurs nœuds Ce mode de fonctionnement leur permet drsquoavoir accegraves immeacutediat agrave une portion de la machine pour toute la dureacutee de vie du mateacuteriel Lorsque leur portion nrsquoest pas utiliseacutee le temps de calcul est mis agrave disposition de la communauteacuteDans les deux cas lrsquoEPFL fournitz les administrateurs systegravemez lrsquoeacutelectriciteacute les locaux et le refroidissement

z les racks la connectiviteacute et les frontalesz du stockage agrave haute performance (home scratch)z des nœuds de test et des serveurs de visualisationLes laboratoires ne paient donc que les nœuds de calcul

Mutualisation = optimisation des ressources

La plupart des besoins se concentrant sur un nombre limiteacute de solutions malgreacute la diversiteacute des domaines abordeacutes des infras-tructures mutualiseacutees performantes devraient satisfaire la plus grande partie des utilisateurs du CSE au sein de lrsquoEPFL Lrsquoapproche mutualiseacutee permet une utilisation plus efficace des ressources si on considegravere le coucirct total de possession (TCO) en tenant compte des infrastructures ainsi que des ressources hu-maines Pour ce qui concerne les infrastructures on ameacuteliore lrsquoefficaciteacute eacutenergeacutetique et la redondance en utilisant des techno-logies agrave la pointe et des salles machine adapteacutees Du cocircteacute res-sources humaines on optimise la reacutepartition des tacircches entre les acteurs du HPC (gestionnaires drsquoinfrastructure administrateurs systegraveme experts applicatifs chercheurs) Une gestion coordonneacutee des ressources humaines amegravene en bonus plus de transparence sur lrsquoutilisation de ces ressources permettant ainsi de mieux anti-ciper les eacutevolutions neacutecessaires Elle permettra aussi de creacuteer une communauteacute multidisciplinaire favorisant ainsi les projets com-muns et lrsquoeacutechange drsquoexpeacuteriences Une rationalisation des ressources mettra agrave niveau les grandes dispariteacutes existant entre drsquoune part les laboratoires qui sont bien eacutetablis dans le CSE et qui disposent deacutejagrave des moyens et connais-sances neacutecessaires et drsquoautre part les laboratoires qui aujourdrsquohui deacutebutent dans le CSE et pour qui lrsquoaccegraves agrave de tels moyens et connaissances nrsquoest pas simpleAfin de rendre un eacuteventuel passage aux serveurs mutualiseacutes le plus agreacuteable possible il est neacutecessaire en premier lieu de faci-liter lrsquoaccegraves agrave lrsquoinformation et le partage drsquoexpeacuteriences dans les domaines Pour cela le coordinateur CSE est agrave votre serviceLe rocircle du coordinateur CSE sera eacutegalement de mettre sur pied un reacuteseau de speacutecialistes inteacutegreacutes dans les groupes de recherche afin drsquoaider agrave lrsquooptimisation des applications (paralleacutelisation) Lrsquooptimi-sation des codes repreacutesente un eacutenorme potentiel de gain de temps pour les chercheurs et drsquoeacuteconomie drsquoeacutenergie dans la perspective du green computing

Inteacuteresseacute

Dans les semaines qui suivent vous pouvez vous attendre agrave une visite de ma part vous pouvez aussi prendre les devants et me contacter directement Je me ferai un plaisir de discuter avec vous de vos sujets de recherche et besoins et je me reacutejouis de vous aider agrave vous orienter dans le paysage CSE de lrsquoEPFL

Reacutefeacuterences

[1] wwwcadmosorg[2] wwwcscsch[3] hpc-ditepflchintranetfinancing_rulesphp n

Nouvelle politique HPC agrave lrsquoEPFL

4 flash informatique44 30 aoucirct 2011 - Ndeg 7flash informatique

Ou encore pour les entreprises un service cibleacute par projet avec NFE (Netvibes For Entreprise) Et pour une gestion moins lourde un prix par tableau de bord avec NPD (Netvibes Premium Dashboard)Des documents tregraves complets deacutecrivant les conditions geacuteneacuterales et une politique de confidentialiteacute deacutefinissent les regravegles et le com-portement agrave adopter sur ce service les aspects juridiques du trai-tement des donneacutees personnelles et leur dureacutee de conservation les droits de proprieacuteteacute les responsabiliteacutes et les garantiesUn blog (blognetvibescomfr) donne des informations sur toute lrsquoactualiteacute du service (pannes nouveauteacutes trucs et astuces)Pour le cocircteacute mode drsquoemploi une FAQ (faqnetvibescomfr) est disponible et le manuel en anglais (faqnetvibescomdownloadsNetvibes-User_Guidepdf) destineacute aux utilisateurs sous format pdf est tregraves clair

Deacutemarrer avec Netvibes

Pour creacuteer votre page deux chemins sont agrave disposition1 Il suffit drsquoaller sur le site (wwwnetvibescomfr) drsquoecirctre titulaire

drsquoune adresse email valable (attention cette adresse sera votre nom drsquoutilisateur) et de creacuteer son compte en cliquant sur Creacuteer un compte en haut agrave droite de lrsquoeacutecran

2 Depuis la page drsquoaccueil de Netvibes il est possible de choisir un nom de tableau de bord (dashboard) puis de cliquer sur lrsquoonglet Dashboard it au centre de lrsquoeacutecran

Une fenecirctre srsquoouvre et vous propose diffeacuterentes images pour personnaliser votre tableau de bord Apregraves avoir fait votre seacute-lection l faudra cliquer sur Crsquoest fait Vous arrivez directe-ment sur une page avec le titre de votre tableau de bord Pour creacuteer votre compte il faut alors cliquer sur Inscription

Un message sera envoyeacute agrave votre adresse email Il faudra confirmer lrsquoactivation du compte en cliquant sur le lien confirm my email address Agrave tout moment il est possible de mettre agrave jour son profil Mais attention car un changement de nom drsquoutilisateur va chan-ger le nom et lrsquourl de votre page publique si elle existe

Les tableaux de bord (dashboard)

Dashboard est le nom de votre page de base sur Netvibes Vous allez pouvoir remplir cette page gracircce agrave la collection de widgets agrave disposition soit par un clic soit par glisser-deacuteposer (drag and drop) et organiser vos informations par centre drsquointeacuterecirct en multi-pliant les dashboards et leur contenuIl est possible drsquoavoir plusieurs dashboards priveacutes pour le mecircme compte mais un seul dashboard public est autoriseacute Une large seacutelection de dashboards preacutedeacutefinis est agrave disposition sur le site Il est possible drsquoen creacuteer des nouveaux via le menu correspondant (Dashboards --gt Nouveau)

Votre premiegravere page

Votre compte est creacuteeacute et vous vous ecirctes authentifieacute sur le site votre premiegravere page brute srsquoaffiche Elle est reacutepartie en plusieurs zonesz titrez barre de recherche Googlez seacuterie horizontale drsquoonglets (il est possible drsquoen ajouter drsquoautres

de les supprimer et de les reacuteorganiserz trois colonnes de base modifiables de une agrave quatre colonnes

selon vos souhaitsz dans ces colonnes des zones (boicirctes) agrave remplir gracircce aux wid-

gets et aux flux RSSMaintenant vous pouvez commencer agrave personnaliser votre page depuis Ajouter du contenu en haut agrave gauche de votre fenecirctre par le champ de recherche libre en explorant les diffeacuterentes cateacute-gories ou en seacutelectionnant les widgets essentiels Crsquoest aussi agrave cet

Netvibes analyse drsquoun succegraves

Suite de la premiegravere page

exemple de page creacuteeacutee en quelques minutes

5530 aoucirct 2011 - Ndeg 7

endroit que vous pourrez importer des flux RSS Chaque widget et chaque flux peuvent ecirctre deacuteplaceacutes eacutediteacutes ou supprimeacutesSi besoin un assistant virtuel peut vous aider Il vous indique com-ment proceacuteder avec les fonctions de base

Page priveacuteepublique

Apregraves vous ecirctre enregistreacute vous arrivez sur votre page priveacuteeLa gestion de vos pages priveacuteespubliques se fait agrave partir du menu Dashboards en haut de votre eacutecran

Les pages priveacutees et la page publique srsquoalimentent de la mecircme maniegraverePour activer sa page publique il faut cliquer sur lrsquoonglet Dash-boards et choisir Activer ma page publique dans le menu deacuteroulant Cette activation se fait en trois eacutetapesz informations personnelles (nom complet type de compte

sexe et date de naissance ndash il est possible de ne pas afficher la date de naissance publiquement) pour son profil public

z choix de lrsquoadresse publique (url)z informations sur la page publique (titre description cateacutegorie

et mot-cleacute)Il est possible de deacutesactiver sa page publique Le contenu restera identique mais ne sera plus accessible publiquement

Lrsquoeacutecosystegraveme de Netvibes

Ce reacutepertoire vous offre la possibiliteacute de rechercher le widget dont vous avez besoin la page publique qui peut vous inteacuteresser ou le thegraveme que vous souhaitez afficher ainsi que creacuteer et soumettre un nouveau widget ou thegraveme

Outil de veille

Pour faire de Netvibes votre outil de veille vous pouvez en plus de lrsquoagreacutegation de flux RSS passer par la creacuteation drsquoun tableau de bord speacutecifique depuis le menu deacuteroulant DashboardUne fenecirctre srsquoouvre qui vous permet drsquoentrer un mot-cleacute sur la theacutematique agrave surveiller

Puis une autre fenecirctre apparaicirct avec des suggestions de thegravemesEnsuite le tableau de bord est creacuteeacute avec des onglets configureacutes en relation avec le thegraveme de votre veille Pour que cette derniegravere soit vraiment performante il faudra la parameacutetrer la personnaliser lrsquoanalyser et la mettre agrave jour en fonction de lrsquoeacutevolution de vos besoins

Mobile Netvibes

Il est neacutecessaire drsquoecirctre deacutejagrave titulaire drsquoun compte sur Netvibes car on ne peut pas le creacuteer agrave partir de la version mobile Deux versions sont agrave disposition des utilisateurs suivant le modegravele de teacuteleacutephone une pour les smartphones (iPad iPhone et Android) et une autre pour les teacuteleacutephones portables classiques Un seul point drsquoaccegraves mobilenetvibescom qui sait repeacuterer votre type drsquoappareilAttention la version mobile est disponible uniquement en lecture Il existe certaines restrictions z pas drsquoaccegraves aux dashboards publicsz pas de modification des paramegravetres de votre tableau de bord

ni de son contenuz pas drsquoajoutcreacuteation de tableau de bord onglet widgetCertains widgets ne sont pas disponibles sur les versions mobileVous en trouvez la liste dans la FAQ correspondante (faqnetvibescomfrversions_mobiles)Selon les informations de Netvibes les widgets Mail et Twitter seront bientocirct disponibles sur votre mobile

Les plus de Netvibes

z Deacutemarrage rapide creacuteation du compte et de la premiegravere pagez Prise en main aiseacutee des diverses fonctionnaliteacutes de lrsquooutil

(ajout de flux et de widgets mise en page personnalisation de la page)

z Pas de publiciteacutez Agrave partir de nrsquoimporte quel poste de travail vous aurez accegraves

agrave toutes les informations que vous aurez inteacutegreacute sur votre page Netvibes par exemple e-mail calendrier meacuteteacuteo flux comptes sur les reacuteseaux sociaux photos) sans avoir besoin drsquoaller consulter chaque site ou page seacutepareacutement

z En seacutelectionnant un widget on voit sur quelles autres plates-formes on le trouve aussi De mecircme on peut le partager et donner son avis Des statistiques sont disponibles (nombre drsquoinstallations sur quel portail) Ainsi que le report de pro-blegraveme commentaire ou promotion du produit

z Netvibes peut aussi servir de reacuteseau social Il est possible drsquoavoir des amis preacutesents aussi sur ce portail

z La suppression de son compte se fait facilement ce qui nrsquoest pas forceacutement eacutevident sur drsquoautres portails

Et les moins

z Certains widgets sont buggeacutes donc grosse deacuteception au mo-ment de lrsquoinstallation Drsquoautres widgets sont plutocirct compli-queacutes agrave installer car il faut passer par un site alternatif

z Les deacutelais pour la mise agrave jour ou lrsquoactivation des flux RSS est signaleacutee par de nombreux utilisateurs

z Selon certains professionnels de la documentation la veille nrsquoest forceacutement aussi optimale que sur drsquoautres portails La situation ideacuteale serait de coupler plusieurs outils

Quelques portails inteacuteressants

De nombreux particuliers ainsi qursquoun certain nombre drsquoinstitu-tions et drsquoentreprises ont opteacute pour une visibiliteacute sur Netvibes

Netvibes analyse drsquoun succegraves

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 3: Flash informatique 2011 - no 7

3330 aoucirct 2011 - Ndeg 7

Les infrastructures pour le CSE

La communauteacute de lrsquoEPFL a accegraves agrave trois types drsquoinfrastructure

eacutequipements de test et deacuteveloppementCes eacutequipements petits sont la proprieacuteteacute des laboratoires lesquels pour en ameacuteliorer lrsquoefficaciteacute peuvent se regrouper pour partager les frais La valeur maximale drsquoun cluster rentrant dans cette cateacute-gorie est fixeacutee agrave 50rsquo000 CHF

eacutequipements mutualiseacutes au niveau centralIl srsquoagit des clusters centraux (Callisto Antares Jupiter etc) Ces machines offrent toute une palette de services qui reacutepondent aux besoins de la communauteacute Leur planification se fait en concerta-tion avec les laboratoires inteacuteresseacutes

eacutequipements high-endParmi ces eacutequipements on compte le Blue GeneP mis agrave disposi-tion par le consortium CADMOS ainsi que les supercalculateurs des institutions partenaires comme le CSCS [2] Avant de tenter lrsquoaccegraves agrave ces eacutequipements il est raisonnable de faire ses preuves sur des machines plus petites ideacutealement dans notre cas sur les clusters mutualiseacutes

High-end

Serveurs mutualiseacutes

Serveurs de faculteacute ou laboratoire

fig 2 ndash hieacuterarchie des infrastructures pour le CSE

Modes drsquoutilisation

Lrsquoaccegraves aux eacutequipements high-end est compeacutetitif crsquoest-agrave-dire qursquoil est neacutecessaire de reacutediger un dossier qui va ecirctre analyseacute par une commission Les projets seront soumis agrave une seacutelection

Pour ce qui concerne les eacutequipements mutualiseacutes les utilisateurs auront deux choixachat semestriel de parts de la machine (location)Les laboratoires achegravetent chaque semestre une part de la machine selon un certain tarif [3] Les achats doivent donc ecirctre anticipeacutesachat de nœuds en utilisation exclusive (coproprieacuteteacute)Certains laboratoires expriment le deacutesir drsquoavoir leurs nœuds Ce mode de fonctionnement leur permet drsquoavoir accegraves immeacutediat agrave une portion de la machine pour toute la dureacutee de vie du mateacuteriel Lorsque leur portion nrsquoest pas utiliseacutee le temps de calcul est mis agrave disposition de la communauteacuteDans les deux cas lrsquoEPFL fournitz les administrateurs systegravemez lrsquoeacutelectriciteacute les locaux et le refroidissement

z les racks la connectiviteacute et les frontalesz du stockage agrave haute performance (home scratch)z des nœuds de test et des serveurs de visualisationLes laboratoires ne paient donc que les nœuds de calcul

Mutualisation = optimisation des ressources

La plupart des besoins se concentrant sur un nombre limiteacute de solutions malgreacute la diversiteacute des domaines abordeacutes des infras-tructures mutualiseacutees performantes devraient satisfaire la plus grande partie des utilisateurs du CSE au sein de lrsquoEPFL Lrsquoapproche mutualiseacutee permet une utilisation plus efficace des ressources si on considegravere le coucirct total de possession (TCO) en tenant compte des infrastructures ainsi que des ressources hu-maines Pour ce qui concerne les infrastructures on ameacuteliore lrsquoefficaciteacute eacutenergeacutetique et la redondance en utilisant des techno-logies agrave la pointe et des salles machine adapteacutees Du cocircteacute res-sources humaines on optimise la reacutepartition des tacircches entre les acteurs du HPC (gestionnaires drsquoinfrastructure administrateurs systegraveme experts applicatifs chercheurs) Une gestion coordonneacutee des ressources humaines amegravene en bonus plus de transparence sur lrsquoutilisation de ces ressources permettant ainsi de mieux anti-ciper les eacutevolutions neacutecessaires Elle permettra aussi de creacuteer une communauteacute multidisciplinaire favorisant ainsi les projets com-muns et lrsquoeacutechange drsquoexpeacuteriences Une rationalisation des ressources mettra agrave niveau les grandes dispariteacutes existant entre drsquoune part les laboratoires qui sont bien eacutetablis dans le CSE et qui disposent deacutejagrave des moyens et connais-sances neacutecessaires et drsquoautre part les laboratoires qui aujourdrsquohui deacutebutent dans le CSE et pour qui lrsquoaccegraves agrave de tels moyens et connaissances nrsquoest pas simpleAfin de rendre un eacuteventuel passage aux serveurs mutualiseacutes le plus agreacuteable possible il est neacutecessaire en premier lieu de faci-liter lrsquoaccegraves agrave lrsquoinformation et le partage drsquoexpeacuteriences dans les domaines Pour cela le coordinateur CSE est agrave votre serviceLe rocircle du coordinateur CSE sera eacutegalement de mettre sur pied un reacuteseau de speacutecialistes inteacutegreacutes dans les groupes de recherche afin drsquoaider agrave lrsquooptimisation des applications (paralleacutelisation) Lrsquooptimi-sation des codes repreacutesente un eacutenorme potentiel de gain de temps pour les chercheurs et drsquoeacuteconomie drsquoeacutenergie dans la perspective du green computing

Inteacuteresseacute

Dans les semaines qui suivent vous pouvez vous attendre agrave une visite de ma part vous pouvez aussi prendre les devants et me contacter directement Je me ferai un plaisir de discuter avec vous de vos sujets de recherche et besoins et je me reacutejouis de vous aider agrave vous orienter dans le paysage CSE de lrsquoEPFL

Reacutefeacuterences

[1] wwwcadmosorg[2] wwwcscsch[3] hpc-ditepflchintranetfinancing_rulesphp n

Nouvelle politique HPC agrave lrsquoEPFL

4 flash informatique44 30 aoucirct 2011 - Ndeg 7flash informatique

Ou encore pour les entreprises un service cibleacute par projet avec NFE (Netvibes For Entreprise) Et pour une gestion moins lourde un prix par tableau de bord avec NPD (Netvibes Premium Dashboard)Des documents tregraves complets deacutecrivant les conditions geacuteneacuterales et une politique de confidentialiteacute deacutefinissent les regravegles et le com-portement agrave adopter sur ce service les aspects juridiques du trai-tement des donneacutees personnelles et leur dureacutee de conservation les droits de proprieacuteteacute les responsabiliteacutes et les garantiesUn blog (blognetvibescomfr) donne des informations sur toute lrsquoactualiteacute du service (pannes nouveauteacutes trucs et astuces)Pour le cocircteacute mode drsquoemploi une FAQ (faqnetvibescomfr) est disponible et le manuel en anglais (faqnetvibescomdownloadsNetvibes-User_Guidepdf) destineacute aux utilisateurs sous format pdf est tregraves clair

Deacutemarrer avec Netvibes

Pour creacuteer votre page deux chemins sont agrave disposition1 Il suffit drsquoaller sur le site (wwwnetvibescomfr) drsquoecirctre titulaire

drsquoune adresse email valable (attention cette adresse sera votre nom drsquoutilisateur) et de creacuteer son compte en cliquant sur Creacuteer un compte en haut agrave droite de lrsquoeacutecran

2 Depuis la page drsquoaccueil de Netvibes il est possible de choisir un nom de tableau de bord (dashboard) puis de cliquer sur lrsquoonglet Dashboard it au centre de lrsquoeacutecran

Une fenecirctre srsquoouvre et vous propose diffeacuterentes images pour personnaliser votre tableau de bord Apregraves avoir fait votre seacute-lection l faudra cliquer sur Crsquoest fait Vous arrivez directe-ment sur une page avec le titre de votre tableau de bord Pour creacuteer votre compte il faut alors cliquer sur Inscription

Un message sera envoyeacute agrave votre adresse email Il faudra confirmer lrsquoactivation du compte en cliquant sur le lien confirm my email address Agrave tout moment il est possible de mettre agrave jour son profil Mais attention car un changement de nom drsquoutilisateur va chan-ger le nom et lrsquourl de votre page publique si elle existe

Les tableaux de bord (dashboard)

Dashboard est le nom de votre page de base sur Netvibes Vous allez pouvoir remplir cette page gracircce agrave la collection de widgets agrave disposition soit par un clic soit par glisser-deacuteposer (drag and drop) et organiser vos informations par centre drsquointeacuterecirct en multi-pliant les dashboards et leur contenuIl est possible drsquoavoir plusieurs dashboards priveacutes pour le mecircme compte mais un seul dashboard public est autoriseacute Une large seacutelection de dashboards preacutedeacutefinis est agrave disposition sur le site Il est possible drsquoen creacuteer des nouveaux via le menu correspondant (Dashboards --gt Nouveau)

Votre premiegravere page

Votre compte est creacuteeacute et vous vous ecirctes authentifieacute sur le site votre premiegravere page brute srsquoaffiche Elle est reacutepartie en plusieurs zonesz titrez barre de recherche Googlez seacuterie horizontale drsquoonglets (il est possible drsquoen ajouter drsquoautres

de les supprimer et de les reacuteorganiserz trois colonnes de base modifiables de une agrave quatre colonnes

selon vos souhaitsz dans ces colonnes des zones (boicirctes) agrave remplir gracircce aux wid-

gets et aux flux RSSMaintenant vous pouvez commencer agrave personnaliser votre page depuis Ajouter du contenu en haut agrave gauche de votre fenecirctre par le champ de recherche libre en explorant les diffeacuterentes cateacute-gories ou en seacutelectionnant les widgets essentiels Crsquoest aussi agrave cet

Netvibes analyse drsquoun succegraves

Suite de la premiegravere page

exemple de page creacuteeacutee en quelques minutes

5530 aoucirct 2011 - Ndeg 7

endroit que vous pourrez importer des flux RSS Chaque widget et chaque flux peuvent ecirctre deacuteplaceacutes eacutediteacutes ou supprimeacutesSi besoin un assistant virtuel peut vous aider Il vous indique com-ment proceacuteder avec les fonctions de base

Page priveacuteepublique

Apregraves vous ecirctre enregistreacute vous arrivez sur votre page priveacuteeLa gestion de vos pages priveacuteespubliques se fait agrave partir du menu Dashboards en haut de votre eacutecran

Les pages priveacutees et la page publique srsquoalimentent de la mecircme maniegraverePour activer sa page publique il faut cliquer sur lrsquoonglet Dash-boards et choisir Activer ma page publique dans le menu deacuteroulant Cette activation se fait en trois eacutetapesz informations personnelles (nom complet type de compte

sexe et date de naissance ndash il est possible de ne pas afficher la date de naissance publiquement) pour son profil public

z choix de lrsquoadresse publique (url)z informations sur la page publique (titre description cateacutegorie

et mot-cleacute)Il est possible de deacutesactiver sa page publique Le contenu restera identique mais ne sera plus accessible publiquement

Lrsquoeacutecosystegraveme de Netvibes

Ce reacutepertoire vous offre la possibiliteacute de rechercher le widget dont vous avez besoin la page publique qui peut vous inteacuteresser ou le thegraveme que vous souhaitez afficher ainsi que creacuteer et soumettre un nouveau widget ou thegraveme

Outil de veille

Pour faire de Netvibes votre outil de veille vous pouvez en plus de lrsquoagreacutegation de flux RSS passer par la creacuteation drsquoun tableau de bord speacutecifique depuis le menu deacuteroulant DashboardUne fenecirctre srsquoouvre qui vous permet drsquoentrer un mot-cleacute sur la theacutematique agrave surveiller

Puis une autre fenecirctre apparaicirct avec des suggestions de thegravemesEnsuite le tableau de bord est creacuteeacute avec des onglets configureacutes en relation avec le thegraveme de votre veille Pour que cette derniegravere soit vraiment performante il faudra la parameacutetrer la personnaliser lrsquoanalyser et la mettre agrave jour en fonction de lrsquoeacutevolution de vos besoins

Mobile Netvibes

Il est neacutecessaire drsquoecirctre deacutejagrave titulaire drsquoun compte sur Netvibes car on ne peut pas le creacuteer agrave partir de la version mobile Deux versions sont agrave disposition des utilisateurs suivant le modegravele de teacuteleacutephone une pour les smartphones (iPad iPhone et Android) et une autre pour les teacuteleacutephones portables classiques Un seul point drsquoaccegraves mobilenetvibescom qui sait repeacuterer votre type drsquoappareilAttention la version mobile est disponible uniquement en lecture Il existe certaines restrictions z pas drsquoaccegraves aux dashboards publicsz pas de modification des paramegravetres de votre tableau de bord

ni de son contenuz pas drsquoajoutcreacuteation de tableau de bord onglet widgetCertains widgets ne sont pas disponibles sur les versions mobileVous en trouvez la liste dans la FAQ correspondante (faqnetvibescomfrversions_mobiles)Selon les informations de Netvibes les widgets Mail et Twitter seront bientocirct disponibles sur votre mobile

Les plus de Netvibes

z Deacutemarrage rapide creacuteation du compte et de la premiegravere pagez Prise en main aiseacutee des diverses fonctionnaliteacutes de lrsquooutil

(ajout de flux et de widgets mise en page personnalisation de la page)

z Pas de publiciteacutez Agrave partir de nrsquoimporte quel poste de travail vous aurez accegraves

agrave toutes les informations que vous aurez inteacutegreacute sur votre page Netvibes par exemple e-mail calendrier meacuteteacuteo flux comptes sur les reacuteseaux sociaux photos) sans avoir besoin drsquoaller consulter chaque site ou page seacutepareacutement

z En seacutelectionnant un widget on voit sur quelles autres plates-formes on le trouve aussi De mecircme on peut le partager et donner son avis Des statistiques sont disponibles (nombre drsquoinstallations sur quel portail) Ainsi que le report de pro-blegraveme commentaire ou promotion du produit

z Netvibes peut aussi servir de reacuteseau social Il est possible drsquoavoir des amis preacutesents aussi sur ce portail

z La suppression de son compte se fait facilement ce qui nrsquoest pas forceacutement eacutevident sur drsquoautres portails

Et les moins

z Certains widgets sont buggeacutes donc grosse deacuteception au mo-ment de lrsquoinstallation Drsquoautres widgets sont plutocirct compli-queacutes agrave installer car il faut passer par un site alternatif

z Les deacutelais pour la mise agrave jour ou lrsquoactivation des flux RSS est signaleacutee par de nombreux utilisateurs

z Selon certains professionnels de la documentation la veille nrsquoest forceacutement aussi optimale que sur drsquoautres portails La situation ideacuteale serait de coupler plusieurs outils

Quelques portails inteacuteressants

De nombreux particuliers ainsi qursquoun certain nombre drsquoinstitu-tions et drsquoentreprises ont opteacute pour une visibiliteacute sur Netvibes

Netvibes analyse drsquoun succegraves

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 4: Flash informatique 2011 - no 7

4 flash informatique44 30 aoucirct 2011 - Ndeg 7flash informatique

Ou encore pour les entreprises un service cibleacute par projet avec NFE (Netvibes For Entreprise) Et pour une gestion moins lourde un prix par tableau de bord avec NPD (Netvibes Premium Dashboard)Des documents tregraves complets deacutecrivant les conditions geacuteneacuterales et une politique de confidentialiteacute deacutefinissent les regravegles et le com-portement agrave adopter sur ce service les aspects juridiques du trai-tement des donneacutees personnelles et leur dureacutee de conservation les droits de proprieacuteteacute les responsabiliteacutes et les garantiesUn blog (blognetvibescomfr) donne des informations sur toute lrsquoactualiteacute du service (pannes nouveauteacutes trucs et astuces)Pour le cocircteacute mode drsquoemploi une FAQ (faqnetvibescomfr) est disponible et le manuel en anglais (faqnetvibescomdownloadsNetvibes-User_Guidepdf) destineacute aux utilisateurs sous format pdf est tregraves clair

Deacutemarrer avec Netvibes

Pour creacuteer votre page deux chemins sont agrave disposition1 Il suffit drsquoaller sur le site (wwwnetvibescomfr) drsquoecirctre titulaire

drsquoune adresse email valable (attention cette adresse sera votre nom drsquoutilisateur) et de creacuteer son compte en cliquant sur Creacuteer un compte en haut agrave droite de lrsquoeacutecran

2 Depuis la page drsquoaccueil de Netvibes il est possible de choisir un nom de tableau de bord (dashboard) puis de cliquer sur lrsquoonglet Dashboard it au centre de lrsquoeacutecran

Une fenecirctre srsquoouvre et vous propose diffeacuterentes images pour personnaliser votre tableau de bord Apregraves avoir fait votre seacute-lection l faudra cliquer sur Crsquoest fait Vous arrivez directe-ment sur une page avec le titre de votre tableau de bord Pour creacuteer votre compte il faut alors cliquer sur Inscription

Un message sera envoyeacute agrave votre adresse email Il faudra confirmer lrsquoactivation du compte en cliquant sur le lien confirm my email address Agrave tout moment il est possible de mettre agrave jour son profil Mais attention car un changement de nom drsquoutilisateur va chan-ger le nom et lrsquourl de votre page publique si elle existe

Les tableaux de bord (dashboard)

Dashboard est le nom de votre page de base sur Netvibes Vous allez pouvoir remplir cette page gracircce agrave la collection de widgets agrave disposition soit par un clic soit par glisser-deacuteposer (drag and drop) et organiser vos informations par centre drsquointeacuterecirct en multi-pliant les dashboards et leur contenuIl est possible drsquoavoir plusieurs dashboards priveacutes pour le mecircme compte mais un seul dashboard public est autoriseacute Une large seacutelection de dashboards preacutedeacutefinis est agrave disposition sur le site Il est possible drsquoen creacuteer des nouveaux via le menu correspondant (Dashboards --gt Nouveau)

Votre premiegravere page

Votre compte est creacuteeacute et vous vous ecirctes authentifieacute sur le site votre premiegravere page brute srsquoaffiche Elle est reacutepartie en plusieurs zonesz titrez barre de recherche Googlez seacuterie horizontale drsquoonglets (il est possible drsquoen ajouter drsquoautres

de les supprimer et de les reacuteorganiserz trois colonnes de base modifiables de une agrave quatre colonnes

selon vos souhaitsz dans ces colonnes des zones (boicirctes) agrave remplir gracircce aux wid-

gets et aux flux RSSMaintenant vous pouvez commencer agrave personnaliser votre page depuis Ajouter du contenu en haut agrave gauche de votre fenecirctre par le champ de recherche libre en explorant les diffeacuterentes cateacute-gories ou en seacutelectionnant les widgets essentiels Crsquoest aussi agrave cet

Netvibes analyse drsquoun succegraves

Suite de la premiegravere page

exemple de page creacuteeacutee en quelques minutes

5530 aoucirct 2011 - Ndeg 7

endroit que vous pourrez importer des flux RSS Chaque widget et chaque flux peuvent ecirctre deacuteplaceacutes eacutediteacutes ou supprimeacutesSi besoin un assistant virtuel peut vous aider Il vous indique com-ment proceacuteder avec les fonctions de base

Page priveacuteepublique

Apregraves vous ecirctre enregistreacute vous arrivez sur votre page priveacuteeLa gestion de vos pages priveacuteespubliques se fait agrave partir du menu Dashboards en haut de votre eacutecran

Les pages priveacutees et la page publique srsquoalimentent de la mecircme maniegraverePour activer sa page publique il faut cliquer sur lrsquoonglet Dash-boards et choisir Activer ma page publique dans le menu deacuteroulant Cette activation se fait en trois eacutetapesz informations personnelles (nom complet type de compte

sexe et date de naissance ndash il est possible de ne pas afficher la date de naissance publiquement) pour son profil public

z choix de lrsquoadresse publique (url)z informations sur la page publique (titre description cateacutegorie

et mot-cleacute)Il est possible de deacutesactiver sa page publique Le contenu restera identique mais ne sera plus accessible publiquement

Lrsquoeacutecosystegraveme de Netvibes

Ce reacutepertoire vous offre la possibiliteacute de rechercher le widget dont vous avez besoin la page publique qui peut vous inteacuteresser ou le thegraveme que vous souhaitez afficher ainsi que creacuteer et soumettre un nouveau widget ou thegraveme

Outil de veille

Pour faire de Netvibes votre outil de veille vous pouvez en plus de lrsquoagreacutegation de flux RSS passer par la creacuteation drsquoun tableau de bord speacutecifique depuis le menu deacuteroulant DashboardUne fenecirctre srsquoouvre qui vous permet drsquoentrer un mot-cleacute sur la theacutematique agrave surveiller

Puis une autre fenecirctre apparaicirct avec des suggestions de thegravemesEnsuite le tableau de bord est creacuteeacute avec des onglets configureacutes en relation avec le thegraveme de votre veille Pour que cette derniegravere soit vraiment performante il faudra la parameacutetrer la personnaliser lrsquoanalyser et la mettre agrave jour en fonction de lrsquoeacutevolution de vos besoins

Mobile Netvibes

Il est neacutecessaire drsquoecirctre deacutejagrave titulaire drsquoun compte sur Netvibes car on ne peut pas le creacuteer agrave partir de la version mobile Deux versions sont agrave disposition des utilisateurs suivant le modegravele de teacuteleacutephone une pour les smartphones (iPad iPhone et Android) et une autre pour les teacuteleacutephones portables classiques Un seul point drsquoaccegraves mobilenetvibescom qui sait repeacuterer votre type drsquoappareilAttention la version mobile est disponible uniquement en lecture Il existe certaines restrictions z pas drsquoaccegraves aux dashboards publicsz pas de modification des paramegravetres de votre tableau de bord

ni de son contenuz pas drsquoajoutcreacuteation de tableau de bord onglet widgetCertains widgets ne sont pas disponibles sur les versions mobileVous en trouvez la liste dans la FAQ correspondante (faqnetvibescomfrversions_mobiles)Selon les informations de Netvibes les widgets Mail et Twitter seront bientocirct disponibles sur votre mobile

Les plus de Netvibes

z Deacutemarrage rapide creacuteation du compte et de la premiegravere pagez Prise en main aiseacutee des diverses fonctionnaliteacutes de lrsquooutil

(ajout de flux et de widgets mise en page personnalisation de la page)

z Pas de publiciteacutez Agrave partir de nrsquoimporte quel poste de travail vous aurez accegraves

agrave toutes les informations que vous aurez inteacutegreacute sur votre page Netvibes par exemple e-mail calendrier meacuteteacuteo flux comptes sur les reacuteseaux sociaux photos) sans avoir besoin drsquoaller consulter chaque site ou page seacutepareacutement

z En seacutelectionnant un widget on voit sur quelles autres plates-formes on le trouve aussi De mecircme on peut le partager et donner son avis Des statistiques sont disponibles (nombre drsquoinstallations sur quel portail) Ainsi que le report de pro-blegraveme commentaire ou promotion du produit

z Netvibes peut aussi servir de reacuteseau social Il est possible drsquoavoir des amis preacutesents aussi sur ce portail

z La suppression de son compte se fait facilement ce qui nrsquoest pas forceacutement eacutevident sur drsquoautres portails

Et les moins

z Certains widgets sont buggeacutes donc grosse deacuteception au mo-ment de lrsquoinstallation Drsquoautres widgets sont plutocirct compli-queacutes agrave installer car il faut passer par un site alternatif

z Les deacutelais pour la mise agrave jour ou lrsquoactivation des flux RSS est signaleacutee par de nombreux utilisateurs

z Selon certains professionnels de la documentation la veille nrsquoest forceacutement aussi optimale que sur drsquoautres portails La situation ideacuteale serait de coupler plusieurs outils

Quelques portails inteacuteressants

De nombreux particuliers ainsi qursquoun certain nombre drsquoinstitu-tions et drsquoentreprises ont opteacute pour une visibiliteacute sur Netvibes

Netvibes analyse drsquoun succegraves

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 5: Flash informatique 2011 - no 7

5530 aoucirct 2011 - Ndeg 7

endroit que vous pourrez importer des flux RSS Chaque widget et chaque flux peuvent ecirctre deacuteplaceacutes eacutediteacutes ou supprimeacutesSi besoin un assistant virtuel peut vous aider Il vous indique com-ment proceacuteder avec les fonctions de base

Page priveacuteepublique

Apregraves vous ecirctre enregistreacute vous arrivez sur votre page priveacuteeLa gestion de vos pages priveacuteespubliques se fait agrave partir du menu Dashboards en haut de votre eacutecran

Les pages priveacutees et la page publique srsquoalimentent de la mecircme maniegraverePour activer sa page publique il faut cliquer sur lrsquoonglet Dash-boards et choisir Activer ma page publique dans le menu deacuteroulant Cette activation se fait en trois eacutetapesz informations personnelles (nom complet type de compte

sexe et date de naissance ndash il est possible de ne pas afficher la date de naissance publiquement) pour son profil public

z choix de lrsquoadresse publique (url)z informations sur la page publique (titre description cateacutegorie

et mot-cleacute)Il est possible de deacutesactiver sa page publique Le contenu restera identique mais ne sera plus accessible publiquement

Lrsquoeacutecosystegraveme de Netvibes

Ce reacutepertoire vous offre la possibiliteacute de rechercher le widget dont vous avez besoin la page publique qui peut vous inteacuteresser ou le thegraveme que vous souhaitez afficher ainsi que creacuteer et soumettre un nouveau widget ou thegraveme

Outil de veille

Pour faire de Netvibes votre outil de veille vous pouvez en plus de lrsquoagreacutegation de flux RSS passer par la creacuteation drsquoun tableau de bord speacutecifique depuis le menu deacuteroulant DashboardUne fenecirctre srsquoouvre qui vous permet drsquoentrer un mot-cleacute sur la theacutematique agrave surveiller

Puis une autre fenecirctre apparaicirct avec des suggestions de thegravemesEnsuite le tableau de bord est creacuteeacute avec des onglets configureacutes en relation avec le thegraveme de votre veille Pour que cette derniegravere soit vraiment performante il faudra la parameacutetrer la personnaliser lrsquoanalyser et la mettre agrave jour en fonction de lrsquoeacutevolution de vos besoins

Mobile Netvibes

Il est neacutecessaire drsquoecirctre deacutejagrave titulaire drsquoun compte sur Netvibes car on ne peut pas le creacuteer agrave partir de la version mobile Deux versions sont agrave disposition des utilisateurs suivant le modegravele de teacuteleacutephone une pour les smartphones (iPad iPhone et Android) et une autre pour les teacuteleacutephones portables classiques Un seul point drsquoaccegraves mobilenetvibescom qui sait repeacuterer votre type drsquoappareilAttention la version mobile est disponible uniquement en lecture Il existe certaines restrictions z pas drsquoaccegraves aux dashboards publicsz pas de modification des paramegravetres de votre tableau de bord

ni de son contenuz pas drsquoajoutcreacuteation de tableau de bord onglet widgetCertains widgets ne sont pas disponibles sur les versions mobileVous en trouvez la liste dans la FAQ correspondante (faqnetvibescomfrversions_mobiles)Selon les informations de Netvibes les widgets Mail et Twitter seront bientocirct disponibles sur votre mobile

Les plus de Netvibes

z Deacutemarrage rapide creacuteation du compte et de la premiegravere pagez Prise en main aiseacutee des diverses fonctionnaliteacutes de lrsquooutil

(ajout de flux et de widgets mise en page personnalisation de la page)

z Pas de publiciteacutez Agrave partir de nrsquoimporte quel poste de travail vous aurez accegraves

agrave toutes les informations que vous aurez inteacutegreacute sur votre page Netvibes par exemple e-mail calendrier meacuteteacuteo flux comptes sur les reacuteseaux sociaux photos) sans avoir besoin drsquoaller consulter chaque site ou page seacutepareacutement

z En seacutelectionnant un widget on voit sur quelles autres plates-formes on le trouve aussi De mecircme on peut le partager et donner son avis Des statistiques sont disponibles (nombre drsquoinstallations sur quel portail) Ainsi que le report de pro-blegraveme commentaire ou promotion du produit

z Netvibes peut aussi servir de reacuteseau social Il est possible drsquoavoir des amis preacutesents aussi sur ce portail

z La suppression de son compte se fait facilement ce qui nrsquoest pas forceacutement eacutevident sur drsquoautres portails

Et les moins

z Certains widgets sont buggeacutes donc grosse deacuteception au mo-ment de lrsquoinstallation Drsquoautres widgets sont plutocirct compli-queacutes agrave installer car il faut passer par un site alternatif

z Les deacutelais pour la mise agrave jour ou lrsquoactivation des flux RSS est signaleacutee par de nombreux utilisateurs

z Selon certains professionnels de la documentation la veille nrsquoest forceacutement aussi optimale que sur drsquoautres portails La situation ideacuteale serait de coupler plusieurs outils

Quelques portails inteacuteressants

De nombreux particuliers ainsi qursquoun certain nombre drsquoinstitu-tions et drsquoentreprises ont opteacute pour une visibiliteacute sur Netvibes

Netvibes analyse drsquoun succegraves

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 6: Flash informatique 2011 - no 7

6 flash informatique66 30 aoucirct 2011 - Ndeg 7flash informatique

Voici une liste non exhaustive de sites qui peuvent ecirctre inteacuteres-sants autant par la probleacutematique traiteacutee que par lrsquoutilisation des possibiliteacutes offertes par le service de personnalisationz La teacuteleacutevision suisse romande wwwnetvibescomtsrGeneralz Histoire-Geacuteo wwwnetvibescommonspoutnikAccueilz Des envies de voyages wwwnetvibescomtourdumonde et wwwnetvibescomcorse-sauvage z Pour les deacuteveloppeurs wwwnetvibescomdrupalGeneralz Environnement wwwnetvibescomnewsenvironnementz Documentation wwwnetvibescomladocActualitesz Deacutecoration wwwnetvibescomantoinehuotDecorationz Museacutee wwwnetvibescomladressemuseedelaposteAccueil

Les concurrents

Agrave part Netvibes des produits concurrents baseacutes sur le mecircme modegravele ont eacutemergeacute agrave la mecircme peacuteriode Vous allez trouver des in-formations et les diffeacuterentes fonctionnaliteacutes de deux drsquoentre eux dans le tableau comparatif agrave la page suivanteLe portail universel nrsquoexiste pas chacun choisira selon ses habi-tudes et preacutefeacuterences personnelles

Conclusion

Crsquoest un outil plutocirct ideacuteal car on peut centraliser sa vie numeacute-rique agrave un seul endroit et y acceacuteder depuis partout Il facilite le travail collaboratif au sein drsquoun groupe ou drsquoune eacutequipe de type PME ou association en permettant le partage de documents et drsquoinformation et une visibiliteacute (page priveacuteepublique) parameacute-

trable en fonction de ses besoins Mais jrsquoeacutemets quelques reacuteserves par rapport au temps agrave investir pour avoir une veille et un site Web vraiment performantsDe plus il est conseilleacute de meacutemoriser la configuration de sa(ses) page(s) au cas ougrave lrsquooutil rencontrerait un problegraveme technique ou viendrait agrave disparaicirctre du paysage informatique

Webographie

z NETVIBES Dashboard everything [en ligne] wwwnetvibescomfr (consulteacute le 10 aoucirct 2011)

z KRIM Tariq Dreamer and doer [en ligne] httpsplusgooglecom100084737546039360199about (consulteacute le 10 aoucirct 2011)

z VIVARES David Utiliser Netvibes outil de veille et de com-munication [en ligne] Strasbourg urfistu-strasbgfruploadsUTILISER20NETVIBESpdf (consulteacute le 10 aoucirct 2011)

z EDUTECH WIKI PAGEFLAKES [en ligne] edutechwikiunigechfmediawikiindexphptitle=SpC3A9cialCiteramppage=Pageflakesampid=16048 (consulteacute le 11 aoucirct 2011)

z PAGEFLAKES PageFlakes [en ligne] wwwpageflakescom (consulteacute le 11 aoucirct 2011)

z IGOOGLE iGoogle [en ligne] wwwgooglecomig (consulteacute le 11 aoucirct 2011)

z MakeTechEasier The Battle For Your Browserrsquos Homepage iGoogle vs Netvibes vs Pageflakes [en ligne] maketecheasiercomigoogle-vs-netvibes-vs-pageflakes20100720 (consulteacute le 11 aoucirct 2011) n

Netvibes analyse drsquoun succegraves

Netvibes iGoogle Pageflakes

Date de mise en production septembre 2005 mai 2005 deacutebut 2006

Socieacuteteacute baseacutee Paris Londres et San Francisco Mountain View Allemagne et San Francisco

Technologie utiliseacutee JavaScriptAjax Ajax ASPNET et Ajax

Organisation de la page onglets et modules 6 onglets maximum et modules

en onglets (tabs) et modules (flakes) module de contenu sponsoriseacute

Modules widgets gadgets flakes

Type de pages priveacutees publiques priveacutees priveacutees groupes priveacutes ou publics

Pages publiques 44rsquo659 non +100rsquo000 pagecasts

Documentation FAQ forum guide de lrsquoutilisa-teur et tout pour le deacuteveloppeur

blog FAQ mode drsquoemploi theacutematique

FAQ tutoriaux blog forum

Cocircteacute deacuteveloppeurs XHTML CSS JavaScriptAjax et API

API HTML et JavaScript API et diffeacuterents guides

Reacuteseaux sociaux Facebook Twitter Facebook Facebook Twitter

Veille flux RSS Delicious Diigo flux RSS flux RSS

GLOSSAIRE ampflux RSS fichier dont le contenu est

produit automatiquement (sauf cas exceptionnels) en fonction des mises agrave jour drsquoun site Web W

portail Web page Web offrant une multi-tude de ressources de contenus et de

services accessibles en ligne

Web 20 eacutevolution du Web 10 vers plus de simpliciteacute et drsquointeractiviteacute ensemble des techniques des fonction-naliteacutes et des usages du World Wide Web permettant aux internautes ayant peu de connaissances techniques de srsquoapproprier les nouvelles fonctionnali-teacutes du Web W

widget contraction des termes windows et gadget Selon le site Netvibes il srsquoagit drsquoune petite application que vous placez sur une page Web et qui vous donne accegraves agrave des informations ou fonctionna-liteacutes speacutecifiques

W = tireacute de Wikipeacutedia

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 7: Flash informatique 2011 - no 7

730 aoucirct 2011 - Ndeg 7

Actualiteacutes

Minutes of the Fifth Summit dellrsquoInformazione di Architettura course Journalism and Information Ar-chitecture from the cathedral-newspaper to a liq-uid universe

Compte-rendu du seacuteminaire Architecture de lrsquoinfor-mation et journalisme du journal-catheacutedrale vers un univers liquide lors du Ve Summit di Architettura dellrsquoInformazione agrave Milan [1]

Lrsquoarchitecte de lrsquoinformation (AI) srsquooccupe de la qualiteacute dans le design et lrsquoergonomie des interfaces Web On peut lrsquoobserver dans sa tribu agrave lrsquooccasion de leurs reacuteunions nationales annuelles cet article relate plus particuliegraverement un seacuteminaire suivi par lrsquoauteur [2] lors de lrsquoeacutedition italienne 2011 et preacutesentant lrsquoapport drsquoun architecte de lrsquoinformation sur des produits eacuteditoriaux Federico Badaloni [3] son animateur est responsable des Projets Editoriaux et AI aupregraves du groupe eacuteditorial Espresso [4] Il est abondamment citeacute (et traduit) ci-dessous

laquoLrsquoarchitecture de lrsquoinformation est lrsquoart et la science de structurer de cataloguer et drsquoindexer des sites web ainsi que des intranets pour aider les utilisateurs agrave trouver et geacuterer lrsquoinformation Elle transpose les principes du design et de lrsquoarchitecture dans les uni-vers digitauxraquo Badaloni formule ainsi son rocircle dans la structure eacuteditoriale qui lrsquoemploie laquoLrsquoAI organise la structure les fonctionnaliteacutes et les parcours de navigation agrave travers les contenus des divers produits digitaux du groupe Espresso Il deacutefinit les concepts des interfaces gracircce auxquelles les utilisateurs finaux naviguent lancent des re-cherches et consultent les contenus des diffeacuterentes plates-formes de distribution de lrsquoinformation digitale Parallegravelement il projette les interfaces drsquoeacuteditions des outils deacutedieacutes agrave lrsquoeacutedition agrave lrsquoorganisa-tion agrave la classification et la recherche du contenu lui-mecircme par les reacutedacteursraquoLes deacutefis auxquels il doit reacutepondre sont bien connus eacuterosion de la diffusion des produits papier et comment reporter (et fideacuteliser) les lecteurs sur leurs versions en ligne

La forme

Si on considegravere un journal imprimeacute on srsquoaperccediloit qursquoil est compo-seacute de multiples fragments organiseacutes selon des conventions typo-graphiques et de mise en page dont la non moindre est lrsquoespace fini agrave disposition (taille et nombre de pages deacutetermineacutes) Cette limitation conduit agrave un choix eacuteditorial et reacutedactionnel propre agrave chaque titre Or dans lrsquounivers digital qualifieacute de liquide lrsquoespace

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

virtuel nrsquoa pas de fin et le fragment se libegravere de son contexte (il suffit de comparer un article agrave un morceau de musique autrefois indissociable drsquoun album maintenant teacuteleacutechargeable agrave lrsquouniteacute) Le traitement graphique des eacuteleacutements deacutefinit eacutegalement un jour-nal Ce sont des eacuteleacutements cognitifs et symboliques que les lecteurs ont inteacutegreacutes de maniegravere inneacutee (titre chapeau dimensions des caractegraveres positions leacutegendehellip) ou acquise (couleurs icocircnes ca-drageshellip) Comprendre et utiliser ce langage et le transfeacuterer dans le design du site srsquoavegravere crucial pour lrsquoidentification des produits

Le contexte

Cependant ce qui donne de la valeur agrave un journal nrsquoest pas lrsquoar-ticle drsquoactualiteacute lui-mecircme mais la maniegravere de raconter une histoire de lui donner du sens de la relier agrave drsquoautres et de lrsquoenglober dans un contexte On pourrait mecircme affirmer que ce contexte est le lieu de la deacuteleacutegation de la confiance du lecteur vis-agrave-vis du journal (je crois agrave cet article parce qursquoil est imprimeacute ici et que jrsquoappreacutecie la maniegravere dont il est traiteacute) LrsquoAI srsquoil veut proposer une alternative virtuelle reacuteussie au journal traditionnel ne doit pas srsquoattacher agrave lrsquoarticle drsquoactualiteacute (disponible partout et rapidement) mais au contexte qui lrsquoaccompagne

La construction du sens

Un journal papier est composeacute drsquoune suite de rubriques (la Une lrsquointernational le national lrsquoeacuteconomiehellip) se succeacutedant selon une hieacuterarchie et un ordre preacuteeacutetabli appeleacute le chemin de fer Leur or-donnancement et leur importance relative apportent un sens au

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 8: Flash informatique 2011 - no 7

8 flash informatique88 30 aoucirct 2011 - Ndeg 7flash informatique

Que peut faire lrsquoarchitecte de lrsquoinformation pour la presse

produit qursquoil est fondamental de comprendre afin de le transposer dans un univers digital Les relations que les rubriques et leurs eacuteleacute-ments constitutifs (textes articles photoshellip) entretiennent entre eux doivent ecirctre maintenues quel que soit le support Ceci drsquoau-tant plus que lrsquoespace Web nrsquoeacutetant pas limiteacute chaque article est susceptible drsquoecirctre enrichi par des meacutetadonneacutees (tag) ou des infor-mations compleacutementaires (videacuteo commentaires des internautes sources et documentation agrave lrsquoorigine de lrsquoinfo liens externes sur des encyclopeacutedieshellip) Crsquoest ce qursquoon appelle la profondeur ou la 3egraveme dimension qui constitue la grande opportuniteacute drsquoune eacutedi-tion Web par rapport au papier Un autre deacutefi est la recomposition potentielle de la narration se-lon le point de vue de lrsquoutilisateur final Nrsquoeacutetant plus contraint par une succession de feuillets on peut offrir de multiples parcours et niveaux de lecture qui singularisent la relation agrave lrsquoinformation disponible La conception des relations (= hyperliens) qui lient les diffeacuterents eacuteleacutements et qui sont autant de parcours de lecture du site (=navigation) est au cœur de la reacuteflexion de lrsquoAI

Le processus

Alors qursquoun journal imprimeacute nrsquoest rien drsquoautre qursquoune photogra-phie figeacutee drsquoun moment deacutetermineacute (lrsquoeacutedition de mercredi boucleacutee agrave 22h) le site Web offre la possibiliteacute de srsquoattacher agrave suivre un processus Alors que lrsquoarticle papier sera publieacute agrave un moment clef et spectaculaire drsquoun eacuteveacutenement (relatant par essence une his-toire tronqueacutee) le compte-rendu Web du mecircme eacuteveacutenement offre le grand potentiel de srsquoattacher agrave ses diffeacuterentes phases dans le temps et agrave srsquoorienter vers un suivi de lrsquoinformation (diachronie) Lrsquoexemple le plus spectaculaire eacutetant les nombreuses timeline amp du 11092001 qui mettent en relation un nombre infini drsquoeacuteveacutene-ments lieacutes aux attentats [5]

La portabiliteacute

LrsquoAI doit travailler afin que lrsquoinformation soit transportable trou-vable virale amp Dans ce but il est important de travailler sur les meacutetadonneacutees widget et sur les applications agrave diffuser dans les

reacuteseaux sociaux De mecircme mettre agrave disposition son contenu en format pur sans le graphisme permet agrave chacun de construire son propre site en recyclant ces informations

Conclusion

Une bonne architecture de lrsquoinformation se reconnait agrave la quan-titeacute de choses qursquoelle rend possibles Crsquoest-agrave-dire agrave la quantiteacute drsquoeacutenergie potentielle qursquoelle introduit dans le systegraveme Il srsquoagit drsquoune eacutenergie qui permet au systegraveme de croicirctre et drsquoecirctre utiliseacute pour veacutehiculer de nouveaux signifieacutes et de nouveaux contextes

Reacutefeacuterences

[1] wwwiasummitit2011[2] wwwiasummitit2011how-to-change-an-university-website[3] federicobadaloniblogkatawebit[4] Gruppo LrsquoEspresso (Rome) un des plus importants parmi les

groupes eacuteditoriaux dans le secteur des meacutedias en Italie (quo-tidien peacuteriodiques radio publiciteacute internet et teacuteleacutevision) pu-bliant de nombreux journaux le plus fameux eacutetant LrsquoEspresso

[5] wwwhistorycommonsorgtimelinejsptimeline=complete_ 911_timeline n

GLOSSAIRE amptimeline frise chronologique qui repreacutesente une suite drsquoeacuteveacutene-

ments positionneacutes sur la flegraveche du temps W

viral qui se reacutepand agrave travers les reacuteseaux sociaux (par analogie aux virus informatiques) Ce terme est surtout utiliseacute en marketing ougrave on utilise les consommateurs eux-mecircmes pour contribuer agrave faire connaicirctre un produit une marque W

W = tireacute de Wikipeacutedia

Avis de deacutecegraves de Jahia 4NatalieMeystreepflch EPFL-Domaine IT architecte de lrsquoinformation au KIS

La migration des sites Web heacutebergeacutes sur nos anciens serveurs vers la nouvelle charte graphique et le nouveau systegraveme Jahia 6 est termineacutee En 2010 nous comptions plus de 550 adresses Web reacute-parties sur trois serveurs Jahia 4 Tous nrsquoeacutetaient pas des sites actifs Le KIS a meneacute une migration de 361 sites agrave partir 18 juin 2010 gracircce au travail acharneacute de Maciej Macowicz Tommy Tran Cansu

Cevher et une task force composeacutee drsquoassistants-eacutetudiants super-viseacutes par Pierre Mellier et Natalie Meystre Les responsables Web des faculteacutes ont grandement contribueacute au succegraves de ce projetAu 15 aoucirct 2011 le cluster Jahia 6 compte 508 sites actifs en ligne et 66 sites en passe drsquoecirctre publieacutes le nombre de pages deacute-passant 25rsquo000 n

Actualiteacutes

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 9: Flash informatique 2011 - no 7

930 aoucirct 2011 - Ndeg 7

DIT-info

Heure-DIT

Deacutejagrave deux seacuteances heure-DIT ont eu lieu sur la seacutecuriteacute informatique et sur le reacuteseau Rappelons que ces preacutesentations courtes (une heure) cibleacutees sur un thegraveme ont pour but de mettre agrave niveau les connaissances des responsables informa-tique drsquouniteacute afin qursquoils puissent ensuite mieux assurer leur rocircle de support et de conseil Si vous nrsquoavez pas pu y assister vous trouverez des montages audio ainsi que les transparents agrave lrsquoadresse ditepflchheure-DITLes prochaines Heure-DIT seront sans doute consacreacutees au stoc-kage et agrave lrsquoauthentification

JacquelineDoussonepflch Domaine IT

-----------

Nouveau arriveacute au DIT

Le groupe Teacuteleacuteinformatique du DIT srsquoenrichit drsquoun nouveau collaborateur Jaouher Garreb Il va collaborer avec Jacques Virchaux durant quelques mois puis le remplacer lors de son deacute-part agrave la retraiteJaouher Garreb srsquooccupera en particulier de lrsquoeacutevolution de la partie dynamique et du contenu de notre site Web (networkepflch) ainsi que des applications maison que nous utilisons pour assurer le fonctionnement du reacuteseau EPNET

YvesDespondepflch Domaine IT

-----------

Une nouvelle adresse mail pour la seacutecu-riteacute informatique

Pour des raisons drsquohomogeacuteneacuteiteacute dans les adresses (e-mail et Web) il a eacuteteacute deacutecideacute que lrsquoadresse e-mail securiteepflch utiliseacutee jusqursquoagrave preacutesent pour les problegravemes de seacutecuriteacute informatique soit reacuteserveacutee aux communications avec lrsquoeacutequipe du service seacutecuriteacute preacutevention et santeacute du campus (SHE) Pour les problegravemes informatiques secure-itepflch est la nou-velle adresseSi vous utilisez lrsquoadresse securiteepflch dans vos proceacutedures pages Web ou scripts pensez agrave les mettre agrave jour Pour rappel les sites Web sontditepflchsecurite geacuteneacuteraliteacutes sur la seacutecuriteacute informatique

secure-itepflch le blog qui recense le derniegraveres attaques on y trouve eacutegalement la campagne de 2010 de sensibilisation agrave la seacutecuriteacute informatiquewinsecepflch le site consacreacute agrave la seacutecuriteacute du monde Windowssecuriteepflch le site du domaine seacutecuriteacute preacutevention et santeacute du campus (SHE)

JacquelineDoussonepflch Domaine IT

-----------

Le DIT vous forme

z La seacutecuriteacute des applications Web vous concerne vous sau-rez tout ou presque sur la meilleure faccedilon de proteacuteger vos applications lors du prochain cours (9 septembre)

z Vous devez apprendre ou parfaire un langage de programma-tion profitez des cours ci-dessous les prochains nrsquoauront lieu qursquoen 2012C++ A Comprehensive Hands-On Introduction (in English)

semaine 35Excel 2010 VBA 1-introduction semaine 36Python level I (in English) semaine 36C Programming (in English) semaine 39

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme consul-tez notre site Web ditepflchformation mot cleacute program-mation

z Vous devez administrer les systegravemes Linux ou Windows nous vous offrons aussi quelques formations une seacuterie de cours Windows 7 deacutebute en semaine 36 tandis qursquoen semaine 41 vous pouvez vous former en Administration Linux RHEL Fedora UBuntu et en semaine 44 deacutebute une formation Windows Server 2008

Pour les deacutetails et drsquoautres cours sur le mecircme thegraveme ditepflchformation mot cleacute systegraveme

z Un unique cours Matlab for beginners in English est preacutevu ne le manquez pas il se deacuteroule les 12 et 13 septembre

z Vous devez reacutediger une thegravese ou autre grand document vous avez le choix entre les outils LaTeX basics (in English) (semaine 40) InDesign en franccedilais (semaine 36) ou en anglais (semaine 48) Word 2010-PC (semaine 40)Word 2011-Mac (semaine 49)

z Deacutecouvrez sur notre site ditepflchformation toutes nos for-mations en bureautique et outils collaboratifs (eacutedition images tableur mail ) pour lrsquoacquisition de donneacutees (LabVIEW) ou la gestion de sites Web (Jahia Dreamweaver hellip)

Pour plus de renseignements nrsquoheacutesitez pas agrave contacter lrsquoeacutequipe par courriel coursditepflch

Lrsquoeacutequipe des cours

HEURE DIT

Actualiteacutes

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 10: Flash informatique 2011 - no 7

10 30 aoucirct 2011 - Ndeg 7flash informatique

Behind the scenes of planepflch 3D versionthe Web application planepflch has been rede-signed with a magnificent three-dimensional view of EPFLrsquos buildings Herersquos a quick overview of some problems that may threaten the virtual builders

Lrsquoapplication Web planepflch vient drsquoecirctre relookeacutee avec une magnifique vue tridimensionnelle des bacircti-ments de lrsquoEPFL Voici un rapide survol de certains problegravemes qui guettent les bacirctisseurs virtuels

Degraves la fin de 2008 lrsquoideacutee drsquooffrir agrave nos visiteurs une vue 3D des bacirctiments de lrsquoEPFL a commenceacute agrave faire son chemin Mais eacutetait-ce reacutealisable techniquement Agrave quel coucirct Dans quels deacutelais Nous savions que deux ans auparavant Google avait mis en service dans son application Google Earth une vue 3D pour les bacirctiments et que certaines villes ameacutericaines y avaient eacuteteacute entiegrave-rement modeacuteliseacutees Puis Google avait dans la fouleacutee proposeacute les outils grand public comme SketchUp et Google 3D Warehouse qui permettaient de construire et teacuteleacutecharger sur Internet des bacirc-timents entiers Drsquoun autre cocircteacute lrsquoEPFL disposait sur AutoCad des plans vectoriseacutes de ses bacirctiments Ajoutez agrave cela une campagne de photos du campus prises par heacutelicoptegravere et le tout semblait parfaitement reacutealisable

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Actualiteacutes

Appel aux articles La nouvelle revue consacreacutee au HPC a besoin de vos contributions z vous souhaitez faire connaicirctre votre travailz vous avez un projet en relation avec le calcul scientifiquez vous voulez creacuteer des nouveaux liensAlors sautez sur lrsquooccasion et proposez-nous un article

Public cible de la revuez les chercheurs de lrsquoEPFL et des institutions partenairesz les leaders de lrsquoHPC en Suisse et agrave lrsquoeacutetranger

Langue des articlesz franccedilais ou anglais avec reacutesumeacute dans les deux langues

Deacutelai de reacutedaction20 septembre parution deacutebut feacutevrier 2012

Pour des raisons drsquoorganisation veuillez annoncer votre article au plus tocirct agrave zettaepflchPour vous abonner agrave la version eacutelectronique envoyez un mail agrave zetta-subscribelistesepflchPour recevoir la version papier veuillez contacter zettaepflch

Call for Articles

The new journal devoted to HPC needs your contri-butionsz you wish to promote your workz you have a project related to scientific computingz you want to get to know new peopleSo jump on the opportunity and write an article

Target audience of the magazinez researchers from EPFL and partner institutionsz HPC leaders in Switzerland and abroad

Language of the articlesz French or English with abstract in both languages

Deadline for submitting articlesSeptember 20 release of the magazine early February 2012

For organizational reasons please announce your article as soon as possible to zettaepflchTo subscribe to the electronic version please email zetta-subs-cribelistesepflchTo receive the printed version please contact zettaepflch n

Agenda

Zettanumerical simulation for science and technology

VittoriaRezzonicoepflch amp MichelaThiemardepflch reacutedactrices en chef de la revue Zetta

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 11: Flash informatique 2011 - no 7

1130 aoucirct 2011 - Ndeg 7

crise drsquourticaire agrave Google 3D Warehouse qui nrsquoavait jamais vu loin de lagrave pareille chose il fallut simplifier simplifier et encore simplifierBref le petit projet consideacutereacute agrave lrsquoorigine comme facilement reacuteali-sable par les experts consulteacutes nous expeacutedia sur les sentiers escar-peacutes drsquoun col himalayen Crsquoest finalement gracircce agrave une socieacuteteacute fran-ccedilaise qui a reacutecemment inteacutegreacute sur Google Earth plusieurs villes franccedilaises en 3D dont Lyon que nous avons vraiment pu pro-gresser et reacutesoudre les principaux problegravemes afin de deacuteposer sur Google Earth courant avril 2011 les modegraveles 3D des bacirctiments de lrsquoEPFL sous une forme enfin preacutesentableLe reacutesultat peut deacutesormais ecirctre eacutegalement vu sur lrsquoapplication planepflch qui a subi pour lrsquooccasion une seacuterieuse mise agrave jour Une vision 3D et un accegraves agrave StreetView (de Google) ont eacuteteacute inteacute-greacutes de maniegravere astucieuse agrave la version 2D existante gracircce agrave un outil de guidage qui permet de viser tregraves facilement une faccedilade de bacirctiment sur le plan 2D et de voir le reacutesultat instantaneacutement sur la version en 3DLe travail nrsquoest pas pour autant termineacute Apregraves cette premiegravere eacutetape nous devrons maintenant comprendre comment mettre en place une strateacutegie de mise agrave jour de la 3D qui va de pair avec la construction ou le renouvellement des bacirctiments agrave lrsquoEPFL Le placage des photos sur les faces des bacirctiments reste eacutegalement un problegraveme ouvert agrave tel point que lrsquoon peut se demander srsquoil ne faudrait pas la peine de modeacuteliser les bacirctiments directement en image de synthegravese Aujourdrsquohui les bacirctiments de lrsquoEPFL sont les seuls dans les envi-

rons agrave ecirctre modeacuteliseacutes en 3D sur Google Earth Lrsquoajout des com-munes avoisinantes permettrait drsquoeacutetoffer et drsquoameacuteliorer cette reacutealiteacute virtuelle n

Dans les coulisses de planepflch version 3DPierreMellierepflch EPFL ndash Domaine IT responsable du KIS et FlorentDeseneuxepflch EPFL ndash DII - Constructions dessinateur

Seulement voilagrave

Le laser (pour les speacutecialistes il srsquoagit en fait drsquoun LIDAR) qui de-vait mesurer et construire tregraves preacuteciseacutement le modegravele numeacuterique de terrain depuis lrsquoheacutelicoptegravere eacutetait mal eacutetalonneacute et il fallut faire intervenir le centre de recherche de lrsquoIGN (Institut Geacuteographique National) pour programmer des routines speacutecifiques afin de cor-riger ces erreurs De plus dans la chaicircne de calcul entre AutoCad et SketchUp une information se perdait (mais ougrave ) rendant par-faitement aleacuteatoire le sens du placage des photos sur certaines faces des bacirctimentsLe modegravele du terrain de lrsquoEPFL stockeacute par Google date deacutejagrave de quelques anneacutees et des bacirctiments (comme le Rolex Learning Cen-ter) une fois importeacutes dans Google Earth eacutetaient tantocirct suspen-dus dans le vide tantocirct partiellement enfouis dans le sol Le temps de latence pour teacuteleacutecharger les fichiers chez Google est eacutenorme Google autorise des traitements par lot des bacirctiments agrave partir de 200 piegraveces il a donc fallu teacuteleacutecharger les quelques dizaines de bacirctiments de lrsquoEPFL un par un puis attendre chaque fois pregraves de 3 semaines afin que ces bacirctiments soient enfin traiteacutes par Google et les deacutelais pour le modegravele de terrain sont encore plus longs (3 agrave 6 mois) Pour mieux afficher les deacutetails de certaines faccedilades cacheacutees agrave lrsquoheacutelicoptegravere une tentative de prise de vues par drone se solda par un positionnement trop impreacutecis des photos qui ne pouvaient pas ecirctre correctement plaqueacutees aux bacirctimentsLes rondeurs du Rolex Learning Center donnegraverent une violente

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 12: Flash informatique 2011 - no 7

12 flash informatique 30 aoucirct 2011 - Ndeg 7

Browsing Web is not anonymous

Surfer sur Internet nrsquoest pas anonyme

Nos butineurs doivent se retrouver dans la forecirct de fenecirctres ou-vertes par chaque usager Un jalon immateacuteriel est dissimuleacute dans les entrailles des navigateurs le cookie Ce teacutemoin peut se deacutecomposer en deux cateacutegories temporellesz bref juste le temps neacutecessaire pour lrsquoactionz interminable des dureacutees qui surpassent largement lrsquohis-

toire amp

Le teacutemoin immuable

Deacutesireux de partir drsquoun exemple concret jrsquoai extrait des entrailles de mon ordinateur la liste des cookies patiemment cumuleacutee de-puis 3 ans Le reacutesultat est impressionnantz 8500 cookies dans Safariz 270 cookies dans FlashA priori la dureacutee neacutecessaire pour accomplir une action technique ne devrait pas deacutepasser une heure peut-ecirctre atteindre 24 heuresEn reacutealiteacute uniquement 01 (9 cookies) reacutepondait agrave ce critegravere limiteacute agrave un jour Intrigueacute par une proportion si faible jrsquoai reacutealiseacute une analyse en combinant les tableaux croiseacutes dans Excel et la puissance du logiciel statistique R

fig 1ndash reacutepartition statistique des cookies drsquouen dureacutee supeacuterieure agrave 1 jour

Deacutesireux drsquoanalyser dans le deacutetail la distribution des donneacutees 26 domaines DNS (comme epflch) ont eacuteteacute retenus Pour simplifier le deacutepouillement lrsquoordre habituel serveurentreprisepays a eacuteteacute inverseacute

cinq sites sont preacutesenteacutes dans cet article deux acadeacutemique lrsquoEPFL et le MIT un du monde du logiciel libre Sourceforge et deux entre-prises Yahoo et Apple Si on exclut les anomalies les sites Web de lrsquoEPFL sont raisonnables la dureacutee de vie ne deacutepasse pas deux ans

fig 2 ndash chepfl ndash un cookie Flash est preacutesent avec une adresse IP 1281785023

fig 3 ndash edumit

Pour un autre campus le MIT les dureacutees deviennent difficilement compreacutehensibles pourquoi conserver des jalons techniques pen-dant 10 ans

fig 4 ndash netsourceforge

Cookies en foliesLaurentKlingepflch EPFL - STI coordinateur informatique agrave la Faculteacute Sciences et Techniques de lrsquoingeacutenieur

Analyse

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 13: Flash informatique 2011 - no 7

131330 aoucirct 2011 - Ndeg 7

Pour Sourceforge on peut eacutegalement srsquointerroger sur la dureacutee de vie sur un site heacutebergeant des projets open sourcePour deux sites commerciaux Apple et Yahoo lrsquoutilisation de coo-kies pour suivre lrsquousager avec des eacutecheacuteances importantes semble logique dans un esprit mercantiliste

fig 5a ndash comapple

fig 5b ndash comyahoo

Pour lrsquoensemble des sites la dureacutee de vie tregraves longue des cookies (au plus 7089 ans) suggegravere une utilisation pour identifier lrsquointer-naute pas pour conserver des preacutefeacuterences Pour visualiser les cookies sur Safari je recommande lrsquoutilisation de safaricookies qui permet de se rendre compte de lrsquoeacutetendue des deacutegacircts

fig 6 ndash httpsweetpproductionscomsafaricookies

Flash cookies cacheacutesApple est le fer de lance de la croisade refusant lrsquointeacutegration de la technologie Flash En premier dans sa tablette iPad puis dans la derniegravere version drsquoultraportable MacBook AirSans entrer dans ce deacutebat sur lrsquointeacuterecirct de disposer de cette exten-sion nombreux sont les bandeaux publicitaires en Flash Sur un iPad leur absence repreacutesente un confort drsquoutilisation indeacuteniable En 2002 agrave partir de la version 6 de Flash il est possible pour un

creacuteateur de contenu drsquoutiliser un objet enregistreacute dans votre or-dinateur (Local Shared Object) Cette donneacutee cacheacutee permet de contourner lrsquoeffacement de cookies Il suffit de dupliquer lrsquoinfor-mation avec un jalon Flash LSO Cette fonction a susciteacute lrsquointeacuterecirct de la commission ameacutericaine du commerce (FTC) en 2010 Proba-blement par reacuteaction la derniegravere version 103 de Flash du 15 mai 2011 propose la suppression de ces informations

Un monde sans Flash et sans cookiesLa directive 200258CE amp sur la Protection des donneacutees dans le secteur des teacuteleacutecommunications par le parlement europeacuteen a engendreacute relativement peu drsquointeacuterecirct agrave sa parution en 2002 contrairement agrave la date de la mise en application dans les eacutetats membres du 25 mai 2011 La principale nouveauteacute est lrsquoaccord explicite de lrsquousager pour lrsquoenregistrement de ses donneacutees y compris pour les cookies Na-turellement les chantres de la liberteacute du commerce voient dans cette directive une contrainte insupportable Mecircme aux USA ougrave la protection des donneacutees personnelles informatiques est presque inexistante il existe un deacutebat dans une commission du seacutenat sur la vie priveacutee (Senate Commerce Committee on Privacy) Lrsquoobjectif est de supprimer les informations quand on le deacutesire avec la mise en place des instruments leacutegislatifs ndash Do Not Track amp Pour ceux qui deacutesirent goucircter au monde paisible de lrsquoInternet sans Flash il existe lrsquoextension clicktoflash amp sur Safari qui preacutesente vos pages avec des encarts pour chaque composant Flash Si lrsquoun drsquoeux vous inteacuteresse un clic et crsquoest visible Un effet remarquable de cette absence est une eacuteconomie conseacutequente des ressources informatiques (processeur et meacutemoire) Pour Firefox et Google Chrome lrsquoextension Flashblock amp utilise une meacutethode similaireEt finalement les utilisateurs drsquoInternet Explorer possegravedent une solution moins eacuteleacutegante en interdisant les sites pouvant utiliser Flash (lifehackercom5533694use-Internet-explorers-built+in-flash-block-feature)

fig 7 ndash page Web libeacutereacutee de Flash

Il existe la solution ultime de supprimer reacuteguliegraverement lrsquoensemble de vos cookies et LSO dans votre ordinateur par exemple sur un Macintosh avec Safari

~LibraryCookiesCookiesplist~LibraryPreferencesMacromediaFlash PlayerSharedObjects~LibraryPreferencesMacromediaFlash Player macromediacomsupportflashplayersys

Malheureusement la suite de cet article va deacutemonter que ces actions ne sont pas suffisantes pour proteacuteger votre vie priveacutee

Cookies en folies

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 14: Flash informatique 2011 - no 7

14 flash informatique1414 30 aoucirct 2011 - Ndeg 7flash informatique

Votre environnement informatique une trace indeacuteleacutebile

Pour preacuteserver sa vie priveacutee on pourrait ecirctre tenteacute de supprimer reacuteguliegraverement les cookies et les donneacutees persistantes contenues dans nos navigateurs Internet A priori on imagine que lrsquoutilisa-tion du mode navigation priveacutee cache aux regards exteacuterieurs nos visites sur les sites Web En pratique crsquoest une illusion car degraves qursquoon visite une page sur Internet on laisse des empreintes sur le serveur Si le concepteur utilise un service externe drsquoanalyse de freacutequentation comme Google Analytics vos visites vont directe-ment tomber dans lrsquoescarcelle de GoogleIl est improbable que vous regardiez le code source de vos sources drsquoinformations favorites pour deacutecouvrir ce contenu JavaScript

ltscript src=httpwwwgoogle-analyticscomurchinjs type=textjavascriptgt ltscriptgt ltscript type=textjavascriptgt _uacct = UA-610236-1urchinTracker() ltscriptgt

Pour la page drsquoaccueil de lrsquoEPFL le code de Google Analytics est contenu dans un fichier annexe wwwepflchjsglobalnavjs

Google Analytics jQueryjGoogleAnalytics(rsquoUA-4833294-1rsquo topLevelDomain rsquoepflchrsquo )

En 2010 un chercheur drsquoune association de deacutefense des liberteacutes individuelles ameacutericaines (Free Frontier Fondation) a eacutecrit un ar-ticle avec comme hypothegravese Votre navigateur est-il unique amp

Au deacutepart nous pensons naiumlvement que le fait drsquoutiliser un na-vigateur standard dans notre ordinateur nous rend anonymes Une visite sur le site httpspanopticlickefforg nous deacutemontre le contraire Mon butineur est unique seul parmi 1rsquo611rsquo981 Cela repreacutesente 2062 bits drsquoentropie de lrsquoinformation Quels sont les indices reacuteveacute-lateurs 1 mes polices de caractegraveres unique 1 sur 1rsquo611rsquo9812 mes extensions 1 sur 806rsquo0003 le type du navigateur 1 sur 230rsquo0004 la langue 1 sur 6375 mon eacutecran 1 sur 286 ma zone horaire 1 sur 87 jrsquoaccepte des supercookies 1 sur 238 jrsquoaccepte des cookies 1 sur 13Il est eacutetonnant de constater que la liste des polices de caractegraveres installeacutees chez moi suffit agrave me distinguer Encore plus surprenant comment un site Web peut-il deacutetecter le contenu de mon ordi-nateur La reacuteponse est malheureusement simple lrsquoutilisation du meacutelange de deux technologies Flash et JavaSur mon iPad qui est une machine fermeacutee sans Flash ni Java jrsquoosais espeacuterer ecirctre moins reconnaissable

fig 8 ndash panopticlick Ipad unique

En pratique il nrsquoen est rien je suis eacutegalement unique pas par la preacutesence de polices que lrsquoabsence de Flash et de Java rend impos-sible agrave deacutetecter mais par la combinaison des autres facteurs

La premiegravere deacutefense vous-mecircme

Si on vous demande de communiquer votre code bancaire il est certain que vous allez refuser Bizarrement si vous allez faire reacute-parer un ordinateur peut-ecirctre allez-vous spontaneacutement proposer votre mot de passe informatique Comment peut-on imaginer une telle diffeacuterence de comportement Je crois que la cleacute reacuteside dans la deacutemateacuterialisation de lrsquoinformation Sous la forme habituelle de

Cookies en folies

Entropie numeacuterique

En 1948 le matheacutematicien Claude Shannon amp publie lrsquoarticle qui creacutee la theacuteorie de la communication moderne entre autres il deacutecrit la relation entre le signal et le bruit Dans le mecircme papier il deacutecrit lrsquoentropie qui correspond agrave la quantiteacute drsquoinfor-mations transmises Dans son article en 1951 lrsquoentropie nrsquoest pas uniquement fonction de la complexiteacute mais eacutegalement de la freacutequence drsquoutilisation Un caractegravere possegravede une entropie de 06 a 13 bit un mot inhabituel employeacute par Shakespeare ou Umberto Eco repreacutesente 04 bit par caractegravere Une retom-beacutee inattendue de ce theacuteoregraveme est la capaciteacute de comprimer lrsquoinformation sous une forme non destructive Tout usager qui compresse un dossier utilise sans le savoir la meacutethode LZW imagineacutee par des eacutelegraveves de Claude ShannonPour deacutenombrer les 692 milliards drsquohabitants vivants de la terre il faut utiliser 327 bits Pour tous les humains ayant veacutecu sur notre planegravete environ 106 milliards en 2002 366 bits sont suffisants (wwwprborgpdfPT_novdec02pdf)Un cinquiegraveme des cookies deacutepasse le long terme (une dureacutee de vie supeacuterieure agrave 9 ans) Dans ce sous-groupe 42 possegravedent une entropie supeacuterieure au nombre total drsquohumains Le moins qursquoon puisse dire est que les informaticiens ont une vision agrave tregraves long terme Parfois la quantiteacute drsquoinformations contenues dans le cookie est digne drsquoun article le record est 3141 carac-tegraveres pour comyieldmanagerad dont voici un extrait

b$K4ltNCltynxU)OKltPulM)OUltLTvT-2=20gt-O3=20gt0eWltYOqs0oltygtBB0sAltxgtnC1Mx8==481N48==481N=-==481NC==-481NO3==482dltnA[2-9$ltdZO28Y$lto(83I$6D)ltNR83gTltQXpJ3gXltQXpJ3ghltQXpJ3goltTW)Q3i3)

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 15: Flash informatique 2011 - no 7

151530 aoucirct 2011 - Ndeg 7

papier de classeurs ou drsquoarchives lrsquoinformation est tangible Si vous deacutemeacutenagez un classeur feacutedeacuteral personne ne va srsquoinquieacuteter Si par contre vous transportez une suite de chariots remplis de papier il est probable que quelqursquoun arrecircte ce transfert physique Dans le cas des fuites des cacircbles diplomatiques ameacutericains crsquoest probablement des wagons de documents qui ont eacuteteacute transfeacutereacutes sous une forme numeacuterique apparemment inoffensive des DVDUne autre proprieacuteteacute de lrsquoinformation digitale est qursquoelle est inal-teacuterable telle une œuvre drsquoart reproductible agrave lrsquoinfini sans perte de qualiteacute Cette copie est tellement parfaite qursquoil est impossible de distinguer lrsquooriginal de la copie Cette probleacutematique nrsquoest pas nouvelle en 1935 Walter Benjamin a deacutecrit la perte de lrsquoaura jalon important pour comprendre lrsquoart moderne frwikipediaorgwikiLrsquoŒuvre_drsquoart_agrave_lrsquoeacutepoque_de_sa_reproductibiliteacute_techniqueLa seacutecuriteacute peut prendre des cheminements particuliegraverement tortueux Confronteacute agrave la neacutecessiteacute de renforcer la complexiteacute des mots de passe dans un ceacutenacle de speacutecialistes informatiques la premiegravere remarque est drsquoordre pratique ce changement provoque trop de demandes de support Par analogie avec la limitation de la vitesse automobile lrsquoobjection serait que cette mesure va engen-drer trop de contraventions La reacuteponse rationnelle est que cette contrainte va reacuteduire la graviteacute des accidents eacutevitant des vies bri-seacutees

Un monde civiliseacute Bizarrement les usagers sur Internet se comportent comme si celui-ci est un espace de liberteacute sans controcircle Tel un Far West du monde moderne ils imaginent la possibiliteacute de naviguer sans laisser de traces et disposer de ressources sans limitesNaiumlvement on pourrait espeacuterer se rendre invisible par lrsquoutilisation de redirection qui cache et transforme votre adresse IP Cette pa-rade est caduque srsquoil est particuliegraverement facile drsquoidentifier votre navigateur Les amateurs de Tor ne doivent pas lire ces lignes (Tor est un outil pour dissimuler votre trafic Internet dans un environ-nement partageacute voir article Deacuteseacutecuriseacute paru dans FI408)Probablement par une simplification sans eacutegale on nous promet des guerres cyberneacutetiques similaires au film Indeacutependance DayDans cette leacutegumineuse hollywoodienne navet ou citrouille lrsquohu-maniteacute est confronteacutee agrave une menace extraterrestre disposant de technologies supeacuterieures aux nocirctres Le deacutenouement est vraiment grotesque un virus informatique humain deacutetruit les envahisseurs Par un curieux hasard du sceacutenario les extraterrestres ont deacutecideacute de nous copier en utilisant un microprocesseur de chez nousUn danger nettement plus tangible est une attaque deacutelibeacutereacutee contre votre forteresse numeacuteriquez on attaque le coffre-fort drsquoune entreprise commerciale speacute-

cialiseacute dans la fabrication de cleacute

z on duplique les cleacutes pour entrer chez vousCela nrsquoest pas un roman drsquoespionnage crsquoest reacuteellement arriveacute pour RSA et Lookeed Heureusement Lookeed posseacutedait drsquoautre meacuteca-nisme de seacutecuriteacute que seulement la cleacute RSA Suite agrave cette attaque RSA vient drsquoannoncer le changement de quarante millions de cleacutes eacutelectronique

fig 9 ndashquarante millions de cleacutes eacutelectroniques RSA agrave changer

Cette meacutethode est connue depuis lrsquoantiquiteacute face agrave une muraille infranchissable on peut saper ses fondations ou simplement construire une rampe drsquoaccegraves au piton rocheux

fig 10 ndash rampe drsquoaccegraves au piton de Massada construite en 7 mois 73 apregraves JC

Les attaques informatiques fonctionnent uniquement si le code malicieux srsquoinscrit dans une architecture mateacuterielle et logicielle tregraves speacutecifique Au lieu de procircner un monde homogegravene ougrave les deacutefauts se propagent agrave la vitesse de la lumiegravere il est preacutefeacuterable drsquoutiliser des environnements heacuteteacuterogegravenesDe la mecircme maniegravere il est vain de vouloir se proteacuteger si nos habi-tudes ou lrsquoingeacuteniositeacute des pirates nous convainquent drsquoouvrir un document manifestement veacuteroleacute Dans ce cas qui est familier la cause nrsquoest pas agrave rechercher du cocircteacute drsquoune faille technologique inconnue mais plutocirct de notre soif de deacutecouvertes accompagneacutee drsquoune curiositeacute ineacutebranlable n

Cookies en folies

GLOSSAIRE ampclicktoflash rentzschgithubcom

clicktoflash

directive 200258CE europaeulegisla-tion_summariesinformation_societylegis-lative_frameworkl24120_frhtm

Do Not Track wwwftcgovostestimony101202donottrackpdf

Flashblock flashblockmozdevorg

lrsquohistoire la deacutefinition de lrsquohistoire est geacuteneacuteralement associeacutee au deacutebut de lrsquoeacutecriture soit environ 5400 ans depuis les poteries drsquoAbydos en Eacutegypte Chez moi 4 cookies expirent le 1er janvier 10000 deacutepassant la limite des dates dans mon tableur favori

Shannon Claude E Prediction and entropy of printed English The Bell System Technical Journal 3050-64 January 1951 enwikipediaorgwikiInfor-mation_entropy

Votre navigateur est-il unique httpspanopticlickefforgbrowser-uniquenesspdf

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 16: Flash informatique 2011 - no 7

16 flash informatique 30 aoucirct 2011 - Ndeg 7

Analyse

HPC dans le CloudFabienFiguerasepflch EPFL ndash Domaine IT chef du groupe Exploitation

Even if Cloud Computing is not a revolution all services offered by various market players must be studied carefully In this article we will see if today it is possible to use a Public Cloud for HPC applica-tions

Mecircme si le cloud computing nrsquoest pas une reacutevolu-tion les services proposeacutes par les diffeacuterents acteurs du marcheacute doivent ecirctre eacutetudieacutes avec soin Dans cet article nous allons voir si aujourdrsquohui il est possible drsquoutiliser un Cloud public pour les applications HPC

Apregraves avoir rappeleacute comment les clusters HPC sont architectureacutes et le modegravele de programmation dominant dans les applications HPC nous comparerons les performances des applications dans un Cloud public et dans un cluster priveacute Puis nous calculerons le prix drsquoun cluster dans un Cloud public Enfin nous terminerons en eacutetudiant les opportuniteacutes drsquoutiliser un Cloud public pour les applications de la grille de PC

HPC architecture et modegravele de program-mation

Pour les lecteurs qui ne sont pas familiers du HPC (High Perfor-mance Computing) je vais rappeler les architectures utiliseacutees agrave lrsquoEPFL et le modegravele de programmation dominant Pour les initieacutes vous pouvez sauter directement agrave la partie suivante Les machines HPC souvent appeleacutees cluster ont lrsquoarchitecture logique communez une machine sur laquelle les utilisateurs se connectent appe-

leacutee frontalez des machines effectuant les calculs interconnecteacutees entre

elles et avec la frontale et ayant accegraves agrave un stockage partageacute Ces machines sont souvent appeleacutees nœuds

z un systegraveme de stockage partageacute entre les nœuds et la frontale avec un systegraveme de fichier parallegravele ou non

Les machines mises agrave disposition de lrsquoenseignement et de la re-cherche agrave lrsquoEPFL peuvent ecirctre regroupeacutees en trois cateacutegories (pour plus de deacutetail voir [1])z le super calculateur Blue Gene pour les calculs massivement

parallegravelesz des clusters geacuteneacuteralistes avec diffeacuterents niveaux de perfor-

mance drsquointerconnexion de systegravemes de fichier parallegravele (GPFS amp) ou non (NFS amp) et plus ou moins heacuteteacuterogegravenes ( avec ou sans GPU)

z une grille de PC et de VM nommeacute Greedy [2] Le modegravele de programmation dominant pour les deux premiegraveres cateacutegories est MPI (Message Passing Interface) [3] qui fait un

grand usage de lrsquointerconnexion entre nœuds Pour obtenir les meilleures performances la latence doit ecirctre la plus faible possible et la bande passante maximale Actuellement crsquoest Infiniband [4] qui domine les technologies drsquointerconnexionPour la grille on trouve des programmes qui utilisent un seul pro-cesseur et qui ne communiquent pas avec lrsquoexteacuterieur

Des applications HPC dans un Cloud public

Actuellement les utilisateurs de Blue Gene et des clusters geacuteneacute-ralistes soumettent leurs travaux dans lrsquoinfrastructure priveacutee de lrsquoEPFL Je nrsquoutilise pas le nom de Cloud priveacute car cela serait un abus de langage en effet le Cloud se reacutefegravere geacuteneacuteralement agrave une infrastructure de machines virtuelles [5]La question est bien sucircr de savoir si ces utilisateurs pourraient utiliser un Cloud public au lieu de lrsquoinfrastructure localePour qursquoun utilisateur veuille soumettre ces travaux dans un Cloud public il faut au moins que les performances et les prix soient du mecircme ordre de grandeur

Cloud public HPC et une infrastructure locale qui est le plus rapide

Avant de preacutesenter les reacutesultats jrsquoinvite le lecteur agrave se poser la question suivante Si mon application utilise intensivement le reacuteseau drsquointer-connexion sera-t-elle plus performante avec un reacuteseau drsquoin-terconnexion agrave faible latence amp et grande bande passante ou avec un reacuteseau agrave forte latence et bande passante moyenne La reacuteponse vous semble eacutevidente Comme moi vous vous dites mais pourquoi perdre son temps agrave faire des tests Je nrsquoai pas de certitudes mais il semblerait que les gestionnaires et autres comptables responsables de nos budgets aient plus suivi les enseignements de Saint Thomas que de Descartes et qursquoils aient besoin de toucher un bon rapport de tests qui montre ce qui semblait deacutejagrave si eacutevidentLe Cloud public le plus connu et qui offre des services HPC est Amazon EC2 [6] De nombreux tests reacutealiseacutes seulement aux Eacutetats-Unis (vous verrez plus loin pourquoi) ont montreacute que pour du HPC en geacuteneacuteral une infrastructure deacutedieacutee de machines physiques est plus performante qursquoune infrastructure de machines virtuelles (VM) dans un Cloud Public Le principe de base drsquoun Cloud Public est de mutualiser au maximum les ressources Donc agrave un mecircme instant plusieurs VM se partagent le processeur ce qui explique simplement qursquoune VM ne dispose que drsquoune fraction de la puis-sance et donc ne puisse pas ecirctre aussi performante qursquoune machine disposant du processeur pour elle seule Le mecircme raisonnement srsquoapplique pour les autres ressources (meacutemoire disque reacuteseau)

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 17: Flash informatique 2011 - no 7

171730 aoucirct 2011 - Ndeg 7

Parmi tous les comparatifs je vous propose de reprendre les conclusions de lrsquoeacutetude reacutealiseacutee par huit membres du Lawrence Berkeley National Lab [7] Lrsquointeacuterecirct principal est drsquoavoir compareacute les performances de six applications et drsquoune batterie de tests HPC sur trois clusters locaux de puissance et drsquoacircge diffeacuterents et sur un cluster HPC-EC2 Lrsquoanalyse des reacutesultats a montreacute que toutes les applications qui faisaient un usage intensif de MPI avaient des performances de six agrave vingt fois moins bonnes sur le cluster dans le Cloud public que sur les clusters locaux Lrsquointerconnexion du cluster du Cloud est de lrsquoEthernet agrave 10Gbps partageacute par toutes les machines physiques alors que les clusters locaux utilisaient de lrsquoInfiniband agrave 20 ou 40 GbpsSaint Thomas est-il satisfait Il pourrait demander de comparer les performances des accegraves disques entre des machines locales et le Cloud public Le reacutesultat sera du mecircme ordre de grandeur En effet les accegraves aux disques dans le Cloud public se font agrave travers NFS et sur un reacuteseau LAN partageacute ou pire agrave travers du WAN Il faudra donc comparer ce reacuteseau agrave faible deacutebit et mutualiseacute agrave un reacuteseau local deacutedieacute agrave large bande passante ougrave les donneacutees seront servies par des fermes de serveurs de fichiers offrant accegraves agrave des systegravemes de fichiers parallegraveles soutenant jusqursquoagrave 100Gbps

Comparaison des coucircts entre un Cloud HPC et une infrastructure locale

Maintenant vous nrsquoavez plus de doute que le Cloud Public est beaucoup moins performant que des infrastructures localesVous pouvez me dire que si une application met 30 de temps en plus pour srsquoexeacutecuter dans le Cloud public que sur mon clus-ter local mais que cela me coucircte 50 de moins je suis encore gagnant Malheureusement ce nrsquoest pas le cas je ne peux pas donner les chiffres exacts ici pour cause de confidentialiteacute avec nos four-nisseurs mais je vous vais vous donner un ordre de grandeur du tarif Amazon [8] pour une configuration drsquoun cluster de taille rai-sonnableSi on prend une base de 125 nœuds (Amazon nrsquoen donne pas plus de 128 par cluster) agrave 2 CPU et 4 cœurs on obtient un total de 1000 cœurs En consideacuterant un OS Linux gratuit (pas comme

SUSE ou Red Hat) un taux de change de 0842 CHF pour un dollar (taux de fin mai 2011) et une TVA de 8 le coucirct sur 3 ans avec reacuteservation de la machine est de 2rsquo421rsquo944 CHFUn beau budget nrsquoest-ce pas Mais attention ce nrsquoest pas fini au prix des nœuds vous devez encore rajouterz les donneacutees qui entrent et sortent du Cloudz lrsquoespace disque pour les donneacutees de calculz les lectures et eacutecritures effectueacutees sur ce stockagePour vous donner une ideacutee du montant agrave rajouter prenons un exemple reacutealistez les volumes de donneacutees sortis de Callisto entre le 23 mai et le

21 juin 2011 1rsquo974 GBz un stockage de 50 TBz pour calculer le nombre drsquoIO prenons une taille de buffer de

1024 octetsCe qui coucircte le plus cher ici crsquoest le stockage finalement sur trois ans agrave ce rythme il faudra rajouter 183rsquo554 CHF On arrive donc agrave un total sur 3 ans (en arrondissant) de 26 millions de FrancsSur la dureacutee de vie de la machine le Cloud public HPC est plus cher qursquoun cluster local Bien sur vous nrsquoecirctes pas obligeacute de me croire et vous pouvez essayer vous mecircme de faire le calcul cepen-dant faites bien attention agrave ne rien oublier dans toutes les options proposeacutees par Amazon pour comparer des choses comparables

Opportuniteacutes pour le Cloud HPC

Moins performant et plus cher Enterrons joyeusement le Cloud public et passons agrave autre chose Pas si vite il y a quand mecircme un inteacuterecirct technique pour le Cloud public HPCOn a vu que srsquoil nrsquoy avait pas de communication entre les nœuds et pas trop drsquoaccegraves disques les performances eacutetaient relativement proches entre un Cloud public et un cluster localLes utilisateurs de Blue Gene et des clusters geacuteneacuteralistes nrsquoont donc pas pour lrsquoinstant drsquointeacuterecirct agrave utiliser un Cloud public Ce-pendant les utilisateurs de la grille semblent de bons candidats en effet les programmes sont mono CPU ne communiquent pas entre eux et ne font pas non plus beaucoup drsquoaccegraves disquesDepuis quelques mois le DIT expeacuterimente un Cloud priveacute de 80 VM mono CPU les applications qui utilisent cette infrastructure

expeacuterimentale ont un profil carac-teacuteristique En effet toutes les VM qui supportent ces applications ont le mecircme type drsquoutilisation des res-sources Elles utilisent entiegraverement le CPU agrave disposition (fig 1) intenseacute-ment la meacutemoire (fig 2) et tregraves peu le disque (fig 3) et le reacuteseau (fig 4)Malheureusement pour que ces applications utilisent un Cloud public il reste quand mecircme deux problegravemes de taille Lrsquoaccegraves agrave la grille est actuellement gratuit agrave lrsquoEPFL alors qursquoil est payant dans un Cloud public Mais surtout le service HPC drsquoAmazon nrsquoest agrave ce jour disponible qursquoaux Eacutetats-Unis

HPC dans le Cloud

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 18: Flash informatique 2011 - no 7

18 flash informatique1818 30 aoucirct 2011 - Ndeg 7flash informatique

Conclusion

Nous avons vu que les applications HPC utilisant le modegravele de programmation MPI ne sont pas de bonnes candidates pour les Cloud publicEn effet lrsquoeacutecart de performance est trop grand et aucun gain financier nrsquoest agrave attendreLe Cloud public pourrait eacuteventuellement servir pour des applications mono CPU mais les utilisateurs de lrsquoEPFL qui au-jourdrsquohui accegravedent gratuitement agrave ces ressources devraient mettre la main agrave la pocheNous nrsquoavons pas abordeacute ici les pro-blegravemes de confidentialiteacute et de seacutecuriteacute lieacutes agrave lrsquoutilisation drsquoun Cloud public mais ils devront ecirctre pris en compte avant de se deacutecider agrave utiliser une infrastructure publique

Reacutefeacuterences

[1] hpc-ditepflch[2] greedyepflch[3] MPI frwikipediaorgwikiMessage_

Passing_Interface[4] Infiniband frwikipediaorgwiki

InfiniBand[5] FI611 Cloud eacutevolution ou reacutevo-

lution flashinformatiqueepflchspipphparticle2310

[6] Cloud Amazon HPC awsamazoncomec2hpc-applications

[7] Performance analysis of high per-formance computing applications on the amazon web services cloud (Lawrence Berkeley National Lab) wwwlblgovcsCSnewscloudcomBPpdf

[8] awsamazoncomec2pricing

HPC dans le Cloud

fig 1 ndash VM sur un serveur toutes utilisent le CPU agrave 100

fig 3 ndash utilisation disque drsquoune VM (deacutebit moyen 23 Kbps)

fig 2 ndash utilisation meacutemoire drsquoune VM (42 de la meacutemoire est active en moyenne)

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 19: Flash informatique 2011 - no 7

191930 aoucirct 2011 - Ndeg 7

HPC dans le Cloud

fig 4 ndash utilisation reacuteseau drsquoune VM (deacutebit moyen 1 KBps)

GLOSSAIRE ampGPFS (General Parallel File System) sys-

tegraveme de fichiers conccedilu pour adresser de faccedilon unique des volumes de donneacutees deacutepassant le peacutetaoctet et reacutepartis sur un nombre de supports physiques pouvant deacutepasser le millier www-03ibmcomsystemssoftwaregpfs et W

latence temps drsquoeacutetablissement de la communication

NFS (Network File System) protocole deacuteveloppeacute par Sun Microsystems qui permet agrave un ordinateur drsquoacceacuteder agrave des fichiers via un reacuteseau W

W = tireacute de Wikipeacutedia

Projets AAA de Switch pour la peacuteriode 2008 - 2011PierreMellierepflch EPFL ndash Domaine IT responsable du KIS

Agenda

Suite aux projets AAI la Fondation SWITCH a deacutemarreacute au prin-temps 2008 une nouvelle phase de projets AAA appeleacutee e-Infras-truture for e-Science pour la peacuteriode 2008-2011 Les uniteacutes de recherche les services informatiques centraux et les uniteacutes drsquoe-learning peuvent soumettre deux fois par anneacutee des proposi-tions de projetsLrsquoobjectif de ces projets est drsquoameacuteliorer le partage des prestations informatiques entre les diffeacuterentes institutions dans les domaines du Grid (optimisation de lrsquousage des ressources) du e-learning (ameacuteliorer lrsquoaccessibiliteacute et le partage) et des organisations vir-tuelles (meilleurs supports informatiques aux projets de recherche interinstitutionnels)Pour la huitiegraveme eacutetape les projets doivent ecirctre soumis jusqursquoau 30 septembre 2011 Ces projets doivent ecirctre centreacutes sur des aspects coopeacuteratifs et doivent impliquer au moins un autre parte-naire institutionnel Le soumissionnaire doit eacutegalement apporter 50 des fonds du projet Les projets seront eacutevalueacutes en fonction des beacuteneacutefices pour lrsquoutilisateur final des aspects coopeacuteratifs du caractegravere drsquoinnovation de la peacuterenniteacute de la solution de la qualiteacute de la gestion du projetDes renseignements tregraves complets sont disponibles agrave lrsquoadresse wwwswitchchaaa ou chez PierreMellierepflch

After the first phase of realization of the infrastructures for authentication and autorization (AAI) SWITCH Foundation has started a new phase for the 2008-2011 period on AAA projects called e-Infrastructure for e-Science The research units the cen-tral informatics service and the e-learning units can participate twice a year by submitting project proposal The objectif of these projects is to improve the sharing of infor-matics resources between different institutions in the domains of Grid (optimization of the use of resources) of e-learning (to improve access and sharing) and of virtual organizations (better informatics support to inter-institutional research projects)For the eighth deadline the projects must be submitted for Sep-tember 30 These projects must focus on cooperative aspects and involved an other institutional partner These projects must be re-alized within a matching fund framework (50 from SWITCH and 50 from the institution) Their evaluation will be based on end user benefits cooperative aspects innovative aspect sustainabil-ity and quality of the project managementMore complete information can be found at wwwswitchchaaa or contact PierreMellierepflch n

n

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n

Page 20: Flash informatique 2011 - no 7

ISSN 1420-7192

Actualiteacutes

Le FI fait peau neuve sur le WebJacquelineDoussonepflch amp AppolineRaposoepflch EPFL-Domaine IT responsables du FI

A new look for the FI online

Le Flash informatique profite du passage agrave la nou-velle charte graphique EPFL pour vous concocter un site tout nouveau tout beau

FlashInformatiqueepflch

La version papier du journal a fait sa mue en janvier 2010 cet eacuteteacute crsquoest le tour de la version en ligne En 2004 nous avions choisi SPIP [1] (voir article Le FI et SPIP de janvier 2004 flashinformatiquespipphparticle383) comme CMS pour mettre le Flash informa-tique sur le Web SPIP est un logiciel libre distribueacute sous licence GNUGPL parfaitement adapteacute agrave la notion de revue drsquoarticles et drsquoauteurs la communauteacute SPIP reste tregraves vivante le nombre de sites qui lrsquoutilisent augmente en permanence nous nrsquoavions donc pas de raison de changer drsquooutil Lapparence est totalement dis-tincte des donneacutees (articles figures etc) qui sont dans une base de donneacutees mySQL ce qui a permis de lui donner lrsquoaspect Web2010 (nouveau look des pages Web de lrsquoEPFL) Ce fut eacutegalement lrsquoocca-sion drsquoune refonte totale de la structure du site centreacute agrave preacutesent sur le Flash informatique les autres publications du DIT agrave peacuterio-diciteacute variable restant accessibles sous ditepflchpublications La navigation a eacuteteacute revue drsquoune faccedilon que nous espeacuterons plus convi-viale On peut agrave preacutesent naviguer drsquoune anneacutee agrave lrsquoautre agrave lrsquointeacuterieur drsquoune mecircme anneacutee agrave lrsquointeacuterieur du mecircme numeacutero acceacuteder aux autres articles drsquoun auteur Beaucoup de ces possibiliteacutes existaient deacutejagrave mais elles sont devenues plus eacutevidentes

PDA iphonetablette

Pour prendre en compte les terminaux plus petits plusieurs solutions ont eacuteteacute adopteacutees au cours des anneacutees Nous avons eu la peacuteriode AvantGo par-faite pour les Palm puis nous proposions un HTML simplifieacute adapteacute aux PDA agrave preacutesent nous avons une option iPhone ougrave les articles sont preacutesenteacutes drsquoune faccedilon ad hoc Une version pour drsquoautres smartphones devrait arriver tout prochainement

Une vitrine sur 25 ans drsquoinformatique

Agrave preacutesent nous avons en ligne les numeacuteros du Flash informatique depuis 1986 pas si mal agrave lrsquoaune de lrsquoacircge du Web

De 1986 agrave 1994 seuls les PDF des numeacuteros dans leur entier sont disponibles mais le moteur de recherche SPIP indexe les titres et les auteurs De 1994 agrave 2001 les articles sont aussi disponibles au format HTMLLes anneacutees SPIP commencent en 2002 avec toujours le PDF du numeacutero et les PDF des articles Depuis janvier 2010 une nouvelle possibiliteacute de lecture est offerte le feuilletage du numeacutero en ligne Crsquoest une fonction fournie gra-tuitement par le site issuucom Nous sommes persuadeacutees que ce creuset drsquoarchives a un inteacuterecirct pour un large public qui en les visualisant pourra se rendre compte agrave quel point les changements technologiques ont eacuteteacute rapides

Anciens liens

Les articles du FI sont en geacuteneacuteral bien reacutefeacuterenceacutes par les moteurs de recherche et beaucoup drsquointernautes francophones les deacutecou-vrent au hasard drsquoune recherche et les gardent dans leurs signets les anciens liens seront maintenus un message invitant les visi-teurs agrave aller deacutecouvrir le nouveau site Pour les personnes qui ont reacutefeacuterenceacute des articles (parus apregraves novembre 2001) dans leurs pages Web il suffit de remplacer ditwwwepflchSICSAPublica-tions par flashinformatiqueepflch car les numeacuteros des articles restent les mecircmes pour retrouver le mecircme article mis au look du jour Exemple ancienne adresse ditwwwepflchSICSASPIPPublicationsspipphparticle252nouvelle adresse flashinformatiqueepflchspipphparticle252Reacutefeacuterence[1] wwwspipnet n