16
FlashInformatique.epfl.ch p/a EPFL - Domaine IT - Station 8 - CH 1015 Lausanne - tél. +41 21 69 322 11 12.06.2012 5 tout public public averti expert Actualités Un nouveau centre de calcul à l’EPFL Aristide Boisseau 1 DIT-info z Nouveau technicien au DIT-SUP 16 Numéro spécial été 2012 – le document et les données z Appel aux articles 16 À votre service Réalisations de GED à l’EPFL Patricia Plaza Gruber 10 Logiciel libre Graphiques avec R Vittoria Rezzonico 2 Kickstart pour Ubuntu Benjamin Barras 12 Rencontres Mondiales du Logiciel Libre 2012 Benjamin Barras, Anne Possoz & Vittoria Rezzonico 15 Prochaines parutions No Délai de rédaction Parution SP 02.07.12 21.08.12 6 16.08.12 14.09.12 7 27.09.12 16.10.12 ../.. Suite page 6 Un nouveau centre de calcul à l’EPFL Aristide.Boisseau@epfl.ch, EPFL, Domaine IT, responsable infrastructure IT New datacenter at EPFL, an in- novative passive water cooling solution has been set up. Nouveau centre de calcul à l’EPFL, une solution innovante de refroi- dissement passif a été mise en place. Introduction Un nouveau centre de calcul (datacenter) est entré en fonction en mai 2012 à l’EPFL. La puissance disponible pour les serveurs sera de 1MW, une grande partie de celle-ci sera dédiée aux clusters HPC (High Performance Computing) les plus gros consommateurs en terme de puissance. De l’espace et de la puissance sont également prévus pour les besoins d’hébergement IT des facultés ainsi que ceux des services centraux (DIT). Cet article présente les différentes étapes du projet et les technologies utilisées pour l’exploitation de ce nouvel outil IT à dispo- sition de l’École. Pourquoi un nouveau data- center ? Les principales infrastructures IT ac- tuelles de l’École — la zone souple du DIT (500kW) et la salle IT de SB (150kW envi- ron) — ne suffisant plus à répondre à la demande d’hébergement, la Direction de l’École a décidé d’investir dans un nouveau local IT en 2011. Cette nouvelle infrastruc- ture, si les prévisions se confirment, devrait être totalement occupée d’ici 2014. Historique Le projet a démarré au début 2011, la mé- thode de gestion de projet retenue fut celle développée par l’Administration fédérale suisse: HERMES, www.hermes.admin.ch. Ce projet avait un objectif double: z mise en place d’un datacenter de 1MW, z rénovation de la centrale technique du bâtiment IN. Le datacenter est situé dans le bâtiment INJ (salles INJ012 et INJ019), il occupe une sur- face de 250m 2 environ et un volume d’en- viron 1000m 3 . Les locaux [INJ011, INJ012, INJ016] et INJ019 ont été regroupés pour obtenir ces deux nouvelles salles. Le nouveau datacenter a pris la place d’an- ciennes salles serveurs (INJ011, INJ016 et INJ019), d’où des contraintes supplémen- taires pendant les travaux: faire le moins de poussière possible et perturber le moins possible le service IT déjà en place (pas de coupure de courant dans la mesure du pos- sible, limiter la poussière). Les infrastructures (centrale technique) pour le datacenter occupent environ la même surface, soit 250m 2 . Actualités page 15

Flash informatique 2012 - no 5

  • Upload
    epfl

  • View
    223

  • Download
    0

Embed Size (px)

DESCRIPTION

Journal informatique de l'Ecole Polytechnique Fédérale de Lausanne du 12 juin 2012

Citation preview

Page 1: Flash informatique 2012 - no 5

FlashInformatique.epfl.ch

p/a EPFL - Domaine IT - Station 8 - CH 1015 Lausanne - tél. +41 21 69 322 11

12.06.20125

tout public public averti expert

ActualitésUn nouveau centre de calcul à l’EPFL

Aristide Boisseau 1

DIT-info z Nouveau technicien au DIT-SUP 16

Numéro spécial été 2012 – le document et les données z Appel aux articles 16

À votre serviceRéalisations de GED à l’EPFL

Patricia Plaza Gruber 10

Logiciel libreGraphiques avec R

Vittoria Rezzonico 2

Kickstart pour Ubuntu Benjamin Barras 12

Rencontres Mondiales du Logiciel Libre 2012 Benjamin Barras, Anne Possoz & Vittoria Rezzonico 15

Prochaines parutions

No Délai de rédaction Parution

SP 02.07.12 21.08.12

6 16.08.12 14.09.12

7 27.09.12 16.10.12

../.. Suite page 6

Un nouveau centre de calcul à l’EPFL [email protected], EPFL, Domaine IT, responsable infrastructure IT

New datacenter at EPFL, an in-novative passive water cooling solution has been set up.

Nouveau centre de calcul à l’EPFL, une solution innovante de refroi-dissement passif a été mise en place.

Introduction

Un nouveau centre de calcul (datacenter) est entré en fonction en mai 2012 à l’EPFL. La puissance disponible pour les serveurs sera de 1MW, une grande partie de celle-ci sera dédiée aux clusters HPC (High Performance Computing) les plus gros consommateurs en terme de puissance. De l’espace et de la puissance sont également prévus pour les besoins d’hébergement IT des facultés ainsi que ceux des services centraux (DIT).Cet article présente les différentes étapes du projet et les technologies utilisées pour l’exploitation de ce nouvel outil IT à dispo-sition de l’École.

Pourquoi un nouveau data-center ?

Les principales infrastructures IT ac-tuelles de l’École — la zone souple du DIT (500kW) et la salle IT de SB (150kW envi-ron) — ne suffisant plus à répondre à la

demande d’hébergement, la Direction de l’École a décidé d’investir dans un nouveau local IT en 2011. Cette nouvelle infrastruc-ture, si les prévisions se confirment, devrait être totalement occupée d’ici 2014.

Historique

Le projet a démarré au début 2011, la mé-thode de gestion de projet retenue fut celle développée par l’Administration fédérale suisse: HERMES, www.hermes.admin.ch.Ce projet avait un objectif double:z mise en place d’un datacenter de 1MW,z rénovation de la centrale technique du

bâtiment IN.Le datacenter est situé dans le bâtiment INJ (salles INJ012 et INJ019), il occupe une sur-face de 250m2 environ et un volume d’en-viron 1000m3. Les locaux [INJ011, INJ012, INJ016] et INJ019 ont été regroupés pour obtenir ces deux nouvelles salles. Le nouveau datacenter a pris la place d’an-ciennes salles serveurs (INJ011, INJ016 et INJ019), d’où des contraintes supplémen-taires pendant les travaux: faire le moins de poussière possible et perturber le moins possible le service IT déjà en place (pas de coupure de courant dans la mesure du pos-sible, limiter la poussière).Les infrastructures (centrale technique) pour le datacenter occupent environ la même surface, soit 250m2.

Actualitéspage 15

Page 2: Flash informatique 2012 - no 5

flash informatique222 12 JUIN 2012 - N°5

ImpressumRevue consacrée aux technologies de l’information, éditée par le Domaine IT de l’EPFL (DIT). Les articles n’engagent que leurs auteurs, sauf ceux qui concernent de façon évidente des prestations officielles (sous la responsabilité du DIT ou d’autres entités). Toute reproduction, même par-tielle, n’est autorisée qu’avec l’accord de la rédaction et des auteurs.

Rédacteur en chef:Jacqueline Dousson, [email protected] en page & graphisme: Appoline Raposo de BarbosaComité de rédaction:Jean-Daniel Bonjour, Patrice Fumasoli, Florence Hagen, Laurent Kling, Julia Paolini, François Roulet, Christophe Salzmann, Richard Timsit & Predrag Viceic

Impression: Atelier de Reprographie EPFLTirage: 4000 exemplairesAdresse Web: flashinformatique.epfl.chAdresse: Domaine IT EPFLStation 8, CH-1015 LausanneTéléphone: +41 21 69 32246 & 32247Abonnement au FI par e-mail à: [email protected]

Graphiques avec [email protected], EPFL - Coordination des systèmes d’information, coordinatrice CSE

R, a powerful environment for statistical comput-ing, can be used to plot your data in a variety of formats. In this article, several easy examples will be shown. No need to be a statistician to appreciate the features of R!

R, puissant environnement pour le calcul en statis-tiques, peut être utilisé pour afficher vos données dans une multitude de formats. Dans cet article, plusieurs exemples simples seront montrés. Pas besoin d’être statisticien pour apprécier les fonc-tionnalités de R!

Fiche descriptive

R

Domaine✦ Statistique, représentations graphiques

Licence✦ GPLv2+

langue✦ multilingue

version✦ 2.15

Autres alternatives libres✦ NumPy/SciPy/MatPlotLib/Mayavi✦ Octave✦ GNUPlot✦ Paquetages Tex, Tikz et PFG

Alternatives non libres✦ S-Plus

Sites Web✦ Projet et téléchargement: www.r-project.org

Plates-formes

Logiciel libre

Il est peut-être réducteur de vouloir utiliser R uniquement pour générer des graphiques, mais cela a plusieurs avantages:z une uniformisation de vos graphiques, idéal lorsqu’on rédige

une thèse;z possibilité de manipuler les données (post-processing) avant

de les afficher;z plusieurs formats de fichiers possibles en sortie, que vous

écriviez vos documents avec LibreOffice, LaTeX ou que vous publiiez vos images sur le Web, R a un pilote de sortie adapté.

Dans l’article R: un logiciel libre pour l’analyse de vos don-nées [1] paru dans le numéro précédent du FI, vous avez décou-vert le logiciel R. Ici, je vais donner quelques exemples simples qui vous permettront de créer des graphiques professionnels que vous pourrez inclure dans vos documents.

Formats de fichiers

R peut générer différents formats de fichiers via les graphic device drivers. On a deux types de pilotes:z ceux pour l’affichage à l’écran;z ceux pour écrire dans un fichier.L’affichage à l’écran se fait par défaut, lorsqu’on appelle une fonc-tion d’affichage (par exemple, plot) sans rien spécifier aupara-vant.Nous allons nous intéresser aux device drivers pour écrire dans un fichier des graphiques générés destinés à être ensuite inclus dans d’autres documents.

Formats bitmapLe format le plus utilisé de cette catégorie est sans doute PNG. Pour écrire votre graphique dans un fichier PNG, il suffit d’entou-rer vos commandes d’affichage:

png("fichier.png", width=400, height=400)# commandes d'affichagedev.off()

La largeur et la hauteur sont spécifiées en pixels par défaut.

Page 3: Flash informatique 2012 - no 5

3312 JUIN 2012 - N°5

Formats non bitmap (vectoriels)Si vous souhaitez inclure votre graphique dans un fichier TeX, vous avez trois drivers à votre disposition: postscript, pdf et tikz. Pour écrire votre graphique dans un PDF ou un fichier TeX, il suffit de faire

pdf("fichier.pdf", width=5, height=5)# commandes d'affichagedev.off()

outikz("fichier.tex", width=4, height=4)# commandes d'affichagedev.off()

respectivement. La largeur et la hauteur sont spécifiées en pouces.D’autres drivers sont disponibles, citons WMF, PostScript, TIFF, BMP et je vous laisse explorer l’aide en ligne de R. Le driver Tikz

Le driver Tikz mérite une attention particulière. Il nous permet de générer des fichiers que l’on peut inclure directement dans des documents LaTeX (voir aussi l’article TeX Live, distribution TeX/LaTeX libre [2] de Benjamin Barras dans le FI 6/2011) de la façon suivante:

\documentclass[11pt]{article}

\usepackage{tikz} \begin{document}

\begin{center} \input{R-graph.tex}\end{center}

\end{document}

Pour avoir accès au driver Tikz sous R, il faut installer le paquetage correspondant, depuis l’environment R, avec la commande:

install.packages("tikzDevice")

et importer le paquetage avant d’utiliser le driver :

require(tikzDevice) tikz("R-graph.tex", width=4, height=4)# commandes d'affichagedev.off()

Quelques exemples pratiques

Maintenant que vous avez installé les paquetages nécessaires et choisi votre format de fichier favori, nous sommes prêts à mon-trer quelques exemples. Les images de cet article ont été générées avec le driver PDF. Dans la suite des exemples de cet article, je vais uniquement indiquer les commandes d’affichage, à vous de rajou-ter le nécessaire pour rediriger la sortie vers un fichier.Il faut d’abord définir des palettes de couleurs qui nous seront utiles par la suite:

Graphiques avec R

theme4pw <- c(rgb(149,193,26, maxColorValue = 255),rgb(179,207,94, maxColorValue = 255),rgb(207,224,154, maxColorValue = 255),rgb(231,239,208, maxColorValue = 255),rgb(229,229,229, maxColorValue = 255))

theme3b <- c(rgb(149,193,26, maxColorValue = 255),rgb(196,217,130, maxColorValue = 255),rgb(226,236,197, maxColorValue = 255))

theme3l <- c(rgb(149,193,26, maxColorValue = 255),rgb(176,209,83, maxColorValue = 255),rgb(136,136,136, maxColorValue = 255)

CamembertsCommençons par l’incontournable camembert tant demandé par les managers. Ignorons, pour un instant, l’aide en ligne de R qui nous dit que les camemberts sont à éviter:

Note: Pie charts are a very bad way of displaying information. The eye is good at judging linear measures and bad at judging relative areas. A bar chart or dot chart is a preferable way of displaying this type of data.

Importons des données depuis un fichier pie.txt:

toplot <- read.table("pie.txt")ltext=rownames(toplot)

purchased used g1 51 24.3 g2 23.6 14.6 g3 7.6 11.8 g4 8 49.3 free 9.8 0

flchier pie.txt

Nous pouvons afficher la première colonne (purchased) dans un camembert (fig. 1):

pie(toplot[,1], labels=ltext, col=theme4pw)

Pour rendre encore plus heureux les managers, nous pouvons afficher un camembert 3D (fig. 2).

require(plotrix) pie3D(toplot[,1], labels=ltext, col=theme4pw, explode=0.1)

g1

g2

g3

g4

free

g1

g2g3

g4

free

fig. 1 – camembert fig. 2 – camembert 3D

Histogrammes cumulatifsLes histogrammes cumulatifs (fig. 3), par rapport aux camemberts, nous donnent une meilleure idée des grandeurs comparées:

Page 4: Flash informatique 2012 - no 5

4444 flash informatique44 12 JUIN 2012 - N°5flash informatique

Graphiques avec R

barplot(as.matrix(toplot), col=theme4pw,xlim=c(0,3.5))abline(h=(0:10)*10, lty=3, col='gray')legend("topright", ltext[length(ltext):1], col='black', pch=c(22), pt.bg=theme4pw[length(theme4pw):1], bty='n')

purchased used

020

4060

8010

0

freeg4g3g2g1

fig. 3 – histogramme cumulatif

Histogrammes

Rainy Dark Foggy Sunny "player 1" 3.2 1.8 1.2 0.9 "player 2" 1.5 2.0 1.2 1.0 "player 3" 4.1 1.5 1.4 1.3

fichier bars.txt

Nous pouvons utiliser les histogrammes sans les empiler (fig. 4), toujours avec la commande barplot.

times <- read.table("bars.txt")

barplot(as.matrix(times),col=theme3b,beside=TRUE, xlab='weather', ylab='time to destination [h]') abline(h=(1:4), lty=3, col='gray') abline(h=0, lty=1, col='black') legend("topright", legend=rownames(times), col='black', pch=c(22), pt.bg=theme3b, bty='n')

Rainy Dark Foggy Sunnyweather

time

to d

estin

atio

n [h

]

01

23

4

player 1player 2player 3

fig. 4 – histogramme simple

La commande Plot

1 3457.6953 6020.6509 3314.5898 2 5268.7849 11918.0629 4884.5262 4 5541.83 20878.2638 9534.0259 8 5543.9268 28863.862 18089.666516 NA NA 29723.2094

fichier cluster-data.txt

Souvent, on souhaite afficher des données y versus x. Dans R, ceci est possible avec la commande plot. L’ajout de graphes sup-plémentaires sur la même figure est possible avec la commande points. Un exemple de ce type de graphe est montré dans la figure 5.

cdata=read.table("cluster-data.txt") plot(cdata[,1], cdata[,2], log="x", type='b',xlab='threads',ylab='GB/s',ylim=c(3000,30000),xaxt='n', yaxt='n', pch=1, col=theme3l[1]) axis(1,at=c(1,2,4,8,16)) axis(2,at=c(5000,10000,15000,20000,25000,30000),lab=c(5,10,15, 20,25, 30)) points(cdata[,1],cdata[,3],type='b',col=theme3l[2],pch=2) points(cdata[,1],cdata[,4],type='b',col=theme3l[3],pch=3) legend("topleft", legend=c("Callisto","Antares","Jupiter"),col=theme3l, pch=c(1,2,3))

threads

GB

/s

1 2 4 8 16

510

1520

2530 Callisto

AntaresJupiter

fig. 5 – graphiques à l’aide des fonctions plot et points

Maintenant, explorons d’autres types de graphes réalisables avec R. Vous verrez que les possibilités sont nombreuses. De plus, le paquetage CRAN augmente encore la palette.

TimelineAfficher une ligne temporelle n’a jamais été si simple – il suffit de connaître les bonnes commandes R. Le prochain exemple illustre les plates-formes et les initiatives en calcul haute performance à l’EPFL entre 1990 et 2004.

"Pascal" "1993/11/01" "1999/05/01""Merope/J90se" "1997/03/21" "2001/02/05""Orion" "1997/02/01" "1999/06/01""Eridan" "1997/12/01" "2005/05/01""Swiss-T0" "1998/05/01" "2000/08/01""Swiss-T0 dual" "1998/10/01" "1999/09/01""Swiss-T1 baby" "1999/08/01" "2003/06/01""Swiss T1" "2000/01/01" "2003/01/01"

flchier hpctimeline.txt

Page 5: Flash informatique 2012 - no 5

5512 JUIN 2012 - N°5

Graphiques avec R

require(plotrix)hpctimeline=read.table("hpctimeline.txt")Ymd.format<-"%Y/%m/%d"

vgridpos<-as.POSIXct(strptime(c("1992/01/01", "1994/01/01", "1996/01/01","1998/01/01", "2000/01/01", "2002/01/01" ), format=Ymd.format))

vgridlab<- c( "1992", "1994", "1996", "1998", "2000", "2002")

startend=as.POSIXct(strptime(c("1992/06/01", "2004/01/01"), format=Ymd.format))

gantt.info <- list(labels=hpctimeline[,1],starts=as.POSIXct(strptime(hpctimeline[,2], format=Ymd.format)),ends=as.POSIXct(strptime(hpctimeline[,3], format=Ymd.format)))

gantt.chart(gantt.info, vgridpos=vgridpos,vgridlab=vgridlab, hgrid=TRUE, priority.legend=FALSE,taskcolors=theme3l[1], xlim=startend)

1994 1996 1998 2000 2002

Swiss T1

Swiss−T1 baby

Swiss−T0 dual

Swiss−T0

Eridan

Orion

Merope/J90se

Pascal

fig. 6 – HPC - historique entre 1994 et 2002

GraphesR est aussi capable d’afficher les graphes orientés ou non-orien-tés, en voici un exemple:

require(igraph)adjmat<-matrix(0,5,5)colnames(adjmat)=c("rock", "paper", "scissors","spock", "lizard")rownames(adjmat)=c("rock", "paper", "scissors","spock", "lizard")adjmat[2,1]=adjmat[3,2]=adjmat[4,3]=adjmat[5,4]=adjmat[1,5]=1adjmat[4,1]=adjmat[5,2]=adjmat[1,3]=adjmat[2,4]=adjmat[3,5]=1gs <- graph.adjacency(adjmat)# affichageplot.igraph(gs, layout=layout.circle,vertex.label=c("rock", "paper", "scissors", "spock","lizard"), vertex.size=80, vertex.color=theme4pw[3],edge.color=theme3b[1])

Dans la figure 7, les étiquettes (nœuds du graphe) ont été rempla-cées par les pictogrammes correspondants.

fig. 7 – exemple de graphe orienté

Conclusion

Dans cet article, je vous ai fourni des recettes toutes prêtes pour afficher vos données avec certains types de graphiques. Si R n’est généralement pas facile d’accès, j’espère vous avoir donné un avant-goût qui puisse vous motiver à explorer ce logiciel. La qualité des graphiques générés ainsi que l’uniformité entre les différentes représentations et l’intégration aisée dans tout type de document font de R un allié dans la rédaction de documents techniques ou scientifiques. Lorsqu’on dispose de beaucoup de données à afficher, le fait de pouvoir importer les fichiers bruts et scripter la génération des graphiques donne à R un avantage notable, par exemple, sur les tableurs.

L’affichage des données est un art, qui nécessite comme base de bonnes données à afficher. Du post-processing est parfois néces-saire pour faire un tri dans les données, ainsi qu’un certain savoir-faire pour mettre en évidence la partie des données souhaitée. Aucun programme ne remplace ce savoir-faire, mais peut-être que R vous motiverait à l’acquérir.

Références

[1] flashinformatique.epfl.ch/spip.php ?article2540[2] flashinformatique.epfl.ch/spip.php ?article2315.

Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 / V. Rezzonico

Page 6: Flash informatique 2012 - no 5

6666 flash informatique66 12 JUIN 2012 - N°5flash informatique

Les choix technologiques, les différentes analyses (risques, bud-gets, planning des travaux, etc.) se sont déroulés de janvier à sep-tembre 2011. Ces choix ont été validés par le comité de pilotage du projet: Domaine IT, Vice-Présidence pour la Planification et la Logistique (VPPL), faculté Informatique & Communications (IC), Domaine Immobilier et Infrastuctures (DII). Les travaux de rénova-tion et d’infrastructures ont été supervisés par le DII.Les travaux ont débuté en août 2011 et se terminent (je l’espère , à la date de l’écriture de cet article) tout début mai 2012; le data-center sera alors opérationnel. Nous devrons affiner notre maîtrise de l’infrastructure encore quelques mois pour clore le projet cet été ou cet automne. Ensuite nous serons dans un mode standard d’exploitation de l’infrastructure.

Spécifications

Tiering- redondanceLes infrastructures pour ce datacenter sont de type Tier 2. Cela veut dire que tous les composants de l’infrastructure sont à double, et permettent de faire face à une défaillance d’un composant (sur les chaînes de distribution de courant, d’eau et de ventilation) sans impact sur l’exploitation. Par exemple, l’eau du lac utilisée pour le refroidissement du datacenter est remplacée en cas de panne par l’eau potable. Les transformateurs du bâtiment sont doublés, un seul suffit à assurer la charge totale du datacenter ainsi que celle du bâtiment. Cette redondance permet également des opérations de maintenance sans coupure pour les différents utilisateurs du bâtiment et en particulier pour ceux du datacenter.Apportons un bémol pour le réseau hydraulique physique (les tuyaux): un seul chemin pour l’aller, pas deux (idem pour le retour).

PuissanceLa puissance à disposition pour les serveurs est de 1MW, le refroi-dissement est également prévu pour cette puissance. La puissance est fournie par deux transformateurs de 1600kVA. La puissance secourue (UPS & /ASI &) est de 300kW pour une durée de 20 minutes. Après ces 20 minutes, c’est la panne car il n’y a pas de géné-ratrice prévue dans l’infrastructure ! C’est pourquoi une stratégie d’arrêt des serveurs sera mise en place en fonction du temps restant à disposition sur les batteries. Néanmoins, il est possible de connecter une géné-ratrice portable à l’infrastructure en cas de main-tenance programmée. Des solutions de secours basées sur les techno-logies de flying wheels + génératrice n’ont pu être étudiées pour des raisons de place, de délais et de coûts.

FroidLa particularité de ce datacenter est la technique de refroidissement utilisée. En règle générale, les datacenters utilisent de l’air frais pulsé (utilisation de CRAC &), mais dans notre infrastructure ce n’est pas le cas.

Nous avons la chance de pouvoir utiliser l’eau du lac pour le re-froidissement. Cette eau est récupérée entre 6°C et 8°C par la sta-tion de pompage tout au long de l’année. Nous n’avons donc pas besoin de fabriquer de l’eau froide d’où une économie importante sur les infrastructures et leurs consommations.L’eau du lac est utilisée dans des échangeurs de 35kW montés dans les portes arrière des racks de 52U (240cm de haut). Le flux d’air nécessaire pour le passage de l’air chaud dans l’échangeur est fourni tout simplement par les ventilateurs des serveurs. Cette solution est déjà utilisée au DIT pour le dernier cluster mis en place fin 2011: ARIES (voir fig. 1).Cette solution nous permet d’équiper au fur et à mesure la salle selon les besoins, rack par rack. L’investissement pour le refroidis-sement est donc fractionné a contrario d’une solution avec de l’air pulsé où généralement on équipe l’ensemble de la salle dès le départ. Les coûts liés à l’exploitation et à la maintenance des CRAC sont, dans notre solution, évités.La température de l’air à l’entrée de l’échangeur est d’environ 40°C pour une sortie moyenne de 21°C dans le cas du cluster ARIES.Le réseau hydraulique dans les salles se trouve dans le faux plan-cher, les échangeurs s’y raccordent par des flexibles.

RégulationNous avons mis en place une régulation du débit de l’eau avec des vannes thermostatiques à la sortie de l’échangeur (voir fig. 2). Ces vannes régulent le débit de l’eau en fonction d’une consigne de température donnée sur celles-ci. La température de l’eau en entrée est de 14°C, le ΔT souhaité dans un premier temps est de 6 degrés.Cette régulation permet d’adapter le débit d’eau en fonction de la puissance utilisée dans le rack ainsi que de changer les consignes (eau en sortie plus ou moins chaude) si l’on souhaite une aug-mentation ou une diminution du ΔT. Ce système permet d’optimi-ser la gestion de consommation d’eau.C’est via cette régulation que nous pourrons aussi adapter notre température dans la salle (température de l’air à la sortie des

../.. Suite de la première page

Un nouveau centre de calcul à l’EPFL

fig. 2 – échangeur et vanne de régulationfig. 1 – arrière du cluster ARIES et échangeur

Page 7: Flash informatique 2012 - no 5

7712 JUIN 2012 - N°5

échangeurs). Cette température de consigne (par exemple 21°C) est importante en cas de panne complète du refroidissement: elle conditionne la marge de temps que nous avons avant d’atteindre une température élevée (40°C) dans le datacenter. Pour une tem-pérature de consigne de 21°C nous avons environ trois minutes avant d’atteindre le seuil des 40°C dans la salle ! Bien évidem-ment, il faudra prendre des mesures d’urgence dans ce cas de figure possible, mais très peu probable (arrêt des machines, dans quel ordre, …).

Récupération de l’énergieL’eau réchauffée de six degrés n’est pour l’instant pas valorisée, des projets sont à l’étude pour utiliser ce potentiel énergétique via des PAC (pompe à chaleur) par exemple. La régulation nous permettra de modifier ce ΔT , et nous pourrons fournir aux PAC de l’eau plus chaude entre 20 et 25°C voire plus.

Accès – Sécurité - DétectionLe contrôle d’accès en INJ012 sera géré comme les accès de la salle machine du DIT au MA (même système de contrôle). L’accès en INJ019 sera géré par le système CAMIPRO. Les salles seront équipées d’un système de vidéosurveillance ainsi que d’un sys-tème anti-effraction. Elles sont équipées d’un système de détec-tion feu (plafond) et dans chaque rack il y aura une détection précoce du feu. Des détecteurs sont installés dans le faux plancher pour alerter en cas de fuites d’eau. Il n’y a pas de système d’ex-tinction préventif (gaz inerte, brouillard d’eau, autre). Le risque de feu reste très faible et la mise en place d’un système d’extinction n’a pas été retenue pour le moment.

Métriques – PUEL’ensemble des composants de l’infrastructure (pompes, ventila-tion, électricité, PDU &, UPS, etc.) sera équipé de sondes SNMP (Single Network Management Protocol) pour permettre le suivi de leurs utilisations/statuts. Nous pourrons donc mesurer les modifications d’un ou plusieurs paramètres appliqués à l’infrastructure afin d’affiner le pilotage du datacenter pour de meilleures performances: l’efficience. Bien évidemment nous suivrons le PUE & du datacenter (une des métriques, mais pas la seule), qui une fois à pleine charge devrait être autour de 1,2 voire inférieur (on l’espère) pour l’en-semble des zones. Une première estimation d’un PUE de 1,06 est avancée pour des machines n’utilisant pas le courant secouru ou très peu (par exemple le cluster des PS3). Un PUE de 2 exprime que pour 1W dédié aux serveurs IT il faut 1W pour le fonction-nement de l’infrastructure (froid, ventilation, batteries, lumières, etc.). Dans l’hypothèse d’un PUE de 1,2 il faudra donc prévoir une consommation de 200kW pour notre infrastructure. On voit donc l’intérêt d’avoir cette valeur le plus proche de 1 possible pour des raisons évidentes d’efficacités énergétique et économique. Prenons l’exemple d’une consom-mation électrique annuelle d’un serveur virtuel de 1MW à 30cts du kWh. La facture virtuelle pour cette consommation sera de: 1000x24x365x0.3 = 2.63 MCHF,

montant auquel il faudra ajouter la consommation des infrastruc-tures pour le refroidissement, la ventilation, la lumière… Soit un facteur égal au (PUE-1). Dans notre exemple: 2.63x(1,2-1) = 525 kCHF.Si on diminue le PUE de 0,05, l’économie réalisée serait de 130kCHF. Sur dix ans une économie de 1.3MCHF ! Si on revalorise le ΔT (via des PAC par exemple) alors, les économies s’additionnent et le modèle général devient encore plus équilibré. Sur les anciennes infrastructures de l’EPFL le PUE moyen est sans aucun doute supé-rieur à 1,5 voire plus. La conclusion s’impose d’elle-même.

fig. 3 – les nouveaux échangeurs et les nouvelles pompes

Agencement

Le datacenter INJ est composé de deux salles à l’usage de l’en-semble de l’École (facultés, services centraux). INJ012 (agrégat de INJ011,INJ012 et INJ016) est une zone pour les serveurs de facultés (ZMD1 – Zone Moyenne Densité 1) et les clusters HPC (ZHD – Zone Haute Densité) tandis que INJ019 (ZMD2 – Zone Moyenne Den-sité 2) est une zone dédiée aux facultés (voir fig. 4). La capacité du datacenter en terme de rack sera d’environ 60 racks de 52 RU (Rack Unit), donc un total de 3120 RU: avantage indéniable en terme de densité de RU/m2, on optimise également l’hébergement. Les racks standards actuels offrent entre 40RU et 47RU, soit un gain en terme de place pour les serveurs allant de 10 à 25% ! Cette optimisation a été possible grâce à la hauteur sous plafond (>4m) disponible dans les locaux. Dans la zone ZHD, la puissance par rack devrait dépasser les 20kW alors que pour les zones ZMD1 et ZMD2 on devrait être à 10kW ou moins. Le premier cluster installé en INJ012 sera un cluster de la faculté SB (26RU soit la moitié d’un rack pour 15kW environ), le second sera BELLATRIX (cluster mutua-lisé tout comme ARIES) pour l’automne 2012. On attend également le successeur du projet CADMOS sans doute pour début 2013.

Un nouveau centre de calcul à l’EPFL

Q02 Q04 Q06Q08NET

Q10 Q12 Q16Q14 Q18Q20NET

Q22 Q24

R31 R29 R27R25NET

R23 R21 R17R19 R15

R13

TCO

M32

Q01 Q03 Q05Q07NET

Q09 Q11 Q15Q13 Q17 Q19 Q21 Q23 R05 R03 R01 100

R32 R30 R28R26NET

R24 R22R18NET

R20 R16 R14 R12 R10 R08 R06R04NET

R02 100

R11

TCO

M31

R09

TCO

M22

R07

TCO

M21

S11 S09 S07S05NET

S03 S01

S12 S10 S08S06NET

S04 S02

fig. 4 – agencement du datacenter

Page 8: Flash informatique 2012 - no 5

8888 flash informatique88 12 JUIN 2012 - N°5flash informatique

La nouvelle installation du cluster de PS3 sera installée dans des racks standardisés de 240 cm de haut. Ces racks pourront être réutilisés pour des serveurs 19 pouces standards.

Infrastructures

Circuit hydrauliquePour permettre le refroidissement de 1MW il a fallu enlever les installations existantes et construire un circuit hydraulique per-mettant d’amener jusqu’à 170m3/h d’eau (14°C) dans le data-center. Pour l’instant, le datacenter a un unique réseau d’eau, un deuxième pourra être mis en place si besoin (température sensi-blement différente, 55°C ou 60°C par exemple).

fig. 5 – nouveau réseau hydraulique central technique – © Alain Herzog

Voici quelques étapes du chantier.

ÉlectricitéToute l’infrastructure électrique du bâtiment a été rénovée, les transformateurs du bâtiment ont été changés (2x1600kVA) pour satisfaire les nouveaux besoins.

fig. 6 – livraison d’un tableau général basse tension dans la centrale technique par le saut de loup

La puissance globale pour les salles INJ012 et INJ019 sera de 1MW dont 300kW secourus ce qui nous permettra d’avoir 20 minutes d’autonomie sur batteries en cas de panne générale de courant. Une stratégie d’arrêt des machines sur le courant secouru sera mise en place pour éviter des arrêts brutaux pour les applications sensibles telles que les serveurs de bases de données ou les ser-veurs de fichiers.La puissance non secourue sera principalement utilisée pour les configurations HPC pouvant s’arrêter sur une coupure brutale: en général les nœuds de calcul peuvent être sur le courant non secouru alors que leurs serveurs de fichiers, frontales, switchs sont quant à eux sur le courant secouru.L’ensemble de la distribution électrique dans les salles se fait par le plafond.

VentilationL’air du datacenter est traité spécifiquement. L’humidité est contrôlée (tolérance entre 20% et 80% d’humidité relative, en général 50%), l’air est filtré et le volume de la salle renouvelé trois fois par heure.

DatacenterLe datacenter a été inauguré le 10 mai 2012. Dans chaque rack du datacenter, les serveurs seront attachés à des PDU intelli-gents qui nous permettront de connaître la puissance consommée de chaque machine hébergée.

fig. 7 – travaux dans le datacenter

fig. 8 – datacenter livré ! – © Alain Herzog

La prochaine étape sera de tester et valider tous les scénarios de pannes éventuelles des infrastructures et les actions à prendre dans ces cas de figure. Cela fera l’objet d’un nouvel article en 2013 avec un point également sur le PUE et autres métriques du datacenter !

Un nouveau centre de calcul à l’EPFL

Page 9: Flash informatique 2012 - no 5

9912 JUIN 2012 - N°5

Appels à contributions

Nous disposons d’un datacenter qui se rapproche d’une certaine façon d’un laboratoire. Nous souhaitons l’exploiter de manière optimale. Dans cette optique nous sommes demandeurs de compétences ou expertises pour nous aider à améliorer notre exploitation (outil/expertise CFD & applicable au datacenter par exemple) ! Nous allons également mettre au concours la décoration des racks. Pour l’ensemble du cluster nommé Bellatrix (4 à 6 racks), une Ama-zone pourrait apparaître sur le flanc des racks… Who knows !

Conclusions et remerciements

Avec ce nouveau datacenter, l’EPFL double sa capacité d’héber-gement IT. Cette infrastructure doit être pilotée et optimisée. Nous allons donc essayer d’en tirer le maximum par un résultat d’un coût d’exploitation minimum ! Il reste encore beaucoup de marge de manœuvre pour réaliser des datacenters plus efficaces, je pense notamment à l’arrivée du courant continu directement dans les salles machines. Pour faire court, on simplifie la chaîne de distribution électrique ASI en éliminant des conversions de courant AC->DC et DC->AC comme le montre la figure 9.

ACDCAC

Switching board

UPS IT equip.(Server, etc.)

DCAC CPU

CPUDCAC DC

UPS ICT

ICTHVDC

HVDC PS Rack IT equip.(Server, etc.)

DC340V

AC DC12V

DC12V

ACAlternating current

DCDirect current

AC incoming

AC incoming

UPS system (current)

HVDC

fig. 9 – comparaison distribution AC/DC dans un datacenter (source NTT Data Intellilink Corp.)

Le courant continu est alors amené directement vers les serveurs. L’ensemble des composants d’un serveur fonctionne en courant continu (carte mère, carte d’extension, …) alors pourquoi avoir un transformateur AC/DC sur chaque serveur ? En éliminant ces convertisseurs, on diminue les pertes liées aux conversions multiples, on gagne de la place dans les serveurs, on simplifie l’infrastructure ASI (moins de composants, CAPEX & donc moins de maintenance, OPEX & !). Par contre la gestion du

courant continu en salle semble poser des problèmes de religions (à l’image des guerres de clochers Mac/Windows ou Linux-Pas Linux) jusqu’à présent. Peu d’intégrateurs de serveurs proposent à ce jour des machines DC. Les économies ne sont pas bonnes pour tout le monde … pour les vendeurs de convertisseurs peut-être ?La piste des datacenters LEGO sous forme de containers est également à retenir. Droit au but: on configure le contenu de la boite avec R racks, avec S serveurs, la définition du type de refroi-dissement (air/eau), le type de redondance, la couleur… Ensuite il suffit de fournir la surface et les infrastructures nécessaires: la prise de courant et éventuellement les raccords pour l’eau lorsque le container est livré et prêt à l’emploi. Le datacenter se construit et évolue selon la demande sur la base de containers plus ou moins grands. Avant de passer aux remerciements, je vous mets en garde sur le respect des plannings dans le domaine du bâtiment: des pro-messes, toujours des promesses, et toujours du retard ! Une pensée ironique et amicale pour mes collègues du DII ! J’ai déjà eu leurs réponses: les spécifications IT changent/évoluent trop vite ! Les univers de l’informatique et de la rénovation d’un bâtiment sont antinomiques: poussières et étincelles de meule ne vont pas de pair avec des équipements informatiques habitués aux salles presque blanches, les fibres optiques ne supportent que très mal le passage d’un transpalette… Néanmoins et pour l’objectivité de mes propos, le datacenter est livré avec peu de retard sur le planning prévu (la date initialement prévue était le 1er avril, évidemment c’était un poisson…) sans aucune pertur-bation non planifiée (sauf pour la poussière !) sur l’IT pendant les travaux: bravo !Je tiens à remercier la VPPL pour nous avoir soutenu et fait confiance, le comité de pilotage SI, le comité de pilotage et le groupe de travail du projet INJ-1MW ainsi que mes collègues du DIT et du DII qui m’ont épaulé et supporté pendant ces 18 mois.Un grand merci également aux utilisateurs des salles INJ011(DIT), INJ016(IC) et INJ019 (équipe du Professeur Lenstra pour le cluster des PS3) qui ont dû s’adapter aux travaux et à leurs impacts pen-dant 8 mois. Des remerciements pour les indigènes du bâtiment INJ qui ont été directement impactés par les travaux et leurs nui-sances associées. Sans oublier l’ensemble des entreprises, des bu-reaux et des fournisseurs qui ont pris part à la rénovation du bâti-ment et à la conception du datacenter en INJ. Et pour reprendre les propos de mon collègue Alain Dufour: «Nous sommes prêts pour la prochaine étape: un datacenter de 10MW voire plus ! »; avec une bonne récupération énergétique, on pourrait réchauffer beaucoup d’eau … assez d’énergie pour tout un campus ? n

Un nouveau centre de calcul à l’EPFL

GLOSSAIRE &ASI: alimentation sans interruption – dis-

positif de l'électronique de puissance qui permet de fournir à un système électrique ou électronique une alimen-tation électrique stable et dépourvue de coupure ou de micro-coupure, quoi qu'il se produise sur le réseau électrique. W

CAPEX: dépenses d'investissement de capital quant aux coûts de développe-ment ou de fourniture des pièces non-consommables pour un produit. W

CFD (Computational Fluid Dynamics): étude de la dynamique des fluides par la résolution numérique des équations la régissant. W

CRAC (Computer Room Air Conditioning): climatisation de salle machine

HPC (High Performance Computing) calcul à haute performance

HVDC (High Voltage Direct Current): le courant continu haute tension est une technologie d'électronique de puissance utilisée pour le transport de l'électricité en courant continu haute tension. W

OPEX: dépenses d'exploitation, soit les coûts courants pour exploiter un produit, des entreprises, ou un système. W

PDU (Power Distribution Unit): barre de distribution du courant dans les racks.

PUE (Power Usage Effectiveness) : indica-teur d'efficience énergétique utilisé pour qualifier l'efficacité énergétique d'un centre d'exploitation informatique. W

UPS (Uninterruptible Power Supply): ali-mentation sans interruption - voir ASI.

W = tiré de Wikipédia

Page 10: Flash informatique 2012 - no 5

flash informatique101010 12 JUIN 2012 - N°5

In the last two years, several EDM (Electronic Docu-ment Management) projects using Alfresco have been completed in our school. In this paper we pre-sent three EDM implementations, and we outline their common points as well as specific features.

Nous parlerons dans cet article de différents projets de GED (Gestion électronique de documents) réalisés à l’EPFL avec le logiciel Alfresco, pour la gestion de documents administratifs. Il s’agit ici de présenter les systèmes installés dans trois secrétariats, leurs points communs et leurs spécificités.

Nous avons déjà abordé, dans plusieurs articles précédents, ce qu’est un système de Gestion Électronique de Documents (GED) et traité des aspects métier liés à la gestion des documents et aux processus de travail. Pour rappel, une GED est un ensemble d’outils permettant de dématérialiser, capturer, classer, gérer, partager, éditer, stocker, rechercher, etc. des documents électro-niques et les informations les concernant. Il est à distinguer d’un système de stockage et de partage de documents en ligne (tel que my.epfl), d’un CMS (comme Jahia) ou d’un système d’archi-vage électronique. Nous aborderons plus concrètement dans cet article, les GED mises en place dans l’Ecole par le DIT avec le logi-ciel Alfresco.L’étude des besoins de différents services intéressés par un tel sys-tème a permis de définir un modèle de GED de base, remplissant les cas d’utilisation communs à tous ces services. La réalisation de ce modèle de base a ensuite servi à intégrer Alfresco à l’in-frastructure technique de l’EPFL (synchronisation avec l’annuaire LDAP de l’Ecole pour les personnes et les groupes, mise en place de l’environnement de haute disponibilité, etc.). Les différentes GED installées par la suite se sont appuyées sur ce modèle de base, qui a été complété par les fonctionnalités spécifiques dont chaque service avait besoin.

Les fonctionnalités faisant partie du modèle de GED de base sont:z organisation hiérarchique de dossiers en plan de classement.

Ce plan de classement est défini pour chaque service;z création, suppression, déplacement des dossiers dans le plan

de classement;z importation, suppression, déplacement de documents;z accès à la GED via l’interface Web d’Alfresco et/ou via CIFS en

se connectant directement au serveur de la GED;z indexation des documents, c’est-à-dire description des docu-

ments selon des critères prédéfinis (métadonnées). Ces méta-données sont définies pour chaque service;

Réalisations de GED à l’[email protected], EPFL - Domaine IT - KIS, responsable du projet GED

z héritage des métadonnées (du dossier père au dossier fils, du dossier au document), afin de faciliter l’indexation des docu-ments;

z capture des e-mails se trouvant sur une boîte e-mail;z gestion de la confidentialité. Par défaut, tous les documents

dans la GED sont confidentiels, c’est-à-dire que seuls les col-laborateurs du service y ont accès. Il est toutefois possible de gérer cette confidentialité en l’adaptant aux besoins de chaque secrétariat;

z possibilité de lier les documents entre eux, afin de garder la relation d’un courrier papier et son annexe;

z recherches simples et avancées. Le masque de recherche avancée est défini pour chaque secrétariat en fonction de ses besoin;

z check in / check out des documents pour modification. Lorsqu’un collaborateur modifie un document, celui-ci appa-raît comme verrouillé pour les autres utilisateurs.

z archivage des dossiers/documents. Il ne s’agit pas d’une fonc-tion d’archivage à proprement parler. Cette fonctionnalité permet d’occulter les dossiers et documents qui ne sont plus d’actualité afin qu’ils n’apparaissent pas lors de recherches.

Le périmètre de la GED, tel qu’il a été défini au début du projet, ne prévoyait pas de traiter les aspects d’archivage pérenne des docu-ments électroniques. De fait, les GED et les SAE (Système d’Archi-vage Électronique) ne couvrent pas les mêmes besoins et ne se situent pas au même moment du cycle de vie des documents. Néanmoins, nous avons recommandé certains formats de fichiers plutôt que d’autres, lorsque l’utilisation faite des documents de la GED le permettait.

Les différentes réalisations de GED menées dans ce projet se répartissent en deux groupes. Le premier est constitué exclusi-vement par la GED dédiée à la gestion des dossiers d’étudiants. Projet beaucoup plus complexe, Alfresco s’interface, dans ce cas, avec l’application métier IS-Academia et le logiciel de numérisa-tion Kofax. Cette réalisation fera l’objet d’un article ultérieure-ment. Le second groupe de GED, est constitué par ce que nous avons appelé les GED de secrétariats, pour lesquelles Alfresco a été installé et paramétré tout seul. Il s’agit de:z la GED du service des Affaires Professorales (APR);z la GED du Système de Contrôle Interne (SCI);z la GED du Service de Santé et Sécurité au Travail de la Faculté

des Sciences de Base (SB-SST), encore dans sa phase de pré-production.

Chacune de ces GED est un exemple de réalisation du modèle de base, avec ou sans développements spécifiques et avec un accom-pagnement plus ou moins fort dans les aspects métiers de la ges-tion de documents.

À votre service

Page 11: Flash informatique 2012 - no 5

111112 JUIN 2012 - N°5

GED des Affaires Professorales (APR)

Le service des APR est composé de trois personnes et s’occupe de la mise au concours des postes de professeurs (tout type de professeur), du processus d’engagement et d’évaluation de ces derniers, ainsi que de toutes les questions touchant leur nomi-nation, leur arrivée dans la région et sur le campus. Le service des APR fait partie des initiateurs du projet de Gestion électronique de documents dans l’École: il a participé à l’appel d’offres public et à la sélection du logiciel Alfresco.Les besoins des collaborateurs de ce service étaient très clairs dès le début du projet: il s’agissait pour eux de disposer de versions électroniques des dossiers de professeurs, afin d’en assurer la sé-curité au moyen de sauvegardes. Ces documents n’existant prin-cipalement que sous format papier, le projet devait comporter un volet de numérisation pour les documents existants et à venir. La possibilité de rechercher les documents en fonction de leur type (contrat, décision, congé de recherche, etc.), du nom du profes-seur, de son prénom ou de son numéro Sciper avait été demandée ainsi qu’un processus d’indexation simplifié.Le besoin premier de sauvegarde nous a conduit à définir ce sys-tème de GED comme un référentiel de documents ou coffre-fort, chargé de stocker les documents vitaux des dossiers de profes-seurs engagés (et qui seront engagés) à l’EPFL.Nous avons travaillé, dans un premier temps, à la définition de ces documents vitaux, en nous posant la question suivante: quels sont les documents essentiels à la constitution et au suivi d’un dossier de professeur ? Le plan de classement s’est ensuite tout naturellement imposé, comme reflet de ce corpus de documents. Le jeu de métadonnées a, quant à lui, été défini en fonction des clés de recherche.Afin de faciliter le travail des collaborateurs des APR, le processus de création de dossiers de professeur a été automatisé (dévelop-pement spécifique). La structure du plan de classement reposant sur une hiérarchie de dossiers stricte et le jeu de métadonnées uniforme ont facilité cette automatisation. Lors de la création d’un nouveau dossier de professeur, les collaborateurs des APR saisissent les nom et prénom du professeur, ainsi que son numéro Sciper et l’arborescence de dossiers est créée automatiquement. Les dossiers héritent ensuite des métadonnées du dossier parent et les documents de celles du dossier dans lequel ils sont classés.Avant la mise en production de la GED, un travail de reprise des dossiers existants a été entrepris. Seuls les dossiers des professeurs encore en exercice ont été intégrés dans la GED. Cela a nécessité l’identification et la mise en évidence des documents vitaux dans chaque dossier de professeur, leur préparation pour la numérisa-tion (enlever les agrafes, trombones, post-it, etc.) et leur numéri-sation. Le système de gestion électronique de documents des APR est en production depuis le début de l’année 2010 et contient un peu plus de 500 dossiers de professeurs.

GED du Système de Contrôle Interne (SCI)

Le SCI encadre les risques sur les processus de gestion ayant une incidence sur les états financiers et assure la mise en place de contrôles de conduite. Il garantit un déroulement conforme des opérations financières à l’EPFL.

Une vingtaine de personnes sont impliquées dans la définition de ces processus de gestion, dont la coordination est assurée par une seule. Des auditeurs externes à l’EPFL doivent également avoir accès à la documentation élaborée par le SCI.Avant l’installation d’Alfresco, le SCI disposait déjà d’un outil pour gérer cette documentation, mais celui-ci ne répondait plus tota-lement aux besoins, notamment sous l’aspect de la maintenance.

Durant la période de constitution de la documentation relative au système de contrôle interne, nous nous sommes appuyés sur un logiciel de gestion documentaire facilitant le suivi en phase de projet. Arrivé en mode opérationnel, il nous est tou-tefois apparu que nous devions pouvoir disposer d’un système de GED robuste avec support assuré par les services de l’EPFL. Dès lors le logiciel Alfresco s’est avéré être l’outil qui nous per-mettait de gérer la base documentaire du SCI de l’EPFL sur le long terme et, chose importante, avec une gestion aisée des accès, tant pour des personnes internes, qu’externes à l’EPFL.

Philippe Staub pour le SCI.

Le système de GED mis en service au SCI est un exemple de dé-ploiement du modèle de base. L’organisation des documents dans un plan de classement existait déjà dans l’ancien système utilisé par le SCI et donnait pleinement satisfaction, la description des documents était également déjà connue ainsi que les différents collaborateurs devant accéder aux documents et avec quels droits. La valeur ajoutée de cette GED a consisté en son installation sur une infrastructure qui garantisse, au niveau du DIT, les aspects de support, de maintenance et de haute disponibilité.Le système de gestion électronique du SCI est en production de-puis le mois de décembre 2011.

La GED SB-SST

Rattaché à la Faculté des Sciences de Base, le Service de la Sécu-rité et Santé au Travail a pour mission d’implémenter la gestion en matière de sécurité et santé au travail décidée par la Direction de la Faculté. Ce service emploie neuf personnes.Comme pour le SCI, le système de GED installé pour le service SB-SST reprend le modèle de base, sans développements annexes. L’accent dans ce projet a été mis sur l’accompagnement métier autour de la gestion des documents.À partir des documents partagés par les collaborateurs et stockés sur un serveur, nous avons travaillé, en collaboration avec le secré-tariat, à l’élaboration d’un plan de classement, à la création d’un jeu de métadonnées pour les dossiers du plan de classement et les documents ainsi qu’à la définition d’un masque de recherches avancées. Nous avons également défini des groupes d’utilisateurs et leurs droits d’accès aux différents dossiers de la GED.Encore dans sa phase de pré-production, cette GED devrait être en production avant la fin de l’année académique. n

Réalisations de GED à l’EPFL

Page 12: Flash informatique 2012 - no 5

flash informatique121212 12 JUIN 2012 - N°5

Kickstart pour [email protected], EPFL - Domaine IT - responsable de la plate-forme Unix à l’EPFL

The aim of this paper is to present kickstart for Ubuntu using the same syntax as the RedHat kick-start, but not the same installer.

Le but de cet article est de présenter kickstart pour Ubuntu utilisant la même syntaxe que le kickstart de RedHat, mais pas le même installeur.

Fiche descriptive

Ubiquity

Domaine✦ Installation de systèmes d’exploitation

Licence✦ GPLv2

langue✦ anglais

version✦ 2.10.16

Autres alternatives libres✦ boot.fedoraproject.org (BFO) ✦ Anaconda (Fedora & RedHat) ✦ AutoYaST (OpenSUSE) ✦ AI (OpenSolaris) ✦ FAI (fai-project.org)

Alternatives non libres✦ Unattended Windows ✦ Jumpstart (Solaris)

Sites Web✦ Projet et téléchargement: https://launchpad.net/ubiquity

Plates-formes supportées

Introduction

Le présent article est rédigé dans le style démarrage rapide. Mais si vous souhaitez avoir un un éclairage supplémentaire sur le sujet, il peut être utile, mais pas obligatoire, de lire l’article Automatiser votre installation Linux avec Kickstart [1] du précédent Flash informatique, qui est bien plus complet. Le but ici n’est pas de redire ce qui a déjà été écrit, mais bien de guider le lecteur qui souhaite utiliser Kickstart pour installer Ubuntu.L’installeur d’Ubuntu s’appelle Ubiquity qui s’appuie lui-même sur le debian-installer (d-i). Ce dernier utilise des commandes connues sous le nom de preseed, et qui permettent de faire une installation automatisée à l’aide d’un fichier texte, méthode appelée preseeding method. Canonical a intégré un interpré-teur Kickstart dans Ubiquity, afin de faire le lien avec la syntaxe

Logiciel libre

Kickstart et les commandes preseed, ce qui peut poser quelques problèmes de compatibilité entre ces deux différentes méthodes.

Comme les liens hypertextes dans la suite du texte sont péris-sables, vous trouverez les mots-clés comme nom de lien qui vous permettront de retrouver facilement les documents cités.

Règles

Le fichier Kickstart est un simple fichier texte, composé de sec-tions, qui doivent être écrites dans l’ordre, soit:1 La section des commandes qui va vous permettre de définir

les paramètres de base de votre système et contient une liste d’éléments identifiés par un mot-clé suivi de ses paramètres. On utilisera l’outil graphique system-config-kickstart qui nous facilitera le travail, il se chargera de nous mettre les bons mots-clés et les paramètres associés.

2 La section %packages qui est la plus difficile, car pas docu-mentée. Ici seul l’outil graphique va nous aider à démarrer rapidement.

3 Les sections %pre et %post qui permettent d’écrire un script de pré-installation ou de post-installation. C’est la seule ma-nière de configurer notre système correctement.

Remarquesw Des commentaires peuvent être ajoutés à l’aide du sym-

bole # au début d’une ligne.w Chaque mot-clé ainsi que ses paramètres associés doivent

être écrits sur une seule ligne.

La bonne nouvelle est qu’Ubiquity permet d’ajouter des com-mandes preseed aux mots-clés Kickstart dans le même fichier. Une documentation complète de ces commandes se trouve ici: Automating the installation using preseeding [2].Mais le plus simple est de lire directement l’exemple complet example-preseed.txt [3] dont la documentation ci-dessus s’est fortement inspirée. Il suffit de remplacer le mot-clé d-i du fichier précédent par le mot-clé preseed dans le fichier Kickstart. Il y a quelques commandes preseed dans l’exemple de fichier Kickstart ci-contre.

Compatibilité

Toutes les fonctionnalités de Kickstart ne sont pas forcément implémentées, et peuvent même être incompatibles avec le de-bian-installer. Il est important de lire la liste des compatibilités concernant Kickstart pour Ubuntu qui se trouvent ici: Kickstart Compatibility [4] et Automatic Installation Ubuntu [5]. De plus, il est conseillé de bien faire des tests avant de se lancer dans une installation automatique.

Page 13: Flash informatique 2012 - no 5

131312 JUIN 2012 - N°5

### Generated by Kickstart Configurator###### Filename: ks.cfg###### System languagelang en_US### Language modules to installlangsupport fr_CH --default=en_US### System keyboardkeyboard ch_fr### System mousemouse### System timezonetimezone Europe/Zurich### Root passwordrootpw --disabled### Initial user### Tous les paramètres doivent être sur une ligneuser barras --fullname "Admin User" --iscrypted --password $6$.WwbX…too long…e5LdwY1### Network### Tous les paramètres doivent être sur une lignenetwork --bootproto=static --device=eth0 --ip=128.178.1.55 --netmask=255.255.255.0 --gateway=128.178.1.1 --nameserver=128.178.15.8 ### Si on utilise dhcp, mettre cette ligne et ### retirer l'autre ci-dessus### network --bootproto=dhcp --device=eth0###### Exemple de commandes preseed### Rechercher ces deux commandes dans le fichier: ### example-preseed.txtpreseed netcfg/get_hostname string ditsbpc13preseed netcfg/get_domain string epfl.ch###### Reboot after installationreboot### Si vous souhaitez voir une installation Ubuntu ### non graphique (rarissime)### Use text mode installtext### Install OS instead of upgradeinstall### Use Web installationurl --url http://mirror.switch.ch/ftp/ubuntu### System bootloader configurationbootloader --location=mbr### Clear the Master Boot Recordzerombr yes### Partition clearing informationclearpart --all### Disk partitioning informationpart / --fstype=ext4 --size=120000part swap --size=8000### System authorization infomationauth --useshadow --enablemd5### Firewall configurationfirewall --disabled

### Package install information%packages@ubuntu-desktopsshautofsntp

### Post installation%post### Modify rc.localmv /etc/rc.local /etc/rc.local.origcat > /etc/rc.local <<EOT#!/bin/sh## Script post installationif [ ! -e /root/postInstall.1 ]; then /root/postInstall.sh && touch /root/postInstall.1fiexit 0EOT

chmod a+x /etc/rc.local###### postinstall.shcat > /root/postInstall.sh <<EOFPOST###### Logecho `date` > /root/post-install.logecho 'Begin log' >> /root/post-install.log###### Pakages installation (example)### apt-get install ntp### apt-get install gufw### tasksel install edubuntu-desktop/server###### Profile/bin/cp /etc./profile /etc/profile.origcat <<EOF>> /etc/profile## B.Barrasexport HISTTIMEFORMAT=" %d.%m.%Y-%T "export HISTFILESIZE=5000EOF###### SSHcd /rootmkdir .sshchmod 755 .sshcat <<EOF>> .ssh/authorized_keysssh-dss AAA…too long…eKZ8n [email protected] 644 .ssh/authorized_keyscd /###### Restriction SSHcat <<EOF>> /etc/ssh/sshd_config## B.BarrasAllowUsers barrasEOF/etc/init.d/ssh restart###### NTPcd /etccp ntp.conf ntp.cpysed 's/^server/#server/' < ntp.cpy > ntp.confcat <<EOF>> /etc/ntp.conf## EPFLserver 128.178.1.1EOFservice ntp restart###### Autofsecho '/net -hosts' >> /etc/auto.masterservice autofs restartln -s ../init.d/autofs /etc/rc2.d/S99autofs###### Restore rc.localmv -f /etc/rc.local.orig /etc/rc.localrm -f /root/postInstall.sh###### Logecho `date` >> /root/post-install.logecho 'End log' >> /root/post-install.log###### Endexit 0EOFPOSTchmod a+x /root/postInstall.sh%end

Kickstart pour Ubuntu

exemple de fichier Kickstart

Page 14: Flash informatique 2012 - no 5

14141414 flash informatique1414 12 JUIN 2012 - N°5flash informatique

Kickstart pour Ubuntu

LimitationsLe point le plus important, à mes yeux, qui va limiter votre instal-lation automatique est celui-ci:

Although most questions used by debian-installer can be preseeded using this method, there are some notable excep-tions.You must (re)partition an entire disk or use available free space on a disk; it is not possible to use existing partitions.

Ce qui veut dire que vous ne POUVEZ PAS INSTALLER Ubuntu, de manière automatique (Kickstart ou debian-installer), si vous n’avez pas une partition LIBRE sur votre disque cible.

SensibilitéKickstart pour Ubuntu est très peu sensible aux changements de version du système d’exploitation, contrairement à RedHat ou Fedora. Cela est dû à la grande stabilité, dans le temps, du debian-installer. Ce qui signifie que votre fichier Kickstart fonctionnera tel quel au gré des versions d’Ubuntu. Cerise sur le gâteau, l’url qui pointe sur votre distribution Ubuntu dans le fichier Kickstart est toujours la même, la différence entre versions ne se fait qu’avec l’amorce que vous utilisez pour démarrer votre installation.

Premiers pas

Il faut utiliser le system-config-kickstart pour générer son pre-mier fichier Kickstart. Il vous permettra d’avoir la liste des pa-quetages à installer, ainsi que tous les mots-clés, d’une manière simple et efficace.

Kickstart pour Ubuntu est très peu sensible aux changements de version du système d’exploitation, contrairement à RedHat ou Fedora. Cela est dû à la grande stabilité, dans le temps, du debian-installer. Ce qui signifie que votre fichier Kickstart fonctionnera tel quel au gré des versions d’Ubuntu. Cerise sur le gâteau, l’url qui pointe sur votre distribution Ubuntu dans le fichier Kickstart est toujours la même, la différence entre versions ne se fait qu’avec l’amorce que vous utilisez pour démarrer votre installation.

Premiers pas

Il faut utiliser le "system-config-kickstart" pour générer son pre-mier fichier Kickstart. Il vous permettra d’avoir la liste des pa-quetages à installer, ainsi que tous les mots-clés, d’une manière simple et efficace.

Sur la page précédente, vous avez un exemple de fichier Kickstart, fonctionnant très bien, qui pourra vous servir par la suite.Dans cet exemple, la post-installation est volontairement longue, mais pas obligatoire, afin de bien montrer tout ce que l’on peut faire avant de mettre en route notre système.

Packages

Dans la section %packages, une entrée par ligne, on spécifie soit un groupe (@) de paquetage ou juste un nom de paquetage. Vous pouvez voir la liste des groupes possibles, à l’aide de la commande suivante:

tasksel --list-tasks

et la liste complète des paquetages se trouve ici: Ubuntu Pac-kages [6].

Post-installation

Ici aussi voir [1], la post-installation se fera non pas à l’instal-lation du système, mais au premier démarrage du système. On utilise le service rc.local qui va exécuter notre script postIns-tall.sh qu’on a pris soin de mettre en place dans la partie %post de notre fichier Kickstart.

Installation

Quelle que soit la méthode d’amorçage choisie, vous devez pas-ser le paramètre ks=… comme paramètre de boot, voir [1]. Par exemple à l’invite de démarrage (boot prompt):

linux ks=cdrom:/ks.cfgoulinux ks=http://http_server.epfl.ch/ks_dir/ks.cfg

Pour plus de détails concernant le passage de paramètres au dé-marrage, voir l’article Personnaliser vos images ISO Linux [7].

Conclusion

Vous pouvez voir la liste complète des questions/réponses (format preseed) avec lesquelles votre système a été installé, en utilisant les commandes suivantes:

sudo debconf-get-selections --installer > \ presseed.txtsudo debconf-get-selections >> presseed.txt

mais cela reste assez indigeste, raison pour laquelle je vous conseille d’utiliser Kickstart.

Références

[1] flashinformatique.epfl.ch/spip.php ?article2539[2] https://help.ubuntu.com/12.04/installation-guide/i386/appen-

dix-preseed.html[3] https://help.ubuntu.com/12.04/installation-guide/example-

preseed.txt[4] https://help.ubuntu.com/community/KickstartCompatibility[5] https://help.ubuntu.com/12.04/installation-guide/i386/auto-

matic-install.html[6] packages.ubuntu.com[7] flashinformatique.epfl.ch/spip.php ?article2203.

Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 / B. Barras

Page 15: Flash informatique 2012 - no 5

1512 JUIN 2012 - N°5

The Libre Software Meeting 1 (LMS) is a great op-portunity for the numerous actors of Free Software to meet and discuss for several days and share some fun, meet new people for the first time after a long time remote collaboration, create new projects. It is a place where creativity can be free in a casual and festive environment.

Cette année les Rencontres Mondiales du Logiciel Libre 1 (RMLL) auront lieu à Genève, après Stras-bourg en 2011, Bordeaux en 2010, Nantes en 2009, etc. 2 Une multitude d'activités autour du libre (conférences, festival, table rondes,...) émaillent ces six journées ouvertes à toutes et à tous, du grand public à l'expert.

Genève du 7 au 12 juillet 2012 Web: 2012.rmll.info

Les Rencontres Mondiales du Logiciel Libre (RMLL) sont l’occa-sion pour de nombreux acteurs du libre de se rencontrer dans un même espace pendant quelques jours. Partager des moments ensemble, faire de nouvelles connaissances, voir pour la première fois d’autres personnes avec qui l’on est en relation électronique depuis longtemps, élaborer de nouveaux projets… un lieu de res-sourcement et de créativité, dans une ambiance décontractée et festive.Ouvertes gratuitement au public, les RMLL sont aussi un vaste programme de conférences, tables rondes et ateliers pratiques autour du Logiciel Libre et de ses usages. Selon les années et les lieux de ces rencontres, les thèmes abordés varient.Les RMLL 2012 ayant lieu cette année à Genève, un thème Mé-dias, radio, télévision et graphisme professionnel a vu le jour, profitant de la présence locale de l’EBU (European Broadcasting Union 3), association de diffuseurs nationaux de radio et télévi-sion, qui vise à la coopération et l’échange de contenu. Pendant deux jours, l’EBU fera ses conférences au sein des RMLL en syner-gie avec le graphisme professionnel.

Rencontres Mondiales du Logiciel Libre [email protected], EPFL - Domaine IT, responsable des lightning talks, [email protected], EPFL - Domaine IT, responsable du programme & [email protected], EPFL - CSE, responsable du thème Recherche et Université

Le programme

Week-end grand publicLes rencontres commencent par un week-end grand public qui aura lieu à la Maison communale de Plainpalais. À l’heure où nous écrivons ces lignes, le programme est encore en chantier mais devrait être une belle occasion pour tout un chacun de découvrir des outils libres, de demander de l’aide les concernant ou encore d’apprendre à participer à des projets libres. Des associations se-ront présentes, des ateliers organisés, des films projetés. Les jeunes ne seront pas oubliés.

La semaine de rencontre, ouverte au publicAu cœur des 4 jours qui suivent, du 9 au 12 juillet, l’UNI-Mail sera le théâtre de conférences, d’ateliers et de tables rondes, en plus du boulevard du Libre, et hébergera diverses assemblées, toujours autour du Libre. Tout au long de l’évènement, le soir, aura lieu le Festival des Arts Numériques Libres.

Les conférences, ateliers et tables rondesPlus de 200 conférences sont organisées en parallèle. Les thèmes abordés sont repris dans le programme de cette année 4. Le fran-çais et l’anglais sont les deux langues des conférences.

Lightning talksPour la première fois lors des RMLL, nous avons prévu chaque jour une session de 10 lightning talks. Il s’agit de présenter en 5 mi-nutes (et pas une plus…), un sujet ayant un rapport direct ou indi-rect avec le logiciel libre. Ce peut être un projet, une entreprise, un programme, du matériel, une technique, une idée ou toute autre chose que seul l’esprit humain est capable d’imaginer et qui en fait l’honneur… Le but est de donner la parole aux personnes qui ont quelque chose à présenter et à partager, mais qui ne sou-haitent pas en faire une conférence ou pensent que le sujet ne s’y prête pas. Les pré-inscriptions se feront depuis le site des RMLL.

Help pointQue ce soit pour installer ou utiliser des logiciels libres, pour ap-prendre à compléter des données dans OpenStreetMap ou dans Wikipédia, pour avoir un conseil sur le choix d’un logiciel, il sera possible de s’adresser à des libristes disponibles pour répondre à ces demandes.

Logiciel libre

1 2012.rmll.info2 un historique de toutes les RMLL est préservé 2012.rmll.info/a-propos-des-rmll/historique3 www.ebu.ch/en/about/index.php4 2012.rmll.info/programme

Page 16: Flash informatique 2012 - no 5

ISSN 1420-7192

Festival des Arts Numériques LibresPas de RMLL sans ses nocturnes, moment de détente festif, ouvert tant aux participants qu’à la population locale. Si le programme n’est pas encore en place, on sait déjà qu’il sera fait de concerts, spectacles, projection de films et autres performances artistiques, toujours dans la philosophie du Libre. Sans oublier les geeks qui, dans cette ambiance, continueront à coder…

Boulevard du libreEspace d’échange et de partage, le boulevard du libre est une occasion rare de rencontrer un grand nombre de communautés actives autour du libre. De nombreux stands présentent leurs di-verses activités. Laissez-vous surprendre par la diversité des projets collaboratifs, dans un nombre étonnant de domaines différents.

Repas du libreL’avant dernier soir est toujours dédié au traditionnel repas du libre, occasion de découvrir la cuisine locale et de penser déjà aux prochaines RMLL.

Organisation

L’organisation de ces RMLL est faite à cent pour cent par des bénévoles. À l’aide de wiki, mailing-listes, chat, site Web, les responsables des divers aspects construisent le programme. Les conférences sont sélectionnées suite à un appel à conférence. Des logements peu chers sont mis à disposition; cette année ce sera la caserne des Vernets; en plus de cela, un système de logement chez l’habitant a été mis en place 5. Les seuls frais pris en charge sont les frais de transport des conférenciers qui en font la demande.

Informations

Pour plus d’informations, vous pouvez visiter le site Web rmll.info, et, lors de la manifestation, vous pourrez vous synchroniser sur la radio-tv RMLL 6 qui sera opérationnelle dès le début des festivités.

Article du FI-EPFL 2012 sous licence CC BY-SA 3.0 /

B.Barras, A. Possoz & V. Rezzonico

Rencontres Mondiales du Logiciel Libre 2012

FI spécial été 2012Le document et les données

Appel aux articles – délai rédaction: 02.07.12

Le FI spécial été est l'occasion de rassembler autour d’un thème des articles en provenance de lieux et de spécialisations différentes.En 2012: les réflexions porteront sur le document et les don-nées. Nous sommes, en effet, à l'époque charnière du presque tout numérique, où le document et les données, qui sont le cœur souvent méconnu de nos systèmes d’information, sont en pleine évolution. Quelques pistes sous forme d'interrogations:z Avec le stockage sur les nuages, nul ne sait plus où se trouvent

physiquement ses données: d’où les interrogations sur leur pérennité, sur les droits d’accès (public, privé, limité), sur la pertinence d'en crypter certaines ?

z À qui appartiennent les documents ? les DRM sont-ils légi-times, qu’est devenue la notion de copyright ?

z Le dispositif de lecture (tablette, liseuse, smartphone …) modi-fie-t-il notre perception du document, et également sa pro-duction ?

z Accès aux données: beaucoup d’initiatives militent pour un accès ouvert et gratuit à des données d’intérêt public (Open data, Web des données) ou scientifiques (Open Access), quels en sont les enjeux ?

z Qui dit document ou données, dit format, éternel sujet de réflexion: quel est le format le plus pérenne, le plus ouvert, le plus adapté ? Comment structurer les données afin qu’elles soient réutilisables ?

z Que deviennent les bibliothèques, elles qui ont toujours été des lieux de transmission de savoir ?

z Nous laissons derrière nous des documents-traces de nos vies, comment et pourquoi se protéger ?

Si ce vaste sujet vous inspire, n'hésitez pas à me [email protected], Domaine IT

DIT-infoNouveau technicien au DIT-SUP

Nous avons le plaisir de compter parmi nous de-puis le 1er avril 2012, comme nouveau technicien dans le groupe de support des services centraux du DIT-SUP, Ludovic Houmard.Ludovic a fait un CFC de médiamaticien et une maturité professionnelle. Il a travaillé au niveau de la gestion du parc IT du groupe Elsa-Mifroma, comme stagiaire chez Philip Mor-ris et comme stagiaire dans notre groupe il y a quelques années. Il est revenu avec de très bonnes connaissances techniques du support aux utilisateurs et de nos procédures et clients. En plus du support aux utilisateurs, Ludovic viendra renforcer le support au niveau des serveurs et des desktops virtuels qui était assuré jusqu’à présent par Olivier Michaud et moi-même.Nous lui souhaitons la bienvenue parmi nous.

[email protected], Domaine IT

Actualités

5 2012.rmll.info/participer/hebergez-un-geek6 2012.rmll.info/radio-tv-rmll