Linformatique au CERN Du papier au web......du web à la Grille François BRIARD IT-AIS-HR...

Preview:

Citation preview

L’informatiqueau CERN

”Du papier au web......du web à la Grille”

François BRIARDIT-AIS-HR

Présentation du lundi 23 août 2004CERN, Genève

1. L’informatique au CERN:6 catégories

2. Informatique administrative:du papier au web…

3. Défis informatiques du LHC:…du web à la Grille

Plan de la présentation

Département IT1. Environnement informatique général2. Services d’informatique administrative3. Informatique pour la physique et l’ingénierie4. Consolidation, coordination et standardisation5. Applications de physique6. Conception et opération des accélérateurs

L’informatique au CERN:en 6 catégories

1. L’informatique au CERN:6 catégories

2. Informatique administrative:du papier au web…

3. Défis informatiques du LHC:…du web à la Grille

Plan de la présentation

Services d’Informatique Administrativeles domaines couverts

1. Couvrir tous les domaines d’applicationspar une offre logicielle cohérente

2. Couvrir tout le cycle de vie desapplications informatiques

- Analyse- Conception- Tests- Support- Maintenance

Services d’Informatique Administrativenotre mission

“Du papier au web”

Services d’Informatique Administrativele public concerné

- Tout individu au CERN- Secrétariats de Département et d’expérience- Services administratifs (HR, FI, SG…)- Autres services du CERN (IT, SC…)- Management- Instituts extérieurs- Compagnies extérieures- Autorités (Etats Membres, CH, FR)

Plus de 12’000utilisateurs AIS

Matériel: homogène

- 1 seul SGBD: Oracle- 1 seule plateforme: Sun- 1 seul système d’exploitation: Solaris (Unix)

Applications: hétérogène

- “Best of breed” (meilleur du marché)- Développements internes

Services d’Informatique Administrativel’infrastructure

Services d’Informatique Administrativeenvironnement applicatif hétérogène

Applicationsdu marché

Exemple 1. EDH: Electronic Document HandlingGestion Electronique de Documents

- remplace tous les formulaires administratifs- couvre tous les domaines- plus d’1’600’000 documents à ce jour- gère le flux décisionnel (workflow)

Services d’Informatique Administrativedémonstrations

Exemple 2. e-RT: e-Recruitment ToolkitOutil de Recrutement Electronique

http://cern.ch/jobs

- libre accès du monde entier- plus de 4’000 candidats enregistrés en 2004

et plus de 12’000 candidatures reçues- gestion électronique de la communication- distribution interne instantanée (au lieu de dizaines de milliers de pages)

Services d’Informatique Administrativedémonstrations

1. L’informatique au CERN:6 catégories

2. Informatique administrative:du papier au web…

3. Défis informatiques du LHC:…du web à la Grille

(basé sur une présentation de François Grey)

Plan de la présentation

- 40 millions de collisions/sec- Après filtre, encore 100 collisions/sec- Plus d’1MB de données par collision

taux d’enregistrement > 1 GB/sec

- 1010 collisions enregistrées/an

> 10 PB/an de données

Les données généréespar le LHC

1 Megabyte (1MB)Une photo digitale

1 Gigabyte (1GB) = 1000MB5Gb = 1 film DVD

1 Terabyte (1TB) = 1000GBProduction annuelle mondiale de livres

1 Petabyte (1PB) = 1000TBProduction annuelled’1 expérience LHC

1 Exabyte (1EB) = 1000 PB3EB = production annuelle mondiale d’informations

CMS LHCb ATLAS ALICE

Chaque année, le LHC généreral’équivalent de 20 millions de CD

Les données généréespar le LHC en 1 an

Où les expériences vont-elles stocker ces données?

Concorde(15 Km)

Ballon(30 Km)

Pile de CD avec1 an de donnéesdu LHC(~ 20 Km)

Mont-Blanc(4.8 Km)

L’analyse des données du LHC requiert une puissance de calcul équivalente à 100’000 processeurs de PC les plus récents

Le traitement des donnéesgénérées par le LHC

Où les expériences vont-elles trouver la puissance de calcul nécessaire?

- Haut débit basé sur une technologie “universelle” fiable- Plus de 1000 PCs double processeurs- Plus d’1 Petabyte de données sur disque et bandes

La puissance de calcul et la capacitéde stockage disponibles au CERN

Loin d’être suffisant!

Les centres de calcul, isolés par le passé, seront connectés, unifiant les ressources informatiques du monde de la physique des particules à travers le monde

> le web met en communde l’information répartie en des millions de lieux différents

> la Grille met en communde la puissance de calcul etde l’espace de stockage distribuéà travers le monde

La solution au manque depuissance de calcul: la Grille

En Europe: 267 instituts4603 utilisateurs

Ailleurs dans le monde: 208 instituts1632 utilisateurs

5 grandes idées

1. Partage mondial de ressourcesQuestion de confiance, domaines administratifsdifférents, Organisations virtuelles, accès 24/24 7/7…

2. Accès sécuriséRègles bien définies, authentification, autorisation,comptabilisation, nouveaux standards

3. Utilisation efficace des ressourcesPlus que de la récupération de cycles (SETI@home),intergiciel (middleware), files d’attentes…

4. Abolition de la distance56Kb/s il y a 10 ans >> 155Mb/s (x 3000!) >> 10 Gb/s

5. Normes ouvertesOGSA (Open Grid Standard Architecture), web services,

boîte à outils Globus (protocoles et services)

Sur quels principesrepose la Grille?

Les projets de Grille à travers le monde

•NASA Information Power Grid•DOE Science Grid•NSF National Virtual Observatory•NSF GriPhyN•DOE Particle Physics Data Grid•NSF TeraGrid•DOE ASCI Grid•DOE Earth Systems Grid•DARPA CoABS Grid•NEESGrid•DOH BIRN•NSF iVDGL

•UK e-Science Grid•Netherlands – VLAM, PolderGrid•Germany – UNICORE, Grid proposal•France – Grid funding approved•Italy – INFN Grid•Eire – Grid proposals•Switzerland - Network/Grid proposal•Hungary – DemoGrid, Grid proposal•Norway, Sweden - NorduGrid•DataGrid (CERN, ...)

•EuroGrid (Unicore)•DataTag (CERN,…)•Astrophysical Virtual Observatory•GRIP (Globus/Unicore)•GRIA (Industrial applications)•GridLab (Cactus Toolkit)•CrossGrid (Infrastructure Components)•EGSO (Solar Physics)

Le développement des Grilles a été initié par la communauté scientifique universitaire et de recherche, mais les industriels s’y intéressent aussi.

Les défis posésau CERN

- Partager des données entre >7000 scientifiques d’origines diverses- Relier de grands centres de calculs, pas juste des PCs- S’assurer que toutes les données soient accessibles partout et tout le temps- Assurer une croissance rapide tout en restant fiable pour plus d’une décennie-Intégrer les nombreuses politiqueset règles des différents centres- Assurer la sécurité des données:il y a plus que de l’argent en jeu!- Fonctionner en 2007

Les domaines d’applicationspossibles des Grilles

• Médecine/Santé (imagerie, diagnostique et traitement)• Bioinformatique (étude du génôme humain et compréhension des maladies génétiques)• Nanotechnologie (conception de nouveaux matériaux à l’échelle atomique)• Ingénierie (optimisation de conception, simulation, analyse de risque et accès et contrôle d’instruments à distance)• Environnement et ressources naturelles (prévision météorologique, observationde la Terre, modélisation et prédictionde systèmes complexes)

Les projets de Grille au CERN

• Projets CERN:LHC Computing Grid (LCG)

• Projets financé UE géré par le CERN:Enabling Grids for E-Science in Europe (EGEE)+ autres

• Projets financés par l’industrie :CERN openlab for DataGrid applications

Pour en savoir plus…

ais.cern.ch www.gridcafe.org

Journée portes ouvertes le 16 octobre 2004

Recommended