27
Dossier : Le Grid Computing Rapport CGT • INSA de Lyon • 19 Novembre 2009 http://www.nemeannetworks.com/images/network.jpg Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 1

Le Grid Computing 2009-2010 - INSA Lyontelecom.insa-lyon.fr › sites › default › files › cgt › promo... · 2015-11-19 · L’histoire du Grid computing 4 II - La Technique!

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Dossier : Le Grid ComputingRapport CGT • INSA de Lyon • 19 Novembre 2009

http://www.nemeannetworks.com/images/network.jpg

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 1

Table des matières

Introduction! 3

I - Historique! 4

L’histoire du Grid computing 4

II - La Technique! 7

1) introduction à la technique du Grid computing 7

2) les différents types de grid Computing 8

3) Comparaison grid computing / cluster 10

4) Fonctionnement du middleware, Le coeur du grid computing 12

5) Les Problèmes technologiques des grilles informatiques 17

III-Marché & Droit! 18

Introduction 18

1) les raisons d’un essor naissant 19

2) Les problèmes posés 22

Conclusion! 26

Bibliographie! 27

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 2

Introduction

Depuis quelques décennies, et notamment dans le domaine de l’informatique, l’Homme est en perpétuelle recherche de tout faire plus rapidement et de façon plus efficace. Des modélisations et des problèmes chaque fois plus complexes nous obligent à avoir une énorme capacité de stockage de données et une puissance de calcul colossale.

Au cours des années, les ordinateurs ont pu se développer à un rythme extrêmement important mais le jour est arrivé où une telle puissance ne pouvait pas être produite par un seul et unique ordinateur standard.

Une première solution a été de construire ce que l’on appelle un «  super-calculateur ». Plusieurs ont été construits depuis les années 60 mais le coût des matériaux, des infrastructures et de l’énergie électrique pour un tel calculateur est immense voire inabordable.

On a également pensé à assembler dans un même lieu un ensemble d’ordinateurs homogènes qui travailleraient en commun. C’est la notion de « cluster ». Ceci s’avère être une solution peu efficace pour des projets de haute envergure par des raisons de coût et d’espace.

Peu de temps après et notamment grâce au développement d’Internet qui a permis d’atténuer les distances géographiques, l’idée du cluster fut reprise mais sous une nouvelle forme. Pourquoi étions-nous obligés de tout localiser au même endroit  ? Pourquoi les machines devaient être homogènes ? L’idée du Grid était apparue : il s’agissait maintenant de partager des ressources d'un grand nombre d'ordinateurs souvent différents, disséminés dans des lieux éventuellement très éloignés. Internet jouera un rôle clé dans la connexion de ces ressources et leur partage.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 3

I - HistoriqueL’HISTOIRE DU GRID COMPUTING

Le terme anglais Grid désigne un système distribué d'électricité. Initialement, le

concept de grille partait du principe d'un tel système  : les ressources d'un ordinateur (processeur, mémoire, espace disque) étaient mises à la disposition d'un utilisateur aussi facilement que l'on branche un appareil électrique à une prise. Cette comparaison a été introduite par Ian Foster's et Carl Kesselman au début des années 90. Leur idée était de pouvoir accéder à la «  grille  » de la même manière qu'on accède à l'électricité. Ce sont eux qui ont donné le nom à cette technique : le Grid Computing." Voici quelques dates importantes ayant marqué les grandes étapes du développement du Grid Computing."

1994  - Beowulf : crée par Thomas Sterling et Donald Becker pour la NASA, il fut un des premiers ancêtres du Grid Computing. Il s’agit, en réalité, d’un cluster qui n’est qu’un réseau d’ordinateurs à composants standards. Les PC possèdent un FOSS (Free and Open Source Software) de système d’exploitation de type Unix, comme BSD, Linux ou Solaris. Les ordinateurs sont connectés dans un petit réseau TCP/IP et contiennent des librairies et des logiciels qui permettent de partager les processus. Les réseaux type Beowulf s’utilisent encore de nos jours, principalement dans des laboratoires scientifiques.

1995 – I-WAY  : I-WAY (Information Wide Area Year) fut un projet visant à relier des

super-calculateurs en utilisant uniquement des réseaux existants. L’idée, mise au point par Ian Foster (un des créateurs du mot “grid”), était de mettre en commun un réseau de 17 super-ordinateurs, cinq centres de recherche sur la réalité virtuelle, et 60 autres centres de recherche de manière à créer un énorme réseau. Une des innovations de ce projet fut la mise au point d'un système de régulation du partage des ressources de calcul, conceptuellement très similaire aux courtiers en bourse, en cours de réalisation pour la grille. I-WAY a fortement influencé la conception du projet Globus, qui est à la base de la plupart des activités relatives à la grille.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 4

1996 – Globus : Globus a été une grande avancé dans le domaine du «middleware». C’est un software qui permet de connecter différentes applications dans un réseau de ressources délocalisées et hétérogènes qui se montrent comme une seule et unique machine virtuelle. A partir de Globus surgit Globus Toolkit, élément incontournable du Grid Computing de nos jours, qui permet de définir les services de base et les principales ressources dont il faut disposer pour construire une grille. Le Globus Toolkit gère les processus, mais aussi propose des solutions de stockage, de sécurité, de mouvement de données, de contrôle et une «trousse à outils» supplémentaire pour développer des services additionnels (négociation d’accords, services de trigger...).Aujourd’hui, il constitue la principale technologie de base des projets de Grid Computing.

1997 – CPU-scavenging : Ce type de grille introduisit l’idée de diviser des tâches et de

les exécuter en parallèle par un réseau d’ordinateurs. Le plus important des projets CPU-scavenging fut seti@home. Ce projet avait comme but d’utiliser la puissance CPU d’un réseau de volontaires possédant une connexion Internet, dans le but de rechercher des indices d’intelligences Extra-terrestre. Ce fut un échec pour cette découverte mais un énorme succès pour découvrir la force et l’intérêt du Grid Computing.

2002 - “The physiology of the Grid” : Cet article, écrit par Ian Foster, Carl

Kesselman, Jeffrey M. Nick et Steven Tuecke constitue une base fondamentale pour ce qui relève de la standardisation des grilles. Ils présentaient une architecture permettant de proposer des solutions aux principales préoccupations clés des systèmes de grilles. Le OGSA, développé par les groupes de travail de Global Grid Forum, représente un nouveau pas des systèmes de grilles qui introduit les concepts et les technologies du service WEB. Ceci fut complété par la création, en 2004, de WSRF (Web Services Ressource Framework) qui adapte les capacités du OGSA au web. Il s’agit d’une étape cruciale pour l’entrée du Grid Computing dans la prochaine génération d’Internet.

"

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 5

" De nos jours, il existe une immense quantité de projets qui se déroulent, pour la plupart, dans des milieux universitaires ou des laboratoires de recherche. En voici quelques-uns :

• Genome@home: Développé par l'Université de Stanford, ce projet étudie les interactions entre le génome et les protéines.

• FightAIDS@HOME: Projet créé par IBM permettant l'identification de médicaments candidats pour bloquer la protéase du VIH. De nos jours plus de 250 000 personnes se sont déjà inscrites.

• Décrypton : la première cartographie du protéome.

Plusieurs autres projets se réalisent dans le cadre de la Globus Alliance :• CMCS  : Développement d’une grille d'information concernant le domaine de la

chimie.• NEES  : Outil qui permet de faire des simulations de tremblements de terre sur des

infrastructures civiles. Permet également de mesurer les possibles dégâts provoqués.• LEAD  : Logiciel permettant l’analyse d’un grand nombre de données

météorologiques.• LTER : Recherche des solutions pour les principaux problèmes écologiques.• BIRN : Mise en commun de ressources médicales et des données sur les traitements

et diagnostiques médicaux.• Et bien d’autres...

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 6

II - La Technique1) INTRODUCTION À LA TECHNIQUE DU GRID COMPUTING

Grille informatique ( traduction de « grid computing ») : Réseau d'ordinateurs formé dans le but d'effectuer des traitements de données complexes et volumineux, liés à l'exécution d'une tâche, en mettant à contribution leurs ressources inutilisées (Définition du grand dictionnaire).Cette grille est une infrastructure virtuelle composée d'un ensemble de ressources informatiques potentiellement partagées, distribuées, hétérogènes, délocalisées et autonomes. Cette infrastructure est qualifiée de virtuelle car les relations entre les entités qui la composent n'existent pas sur le plan matériel mais seulement d'un point de vue logique.Ces ressources sont donc qualifiées de :

• Partagées : elles sont accessibles aux différents consommateurs de la grille.

• Distribuées : les ressources peuvent appartenir à plusieurs sites, organisations, ou réseaux.

• Hétérogènes : toutes les machines sont sous des systèmes d'exploitation différents et avec des ressources de puissance et de type différents.

• Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs agents, qu'ils soient centralisés ou répartis.

• Autonomes : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle.

• Délocalisées : les ressources peuvent se situer à différents endroits géographiques.

" Pour résumer, le grid computing est semblable aux clusters, à l'exception du fait que les ressources sont reliées entre elles, non par des câbles ultra rapide sur de courtes distances, mais par le réseau internet.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 7

II - La Technique2) LES DIFFÉRENTS TYPES DE GRID COMPUTING

Le Grid computing est une technique relativement vaste et applicable à beaucoup de

domaines. Elle peut être appliquée de différentes manières pour s'adapter aux besoins. On note 4 grandes applications de cette méthode :

http://michaelgr.files.wordpress.com/2008/10/cern-grid-computing-center-02.jpg

" - Computational Grids : C'est le partage de la puissance de calcul de chaque ordinateur, par exemple le programme TeraGrid qui a une puissance de calcul de plus de 750 teraflops, ou encore le SETI@home qui rassemble la puissance de calcul de plus de 900 000 ordinateurs personnels. Le Sun Grid Compute Utility en est encore un exemple ; ce type de grid computing est en train de se multiplier, généralement pour la recherche (humanitaire, scientifique, …)." -Data Grids : Ce type de Grid computing est plutôt voué à échanger des données entre différents utilisateurs comme des résultats d'expériences. Typiquement, le «  data grids » va brasser d'énormes quantités de données comme dans le projet LHC Computing Grid.Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 8

" -Storage Grids : Ce type de grille est plutôt destiné aux utilisateurs ayant besoin d'avoir un énorme espace de stockage. Par exemple, l'un des plus gros et plus connu est le réseau Amazon S3.

" -Equipment Grids : Les grilles peuvent aussi partager l'accès à du matériel (tel que des télescopes via le réseau eSTAR Project).

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 9

II - La Technique3) COMPARAISON GRID COMPUTING / CLUSTER

" Cluster (Grappe): Ensemble d’équipements de nature identique partageant les mêmes ressources et regroupés sur un même site, sous le contrôle d'une unité centrale. (Définition du grand dictionnaire)

Nous avons vu que les clusters et le grid computing étaient relativement proches dans leurs utilisations. Nous allons donc voir quelles sont les différences qui peuvent les distinguer et comment les 2 systèmes cohabitent.

" Tout d’abord, on peut constater qu'au niveau des liens entre machine de calcul, les clusters de processeurs sont avantagés, toutes les machines étant au même endroit, elles peuvent être branchées entre elles avec des liens super rapides. De par ce fait, on adapte le travail qu'on donne aux grilles. On préfèrera donner des tâches facilement «parallélisables», permettant ainsi à chaque machine de travailler de son côté pour éviter d'être limitée par la vitesse des liens de connexion.

" D'un autre côté, le Grid Computing permet d'avoir à un moindre coût la même puissance qu'un super-calculateur. En effet, rassembler énormément d'ordinateurs grand public revient moins cher que de créer un petit nombre de super-calculateurs (au niveau de la conception et des coûts de production, la production en masse y étant pour beaucoup).

De plus, les clusters ne peuvent pas se séparer de leur design initial, contrairement aux grilles qui peuvent augmenter leur capacité de calcul avec le nombre de machines connectées, quelque soit le type de machine et le système d'exploitation installé dessus.

" Également, nos ordinateurs ne sont, en général, pas utilisés à plus de 10% de leur capacité, alors que chaque seconde de calcul non utilisée est une seconde perdue à jamais. C'est pour cela qu'au lieu de louer (à un prix onéreux) du temps de calcul sur un super-calculateur, il est plus rentable (notamment pour les grandes firmes) de se servir de la puissance non utilisée de leur parc informatique. En effet, louer du temps sur un super-calculateur revient très cher, et ces machines, même si elles sont optimisées consomment

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 10

énormément d'énergie, alors que le parc informatique d'une entreprise consomme quasiment la même énergie qu'il soient utilisés à 10% ou 50%.

http://upload.wikimedia.org/wikipedia/commons/f/f3/GRIDFLOPS.png

" Au niveau des performances pures, on peut voir sur ce graphe que les super-calculateurs ont une capacité de calcul qui augmente de façon logarithmique, ce qui devrait, à terme, amener à la fin du développement de ce type de machine. On remarque aussi que les réseaux de machines (ici FOLDING@HOME et SETI@HOME ont des performances proches de meilleur calculateur (ici en 2007).

" En conclusion, les super-calculateurs possèdent désormais une puissance de calcul plus élevée que les systèmes utilisant le grid computing (notamment pour les applications non facilement «parallélisables»). Par contre, le Grid Computing est économiquement plus intéressant, sans compter sa plus grande facilité d'implémentation et sa grande capacité d'évolution.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 11

II - La Technique4) FONCTIONNEMENT DU MIDDLEWARE, LE COEUR DU GRID COMPUTING

Le middleware est défini comme étant un «logiciel servant d'intermédiaire

transparent entre des applications appartenant à des systèmes hétérogènes liés en réseau, lesquels entretiennent le plus souvent des relations basées sur le modèle client-serveur.» (Définition du Grand Dictionnaire).Voici une illustration de la place du middleware dans un système informatique.

http://sardes.inrialpes.fr/~krakowia/MW-Book/Chapters/Intro/Chapters/Intro/Figs/middleware.gif

" Le middleware est non seulement un domaine en plein développement mais aussi une branche essentielle pour l'intégration des applications dans la grille informatique. Il a pour rôle essentiel d'assurer la stabilité des applications installées sur différents systèmes interconnectés par Internet. On parle ainsi d'abstraction du matériel. Il doit notamment régler les problèmes de sécurité, de gestion des ressources et des données.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 12

Remarque :

Les grilles informatiques peuvent être conçues selon trois différentes approches :• La virtualisation de super-calculateur a pour but de construire un super-calculateur

virtuel sur internet en exécutant les applications sur des ressources distantes.• L’Internet computing a pour but d’utiliser les ressources distantes uniquement si

elles sont en veille.• Le metacomputing a pour but «  d’acheter du service de calcul sur l’Internet  ».

(exemple  : « plutôt que de demander de l’énergie pour chauffer le café, acheter le café chaud »).

Nous ne traiterons évidemment pas ces trois approches dans ce dossier car chacune d’entre elles pourrait constituer un dossier en entier ; or le but de ce dossier est de présenter en général le grid computing.

Pour illustrer le rôle du middleware, nous allons plutôt nous intéresser à l’approche de virtualisation de super-calculateur grâce au Globus Toolkit.

Le Globus Toolkit : un exemple de virtualisation de super-calculateur

" Plusieurs «intergiciels» (middleware) ont été développés pour le grid computing mais le Globus Toolkit est celui qui est le plus cité. Nous nous intéresserons par conséquent uniquement à cet outil. " Globus est une VO (Virtual Organization) qui est composée de plusieurs centres de recherches situés aux Etats-Unis, en Suède et dans d'autres pays. Le Globus Toolkit est une librairie développée en C et en Java qui permet de «gridifier» une application, c'est-à-dire l'intégrer dans la grille informatique. Ce qui fait l'intérêt du Globus Toolkit, c'est qu'il est open source, donc utilisable par tout le monde.

"

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 13

" Le Globus Toolkit est décomposé en plusieurs modules qui s'occupent chacun de gérer différents aspects, dont le middleware :

− Resource management : s'occupe principalement de la gestion des tâches et des ressources.

− Data management : transmet, stocke et gère les flux de données massifs.− Information services : permet la découverte des ressources disponibles.− GSI Security Layer : Gère les fonctionnalités fondamentales concernant la

sécurité.

http://www.buyya.com/papers/gmchapter.pdf

GSI Security Layer

" Le module Grid Security Infrastructure (GSI) permet l'authentification des utilisateurs de la grille et de la sécurisation des communications. Ce module est basé sur le SSL (Secure Sockets Layer), le PKI ( Public Key Infrastructure) et le X.509 Certificate Architecture. " Il doit permettre une confiance mutuelle entre l'utilisateur de la grille et les machines distantes. Cela se fait à travers des proxys et des certificats de confiances (certificates authorities ou CAs) qui donnent l'accès aux ressources à l'utilisateur. Ainsi, chaque

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 14

utilisateur se voit attribuer un compte et peut s'identifier d'une manière unique pour tous les services de la grille. Le GSI permet aussi le cryptage des données, l'autorisation d'accès aux ressources et la création d'organisations virtuelles. Les organisations virtuelles peuvent être créées justement avec ces certificats de confiance et peuvent permettre à un utilisateur donné d'accéder aux ressources si l'administrateur lui en donne la permission.

Ressource Management

" Ce module est composé de 2 packages : le Globus Resource Allocation Manager (GRAM) et le Globus Access to Secondary Storage (GASS)." Le GRAM est chargé de s'occuper de l'exécution des tâches sur la machine distante. Après une authentification réussie, le GRAM crée un gestionnaire des tâches qui contrôle et exécute les tâches en fonction du scheduler (ordonnanceur) local sur le système." Le GASS est un mécanisme d'accès aux fichiers qui permet de «pré-charger» (fetch), ouvrir un fichier distant et écrire dessus. Il permet le transfert des exécutables (staging-in) sur les noeuds de la grille et de récupérer les résultats et les messages d'erreurs.

Information Services

"" Ce module donne des informations sur les ressources et services disponibles sur la grille dans un contexte volatile où les noeuds ne sont pas toujours présents. Pour cela, il existe un package appelé le Monitoring and Discovery Service (MDS). Il permet de découvrir les ressources faisant partie de l'organisation virtuelle et de les surveiller. Toutes ces informations sont indexées dans un fichier XML que peut voir l'administrateur, ce qui lui permet de mieux gérer la grille.

Data Management

" Il existe 2 packages au sein de ce module qui lui permettent de transmettre, stocker et gérer les données massives : le GridFTP et le Replica Location and Management (RLM)." Le GridFTP est une extension du protocole standard FTP mais avec l'intégration des services du GSI décrits plus haut. "

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 15

" Le RLM permet la duplication d'un fichier sur la grille et enregistre donc le lieu de chaque réplique afin de les créer ou de les effacer.

" Nous avons vu ainsi un middleware particulier, le Globus Toolkit, qui propose une solution d'intégration des applications à une grille informatique. D'autres middlewares existent aussi tels que UNICORE, Legion... Le middleware règle beaucoup de problèmes liées à la «gridification» des

applications. Pourtant, de nombreux problèmes persistent pour avoir des grilles informatiques stables.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 16

II - La Technique5) LES PROBLÈMES TECHNOLOGIQUES DES GRILLES INFORMATIQUES

Le premier problème auquel on est confronté lors de la mise en place d'une grille

informatique est l'hétérogénéité des ressources. Cependant, nous avons vu que ce problème pouvait être réglé grâce au middleware. Il y a évidemment encore beaucoup d'efforts à faire pour avoir des structures réellement stables mais la recherche avance à grands pas avec une coordination des laboratoires internationaux et des universités (exemple : projet Globus).

" Un autre problème qui se pose est la fiabilité des machines distantes. Comment fait-on pour savoir qu'une ressource ne se trompe pas ? Comment fait-on pour être sûr que les données renvoyées ne sont pas volontairement (acte de malveillance) erronées ? Pour régler ce problème, il faut demander à plusieurs ressources d'effectuer la même tâche et confronter les résultats pour être sûr de l'exactitude de ces résultats. Cependant, cela contribue à une perte de performance qui n'est déjà pas très élevée comparée à celle des super-calculateurs. Il faut donc gérer tous ces problèmes qui ne font que diminuer la performance que la grille pourrait avoir.

" Un autre problème majeur est lié à la sécurité. On peut imaginer que des pirates arrivent à réserver des ressources pour leurs propres fins et ainsi priver ce potentiel de ressources à l'utilisateur de la grille. Il faut donc réussir à détecter assez rapidement tout abus des utilisateurs de la grille et toute tentative de réservation des ressources extérieure à la grille. Par exemple, un hacker peut développer sa propre grille informatique en envoyant des worms à des utilisateurs non protégés, lui permettant ainsi de craquer des mots de passe (dans le commerce principalement) qui lui sont habituellement inaccessibles. Il est probable que les fabricants d'antivirus et de firewall, adapteront leurs produits (ou en créeront des nouveaux plus adaptés) afin de se protéger contre toute attaque éventuelle sur la grille.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 17

III-Marché & DroitINTRODUCTION

!

! Le Grid Computing est une technologie que l’on peut encore qualifier de «jeune»,

bien que cette dernière soit déjà le sujet de discussions de chercheurs depuis plus d’une

vingtaine d’années.

http://wallpaper-s.org/12__Bio-Grid_Computing.htm

De part sa propre définition, le Grid Computing nous oblige à nous poser un certain nombre

de questions quant à sa possible réalisation, ainsi qu’à son possible développement et sa

commercialisation dans le monde entier.

! Nous allons donc étudier les différents paramètres qui ont permis le développement

ainsi que le début de l’essor du Grid Computing, puis nous verrons les différents problèmes

que pose l’utilisation et l’implantation de cette nouvelle technologie à travers le monde. Et

enfin, nous citerons quelques cas concrets de l’utilisation, déjà bien aboutie, du Grid

Computing.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 18

III-Marché & Droit1) LES RAISONS D’UN ESSOR NAISSANT

http://www.etudiantguinee.com/Images/i%20business%20world.jpg

! Comme expliqué dans les parties précédentes de ce dossier, le but originel du Grid

Computing était de disposer de toutes les ressources informatiques dont nous avons besoin,

simplement en nous connectant à un réseau, comme nous branchons nos appareils

électriques à une prise afin de disposer de la quantité d’électricité suffisante pour nous en

servir.

Un concept économiquement intéressant et bien fondé

! Le Grid Computing pourrait permettre, à chaque personne se connectant à un réseau

« Grid », de faire tout ce qu’il souhaite avec sa machine, sans se sentir limité, que ce soit par la

mémoire dont dispose son ordinateur, ou bien par la vitesse de calcul de son processeur, ou

encore par les logiciels qu’il possède. Ce dernier se connecte et peut lancer un logiciel qu’il

ne possède pas en passant simplement par la grille. Tout sera transparent, comme si

l’utilisateur en question possédait tout ce dont il a besoin.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 19

Rendre accessible à tous ce qui, autrefois, nous paraissait irréalisable est une vision utopique

et nous en sommes encore loin aujourd’hui.

! De nos jours, c’est dans la recherche qu’est le plus implantée cette technologie du

Grid Computing. En effet, la recherche a besoin de plus en plus de capacité de calcul, ainsi

que de matériel à la pointe de la technologie. Or ces exigences ont un coût non négligeable.

On peut prendre ici le cas des super-calculateurs qui non seulement coûtent chers à l’achat,

mais aussi à l’utilisation et n’est pas forcément facile à utiliser. A contrario, un ordinateur

relié à un réseau « Grid » n’a pas besoin d’avoir une puissance de calcul phénoménale car ce

dernier travaille en parallèle avec d’autres ordinateurs. De plus, si un nombre suffisant

d’ordinateurs est connecté au réseau, il est alors possible de dépasser les performances d’un

super-calculateur malgré la lenteur relative de la connexion entre les différents ordinateurs

par rapport à celle entre deux processeurs d’un même super-calculateur. Certains intègrent

des super-calculateurs et des « clusters » dans leur réseau « Grid » afin d'en accroître encore

plus les performances.

Un argument écologique non négligeable

! L’écologie est aujourd’hui un sujet important, et tout projet ne respectant pas au

mieux cette nouvelle règle, ne peut absolument pas voir le jour sur le marché mondial. Or, le

Grid Computing permet d’utiliser des ressources déjà disponibles dans le monde. Le super-

calculateur est très gourmand en ressources électriques et les procédés utilisés pour le

fabriquer ne sont pas des moins polluants. Cette technologie est donc un bon moyen pour

s’affranchir des problèmes matériels tout en pouvant continuer d’augmenter les

performances.

Un véritable atout pour la science

! Le Grid Computing n’est pas suffisamment développé aujourd’hui pour être utilisé

par tout le monde. En revanche, les scientifiques l’ont déjà adopté depuis plusieurs années et

elle fait tous les jours de nouveaux adeptes. En effet, en 2008, « Le Consortium EGEE (Enabling Grids for E-sciencE) était constitué de plus de 90 contractants provenant de 32 pays, répartis en 12 fédérations, représentant ainsi pratiquement toutes les grandes initiatives nationales de grille en Europe ainsi que des projets de grille aux Etats-Unis et en Asie. »

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 20

De plus, les entreprises qui vendent ce service, ont tout intérêt à le vendre aux professionnels

et aux scientifiques, car dans la plupart des cas, si ces derniers l’adoptent, une vingtaine

d’années plus tard, le monde entier l’adopte. C’était par exemple le cas d’Internet qui était au

départ un réseau visant à relier les professionnels entre eux, et qui petit à petit a fini par se

développer pour devenir un outil indispensable dans la vie de tous les jours.

On peut alors se demander pourquoi cette technologie n’est elle toujours pas implantée dans notre vie au quotidien. Son développement va-t-il suivre l’exemple d’Internet ?Malgré ses aspects révolutionnaires, beaucoup de problèmes se posent au niveau de la sécurité, ainsi qu’au niveau législatif. Il n’est pas aisé de partager des données à travers internet en étant absolument sûr qu’elles soient protégées, alors comment pouvons nous protéger des ressources partagées ?Enfin, le problème majeur de la propriété intellectuelle se pose aussi, surtout dans le monde scientifique. Comment gérer ces problèmes ?

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 21

III-Marché & Droit2) LES PROBLÈMES POSÉS

http://www.icone-gif.com/icone/3d/software-Securite/Cadenas_3D.png

La propriété intellectuelle

" Lorsqu’un brevet est déposé par une entreprise X, c’est parce qu’un chercheur de cette entreprise a fait une découverte intéressante qui pourra, si le produit en découlant arrive à terme, devenir un gain économique important. Ainsi, le bénéficiaire est l’entreprise X, et tous les noms sur le brevet sont ceux des personnes ayant activement participé à la recherche en question. Mais dans le cas d’une recherche se servant d’un réseau « Grid », à qui appartiennent les données ?Chaque ordinateur ayant apporté sa contribution au calcul, chacun des possesseurs des ordinateurs est en droit de dire qu’il a participé à l’élaboration du brevet. Sur certains réseaux « Grid » (pour la recherche) déjà existant, la règle est que chacune des personnes reliée au réseau possède le droit d’utiliser les données de la grille, mais elles ne leur appartiennent pas.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 22

D’autres grilles, très localisées, très petites, utilisent des règles plus simples, c’est-à-dire que tout est basé sur la « confiance » entre les différents points qui constituent la grille." Et dans le domaine publique ? En effet, plusieurs applications au Grid Computing sont déjà existantes comme certains centres médicaux utilisent cette technologie pour faire des mammographies. Mais après que les tests aient-été fait, à qui appartiennent les résultats ? Ils n’appartiennent pas à la personne concernée, mais ils n’appartiennent pas non plus aux médecins et encore moins aux chercheurs qui voudraient pouvoir utiliser ces derniers pour leurs recherches. La règle est ici, que le patient doit signer un papier, explicitant qu’il accepte ou non que ses données soit utilisées à des fins de recherche.

Et dans le cas mondial ?

" Nous avons vu jusqu’ici des cas où la grille est utilisée à des fins de recherche seulement. Il est alors facile de trouver des compromis, ou bien des règles que chacun peut respecter. Mais que se passerait-il dans le cas où le réseau «Grid» serait mondial ? Les intérêts des personnes utilisant la grille n’étant plus simplement de faire avancer la science, des conflits apparaitraient.

Il faudrait appliquer des «règles internationales» au réseau, or aujourd’hui, même Internet n’en possède pas réellement. Chaque problème est traité au cas par cas, mais pour une utilisation mondiale du service, il serait impossible de continuer ainsi.De plus, il ne serait pas possible de passer des accords avec le monde entier pour chaque projet ou chaque application produite sur la grille.

Également, les taxes dans les différents pays étant différentes, comment seraient taxer les infrastructures ? Si une seule entreprise possède différents noeuds du réseau dans des pays différents, comment seront taxés ces noeuds ? Comment seront taxés les services d’une entreprise, qui repose bien entendu sur la «technologie de grille», si cette dernière se situe dans un pays différent de l’endroit où elle fournit le service ?

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 23

Et la sécurité ?

" La sécurité de la grille est absolument primordiale. Si une «grille mondiale» devait voir le jour, les données devraient être impérativement protégées.Pour cela il a été mis au point un «intergiciel» (middleware) qui permettrait de régler tous les problèmes de connexion et d’authentification au réseau «Grid» et qui régirait tous les problèmes de sécurité. Chacun des ordinateurs du réseau devrait alors installer ce middleware. Mais, dans ce domaine, encore beaucoup de progrès sont à faire.

Aujourd’hui, la grille EGEE, par exemple, est surveillée par différentes équipes ayant pour mission de tester et de régler les problèmes de sécurité qu’ils observent. Ces derniers vérifient constamment l’état de la grille afin qu’aucune faille de sécurité ne soit facilement exploitable. Serait-il possible de conserver ce système de sécurité pour un réseau mondial ?

Que se passerait-il si quelqu’un de mal intentionné parvenait à accéder à une partie du réseau «Grid» à laquelle il ne devrait pas avoir accès ? Ce dernier pourrait avoir accès à des données importantes, et il pourrait aussi, à des fins personnels, se servir de la puissance de calcul de plusieurs machines, reliées au réseau, ne lui appartenant pas.La solution serait peut-être de hiérarchiser les utilisateurs afin que certains aient plus de droits que d’autres sur la grille. Les abus seraient alors évités mais si un utilisateur expérimenté parvenait à trouver les codes d’accès d’un utilisateur possédant beaucoup de droits sur la grille, rien ne pourrait l'empêcher de faire ce qu’il veut.

Qui paye ?

" Comment la grille serait-elle rentabilisée ? Les tarifs seraient-ils les mêmes pour une personne ayant besoin d’énormément de ressources et utilisant la grille presque constamment, un chercheur par exemple, que pour une tierce personne n’utilisant la grille que de temps à autre à titre purement personnel ?

Nous prendrons ici l’exemple de l’EGEE, le réseau «GRID» très développé en Europe. Tout d’abord, les fonds permettant de «construire» le réseau viennent de l’Union Européenne. Ensuite, les services fournis, par des entreprises privées, sur le réseau sont payants, et chaque pays l’utilisant doit reverser une certaine somme. Ainsi, le réseau serait rentabilisé et les bénéfices pourront être réutilisés dans le but d’améliorer les installations ou les services, par exemple. Ainsi le long terme de l’infrastructure est assuré.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 24

Aujourd’hui, les grilles n’ont qu’un domaine d’application : celui de la recherche. Ce sont donc les gouvernements qui payent un tel service à leurs chercheurs. Comment cela se déroulerait-il si les grilles étaient utilisables par le monde entier ? Il faudrait mettre en place des «forfaits d’accès à la grille», ainsi que des droits d’accès à la grille car un chercheur n’a clairement pas les mêmes besoins en ressources qu’un particulier.De plus, en terme de licence logiciel, aucun développeur ne commercialise des licences « Grid Computing » mais seulement des licences par ordinateur ou bien par entreprise. Un autre type de licence sera alors à mettre en place afin que quiconque relié à la grille puisse utiliser un logiciel qui est installé sur une machine distante sans l’avoir réellement acheté.

"

" Le Grid Computing est une technologie assez bien développée dans le monde de la recherche, car elle permet une meilleure collaboration entre les chercheurs, elle garantit la propriété intellectuelle grâce au fait qu’un utilisateur, bien qu’il utilise une ressource partagée, garde tous les droits sur son projet. En revanche, malgré de très bon résultat, cette technologie reste encore très compliquée et pour pouvoir s’en servir, il est nécessaire d’avoir un minimum de connaissances en informatique. De plus, la sécurité étant gérée par plusieurs groupes de personnes, il faut avoir une confiance totale en ces personnes qui sont les seules à pouvoir gérer cet aspect là de la grille. Enfin, par exemple en France, certaines lois visant à réduire le piratage seraient totalement obsolètes et il faudrait alors revoir la législation concernant Internet.Il serait donc impossible, pour toutes les raisons citées ci-dessus, de créer pour le moment une grille internationale permettant de relier n’importe qui au réseau pour lui fournir les services dont nous avons parlé en introduction de cette partie.

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 25

ConclusionEn conclusion, comme nous avons pu le voir, le Grid Computing existe au niveau

technologique depuis maintenant un bon nombre d’années. Pourtant, cette technologie n’a

pas émergé lors de sa création, entre autre à cause de problèmes de sécurité du réseau et de

son débit.

Mais cette technologie est en passe d’être utilisée à travers le monde, notamment

grâce au développement rapide d’Internet, au nombre de machines et au besoin de réduire les

coûts en utilisant les ressources en veille…

On pourrait donc se projeter dans un monde où une famille va acheter un boitier de la taille d’un ballon de foot avec son écran. Elle aura ainsi juste à brancher l’écran au boitier puis le boitier à la prise électrique pour pouvoir profiter entièrement de toutes les fonctionnalités d’un ordinateur classique (sans l’encombrement généré). De cette manière, juste en appuyant sur le bouton «  power  », le boitier sera connecté en quelques secondes aux ressources nécessaires quel que soit leur emplacement géographique. La famille payera éventuellement

un forfait pour l’utilisation de ces ressources distantes ne lui appartenant pas.

Cependant, tout ceci ne pourra être possible que si l’on résout certains problèmes tels que la sécurité ou encore le problème de droit sur les données et résultats transitant à

travers le monde. Quelle justice doit être appliquée  ? Celle du pays où sont situées les

ressources, ou celle du pays où est situé l’utilisateur ?

Pour l’instant, le Grid Computing est utilisé par les chercheurs et commence déjà à poser des problèmes de droit. L’utilisation actuelle, uniquement pour la recherche, ressemble fortement à l’utilisation d’Internet à ses débuts. Cependant, contrairement à la philosophie

d’Internet qui était initialement purement à but militaire, celle du Grid Computing se place

dans une perspective de partage dans une époque où la réduction de la consommation

d’énergie est cruciale. En effet, le Grid Computing s’inscrit dans le concept du GreenIT même

si les données sur ce sujet restent floues. Ainsi, le Grid Computing réunit les deux valeurs

importantes du moment : l’écologie et le partage.

Sauvons notre planète : choisissons le Grid Computing !  

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 26

Bibliographie

Sites internet

http://www-igm.univ-mlv.fr/~dr/XPOSE2006/Jolly_Laskri

http://www.gridcafe.org/

http://videos.techielife.com/what-is-cloud-computing/video-online/2008/11/13

http://www.gridipedia.eu/

http://wapedia.mobi/en/Grid_computing#5

http://www.ncess.net/events/conference/2005/papers/papers/ncess2005_paper_Hinds.pdf

http://www.itscan.be/files/Grid_Computing_2008_dossier_FR.pdf

http://www-sop.inria.fr/intech/grid/priol.pdf

Articles précis

[1]Mémoire de Rémy NICOLAS : Technologie Globus pour le grid computing,Domaine : Informatique, Ecole :Supinfo Paris, soutenu en 2006, durée : 30 min de lecture : http://www.supinfo-projects.com/fr/2006/admin_globus_2006/1/

[2]Pas d'auteur : Grid computing In : wikipedia.org : http://en.wikipedia.org/wiki/Grid_computing

[3]Zsolt Németh and Vaidy Sunderam. Characterizing grids : attributes, definitions, and formalisms. Journal of grid computing 1. 2003, volume 1

[4]Parvin Asadzadeh, Rajkumar Buyya, Chun Ling Kei, Deepa Nayar, and Srikumar Venugopal. Global Grids and Software Toolkits:A Study of Four Grid Middleware Technologies. Grid Computing and Distributed Systems (GRIDS) Laboratory Department of Computer Science and Software Engineering The University of Melbourne, Australia

Alfaro Argenti Bruno • Aurelle Lambert • Baydoun Bilal • Blanc Arnaud 27