123 Multimédia SGBD et Clusters font bon ménage

Embed Size (px)

Citation preview

MISE EN UVRE LPREUVE DES FAITSSUR LE TERRAIN

INFRASTRUCTURE

SGBD et clustersLes bases de donnes modernes ont muscl leurs services pour tirer parti des serveurs en grappe. La continuit de service sen trouve amliore mme si les cots de tels environnements restent levs. Par Francisco Villacampa

font enfin bon mnagePostes clients Postes clients

LSI VOUS TES PRESSLes SGBD tirent diffremment parti des clusters. La base de donnes oriente objet Cach dInterSystems, par exemple, est taille pour tenir des charges de travail importantes. Elle profite donc au mieux des capacits de reprise sur incident matriel offertes par les grappes de serveurs. Suivant un schma diffrent, certains SGBD oprent des tests dintgrit, puis communiquent leur tat au cluster afin de prvenir toute corruption de donnes. Enfin, dautres SGBD sont dots de moteurs dexcution parallles qui exploitent simultanment la puissance de traitement offerte par diffrents serveurs, diminuant ainsi les temps de rponse. Quels que soient les scnarios dexploitation, la note reste leve, y compris lorsque les systmes de cluster exploitent des serveurs base x86 dIntel.

es clusters ne sont plus rservs aux seuls laboratoires scientifiques. Grce des SGBD qui savent de mieux en mieux tirer parti de ce type darchitecture matrielle, les PME peuvent galement sen quiper. la cl, une meilleure continuit de service pour les entreprises devant faire face lexigence dune forte prsence en ligne, notamment celles qui distribuent des services via des passerelles doprateur et qui doivent assurer un accs leurs donnes 24 h/24 et 7j/7. En gnral, les entreprises qui font le choix dun cluster se cantonnent deux serveurs matriels relis physiquement en rseau, mais interconnects de manire logique par un gestionnaire de serveurs en grappe. Reste nanmoins choisir le SGBD le mieux adapt son architecture et ses besoins.

Des matriels parfois limitsLutilisation de cluster de haute disponibilit et linstallation de SGBD capables den tirer parti restent onreuses. Particulirement dans les systmes base de processeurs Risc o les perspectives dvolution apparaissent limites. Les serveurs base Alpha et PA-Risc arrivant en fin de vie, ces entreprises vont devoir procder au renouvellement de leur matriel, en migrant vers des architectures de cluster plus prennes.

Acc s con cur ren tie l (c lus ter

Acc s rp art is

(clu ste ra cti f-a cti f)

LUTILISATION

Scuriser les services daccs aux donnesLa PME Eurdit, qui exploite lannuaire europen des affaires Europages, soit 500 000 fiches dentreprises disponibles en 25langues, est particulirement concerne par le besoin de haute disponibilit. Nous avons opt en 2001 pour un systme qui repose sur deux serveurs baseDCISION INFORMATIQUE

dUltraSPARC II, un quadriprocesseur actif et un biprocesseur passif, ainsi que sur Unix Solaris. Le logiciel de gestion Sun Cluster HA se charge de basculer lexcution de notre base documentaire Tamino 3.1 de Software AG sur un autre serveur en cas de dfaillance matrielle ou logicielle , dtaille Thierry Cohen Solal, DSI dEurdit. De son ct, la socit Alcade, un hbergeur dapplications de gestion financire, voulait aussi mettre en place un dispositif de haute disponibilit. Mais il a fait le choix dune architecture objet. Nous avons install en grappe deux serveurs Dell base de biprocesseurs Xeon, essentiellement pour assurer la haute disponibilit du matriel. Le serveur dapplications JavaN 610 / 1ER NOVEMBRE 2004

quilibre naturellement les requtes adresses la base de donnes oriente objet Cach dInterSystems,souligne Pierre Site, PDG dAlcade. En plus de la haute disponibilit, les clusters facilitent galement labsorption de pics transactionnels importants. condition toutefois dutiliser une base de donnes capable de raliser des oprations de lecture et dcriture en parallle avec plusieurs serveurs applicatifs. Notre activit de rparation et dentretien domicile ncessite une rponse rapide aux appels par lenvoi de techniciens, et ceci lchelle nationale, indique Jrme Plumey, responsable informatique de Maisoning. Nous avons donc dploy Oracle7, 8i puis 9i RAC

38

RETOUR DEXPRIENCE

Des temps de rponse rduitsLes SGBD dots dun moteur dexcution de requtes parallles sont en mesure dexploiter en simultan la puissance de traitement de plusieurs serveurs. Cela permet de rpartir la charge de travail et de diminuer les temps de rponse (cluster actif-actif). Les sauvegardes peuvent seffectuer intervalles rguliers par rplication sur un nud, sans perturber la continuit de service sur lautre nud.

Une mise jour des comptencesLa gestion dune base de donnes sur un cluster matriel ncessite les comptences dun administrateur ddi. Afin notamment de configurer les agents de surveillance ou de surveiller les mcanismes dallocation de mmoire vive pour chaque instance du SGBD. Des actions de formation sont prvoir pour mettre jour le niveau des quipes charges dadministrer le systme.

123 MULTIMEDIAActivit : vente de logos, de sonneries et de services Audiotel. Sige : Toulouse (31). Effectif France : 300 personnes. CA 2003 : 118 millions deuros.

Christophe Laporte, Acc s con cur ren tie l (c lus ter Acc s rp art is ( act clu if-p ste ass ra if) cti f-a cti f)Marc Martin

administrateur bases de donnes de 123 Multimedia.

act if-p ass if)

Administrateur Serveur applicatifAccs squentiel

Paramtrer sa base de donnes Les processeurs logiques font baisser la facture logicielle Entre autres plates-formes, nous utilisons depuis 2001 un cluster constitu de deux serveurs HP DL 740, quips de quatre processeurs Intel Xeon chacun. Nous avons install le SGBD SQL Server 2000 Enterprise Edition, sur ce cluster quip de lenvironnement Windows Server 2003 Enterprise Edition. La gestion du cluster est assure par loutil Microsoft Application Center, charg notamment de lier les serveurs entre eux. Celui-ci permet aussi de configurer le cluster en mode reprise sur accident, de sorte quen cas de dfaillance dune des machines, la deuxime prend automatiquement le relais. Lorsque les requtes sont effectues en parallle sur les deux serveurs, et que la fonction dHyperThreading est active, nous pouvons rpartir la charge transactionnelle sur seize processeurs logiques, pour huit processeurs physiques. Les temps de rponse diminuent, comme, dailleurs, lenveloppe globale acquitte au titre des licences.

Ba

Serveur applicatif

sc

ul

Base de donnes partageAccs parallle

e

su

ri

nc

id

en

Une disponibilit accrueChacun des serveurs (ou nuds) dun cluster dispose dun processeur, de mmoire vive, de capacits de stockage et dinterfaces rseau. Les SGBD dots dagents de surveillance, communiquent leur tat au logiciel de gestion du cluster. En cas de dfaillance logicielle, le logiciel de gestion du cluster assure une reprise sur incident et fait basculer lexcution du SGBD sur un deuxime serveur applicatif (cluster actif-passif). En cas dchec dun test dintgrit du SGBD, son excution peut tre dporte sur un deuxime nud actif (cluster actifactif).

t

Base de donnes partitionne

veurs , prcise Christophe Laporte, administrateur bases de donnes chez 123 Multimedia.

LA MISE EN UVRE

Opter pour des systmes certifisDs lors que les associations clusters-SGBD sont certifies par les fournisseurs, leur mise en uvre est gnralement rapide. Notre entreprise compte 70 salaris, en majorit spcialistes des donnes SGML et XML, prcise Thierry Cohen Solal, DSI dEurdit. Mais nous ne connaissons pas grand-chose aux clusters. Cest pourquoi Sun a cr un protoN 610 / 1ER NOVEMBRE 2004

[Real Application Clusters, Ndlr] afin dassurer la haute disponibilit, et la tenue en charge de notre systme , explique-t-il. Les besoins taient similaires chez le distributeur de logos et de sonneries 123 Multimedia. Nos 600 Go de donnes sont gres par le SGBD SQL Server Enterprise Edition et lenvironnement

Windows Server 2003. Lexcution est confie un cluster fond sur deux serveurs de type HP DL 740, base de quadriprocesseurs Xeon. En cas de dfaillance matrielle, nous pouvons basculer automatiquement sur le deuxime serveur. Lorsque le trafic augmente, le SGBD peut aussi rpartir les accs en parallle entre les deux serDCISION INFORMATIQUE

type de grappe de serveurs Sun Fire, base de processeurs UltraSPARC II. La configuration du logiciel de gestion des nuds Sun Cluster HA 2.2 a dur cinq jours. Linstallation de la base de donnes Tamino 3.2 de Software AG sest droule en peine deux jours.Toutefois, la mise en ligne ninterviendra quau terme de cinq mois de dveloppements en 1996, un dlai imputable notamment la traduction du site en six langues. Forte de 400 salaris, lentreprise de rparation Maisoning a choisi de piloter en interne la migration de la base de donnes Oracle7 vers Oracle8i, puis, (suite p. 40)

39

MISE EN UVRE LPREUVE DES FAITSSUR LE TERRAIN

(suite de la p. 39)

dans un second temps, vers le SGBD parallle 9i RAC. Le cluster sappuie sur deux serveurs HP DS20 et sur lenvironnement Tru64. Nous avons retenu des interfaces rseau de type Fibre Channel, car le volume de donnes traiter est important. Alors que la migration na dur que trois semaines, il aura fallu quatre semaines pour paramtrer les verrouillages daccs, la mmoire alloue et la remonte dinformations en cache , dtaille Jrme Plumey, responsable informatique de Maisoning. La mise en uvre aura galement ncessit la formation dun administrateur de bases de donnes. La prime de la simplicit revient en la matire au SGBD de Microsoft, install chez 123 Multimedia sur un cluster de deux serveurs quadriprocesseurs HP ProLiant DL 740 relis par un lien Fibre Channel. Linstallation fin 2001 de SQL Server Enterprise etRETOUR DEXPRIENCE

Windows Server 2000 sest rvle trs simple. Des assistants de configuration guident lutilisateur pour installer la base parallle , analyse Christophe Laporte, administrateur de bases de donnes de 123 Multimedia.

LES COTS

Le prix dun systme reste levLes cots dacquisition restent globalement levs. En effet, en plus des licences du SGBD, frquemment factures au processeur, le matriel exploit par le cluster gonfle rapidement la note. Nous changeons de matriel tous les 3 ans, cest la raison pour laquelle nous avons opt pour la location de notre parc. Notre SGBD Tamino 3.2 de Software AG, install sur un cluster de serveurs UltraSPARC aura cot 300 000 ht en 2001 , indique Thierry Cohen Solal, DSI dEurdit. Pour 123 Multimedia, la

facture stablit approximativement 30 000 ht pour le matriel, acquitts pour deux serveurs quadriprocesseurs Xeon, et 120000 ht en licences Microsoft SQL Server, au titre de huit processeurs, soit un total final de 150 000 ht. Certes, cela est considrable, mais une interruption de service nous coterait encore plus cher,commente Christophe Laporte, administrateur de 123 Multimedia. Le constat reste le mme pour lAfnic, qui exploite une architecture similaire. Hors licences du SGBD Oracle9i RAC, nos deux serveurs HP biprocesseurs AlphaServer ES40, deux chemins daccs Fibre Channel et une baie de stockage SAN nous ont cot environ 150 000 ht , atteste Malek Shabou, chef de projet lAfnic. ce titre, les systmes fonds sur les environnements Linux, et des bases de donnes telle MySQL Cluster, promettent de srieuses perspectives

dconomies. Lenvironnement est gratuit, et le SGBD est factur moins de 5 000 ht par processeur. Son usage reste nanmoins peu rpandu.

LES GAINS

Disponibilit et temps de rponseLes clusters apportent aux bases de donnes des taux de disponibilit suprieurs 99 %. condition de disposer doutils pour contrler le comportement du SGBD. cette fin, Software AG a dvelopp en 2001 des agents de surveillance chargs de tester lintgrit de la base Tamino 3.1 et den communiquer ltat au cluster, constitu de deux nuds base dUltraSPARC. Ce mcanisme nous permet de scuriser notre SGBD. En cas de dfaillance logicielle, il est possible de redmarrer la base ou de faire basculer son excution sur un autre serveur matriel , confie Thierry Cohen Solal, DSI dEurdit. Pour Maisoning, linstallation dune base de donnes parallle amliore la tenue en charge et rduit les temps de rponse. Le dploiement dOracle9i RAC fin 2002 sur notre cluster de serveurs Risc, base de processeurs Alpha EV45, a eu pour effet daugmenter la puissance de traitement de 60%,se rjouit Jrme Plumey, responsable informatique de Maisoning. Dans le but daccrotre les performances, lentreprise migre aujourdhui vers les dernires architectures base de processeurs EV7. Tout comme Eurdit dailleurs, qui adopte actuellement la version 4.2 de la base de donnes XML Tamino. Celle-ci gre le langage dinterrogation XQuery, capable de formuler des requtes natives en langage XML , prcise Thierry Cohen Solal. Les SGBD parallles offrent galement des fonctions avances de rpartition de charge, entre processeurs logiques. Lorsque la fonction dHyperThreading est active, lenvironnement Windows Server 2003 peut dclarer seize processeurs logiques, sur un systme qui compte deux serveurs

Rpartir les charges de travail La puissance de traitement a t amliore de 60% En 2001, nous avons fait migrer notre SGBD Oracle7 vers la version 8i, sur une architecture de cluster Compaq, constitue de deux serveurs Alpha en environnement Tru64. Cela nous a permis de scuriser le matriel. Mais le cluster manquait de souplesse. Par exemple, lors doprations de maintenance sur la base de donnes, les utilisateurs taient temporairement dconnects. Par ailleurs le temps de rponse se dgradait avec laugmentation des connexions de 140 postes de travail. Pour rsoudre ce problme, nous avons adopt le SGBD parallle Oracle9i RAC. Son moteur dexcution des requtes [Oracle Parallel Query, Ndlr] exploite quatre processeurs Alpha enFabrice Guyot

Jrme Plumey,responsable informatique de Maisoning.

MAISONINGActivit : dpannage et travaux dentretien domicile. Sige : Saint-Avertin (37). Effectif : 400 personnes. CA 2003 : 45 millions deuros. traite celui des 70 autres. Autre bnfice, nous pouvons attendre avant de mettre jour notre matriel qui vient de retrouver une deuxime jeunesse. Concernant lavenir de la base de donnes, je ne vois pas les avantages offerts par Oracle 10g, successeur de 9i RAC.

simultan, rpartis entre deux machines, ce qui a eu pour effet daugmenter la puissance de traitement de 60%. Mme si le rsultat nest pas linaire, la rpartition de charge est bien relle. Aujourdhui, les accs de 70 utilisateurs sont traits par un serveur, tandis que le second

DCISION INFORMATIQUE

40

N 610 / 1ER NOVEMBRE 2004

SGBD et clusters font enfin bon mnage

AVIS DINTGRATEURJean-Yves Migeon,responsable des produits centres de donnes de Sun Microsystems.

SUN MICROSYSTEMSActivit : constructeur et diteur informatique. Sige : Vlizy (78). Effectif France : 1000 salaris. CA 2003 France : non communiqu.

Les clusters deux nuds se banalisentQuels bnfices peut-on retirer dun SGBD en cluster ? Entre autres, celui de la haute disponibilit. Lorsquun nud rencontre un problme dexcution, le logiciel dadministration Sun Cluster fait basculer lexcution de lapplication sur un deuxime nud. Ces architectures sont essentiellement proposes avec notre Unix Solaris. Quelles applications peuvent en tirer le meilleur parti ? Toutes dans le cadre de reprise sur incident matriel. En revanche, la rpartition de la charge de travail nest possible quavec des applications parallles, telles les bases de donnes Oracle9i RAC ou 10g, capables de tirer parti de la puissance de traitement de deux serveurs. Combien de nuds comptent habituellement un cluster ? Les clusters de production qui comptent plus de deux nuds sont plutt rares. lexception toutefois des clusters de calcul.

quadriprocesseurs. Du coup, lenvironnement peut oprer une rpartition de la charge de travail sur seize instances du SGBD , souligne Christophe Laporte, administrateur chez 123 Multimedia. Quant aux bases de donnes objet, leur conception est nativement oriente vers la haute disponibilit. En 2001, nous nous sommes intresss au SGBD orient objet Cach dInterSystems, car celui-ci est naturellement haute disponibilit et peut grer de 5 5 000 requtes indiffremment. Le serveur dapplications

soccupe de rpartir la charge des accs la base, au moyen dinstances des classes du SGBD Cach , prcise Pierre Site, PDG dAlcade.

LES CUEILS

Une administration spcifique est prvoirLa configuration dun SGBD sur un cluster demande un paramtrage soigneux. Les agents de Tamino utilisent des scripts Unix pour commander au cluster un redmarrage de la base, ou

la bascule sur le deuxime serveur. Au dpart, le temps avant bascule tait trop court, ce qui provoquait une corruption de la base, une reconstruction, et donc une interruption de service momentane , illustre Thierry Cohen Solal, directeur informatique dEurdit. Les bases de donnes parallles, qui formulent des requtes en simultan sur diffrents serveurs ncessitent des paramtrages particuliers. Suivant leur schma de fonctionnement, le serveur applicatif rpartit les requtes,

vers des tables spcifiques qui sont verrouilles. Et cela, principalement afin de ne pas partager un champ, ce qui aurait pour effet de le corrompre. Afin dexcuter ces requtes, ladministrateur dispose doutils de supervision destins surveiller et paramtrer le SGBD. Il est par exemple ncessaire de dfinir la mmoire alloue chaque instance, ou des verrouillages daccs du serveur applicatif vers le SGBD. Ces oprations minutieuses ont t prises en charge par les ingnieurs dOracle , acquiesce Jrme Plumey, responsable informatique de Maisoning. Dautres obstacles peuvent surgir, par exemple lors dune migration ascendante. Les mcanismes dinstance permettent dexcuter sans difficult une base Oracle9i, aux cts de la base de production Oracle8i durant le temps de la migration. Malheureusement, des problmes de format de dates incompatibles ont considrablement ralenti lexportation de donnes , regrette-t-il. Dans tous les cas, il est essentiel de tester le bon fonctionnement des SGBD en cluster. dfaut, ceux-ci peuvent souffrir dune corruption de donnes, ou stopper leur travail transactionnel sans en avertir le gestionnaire du cluster. s

Quelques systmes de donnes dots de services pour clustersditeur Software AG Produit Tamino 4.2 Description Base de donnes XML. Haute disponibilit pour les architectures en cluster de HP, IBM ou Sun. Test dintgrit, bascule sur incident et reconstruction du modle de donnes. Systme de gestion de bases de donnes relationnelles pour clusters. Hautes performances et disponibilit. Architecture parallle : moteur dexcution de requtes Oracle Parallel Query, systme de fichiers rparti et virtualisation. SGBDR pour environnement Microsoft. Hautes performances et disponibilit. Moteur transactionnel parallle MS DTC, reprise sur incident, exploitation de processeurs logiques avec HyperThreading activ. SGBDR destin la haute performance et la haute disponibilit. Agent de supervision I-Spy 2.0 : surveillance des transactions, et des temps dexcution. Moteur dexcution de requtes parallles ISTAR/ Distributed Query Coordinator. SGBDR destin au serveur dapplications IBM WebSphere Edge Server. Hautes performances et disponibilit. Moteur dexcution de requtes parallles et agent de surveillance de lintgrit du modle de donnes HAStatus Check. SGBDR hautes performances et disponibilit. Moteur de gestion des tables rparties NDBCluster. Site web http://www2.softwareag.com/

Oracle

9i RAC

http://www.oracle.com

Microsoft

SQL Server 2000 Enterprise Edition

http://www.microsoft.com

IBM

Informix XPS 8.5

http://www.ibm.com

IBM

DB2 Universal Database

http://www.ibm.com

MySQL AB

MySQL Cluster

http://www.mysql.com/products/ cluster/

DCISION INFORMATIQUE

41

N 610 / 1ER NOVEMBRE 2004