Exposé GT 24/10/2002 Dimitri Lecas. ScotchFaxBlendSopalin graphe sequentielparallele global local...

Exposé GT 24/10/2002

Dimitri Lecas

Scotch

PaStiX

Scotch Fax Blend Sopalin

graphe

sequentiel parallele

globallocal

symbolique numerique

noeud ddl

permutation symbolMatrixsolverMatrix distribuée

solverMatrixdistribuée etfactorisée

solutiondistribuée

element

Factorisation Symbolique

graphe

globallocal

noeud ddl

solutiondistribuée

element

Repartitionnement et distribution des blocs

Gère le parallélisme induit par le creux (arbre d’élimination par blocs).

Découpe et distribue les blocs afin de prendre en compte le parallélisme potentiel induit par les calculs en plein .

Utilise la taille de bloc optimale pour les routines BLAS de niveau 3.

Arbre d’élimination par blocs

Repartitionnement de la matrice

Graphe de tâches

Matrice symboliquepar blocs

Modélisation coûts calcul et comm

Nombre de processeurs

Distribution et ordonnancement

Données locales Ordonnancement tâches

Schéma de communication

Factorisation et résolution //

Estimation du temps de calcul

Espace Mémoire nécessaire

Graphe de tâches

Schéma de communication Limitation

mémoire

Réduction surcoût mémoireFactorisation

et résolution //

Nouveau schéma de communication

Graphe de tâches

Schéma de communication

Factorisation et résolution //

Calcul d’un schéma I/O pour l’OOC

Limitation mémoire

Schéma I/O disque

Distribution mixte 1D/2D

• Le solveur gère une distribution 1D ou 2D des blocs

• 1D sur les petits supernodes -> efficacité BLAS

• 2D sur les plus gros supernodes -> scalabilité

Critère de basculement entre les 2 distributions

1D block distribution

2D block distribution

1 2 3 4 5 6 7 8

1 2 3 4 5 5 6 7 8

51 2 3 4 5 6 7 8

4 41 2 2 3 86 7

3216 7 7

Repartionnement et processeurs candidats

Sopalin

graphe

globallocal

noeud ddl

solutiondistribuée

element

L’algorithme de factorisation parallèle

• A est Symétrique Définie Positive factorisation sans pivotage

• Algorithme supernodal de factorisation parallèle creuse L.Lt / L.D.Lt avec agrégation locale complète et distribution mixte 1D/2D.

BStruct(Lk*)

BStruct(L*k)

Graphe de tâches

Schéma de communication Limitation

mémoire

Réduction surcoût mémoireFactorisation

et résolution //

Nouveau schéma de communication

Algorithme de la factorisation //

FACTOR(k): factoriser le bloc diagonal k

Factoriser Akk en LkkLtkk;

BDIV(j,k): mis-à-jour Ljk

Résoudre LkkLjkt = At

BMOD(i,j,k): calculer la contribution de Lik pour le bloc Lij Calculer Cj=LikLjk

Si map(i,j) == p Alors Aij = Aij – Cj;

Sinon AUBij=AUBij + Cj;

Lik Lij

COMP1D(k): factoriser le bloc-colonne k et calculer toutes les contributions destinées aux blocs-colonnes de BCol(k)

Factoriser Akk en LkkLtkk;

Résoudre LkkLt* = At

Pour j BCol(k) Faire

Calculer C[j]=L[j]kLjkt;

Si map([j],j) == p Alors A[j]j = A[j]j – C[j];

Sinon AUB[j]j=AUB[j]j + C[j];

Algorithme de la factorisation //Pour n = 1 à NTp Faire

Selon (le type de Kp[n]) Faire

COMP1D: Recevoir et ajouter tous les AUB[k]k dans A[k]k;COMP1D(k);Phase_Envoi();

FACTOR: Recevoir et ajouter tous les AUBkk dans Akk;FACTOR(k);

envoyer Lkk à tous les processeurs dans map([k], k);

BDIV: Recevoir Lkk et recevoir et ajouter les AUBij pour Ajk;BDIV(j,k);

envoyer Fjt à tous les processeurs dans map([j], k);

BMOD: Recevoir Ljkt

BMOD(i,j,k); Phase_Envoi();

Structure de donnéestypedef struct SymbolCblk_ { INT fcolnum; // First column index INT lcolnum; // Last column index (inclusive) INT bloknum; // First block in column (diag.)} SymbolCblk;

typedef struct SymbolBlok_ { INT frownum; // First row index INT lrownum; // Last row index (inclusive) INT cblknum; // Facing column block INT levfval; // Level-of-fill value} SymbolBlok;

typedef struct SymbolMatrix_ { INT baseval; // Base value for numberings INT cblknbr; // Number of column blocks INT bloknbr; // Number of blocks SymbolCblk * restrict cblktab; // Array of column blocks SymbolBlok * restrict bloktab; // Array of blocks INT nodenbr; // Number of nodes in matrix} SymbolMatrix;

Structure de données

typedef struct SolverMatrix_ { SymbolMatrix symbmtx; SolverCblk * restrict cblktab; SolverBlok * restrict bloktab; INT coefnbr; INT ftgtnbr; FLOAT * restrict coeftab; FanInTarget * restrict ftgttab; int procnum; int procnbr; BlockTarget * restrict btagtab; INT btagnbr; BlockCoeff * restrict bcoftab; INT bcofnbr; Task * restrict tasktab; INT tasknbr; Ooc * restrict oocstr; UpDownVector updovct;} SolverMatrix;

typedef struct SolverCblk_ { INT stride; INT procdiag; INT cblkdiag;} SolverCblk;

typedef struct SolverBlok_ { INT coefind;} SolverBlok;

Structure de données#define COMP_1D 0#define DIAG 1#define E1 2#define E2 3#define DRUNK 4

typedef struct Task_ { INT taskid; INT prionum; INT cblknum; INT bloknum; INT ctrbcnt; BlockTarget * btagptr; INT indnum; INT tasknext;} Task;

Structure de donnéestypedef enum { FTGT_CTRBNBR = 0, FTGT_CTRBCNT, FTGT_PROCDST, FTGT_TASKDST, FTGT_BLOKDST, FTGT_PRIONUM, FTGT_FCOLNUM, FTGT_LCOLNUM, FTGT_FROWNUM, FTGT_LROWNUM, MAXINFO} FanInInfo;

typedef struct FanInTarget_ { INT infotab[MAXINFO]; FLOAT * coeftab;} FanInTarget;

Factorisation LU

Stockage de la partie U

U*kLkk

Transposition

Structure de données

typedef struct SolverMatrix_ { SymbolMatrix symbmtx; SolverCblk * restrict cblktab; SolverBlok * restrict bloktab; INT coefnbr; INT ftgtnbr; FLOAT * restrict coeftab; FLOAT * restrict ucoeftab; FanInTarget * restrict ftgttab; int procnum; int procnbr; BlockTarget * restrict btagtab; INT btagnbr; BlockCoeff * restrict bcoftab; INT bcofnbr; Task * restrict tasktab; INT tasknbr; Ooc * restrict oocstr; UpDownVector updovct;} SolverMatrix;

typedef struct SolverCblk_ { INT stride; INT procdiag; INT cblkdiag;} SolverCblk;

typedef struct SolverBlok_ { INT coefind;} SolverBlok;

Algorithme de la factorisation // FACTOR(k): factoriser le bloc diagonal k

Factoriser Akk en LkkUkk;

BDIV(j,k): mis-à-jour Ljk et Uik

Résoudre LkkUki = Aki;

Résoudre Ukk Lik = Aik;BMOD(i,j,k): calculer la contribution

de Lik pour le bloc Lij Calculer Cj=LikUkj;

Calculer Dj=LjkUki;Si map(i,j) == p Alors Aij = Aij – Cj;

Aji = Aji – Dj;Sinon AUBij=AUBij + Cj;

AUBji=AUBji + Dj;

Lik Lij

COMP1D(k): factoriser le bloc-colonne k et calculer toutes les contributions destinées aux blocs-colonnes de BCol(k)

Factoriser Akk en LkkUkk;

Résoudre LkkUk* = Ak* ;

Résoudre L*kUkk = A*k ;

Pour j BCol(k) Faire

Calculer C[j]=L[j]kUkj;

Calculer D[j]=LjkUk[j];

Si map([j],j) == p Alors A[j]j = A[j]j – C[j]; Aj[j]=Aj[j]-D[j];

Sinon AUB[j]j=AUB[j]j + C[j]; AUBj[j]=AUBj[j] + D[j];

Pour n = 1 à NTp Faire

Selon (le type de Kp[n]) Faire

COMP1D: Recevoir et ajouter tous les AUB[k]k dans A[k]k; Recevoir et ajouter tous les AUBk[k] dans Ak[k];

COMP1D(k);Phase_Envoi();

FACTOR: Recevoir et ajouter tous les AUBkk dans Akk;FACTOR(k);

envoyer Lkk et Ukk à tous les processeurs dans map([k], k);

BDIV: Recevoir Lkk et Ukk et recevoir et ajouter les AUBij pour Ajk et Aki;

BDIV(j,k);

envoyer Fjt à tous les processeurs dans map([j], k);

BMOD: Recevoir Uki et Lik

BMOD(i,j,k); Phase_Envoi();

Pivotage StatiqueFactorisation A=LU avec contrôle de l’amplitude de la diagonale

Si (|aii|) < 1Aε

Alors aii = 1Aε

Resoudre LUx = b

Iterer: xAbr

rdxLU :Resoudre

ii )bxA(

rmaxberr

inerSinon term

reitereret berr lastberret dx x xalors

lastberr)2

1berret ε(berr Si

Perspectives

• Interface externe

• Portabilité

Exposé GT 24/10/2002 Dimitri Lecas. ScotchFaxBlendSopalin graphe sequentielparallele global local...

Documents

Gestion d'une épidémie de gale dans trois établissements de Côte-d'Or G. Lecas, F. Adam, C. Belpois-Duchamp, A. Martin, L.S. Aho Glélé, M. Tiv

T. Masrour - cours dynamique des systèmes - vibrations -chapitre2-n ddl (1)

Qualité des données gérées avec un ORM. De UML au DDL, en

FILET DE SÉCURITÉ ANTI-CHUTE SANS NOEUD …...FILET DE SÉCURITÉ ANTI-CHUTE SANS NOEUD N820H FILET DE SÉCURITÉ À HAUTE TÉNACITÉ GRANDEUR DE LA MAILLE : 2 1/2" COULEUR : NOIR

Lecas G, Guerre G, Astruc K, Adam F, Belpois- Duchamp C, Martin … · Duchamp C, Martin A, Aho Glélé LS, Tiv M Soins de Ville Et. de Sant é Et. Médico-Social Prévalence infectés

Η SQL ως γλώσσα ερωτημάτωνvclass.uop.gr/modules/document/file.php/ITCOM324/SQL (SELECT) … · Η γλώσσα SQL Η SQL αποτελείται από: DDL (Data

Site Planning Guide - Oracle Cloud · soient exemptesd’erreurs et vous invite,lecas échéant, àlui en faire part parécrit. Si celogiciel, oula documentation quil’accompagne,estconcédé

Document de travail n° 22 · Modèle Mod1 (GLM mixte) Mod2 (GAM mixte) Mod3 Mod4 Mod5 Mod6 annee Estimation =0,0032 P=0,0189 ddl=1 P=0,0195 ddl=1 P=0,0204 ddl=1 P=0,025 ddl=1 P=0,033

Brochures Ddl Cerelog

Matériaux: /////Fabriquerun noeud papillon////...4. Assembler les pièces du noeud papillon à la machine au point droit en respectant une valeur de couture de 1cm. 5. Réduire

Brevet noeud - flambeaux.chflambeaux.ch/uploads/media/Noeud4.pdf · du jour où fut inventée la corde, le noeud était trouvé, probablement une demi-clé.” Dans son ... ( surtout

Exercices 1 DDL

DDL-900A MANUEL D’UTILISATION - Machine à coudre et

LES ATTESTATIONS ENTRANT DANS LE CADRE DE DDL EN 5 POINTS Colloque homologué 12C0419 CPFformation Présenté par Michel RIBOLLET

Etape 1 Etape 2infocapagde.free.fr/noeuds.pdf · Le noeud de longe Le noeud de longe Il est un principe auquel les cavaliers ne dérogent jamais : le noeud qui sert à attacher un

5TechniquesPour Finir“ Joliment”UnBracelet Coulissant · Àsavoir: àlafin, une"foislesurplusde filcoupé,avecquoifixerle noeud. • … Une##foisle# filcoupé,# il#faudralefixer#

Concertation Réaménagement du Noeud …lyonturin.eu/analyses/docs/Concertation noeud autoroute...Membre de la Coordination des opposants au Lyon-Turin. Concertation "Réaménagement

Βάηο Γνκέλσλdelab.csd.auth.gr/courses/dblab/dbLabIntro.pdf · κώδικα SQL-DDL 25 •Η απόκαε θααθπή 2νπ θώηθα SQL-DDL (Data Definition Language)

Technique de couléee ddl d - Renfert

vrilleau.netvrilleau.net/_iserv/dlfiles/dl.php?ddl=realiser-un-diaporama... · Author: vrilleau Created Date: 12/1/2012 11:05:16 AM