Upload
truongphuc
View
245
Download
0
Embed Size (px)
Citation preview
Simulation multi-échelles des solides par une approche coupléedynamique moléculaire/éléments finis. De la modélisation à la
simulation haute performance.
Guillaume ANCIAUX
Université Bordeaux IProjet ScAlApplix : INRIA Futurs et LaBRI
CEA-DAM Ile-de-France
6 juillet 2007
Guillaume ANCIAUX 6 juillet 2007 1 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Guillaume ANCIAUX 6 juillet 2007 2 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Introduction Guillaume ANCIAUX 6 juillet 2007 3 / 65
Introduction : contexte
Contexte :
Laser mégajoule et endommagement laserSimulation des matériaux, à différentes échelles :
microscopique (applications aux nano-technologies)macroscopique (applications industrielles)
Algorithmes parallèles et HPC Impact sur desoptiques de la LIL
Objectifs :1 Étude des mécanismes microscopiques sur objets de taille macroscopique.
Simulation de grands volumes de matièreSimulation des mécanismes microscopiques
2 Analyse des algorithmes de couplage
Introduction Contexte et objectifs Guillaume ANCIAUX 6 juillet 2007 4 / 65
Introduction : approches classiques (1)
Approche microscopique (dynamique moléculaire)
Md2q(t)
dt2= −∇V (q(t)) + f ext
V est un potentiel empirique (Lennard-Jones, EAM)
fi
Approche macroscopique (mécaniquedes milieux continus)
ρd2u(t)
dt2= divσ + f ext
σ dépend de la déformation et del’histoire du matériau.Discrétisation par éléments finis.
XΓt
Ω0
Ωt
Φt
Configuration actuelleConfiguration de référence
ΓuΓ0u
Γ0t
xt = X + u(t)
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 5 / 65
Introduction : approches classiques (2)
Avantages et limitations de la dynamique moléculaire (DM)
1 Bonne description de l’ensemble des mécanismes microscopiques(dislocations, phénomènes non réversibles)
2 Échelle spatiale : Un cristal de 1 µm3 de silicium contient de l’ordre de 1011
atomes3 Énormes volumes de données ∼ 6,5 Tera-octets par pas de temps pour 1011
atomes simulés.4 Échelle temporelle : Pas de temps = femto-seconde(10−15 s.)
Avantages et limitations des éléments finis (FE)
1 Permet de modéliser des objets macroscopiques2 Nécessite un maillage très fin afin de capturer l’information pertinente.3 Discontinuité (nouvelles surfaces), singularité (pointes de fissures), lois de
comportement empiriques
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 6 / 65
Introduction : approches classiques (2)
Avantages et limitations de la dynamique moléculaire (DM)
1 Bonne description de l’ensemble des mécanismes microscopiques(dislocations, phénomènes non réversibles)
2 Échelle spatiale : Un cristal de 1 µm3 de silicium contient de l’ordre de 1011
atomes3 Énormes volumes de données ∼ 6,5 Tera-octets par pas de temps pour 1011
atomes simulés.4 Échelle temporelle : Pas de temps = femto-seconde(10−15 s.)
Avantages et limitations des éléments finis (FE)
1 Permet de modéliser des objets macroscopiques2 Nécessite un maillage très fin afin de capturer l’information pertinente.3 Discontinuité (nouvelles surfaces), singularité (pointes de fissures), lois de
comportement empiriques
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 6 / 65
Introduction : approches classiques (2)
Avantages et limitations de la dynamique moléculaire (DM)
1 Bonne description de l’ensemble des mécanismes microscopiques(dislocations, phénomènes non réversibles)
2 Échelle spatiale : Un cristal de 1 µm3 de silicium contient de l’ordre de 1011
atomes3 Énormes volumes de données ∼ 6,5 Tera-octets par pas de temps pour 1011
atomes simulés.4 Échelle temporelle : Pas de temps = femto-seconde(10−15 s.)
Avantages et limitations des éléments finis (FE)
1 Permet de modéliser des objets macroscopiques2 Nécessite un maillage très fin afin de capturer l’information pertinente.3 Discontinuité (nouvelles surfaces), singularité (pointes de fissures), lois de
comportement empiriques
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 6 / 65
Introduction : approches classiques (2)
Avantages et limitations de la dynamique moléculaire (DM)
1 Bonne description de l’ensemble des mécanismes microscopiques(dislocations, phénomènes non réversibles)
2 Échelle spatiale : Un cristal de 1 µm3 de silicium contient de l’ordre de 1011
atomes3 Énormes volumes de données ∼ 6,5 Tera-octets par pas de temps pour 1011
atomes simulés.4 Échelle temporelle : Pas de temps = femto-seconde(10−15 s.)
Avantages et limitations des éléments finis (FE)
1 Permet de modéliser des objets macroscopiques2 Nécessite un maillage très fin afin de capturer l’information pertinente.3 Discontinuité (nouvelles surfaces), singularité (pointes de fissures), lois de
comportement empiriques
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 6 / 65
Introduction : approches classiques (2)
Avantages et limitations de la dynamique moléculaire (DM)
1 Bonne description de l’ensemble des mécanismes microscopiques(dislocations, phénomènes non réversibles)
2 Échelle spatiale : Un cristal de 1 µm3 de silicium contient de l’ordre de 1011
atomes3 Énormes volumes de données ∼ 6,5 Tera-octets par pas de temps pour 1011
atomes simulés.4 Échelle temporelle : Pas de temps = femto-seconde(10−15 s.)
Avantages et limitations des éléments finis (FE)
1 Permet de modéliser des objets macroscopiques2 Nécessite un maillage très fin afin de capturer l’information pertinente.3 Discontinuité (nouvelles surfaces), singularité (pointes de fissures), lois de
comportement empiriques
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 6 / 65
Introduction : Approche multi-échelle
Idée : utilisation des avantages des deux modèles
Le modèle continuPermet de gérer des domaines de grande taille.
Modèle atomiqueBonne description des mécanismes microscopiques.
Comment coupler ces deux modèles ?
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 7 / 65
Introduction : Les différentes approches de couplage
Approche couplage jointif : seamless
Macroscopic, Atomistic and Ab initio Dynamics (MAAD)(Abraham et al. 1998)
QC-method (Tadmor et al. 1996)
CGMD (Coarse Grained Molecular Dynamics)Agglomération de la matrice de raideur
Approche avec recouvrement : Bridging
Bridging Scale Method (Liu)Utilisation des fonctions de Green : prédiction des positionsatomiquesDépendance forte à la périodicité cristalline
Bridging Method (T. Belytschko & S. Xiao)Pondération spatiale de l’énergieAucune hypothèse sur la structure de l’échantillon simulé
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 8 / 65
Introduction : Les différentes approches de couplage
Approche couplage jointif : seamless
Macroscopic, Atomistic and Ab initio Dynamics (MAAD)(Abraham et al. 1998)
QC-method (Tadmor et al. 1996)
CGMD (Coarse Grained Molecular Dynamics)Agglomération de la matrice de raideur
Approche avec recouvrement : Bridging
Bridging Scale Method (Liu)Utilisation des fonctions de Green : prédiction des positionsatomiquesDépendance forte à la périodicité cristalline
Bridging Method (T. Belytschko & S. Xiao)Pondération spatiale de l’énergieAucune hypothèse sur la structure de l’échantillon simulé
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 8 / 65
Introduction : Approche par recouvrement
Difficultés numériques :
Ne pas compter plusieurs foisl’énergie dans la zone derecouvrement
Différentes échelles detemps/espace
Réflexions des ondes acoustiques
Zon
e at
omiq
ueZ
one
élém
ents
fini
s
Zon
e de
rec
ouvr
emen
t
Introduction Méthodes multi-échelles Guillaume ANCIAUX 6 juillet 2007 9 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Notre méthode Guillaume ANCIAUX 6 juillet 2007 10 / 65
Couplage discret/continu
La Bridging Method est introduite par T.Belytschko & S. Xiao
Idée :
Formulation Hamiltonienne(énergie) et schéma d’intégration(Velocity Verlet) communs pour lesdeux modèles
Pondération de l’énergie des deuxmodèles pour lisser la transition desphénomènes dynamiques.
Imposer des déplacementséquivalent entre les deux domainespour “Recoller” les modèles parl’application de contraintes(multiplicateurs de Lagrange)
Zone Atomique
Zone mécanique continue
l(X)
R
0 1
Zone de recouvrement
ΩA ΩR ΩC
ΓR α(X)
Notre méthode Formulation initiale Guillaume ANCIAUX 6 juillet 2007 11 / 65
Formulation par un Hamiltonien pondéré
La Bridging Method décrite par S. Xiao se base sur une formulation Hamiltoniennepondérée spatialement.
E = EA + EC + g(qΩR , uΩR )λ gi =X
I
ϕI(Xi)uI − qi = 0
EA =X
qi∈ΩA|ΩR
Ei(qΩA) +X
qi∈ΩR
(1 − α(Xi))Ei(qΩR )
EC =X
e∈ΩC|ΩR
Ee(uΩC ) +
Z
ΩRα(X)EC
pot(uΩR )dX
La contrainte est appliquée par résolution du système suivant :
∀i, gi(u(Xi) − qi) = y(Xi) − xi = 0 =⇒ Hλ = rhs
où H est la matrice des contraintes
Notre méthode Formulation initiale Guillaume ANCIAUX 6 juillet 2007 12 / 65
Forces fantômes
Il existe une force résiduelle Ri due au couplage.Nous avons mis en évidence son existence dans un contexte de la chaînemonoatomique 1D couplée avec un maillage homogène de pas h.
I−1nn0
R
Pondération
nN−2I+1
nnI
Ie
I−1e
r0
h
La pondération énergétique modifie l’expression des forces :
FI =
Z
ΩRα(X)
∂ECpot(uΩR )
∂uIdX
f i =X
qk∈ΩA
»
1 −α(Xi) + α(Xk )
2
–
∂EApot(q i , qk )
∂q i.
Notre méthode Effets indésirables Guillaume ANCIAUX 6 juillet 2007 13 / 65
Forces fantômes
Dans une situation cristalline homogène et un domaine éléments finis sansdéformation :
Atome central (A) : force nulle
Atome au bord du recouvrement (B,A’) : force résiduelle due à la formulationnon locale des interactions atomiques et la pondération spatiale.
R
1−1
R
R
AB A’
Si Rcut ≥ 2r0, la force résiduelle est non nulle pour des atomes proches desbords de la zone de couplage et particulièrement pour des atomes hors de lazone de couplage . La contrainte de Lagrange ne pourra donc en aucun cascorriger cette force résiduelle.
Après relaxation, le cristal est déformé aux bords de la zone de couplage.
Notre méthode Effets indésirables Guillaume ANCIAUX 6 juillet 2007 14 / 65
Modification du schéma d’intégration
Approximation : négliger les forces fantômes .
FI =
Z
ΩRα(X)
∂ECpot(uΩR )
∂uIdX ≃ α(XI)
Z
ΩR
∂ECpot(uΩR )
∂uIdX = α(XI)FI
f i =X
qk∈ΩA
»
1 −α(Xi) + α(Xk )
2
–
∂EApot(q i , qk )
∂q i≃ (1 − α(Xi))
X
qk∈ΩA
∂EApot(q i , qk )
∂q i
= (1 − α(Xi))f i
Nouvelle expression de l’équation du mouvement pour le système couplé :
8
<
:
MI uI = −FI + 1α(XI )
P
kλk
∂gk∂uI
mi d i = f i + 1(1−α(Xi ))
P
kλk
∂gk∂di
Nous pouvons majorer l’erreur commise sur le calcul des forces par un termeproportionnel à l’inverse de la taille du recouvrement.
Notre méthode Effets indésirables Guillaume ANCIAUX 6 juillet 2007 15 / 65
Modification du schéma d’intégration
Approximation : négliger les forces fantômes .
FI =
Z
ΩRα(X)
∂ECpot(uΩR )
∂uIdX ≃ α(XI)
Z
ΩR
∂ECpot(uΩR )
∂uIdX = α(XI)FI
f i =X
qk∈ΩA
»
1 −α(Xi) + α(Xk )
2
–
∂EApot(q i , qk )
∂q i≃ (1 − α(Xi))
X
qk∈ΩA
∂EApot(q i , qk )
∂q i
= (1 − α(Xi))f i
Nouvelle expression de l’équation du mouvement pour le système couplé :
8
<
:
MI uI = −FI + 1α(XI )
P
kλk
∂gk∂uI
mi d i = f i + 1(1−α(Xi ))
P
kλk
∂gk∂di
Nous pouvons majorer l’erreur commise sur le calcul des forces par un termeproportionnel à l’inverse de la taille du recouvrement.
Notre méthode Effets indésirables Guillaume ANCIAUX 6 juillet 2007 15 / 65
Modification du schéma d’intégration
Approximation : négliger les forces fantômes .
FI =
Z
ΩRα(X)
∂ECpot(uΩR )
∂uIdX ≃ α(XI)
Z
ΩR
∂ECpot(uΩR )
∂uIdX = α(XI)FI
f i =X
qk∈ΩA
»
1 −α(Xi) + α(Xk )
2
–
∂EApot(q i , qk )
∂q i≃ (1 − α(Xi))
X
qk∈ΩA
∂EApot(q i , qk )
∂q i
= (1 − α(Xi))f i
Nouvelle expression de l’équation du mouvement pour le système couplé :
8
<
:
MI uI = −FI + 1α(XI )
P
kλk
∂gk∂uI
mi d i = f i + 1(1−α(Xi ))
P
kλk
∂gk∂di
Nous pouvons majorer l’erreur commise sur le calcul des forces par un termeproportionnel à l’inverse de la taille du recouvrement.
Notre méthode Effets indésirables Guillaume ANCIAUX 6 juillet 2007 15 / 65
Qualité du couplage
Condition initiale
La qualité du couplage dépendde :
1 Taille du recouvrement2 Taille des éléments3 Pondération du premier
élément
Coupla
ge n
on a
dapt
ée
Couplage adapté
=⇒ étude de la fonction de transfertNotre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 16 / 65
Qualité du couplage
Condition initiale
La qualité du couplage dépendde :
1 Taille du recouvrement2 Taille des éléments3 Pondération du premier
élément
Coupla
ge n
on a
dapt
ée
Couplage adapté
=⇒ étude de la fonction de transfertNotre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 16 / 65
Qualité du couplage
Condition initiale
La qualité du couplage dépendde :
1 Taille du recouvrement2 Taille des éléments3 Pondération du premier
élément
Coupla
ge n
on a
dapt
ée
Couplage adapté
=⇒ étude de la fonction de transfertNotre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 16 / 65
Qualité du couplage
Condition initiale
La qualité du couplage dépendde :
1 Taille du recouvrement2 Taille des éléments3 Pondération du premier
élément
Coupla
ge n
on a
dapt
ée
Couplage adapté
=⇒ étude de la fonction de transfertNotre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 16 / 65
Qualité du couplage
Condition initiale
La qualité du couplage dépendde :
1 Taille du recouvrement2 Taille des éléments3 Pondération du premier
élément
Coupla
ge n
on a
dapt
ée
Couplage adapté
=⇒ étude de la fonction de transfertNotre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 16 / 65
Caractérisation du taux de réflexion des ondes
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 100
0.00%
1.00%
2.00%
3.00%
4.00%
5.00%
6.00%
7.00%
8.00%
9.00%
10.00%
Pou
rcen
tage
de
l’éne
rgie
réf
léch
ieda
ns le
dom
aine
ato
miq
ue
de la fréquence injectéeCoefficients de réflexion en fonction
1361224
Longueur d’onde adimentionnelle (multiple de r0)
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 17 / 65
Équation du mouvement couplé (1)
On souhaite trouver l’équation de la dynamique qui est calculé dans une zonede couplage
Utilisation du schéma d’intégration velocity verlet
Forme matricielle de l’accroissement des vitesses :
mq(t + ∆t) − q(t)
∆t= f (t) + z1→2F (t) + z1→1f (t) + θ
−1H−1 g(u(t), q(t))∆t
Mu(t + ∆t) − u(t)
∆t= F + z2→1F (t) + z2→1 − β
−1AtH−1 g(u(t), q(t))∆t
avec : f (t) = 12 (f (t) + f (t + ∆t)), Aij = ϕj(Xi) et θ et β les matrices de
pondérations et la matrice de contrainte Hij =P
J ϕJ (Xi )ϕJ (Xj )
α(XJ )MJ− 1
αi miδij
La contrainte n’est pas nulle lorsque l’on utilise une approche condenséeHij = δij
P
k Hik
Il faut pouvoir maîtriser le dernier terme pour faire tendre ∆t vers 0 et ainsitrouver une équation de la dynamique.
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 18 / 65
Équation du mouvement couplé (2)
Nous avons montré sous certaines conditions et notament concernant lesvaleurs propres de la matrice Q = (I − HH−1) :
g(u(t + n∆t), q(t + n∆t)) =∆t2
nX
i=1
Q iF(t)
H(t) = lim∆t → 0g(u(t), q(t))
∆t= (HH−1
− I)
∆t = 0 =⇒ minimisation de l’influence du passé de la contrainte.
Après linéarisation des forces on peut écrire l’équation du mouvement sous laforme d’un système matriciel :
„
m 00 M
« „
du
«
=
„
C11 C12
C21 C22
« „
du
«
On étudiera alors les modes admis par cet oscillateur harmonique sansfriction.
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 19 / 65
Étude des modes (R = 12h, h = 6r0)P
ouvo
ir de
tran
smis
sion
20 r0 8 r0 4 r0 2 r0
Fréquence exprimée en radian par seconde
Modes modèle de couplagecas condensé
Modes modèle de couplage
Modes chaine atomique
Modes éléments finis
1e+12 1e+13 1e+11
1e−06
1e−05
1e−04
0.001
0.01
0.1
1
1e+13 1e+12 1e+11
1e−07 1e−08
1e−06 1e−05 1e−04 0.001 0.01 0.1
1 10
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 20 / 65
Étude des modes (R = 12h, h = 6r0)P
ouvo
ir de
tran
smis
sion
20 r0 8 r0 4 r0 2 r0
Fréquence exprimée en radian par seconde
cas condenséModes modèle de couplage
Modes modèle de couplage
Modes chaine atomique
Modes éléments finis
1e+12 1e+13 1e+11
1e−06
1e−05
1e−04
0.001
0.01
0.1
1
1e+13 1e+12 1e+11
1e−07 1e−08
1e−06 1e−05 1e−04 0.001 0.01 0.1
1 10
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 20 / 65
Conclusion de l’étude 1D
Nous avons fait une approximation concernant le calcul des forces, ce quinous affranchi des forces fantômes
Nous avons fait des mesures du taux de réflexion d’ondes induit par notreméthode à partir de simulations.
Nous avons exhibé l’équation de la dynamique qui est résolue dans la zonede couplage.
Nous avons montré que la condensation de la matrice induisait une forcesupplémentaire
Nous avons pu faire le lien entre cette fréquence de coupure et les “pics” deréflexions observés et notament la dépendance forte avec la taille deséléments finis.
Nous avons montré le décalage de la fréquence de coupure d’une zone decouplage et particulièrement dans le cas où l’on condense la matrice decontrainte.
En revanche :
La formulation linéaire sous forme d’oscillateur harmonique ne permet pas dequantifier la réponse des modes face à des stimulations
Notre méthode Analyse 1D du modèle de couplage Guillaume ANCIAUX 6 juillet 2007 21 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Modèles informatiques Guillaume ANCIAUX 6 juillet 2007 22 / 65
Modèles informatiques et structures de données
Application du couplage :
Résolution d’un système linéaireHλ = rhs ou bien calcul direct àl’aide de H
Le second membre à pour valeur :rhsi =
P
J uJϕJ(Xi) − qi
Difficultés algorithmiques :
Calcul efficace des fonctions debase éléments finis dans la zone derecouvrement (ϕI(Xi)).
Besoin de structures de donnéesadaptées à l’interface
Garder la cohérence des structuresde données
Zon
e at
omiq
ueZ
one
élém
ents
fini
s
Zon
e de
rec
ouvr
emen
t
Modèles informatiques Structures de données Guillaume ANCIAUX 6 juillet 2007 23 / 65
Structure de données pour l’interpolation rapide
Maintient d’une association entrechaque atome et l’élément qui lecontient (optimisation de son calculpar des boîtes de verlet)
Pré-calculs des fonctions de basespour tout site atomique ϕI(Xi)
Les fonctions de bases sontstockées dans une structure dedonnée appropriée
Cela permet, grâce àl’association atome/élément,d’accéder en temps constantaux champs interpolés.
Element a
Element b
Element d
Element e
Element f
Element c
...........
i
i+1
I
I+1
I+2I+4
I+5
I+6
I+3
I I+1 I+6
1
n a
21 3
2
Indirection locale −> globaledes atomes
indirection locale −> globale des noeuds de maillage
Associationatome −> élement
ϕI+1(Xi ) ϕI+2(Xi )ϕI (Xi )
Modèles informatiques Structures de données Guillaume ANCIAUX 6 juillet 2007 24 / 65
Placement des codes sur les processeurs
Stratégie : deux ensembles de processeurs distincts pour chaque modèle
Pondération MD Pondération FE
de couplage
(Stamp, Lammps)
Dynamique moléculairemilieux continusMécanique des
(LibMesh)
Interaction
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 25 / 65
Diagramme du couplage de deux codes parallèles (SPMD)
Mécanique continueDynamique moléculaire
nonnon
oui
Initialisation de lazone de couplage
InitialisationT ai InitialisationT c
i
Calcul des ForcesT as (2)Calcul des forcesT a
s (2)
T Ri
Couplage : Application des contraintes de LagrangeT Rc
Mise à jour des vitessesT as (3)
Mise à jour des positionsT as (1)
Mise à jour des vitessesT cs (3)
Mise à jour des positionsT cs (1)
T = Tmax ?
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 26 / 65
Détails de l’étape de couplage
Mécanique continueDynamique moléculaire
Sommation des contributions
Tc(1)P
J uJϕ(Xi ) − qi = rhsi
Correction des vitesses Correction des vitesses
qi := qi −∆t
(1−αi )miλi uI := uI + ∆t
αI MI
Pmj=1 λj ϕI (Xj )T a
c (4) T cc (3)
Calcul de la contribution au RHS Calcul de la contribution au RHS
T ac (1) T c
c (1)−qiP
J uJϕ(Xi )
T ac (3) T c
c (3)λi = rhsi/Hi λi = rhsi/Hi
Calcul des contraintes Calcul des contraintes
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 27 / 65
Décomposition de domaine des codes sous jacents
Décomposition en boîtes ou macro-boîtesAutorise les migrations d’atomes d’un processeur à l’autre
Décomposition par partitionnement de graphe (Métis, Scotch...)
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 28 / 65
Redistribution des données du système de contrainte (1)
Pour illustrer nos explications, on considère la distribution suivante :
5 processeurs dédiés à la dynamique moléculaire et 2 processeurs dédiés à lamécanique des milieux continus
domaine continu
recouvrement
domaine atomique
P1
P6
P7
P2
P3P4
P5
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 29 / 65
Redistribution des données du système de contrainte (2)
Dans le cas où le placement des modèles est fait sur deux ensembles deprocesseurs différents : chacun d’eux possède un vecteur parallèlereprésentant le vecteur des inconnues. Ce dernier est donc dupliq ué.
P6
P7
P1
P2
P3
P4
P5
P1
P2
P3
P4
P5
Le schéma de redistribution peut être entrelacé selon le positionnement desatomes en mémoire.
Renumérotation des multiplicateurs de Lagrange permet de minimiser lescommunications
Suites aux migrations le schéma de communication garde sa cohérence parun protocole réseau dédié
Modèles informatiques Parallélisation Guillaume ANCIAUX 6 juillet 2007 30 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Résultats Guillaume ANCIAUX 6 juillet 2007 31 / 65
Environnement de couplage LibMultiScale
Développement en C++Codes sous-jacents de dynamique moléculaire
Stamp (CEA), testé avec le potentiel Lennard Jones ajusté pour l’argon(1D,2D,3D), et avec le potentiel EAM ajusté pour un cristal de Cuivre enconfiguration CFC.Lammps (Sandia), testé avec le potentiel Lennard Jones ajusté pour l’argon (2Det 3D) et avec EAM ajusté pour un cristal de cuivre en configuration CFC.
Codes sous-jacents de mécanique des milieux continusElements finis pour l’élasticité non linéaire avec un comportement basé sur larègle de Cauchy-Born.Implémentation à partir de la librairie libMesh.
Plateformes de calcul utiliséesGrid5000 (site de Bordeaux et Sophia-Antipolis), jusqu’à 100 processeurs AMDOpterons (IBM eSeries) avec interconnection réseau Myrinet et Infiniband.Linux (Debian, Gentoo, Fedora), AIX
Résultats Guillaume ANCIAUX 6 juillet 2007 32 / 65
Propagation d’onde 2D (1)
Cristal d’argon à 0 Kelvin (Lennard Jones,296 400 atomes)
Maillage structuré (2 × 1716 nœuds, 3250éléments), éléments P1, Cauchy-Born
Conditions limites périodiques selon l’axe X
Condition initiale de déplacementgaussienne (A.e(−(||x||−r)2/τ) de largeurτ = 67 Å)
36 processeurs, 2 secondes par pas detemps
Résultats Cas de propagation d’ondes Guillaume ANCIAUX 6 juillet 2007 33 / 65
Propagation d’onde 2D (2)
Confirmation de la problématique fréquentielle :
1,73 3,46 6,93 13,86 27,71 55,430%
1%
2%
3%
4%
5%
6%
7%
8%
9%
10%
Energie réfléchie sur la propagation d’une
initi
ale
réflé
chie
dan
s la
zon
e M
DP
ourc
enta
ge d
e l’o
nde
Taille des éléments en distance inter−atomique
gaussienne de largeur de bande de 67 Å
21,21 31,81 42,42 53,02 63,63 74,23 84,84 95,44 106,05 116,65 127,26 137,86 148,47 159,07 169,67 265,120 %
1 %
2 %
3 %
4 %
5 %
6 %
7 %
8 %
9 %
10 %
Å
en fonction de la taille du recouvrementVariation de l’énergie réfléchie
pour
cent
age
de l’
onde
inje
ctée
Ond
e ré
fléch
ie
Taille du recouvrement en
Résultats Cas de propagation d’ondes Guillaume ANCIAUX 6 juillet 2007 34 / 65
Propagation d’onde 3D (1)
Cristal de Cuivre à température nulle(Potentiel EAM, 1 024 000 atomes).
Maillage structuré (2× 9 216 éléments,10 625 nœuds), éléments P1,Cauchy-Born.
Conditions limites périodiques selonl’axe X et Z .
Condition initiale de déplacementgaussienne (A.e(−(||x||−r)2/τ) delargeure τ = 67 Å.
Résultats Cas de propagation d’ondes Guillaume ANCIAUX 6 juillet 2007 35 / 65
Propagation d’onde 3D (2)
Perturbation de la dynamique par les ondes miroirs dues aux conditions limites.
Résultats Cas de propagation d’ondes Guillaume ANCIAUX 6 juillet 2007 36 / 65
Propagation de fissure dans un cristal d’argon (2D)
Boite de 600 Å × 800 Å
91 556 atomes(Lennard Jones)
1 129 nœuds, 2 082 éléments.
Conditions limites périodiques selonl’axe X .
penny shaped crack : occlusion crée enretirant des atomes (ellipsoïde 50 Å ×
2,5 Å).
Perturbation de la dynamique par lesondes miroirs dues aux conditionslimites.
Résultats Cas de propagation de fissure Guillaume ANCIAUX 6 juillet 2007 37 / 65
Propagation de fissure dans un cristal de Cuivre (3D)
Cristal de Cuivre à température nulle, potentiel EAM tabulé (2 829 575atomes).Maillage non structuré avec déraffinement, éléments P1, Cauchy-Born. (575679 éléments et 92 814 nœuds)Zone de couplage ellipsoïdale pour éviter des conditions limites périodiquespenny crack : occlusion crée en retirant des atomes (ellipsoïde 25 Å, 1.8 Å et1.8 Å).Modèle toujours en cours de développement (extraction des données, ...)
Résultats Cas de propagation de fissure Guillaume ANCIAUX 6 juillet 2007 38 / 65
Mesures de performances du modèle de propagation 3D
15
20
25
30
35
40
45
50
55
60
10 15 20 25 30 35 40
Tem
ps e
n se
cond
es p
our
20 p
as d
e te
mps pour des rapports de distributions distincts
en fonction de nombre de processeursTemps de simulation couplée
Nombre de processeurs
ratio 1/8ratio 1/4ratio 1/3ratio 1/2ratio 1
Résultats Mesures de performances Guillaume ANCIAUX 6 juillet 2007 39 / 65
Mesures de performances du modèle de propagation 3D
7570
65605550454035302520151050
464442403836343230282624222018161412108642Tem
ps e
n se
cond
es p
our
50 p
as d
e te
mps
Nombre de processeurs dédiés à la dynamique moléculaire
Waiting
Total
Temps de simulation des différentes tâchessur 48 processeurs
TC
T AS
T CS
Résultats Mesures de performances Guillaume ANCIAUX 6 juillet 2007 40 / 65
Mesures de performances du modèle de propagation 2D
Résultats Mesures de performances Guillaume ANCIAUX 6 juillet 2007 41 / 65
Plan
1 IntroductionContexte et objectifsMéthodes multi-échelles
2 Notre méthodeFormulation initialeEffets indésirablesAnalyse 1D du modèle de couplage
3 Modèles informatiquesStructures de donnéesParallélisation
4 RésultatsCas de propagation d’ondesCas de propagation de fissureMesures de performances
5 Conclusion
Conclusion Guillaume ANCIAUX 6 juillet 2007 42 / 65
Conclusion
Etude approfondie de la Bridging MethodContrôle des forces fantômesFormulation du couplage sous forme d’un oscillateur harmoniqueÉtude spectrale du couplageRésultats numériques
Conception du prototype LibMultiScaleStructure de données adaptées à l’interpolation rapideStratégie de distribution du couplage pour des codes parallèlesTraitement des migrations atomiquesGénération de graphes au format du partionneur de graphe ScotchComposants utiles aux cas tests (Visualisation, stimulation, etc...)
Conclusion Guillaume ANCIAUX 6 juillet 2007 43 / 65
Perspectives
ModélisationGénéralisation de l’étude spectrale aux dimensions 2 et 3.Enrichissement du modèle harmonique afin de modéliser les modificationsd’amplitudes des réflexions.Étude du comportement du couplage pour un matériau amorphe.Intégration à pas de temps multiples.Simulation à températures finies.
Modèles informatiquesAmélioration de la préparation du couplage (interface graphique)Automatisation de la décomposition de domainesApproche multi-thread du placement des différentes tâches.Redistribution de la ShapeMatrix.
Conclusion Guillaume ANCIAUX 6 juillet 2007 44 / 65
Fonction de pondération d’ordre 2
Position centrale (A) : fi = (1 − α(Xi))fi −r02R
Pi−1k=i−µ,k 6=i(k − i)fi,k
Position au bords du recouvrement (B,A’) :f Ri = (1 − α(Xi))fi −
r02R
Pi+µk=i+2(k − i − 1)fi,k
Fonction de pondération non linéaire.
f Ri = (1−α(Xi))fi − 1
2
Pi+µk=−µ,k 6=0
h
Ppj=0
α(2j+1)(i r0)(2j+1)!
r 2j+10 k2j+1
i
fi,k+i +R(r0k)fi,i+k
Fonction : α(x) = −2(x/R)3 + 3(x/R)2
=⇒ fi = (1 − α(Xi ))fi +2r2
0
R2[(−3i2r0/R + 3i)
µX
k=1
kf0, k − r0/Rµ
X
k=1
k3f0,k ]
Conclusion Guillaume ANCIAUX 6 juillet 2007 45 / 65
Introduction : approche atomistique
Simulation de dynamique moléculaire :
Md2x(t)
dt2= −VM(x(t))
où VM est un potentiel empirique (Lennard-Jones, EAM, Coulomb)Description fine du système étudié.Tous les phénomènes de structures sont capturés (dislocations, relaxations ducristal, phénomènes non réversibles)
Équipes :
A. Nakano (Louisiana State University)
H. Gao (Max Planck Institute for Metals Research)
S. Plimpton (Sandia)
G. Zerah (CEA/DPTA)
Conclusion Guillaume ANCIAUX 6 juillet 2007 46 / 65
Intégration standard des modèles : LeapFrog sous contrainte
(T as ) Intégration MD
Calcul des forcesf n+1i
dn+1i = dn+1/2
i + ∆t2mi
f n+1i
dn+1/2i = dn
i + ∆t dn+1/2i
dn+1/2i = dn
i + ∆t2mi
f ni
(T cs ) Intégration FE
Calcul des forcesF n+1i
un+1/2i = un
i + ∆t un+1/2i
un+1/2i = un
i + ∆t2Mi
F ni
un+1i = un+1/2
i + ∆t2Mi
F n+1i
Application de la contrainte
Conclusion Guillaume ANCIAUX 6 juillet 2007 47 / 65
Système de contraintes
La contrainte : ∀i, gi(y(Xi) − qi) = y(Xi) − xi = 0 =⇒ Aλ = rhs avec :
Aij =
∑J ϕJ(Xi)ϕJ(Xj)
αJMJ−
1αimi
δi ,j
rhsi =∑
J
yJϕJ(Xi) − xi
A peut être condensée sur sa diagonale =⇒ Ai =P
j Ai,j
On corrige alors les vitesses :
yI = yI +∆t
αIMI
X
j
λjϕI(Xj) xi = xi −∆t
(1 − αi)miλi
Remarque : Il doit être notifié que pour que le système ne soit pas singulier, lafonction de pondération ne doit pas prendre la valeur nulle.
Conclusion Guillaume ANCIAUX 6 juillet 2007 48 / 65
Système de mesure du taux de réflexions
Modèle 1D constitué du couplage entre une chaîne d’atome d’argon disposésà l’équilibre et d’un maillage de pas h homogène.
72 r0 72 r0
416 r0
400 r0
416 r0
Stimulation du modèle atomique par une fonction de déplacement avec unspectre maîtrisé.
−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
−15 −10 −5 0 5 10 15
L=1L=3L=6
Après un nombre suffisant de pas de temps, on mesure l’énergie contenuedans la zone atomique, zone de couplage exclue.
Comparaison avec le résultat obtenu par une simulation de dynamiquemoléculaire sur un modèle plus grand avec des conditions limites périodiques.
Conclusion Guillaume ANCIAUX 6 juillet 2007 49 / 65
Caractérisation du taux de réflexion des ondes (3)
−101.10
−51.10
−31.10
−21.10
−11.10
Coefficients de réflexion en fonctionde la fréquence injectée
dans
le d
omai
ne a
tom
ique
Longueur d’onde adimentionnelle (multiple de r0)
18 %
12 %
10 %
8 %
4 %
0 %
6 %
2 %
16 %
14 %
2 4 6 8 16 18 2010 12 14 22 24 26 28 30 32 34 36
Pou
rcen
tage
de
l’éne
rgie
réf
léch
ie
Conclusion Guillaume ANCIAUX 6 juillet 2007 50 / 65
Équation du mouvement couplé : cas non condensé
Dans ce cas, la contrainte est résolue exactement et donc g(u(t), q(t)) = 0pour tout t .On peut donc passer à la limite lorsque le pas de temps tend vers zéro pourobtenir l’équation du mouvement couplé suivante :
md(t) = f (t) + θ−1H−1AM−1F (t) − θ−1H−1m−1f (t)Mu(t) = F (t) − β−1At H−1AM−1F (t) + β−1At H−1m−1f (t).
Si on linéarise les forces, alors F (t) = K FE u(t) et f (t) = K Ad(t). On obtientalors :
md(t) = (I − θ−1H−1m−1)K Ad(t) + θ−1H−1AM−1K FE u(t)Mu(t) = (I − β−1AtH−1AM−1)K FE u(t) + β−1AtH−1m−1K Ad(t).
Ce qui peut aussi être écrit sous la forme d’un système matriciel :
„
m 00 M
« „
du
«
=
„
B11 B12
B21 B22
« „
du
«
.
où B11 = (I − θ−1H−1m−1)K A, B12 = θ−1H−1AM−1K FE ,B21 = β−1AtH−1m−1K A et B22 = (I − β−1At H−1AM−1)K FE .
Conclusion Guillaume ANCIAUX 6 juillet 2007 51 / 65
Équation du mouvement couplé : cas condensé (1)
Dans ce cas, la contrainte n’est plus résolue exactement car on utilise unematrice de contrainte modifiée H. Nous avons montré par récurrence lapropriété suivante :
∀(t , ∆t) ∈ R2, ∀n ∈ N
g(u(t + n∆t),q(t + n∆t)) =
∆t2
nX
i=1
Q in
AM−1 [F (t + ∆t(n − i)) + F (t + ∆t(n − i + 1))]
−m−1 [f (t + ∆t(n − i)) + f (t + ∆t(n − i + 1))]o
où Q = (I − HH−1).L’expression de la contrainte peut donc être assimilée à une convolution entrela fonction
F(t) = AM−1 [F (t) + F (t + ∆t)] − m−1 [f (t) + f (t + ∆t))]
et la matrice Q dont les valeurs propres sont particulièrement importantespour connaître l’influence de « l’historique », mais aussi la stabilité dusystème.
Conclusion Guillaume ANCIAUX 6 juillet 2007 52 / 65
Étude spectrale
La forme des équations de mouvement linéarisées sont celle d’un oscillateurharmonique.
Il convient naturellement d’étudier les modes de cet oscillateur par l’étude desvaleurs propres et des vecteurs propres des matrices suivantes :
„
m−1B11 B12
B21 M−1B22
« „
m−1C11 C12
C21 M−1C22
«
La solution de ce système s’écrit comme une combinaison linéaire des N
modes ajoutée à une solution particulière liée ici à une stimulationharmonique de fréquence ω :
d(t) = V Ae−iωt +PN
k=1 ck V Aωk
e−iωk t
u(t) = V Ce−iωt +PN
k=1 ck V Cωk
e−iωk t
En l’absence de forces de friction, chaque mode, s’il est stimulé, amènel’oscillateur à la résonance.
En fait, Dans ce cas précis le modèle sortirait du régime linéaire et invalideraitnotre approche : nous ne nous intéresserons qu’aux modes et non à leurréponses face à des stimulations.
Conclusion Guillaume ANCIAUX 6 juillet 2007 53 / 65
Confrontation des modes majeurs avec les résultats numériques
Dans un premier temps, on s’intéresse uniquement aux modes de valeursabsolue les plus importants.
On les compare au modes de la chaîne atomique et du maillage homogène.
pas FE h 1er Mode propre couplage Mode propre FE Mode propre MD1r0 2, 14.1013 (λ = 2r0) 3,17% 4,06%3r0 9, 98.1012 (λ = 6, 72r0) -26,25% 123,55%6r0 5, 05.1012 (λ = 13, 7r0) -27,52% 341,77%
12r0 2, 42.1012 (λ = 28, 8r0) -25,62% 823,20%24r0 1, 12.1012 (λ = 62, 2r0) -23,83% 1895,31%
Les modes correspondent aux « pics » de réflexions mesurés.
Les modes qui « résonnent » et causent vraisemblablement les réflexionssont proches de la fréquence de résonance du modèle éléments finis.D’autres propriétés doivent être étudiées
La valeur imaginaire des modesLa répartition atome/noeuds des vecteurs propres
Conclusion Guillaume ANCIAUX 6 juillet 2007 54 / 65
Étude des modes dans le cas condensé (R = 12h, h = 6r0)
1e−06
1e−05
1e−04
0.001
0.01
0.1
1
1e+13 1e+12 1e+11
Le spectre est « décalé » par la condensation vers les hautes fréquences.
Le modèle couplé peut désormais admettre des hautes fréquences sansstimuler les modes de résonances du maillage.
De plus le pouvoir de transmission reste faible pour ces hautes fréquences.
Conclusion Guillaume ANCIAUX 6 juillet 2007 55 / 65
Étude des modes et du paramètre boundary (R = 12h, h = 6r0)
Fréquence en radian par seconde
Pou
voir
de tr
ansm
issi
on
1e+12 1e+11 1e+13 1e+14 1e+15
$10^−2$$10^−1$$10^−3$
non condensé
10
9
8
7
6
5
4
3
2
1
0
Conclusion Guillaume ANCIAUX 6 juillet 2007 56 / 65
Composants logiciels
Conclusion Guillaume ANCIAUX 6 juillet 2007 57 / 65
Associer atomes et éléments finis
Besoin d’identification des atomes contenus dans un élément donné=⇒ L’algorithme naïf est constitué d’une double boucle O(Natomes × Nelements)
Introduction d’une grille
Place les éléments dans la grille
L’association nécessite alors unerecherche parmis un sous ensembled’éléments
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 2000
2.5
5
7.5
10
12.5
15
17.5
20
AssociationRemplissage de lagrilleTotal
Temps (secondes) de calcul de l’association
Nombre de divisions de la grille
Conclusion Guillaume ANCIAUX 6 juillet 2007 58 / 65
Caractérisation du taux de réflexion des ondes (2)
de la fréquence injectéeCoefficient de réflexion en fonction
25 %
20 %
15 %
10 %
5 %
0 %2 4 6 8 1210 14 16 18 20 22 24 26 28 30 32 34 36
Non condensée
Condensée
Longueur d’onde adimentionnelle (multiple de r0)
dans
le d
omai
ne a
tom
ique
Pou
rcen
tage
de
l’éne
rgie
réf
léch
ie
Conclusion Guillaume ANCIAUX 6 juillet 2007 59 / 65
Effet de la dynamique : gestion de la migration des atomes (2)
Le schéma de redistribution conserve sa cohérence par un protocole qui met enjeux les processeurs de la zone de couplage.
Étape 1 : L’ancien propriétaire P1
prévient son homologue élémentsfinis Q1 qu’il vient de migrer unatome le concernant vers P2. Q1 estalors en attente d’unecommunication de P2.
Étape 2 : L’ancien propriétaire P1
prévient le nouveau propriétaire P2
qu’il devra désormais contacter Q1
pour ajuster les buffers d’échangeset les redistributions.
Étape 3 : P2 envoie la nouvelleposition dans ses buffers decommunication à Q1.
Etape 1
Etape 2
Etape 3
Conclusion Guillaume ANCIAUX 6 juillet 2007 60 / 65
Effet de la dynamique : gestion de la migration des atomes (1)
Lors de l’évolution de la dynamique de la simulation, les codes de dynamiquemoléculaire sont amenés à « migrer » certains atomes vers d’autres processeurs.
ΩA3
ΩA2
ΩA1
ΩC4
ΩC5
ΩCΩRΩA
Zone AtomiqueZone de Recouvrement
Zone Eléments Finis
Conclusion Guillaume ANCIAUX 6 juillet 2007 61 / 65
Effet de la dynamique : gestion de la migration des atomes (1)
Lors de l’évolution de la dynamique de la simulation, les codes de dynamiquemoléculaire sont amenés à « migrer » certains atomes vers d’autres processeurs.
Zone AtomiqueZone de Recouvrement
Zone Eléments Finis
Conclusion Guillaume ANCIAUX 6 juillet 2007 61 / 65
Mesures de performances du modèle de propagation 2D
4
4
8
81
1
6
6
2
2
0
0 2
2
4
4
3
3
2
2
00.250.5
0.751
1.251.5
1.752
2.252.5
2.753
3.253.5
3.754
Ts(c)
Ts(a)Tc
nombre de processeurs dédiés aux éléments finis
nombre de processeurs dédiés à la dynamique moleculaire
Temps de simulation des différentes tâchessur 36 processeurs
pour
100
pas
dete
mps
tem
psen
seco
ndes
Conclusion Guillaume ANCIAUX 6 juillet 2007 62 / 65
Mesures de performances du modèle de propagation 2D
60
55
50
45
40
35
30
25
20
15
10
5
04642383430262218141062
Temps d’attente liés couplage
Barrière aprèsT RC (2)
Barrière avant couplageBarrière finaleT R
C (1b) + T RC (4b)
Total
Nombre de processeurs dédiés à la dynamique moléculaire
Tem
psen
seco
ndes
pour
50pa
sde
tem
ps
Conclusion Guillaume ANCIAUX 6 juillet 2007 63 / 65
Mesures de performances du modèle de propagation 2D
32
24
20
16
8
4
0 0,25 0,5 0,75 1 1,25 1,5 1,75 2 2,25 2,5 2,75 3
Tc(4a,4b)
Tc(3)
Tc(2)
Tc(1a,1b)
Surcoût de couplage sur 36 processeurs
Nom
bre
depr
oces
seur
sdé
diés
àla
dyna
miq
uem
oléc
ulai
re
Temps en secondes
pendant 100 pas de temps
Conclusion Guillaume ANCIAUX 6 juillet 2007 64 / 65
Mesures de performances du modèle de propagation 3D
11/2
1/3
1/4
1/8
Temps de couplage pour différents ratios de distributionT
emps
en
seco
ndes
pou
r 20
pas
de
tem
ps
Nombre de processeurs
5
6
7
8
9
10
11
12
13
10 15 20 25 30 35 40
Conclusion Guillaume ANCIAUX 6 juillet 2007 65 / 65