PROCCOU.docDi rect ion des appl icat ions mi l i ta i res Centre
DAM Î le de France
INFORMATIQUE D’ENTREPRISE INFORMATIQUE SCIENTIFIQUE
SIMULATION NUMERIQUE SECURITE INFORMATIQUE
Date de diffusion : septembre 2018
Commissariat à l’énergie atomique et aux énergies alternatives
Centre DAM Île de France - Bruyères-le-Châtel – F- 91297 Arpajon
Cedex
Tél : (33) – 01 69 26 40 00 Établissement public à caractère
industriel et commercial
R. C..S. PARIS B 775 685 019
PROPOSITIONS DE STAGES 2019
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
TABLE DES MATIERES 1 Les stages proposés en un coup d’oeil
.....................................................................
4
2 Le CEA
......................................................................................................................
5
3 Le CEA/DAM
.............................................................................................................
6
5 Le CAMPUS TERATEC
..........................................................................................
10
6 Les activités informatiques au CEA/DAM – Ile de France
....................................... 12
7 Sites utiles
...............................................................................................................
12
9 Les thématiques des stages
...................................................................................
13
10 Les stages en informatique d’entreprise
.................................................................
14
11 Les stages en informatique scientifique
..................................................................
17
12 Les stages en simulation numérique
.......................................................................
31
13 Les stages en sécurité informatique
.......................................................................
42
Page 3
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
1 LES STAGES PROPOSES EN UN COUP D’OEIL
Thème Titre Référence Formation Durée (mois)
Info rm
ati que
d'en tre
pris e
DevOps : automatisation des tests sur l’application PLM IE-19-01
Bac + 4/5 5 à 6
DevOps : intégration continue, analyse et qualité de code IE-19-02
Bac + 4/5 5 à 6
Développement d’un outil de gestion du parc de postes Windows DAM
IE-19-03 Bac + 4/5 3 à 6Info rm
ati que
d'en tre
pris e
Evaluation de solutions de NAS open source IS-19-01 Bac + 4/5 3 à
6
Interface web de visualisation de filesystem IS-19-02 Bac + 4/5 3 à
6
Conception d'une nouvelle architecture de tests pour le projet open
source Lustre IS-19-03 Bac + 4/5 4 à 6
Développement d'une fonctionnalité de classes de service dans un
logiciel de stockage
IS-19-04 Bac + 4/5 4 à 6
Bibliothèques d'accès à des nouvelles technologies de stockage
IS-19-05 Bac + 4/5 4 à 6
Développement d'une interface S3 pour un logiciel de stockage objet
distribué
IS-19-06 Bac + 4/5 4 à 6
Développement d'un mécanisme de versionnage de données IS-19-07 Bac
+ 4/5 4 à 6
Info rm
ati que
sc ien
tif ique
Prédiction du taux de dé-duplication pour du stockage massif de
données IS-19-08 Bac + 4/5 4 à 6
Définition d'un benchmark générique pour la validation de cluster
IS-19-09 Bac + 4/5 4 à 6Info rm
ati que
sc ien
tif ique
Génération de rapports de profilage pour SELFIE IS-19-10 Bac + 4/5
4 à 6
Génération d'un simulateur de communications MPI IS-19-11 Bac + 4/5
4 à 6
Etude et amélioration d’outils de configuration de fabrics
InfiniBand IS-19-12 Bac + 4/5 4 à 6
Etude et intégration d’une solution de monitoring InfiniBand
IS-19-13 Bac + 4/5 4 à 6
Evaluation du routage sur les réseaux d’interconnexion de clusters
de calcul (HPC)
IS-19-14 Bac + 4/5 4 à 6
Algorithmes de reconstruction d’interface par Machine Learning et
Apprentissage Supervisé
SN-19-01 Bac + 4/5 4 à 6
Opérateur de diffusion vectoriel pour l’hydrodynamique lagrangienne
turbulente SN-19-02 Bac + 5 5 à 6
Optimisation géométrique de maillages hexaédriques SN-19-03 Bac + 5
5 à 6
Métriques orientées pour maillages quadrangulaires surfaciques
SN-19-04 Bac + 5 5 à 6
Sim ulat
numéri que
Etude et implantation d’algorithmes parallèles de génération
d’hexaèdres par combinaison de tétraèdres SN-19-05 Bac + 5 5 à
6
Equilibrage de charge dynamique pour la visualisation scientifique
SN-19-06 Bac + 5 5 à 6
Etude et évaluation de la structure de donnée SVDAG et ses
variantes pour le RayTracing en visualisation scientifique SN-19-07
Bac + 5 5 à 6
Etude et implémentation d’algorithmes massivement multi-threads et
GPU en visualisation scientifique SN-19-08 Bac + 5 5 à 6
Algorithme concurrent d’appariement de sommets dans un graphe
SN-19-09 Bac + 5 5 à 6
Simulateur des flux de données des codes de calcul HPC SN-19-10 Bac
+ 5 5 à 6
Couplage d’un framework de visualisation in-situ avec un code de
calcul hydrodynamique HPC
SN-19-11 Bac + 5 5 à 6
Sim ulat
numéri que
R&D autour de la cartographie réseau SI-19-01 Bac + 5 3 à
6
Dé-obscurcissement de JavaScript SI-19-02 Bac + 5 5 à 6
Séc urit
info rm
ati que
Reconnaissance automatique de fonctions par effets de bord SI-19-03
Bac + 4 3
Techniques de fuzzing et d'audit de code appliquées à l'évaluation
de la sécurité de systèmes de fichiers réseau
SI-19-04 Bac + 5 5 à 6Séc urit
é
SI-19-05 Bac + 5 5 à 6
Page 4
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
2 LE CEA
Acteur majeur de la recherche, du développement et de l'innovation,
le Commissariat à l’énergie atomique et aux énergies alternatives
intervient dans quatre domaines :
• la défense et la sécurité,
• les énergies nucléaires et renouvelables,
• la recherche technologique pour l’industrie,
• la recherche fondamentale (sciences de la matière et sciences de
la vie).
S’appuyant sur une capacité d’expertise reconnue, le CEA participe
à la mise en place de projets de collaboration avec de nombreux
partenaires académiques et industriels.
Le CEA est implanté sur 9 centres répartis dans toute la France. Il
développe de nombreux partenariats avec les autres organismes de
recherche, les collectivités locales et les universités. A ce
titre, le CEA est partie prenante des alliances nationales
coordonnant la recherche française dans les domaines de l’énergie
(ANCRE), des sciences de la vie et de la santé (AVIESAN), des
sciences et technologies du numérique (ALLISTENE), des sciences de
l’environnement (AlIEnvi) et des sciences humaines et sociales
(ATHENA).
Reconnu comme un expert dans ses domaines de compétence, le CEA est
pleinement inséré dans l'espace européen de la recherche et exerce
une présence croissante au niveau international.
Le CEA compte 16 010 techniciens, ingénieurs, chercheurs et
collaborateurs pour un budget de 4,1 milliards d'euros (chiffres
publiés fin 2016).
ORGANIGRAMME DU CEA
Page 5
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
3 LE CEA/DAM
Une direction au service de la dissuasion La Direction des
applications militaires (DAM) du CEA, a pour mission de concevoir,
fabriquer, maintenir en condition opérationnelle, puis démanteler
les têtes nucléaires qui équipent les forces nucléaires aéroportée
et océanique françaises. La DAM est chargée de la conception et de
la réalisation des réacteurs et de cœurs nucléaires équipant les
bâtiments de la Marine nationale, sous-marins et porte-avions. Elle
apporte son soutien à la Marine nationale pour le suivi en service
et le maintien en condition opérationnelle de ces réacteurs. La DAM
est également responsable de l'approvisionnement des matières
nucléaires stratégiques pour les besoins de la dissuasion. Dans un
monde en profonde mutation, la DAM contribue aussi à la sécurité
nationale et internationale à travers l’appui technique qu’elle
apporte aux autorités, pour les questions de lutte contre la
prolifération nucléaire et le terrorisme et de désarmement. Depuis
le transfert du centre de Gramat en 2010 de la Direction générale
de l’armement au CEA, la DAM apporte son expertise à la Défense
dans le domaine de l’armement conventionnel. Une direction ouverte
à la recherche Le partage national et international des
connaissances (lorsqu’il est possible), la confrontation à
l’évaluation scientifique extérieure, l’intégration à des réseaux
de compétences constituent des gages de crédibilité scientifique.
Les équipes de la DAM réalisent chaque année environ 2000
publications et communications scientifiques. Cette ouverture de la
DAM passe également par la mise à la disposition de la communauté
des chercheurs de ses moyens expérimentaux et par la contribution
de ses équipes à d’autres programmes de recherche. Une direction
actrice de la politique industrielle française La DAM partage très
largement son activité avec l’industrie française : c’est ainsi que
le montant des achats, auprès de celle-ci, représente plus des deux
tiers de son budget ; le dernier tiers se répartit entre les
salaires des personnels (un cinquième) et les taxes. La politique
industrielle de la DAM est originale à plus d’un titre :
• d’abord parce que la DAM conserve la maîtrise d’œuvre d’ensemble
de la grande majorité des systèmes dont elle a la responsabilité :
elle veille ainsi au juste équilibre entre les grands groupes
industriels de la Défense et les PME souvent innovantes, en
contractualisant directement avec ces dernières, leur permettant
ainsi de recevoir la juste rémunération de leur production ;
• ensuite, parce que la répartition de son budget est sous-tendue
par une répartition des travaux : la DAM conduit la recherche dans
ses laboratoires grâce à son personnel de haut niveau scientifique
et technologique. Une fois la définition d’un produit acquise, la
DAM transfère la définition et les procédés vers les industriels
qui en réalisent le développement, puis la production.
La DAM a également pour objectif que ses centres participent à la
vie économique locale par leur implication dans les pôles de
compétitivité. Hors de son propre champ d’utilisation, elle
valorise ses recherches par le transfert de technologies vers
l’industrie et le dépôt de nombreux brevets.
Page 6
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
Le format La DAM comprend cinq centres aux missions homogènes, dont
les activités se répartissent entre la recherche de base, le
développement et la fabrication :
• DAM Ile-de-France (DIF), à Bruyères-le-Châtel, où sont menés les
travaux de physique des armes, les activités de simulation
numérique et de lutte contre la prolifération nucléaire ; DIF est
aussi le centre responsable de l’ingénierie à la DAM ; enfin, au
centre DIF est rattachée l’INBS-Propulsion Nucléaire du centre
CEA/Cadarache, en région Provence Alpes-Côte d’Azur, où sont
implantées les installations d'essais à terre et une partie des
fabrications de la propulsion nucléaire ;
• Le Cesta, en Aquitaine, consacré à l’architecture des
armes, aux tests de tenue à l’environnement. Il met en œuvre le
Laser Mégajoule, équipement majeur de la Simulation ;
• Valduc, en Bourgogne, dédié aux matériaux nucléaires et à
l’installation expérimentale Epure du programme Simulation ;
• Le Ripault, en région Centre, dédié aux matériaux non
nucléaires (explosifs chimiques…) ;
• Gramat, (ex-DGA) en Midi-Pyrénées, qui conduit au profit de la
Défense des activités en vulnérabilité des systèmes et efficacité
des armements.
Centre DAM Île-de-France
Page 7
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
4 LE CENTRE DAM - ILE DE FRANCE
Le CEA/DAM - Île de France (DIF) est l'une des directions
opérationnelles de la DAM.
Le site de la DIF compte environ 2000 salariés CEA et accueille
quotidiennement environ 600 salariés d'entreprises extérieures. il
est situé à Bruyères-le-Châtel à environ 40 km au sud de Paris,
dans l'Essonne.
Les missions de la DIF comprennent :
• la conception et garantie des armes nucléaires, grâce au
programme Simulation. L'enjeu consiste à reproduire par le calcul
les différentes phases du fonctionnement d'une arme nucléaire et à
confronter ces résultats aux mesures des tirs nucléaires passés et
aux résultats expérimentaux obtenus sur les installations actuelles
(machine radiographique, lasers de puissance, accélérateurs de
particules) ;
• la lutte contre la prolifération et le terrorisme, en contribuant
notamment au programme de garantie du Traité de Non Prolifération
et en assurant l'expertise technique française pour la mise en
œuvre du Traité d'Interdiction Complète des Essais Nucléaires
(TICE) ;
• l'expertise scientifique et technique, dans le cadre de la
construction et du démantèlement d'ouvrages complexes ainsi que
pour la surveillance de l'environnement et les sciences de la terre
;
• l'alerte des autorités, mission opérationnelle assurée 24h sur
24, 365 jours par an, en cas d'essai nucléaire, de séisme en France
ou à l'étranger, et de tsunami dans la zone Euro-méditerranéenne.
La DIF fournit aux autorités les analyses et synthèses techniques
associées.
Depuis 2003, le centre DAM-Île-de-France héberge le complexe de
calcul scientifique du CEA, qui regroupe l’ensemble des
supercalculateurs du CEA, et qui comprend à ce jour :
• le supercalculateur Tera1000-1 pour les besoins du programme
Simulation du CEA/DAM, mis en service en 2016, dispose d’une
puissance de calcul de 2,5 petaflops, c’est à dire capable
d’effectuer 2,5 millions de milliards d’opérations par seconde. Il
est complété en 2018 par Tera1000-2, autre composante du projet
Tera1000, qui préfigure les architectures et technologies du futur
supercalculateur qui sera installé à l’horizon 2020.Sa puissance de
calcul est de 12,5 petaflops.
Page 8
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
• Le supercalculateur Cobalt du Centre de Calcul pour la Recherche
et la Technologie (CCRT), ouvert à la communauté civile de la
recherche et de l’industrie, pour une puissance globale de 1,5
petaflops.
• le supercalculateur IRENE, d’une puissance de 9 petaflops,
deuxième élément d’un réseau de supercalculateurs de classe
petaflopique destiné aux chercheurs de la communauté scientifique
européenne. Ce supercalculateur est hébergé au TGCC (Très Grand
Centre de Calcul) et exploité par les équipes du CEA, qui apporte
ainsi sa contribution à la participation de la France au projet
PRACE (Partnership for Advanced Computing in Europe)
Page 9
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
5 LE CAMPUS TERATEC La plupart des stages proposés se déroulent
dans les locaux du campus
[email protected]. Les autres se déroulent dans les
locaux situés à l’intérieur du site CEA.
Le Campus TERATEC est l’une des deux composantes de la Technopole
TERATEC, l’autre composante étant le « Très Grand Centre de Calcul
du CEA » (TGCC).
Cette technopole, a été créée à l’initiative du CEA afin de
développer et promouvoir la simulation numérique haute performance,
à proximité du site du CEA, sur la commune de Bruyères-le-Châtel,
dans le département de l’Essonne.
Une cantine « inter-entreprises » est accessible à tous les
stagiaires.
L’accès principal à la Technopole TERATEC se fait par une entrée
commune au TGCC et au Campus, située au nord-ouest, sur le chemin
de la Piquetterie.
Page 10
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
Le CEA a mis en place un réseau spécifique de cars qui dessert
Paris et de nombreuses communes de la région parisienne. Par
ailleurs, le campus
[email protected] est desservi par la ligne de transport
en commun 91-04, entre la gare routière d’Evry et la gare
autoroutière de Briis-sous-Forges.
Page 11
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
6 LES ACTIVITES INFORMATIQUES AU CEA/DAM – ILE DE FRANCE
Le système d’information (SI) de la DAM est constitué de 4
sous-systèmes : entreprise, technique, industriel et scientifique,
concernant respectivement :
• les aspects budget, ressources humaines, logistique, sécurité des
personnes et des biens, patrimoine …
• les activités « Programme » de la DAM : bureau d’études,
méthodes, calcul, fabrication, qualité des produits fabriqués,
gestion des matières …
• les procédés industriels : acquisition mesures, système de
supervision, surveillance, commande contrôle, contrôle des
utilités, accès, autocom télécom …
• le domaine scientifique associant la simulation avec le calcul
haute performance.
Les activités déclinées dans ces systèmes d’information dans
lesquelles s’inscrivent les stages proposés, sont les suivantes
:
• étude, conception et réalisation du système d’information du
CEA/DAM ; • définition, conception, déploiement et exploitation des
réseaux et des serveurs ; • étude, conception, développement et
maintenance de codes et outils de simulation
numérique et d’environnement logiciel dans le domaine du calcul
haute performance ; • étude, conception, développement de systèmes
informatiques dans le domaine du calcul
haute performance ; Auxquelles deux activités transverses sont
ajoutées :
• expertise et activités opérationnelles dans le domaine de la
sécurité informatique ; • animation scientifique dans le domaine du
calcul scientifique haute performance.
7 SITES UTILES Pour plus d’informations, vous pouvez consulter les
sites suivants : http://www.cea.fr http://www-hpc.cea.fr/
http://www.teratec.eu/ Retrouvez tous les stages proposés par le
CEA sur le site : http://www.cea.fr/recrutement
8 COMMENT POSTULER POUR UN STAGE ? Pour faire acte de candidature,
veuillez transmettre un CV et une lettre de motivation par mail à
l’adresse suivante :
[email protected] Pour tout renseignement
complémentaire, vous pouvez contacter Isabelle Visotto au
01.69.26.40.00. Nous attirons l’attention des candidats sur le fait
que les délais d’instruction des dossiers de candidature sont de 2
mois, sauf pour les thématiques « Informatique d’entreprise » et «
sécurité informatique » pour lesquels le délai est de 4 mois.
Page 12
9 LES THEMATIQUES DES STAGES
Les stages proposés se déclinent dans les 4 thématiques suivantes :
Informatique d’entreprise : serveurs bureautiques et applicatifs,
applications de gestion, postes de travail, bases de données,
Intranet ; Informatique scientifique, Calcul Haute Performance
(HPC) et réseaux : grands calculateurs à vocation scientifique,
High Performance Computing, stockage haute performance, logiciels «
système », Linux, réseaux d’entreprise, interconnexion des
calculateurs ; Simulation numérique : développement de logiciels
scientifiques, IHM, visualisation, gestion de données, pré et
post-traitement ; Sécurité informatique : développement d’outils
logiciels.
Page 13
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
10 LES STAGES EN INFORMATIQUE D’ENTREPRISE
Titre
Référence IE-19-01
Contexte
L’application SEQUOIA a été déployée en 2010 au sein des différents
centres de la DAM, et regroupe aujourd’hui plusieurs centaines
d’utilisateurs. L’activité couverte par cette application est
centrale : il s’agit de gérer le cycle de vie des produits et de
garantir leur qualité. Cette application s’appuie sur un outil du
marché, complété par des développements spécifiques qui évoluent
régulièrement. La complexité de l’application et la richesse des
fonctionnalités qu’elle offre, nécessite d’automatiser les tests
sur toutes les versions avant leur déploiement. Ce sujet s’inscrit
dans la démarche DevOps engagée au sein du service informatique. Le
patrimoine de tests automatiques a été initié et doit être enrichi
continuellement. Dans ce contexte, l’outil Selenium a été mis en
œuvre. D’autres briques logicielles viennent progressivement
compléter la solution d’automatisation, et s’interfacer avec le
système d’intégration continue. Une interface avec l’outil de
gestion de test TestLink a par exemple été mise en place. Compte
tenu des enjeux métier auxquels répond ce sujet, des méthodes de
travail très rigoureuses ont été mises en place et devront être
respectées, rendant ainsi l’environnement de travail très
enrichissant.
Objectifs
Les objectifs du stage sont :
Prise de connaissance de l’application et montée en compétence sur
son architecture Montée en compétence sur l’outil d’automatisation
de test Selenium Développement des tests automatiques Intégration
de la solution aux autres briques DevOps
Rédaction de la documentation technique
Domaines de spécialité requis Programmation, génie logiciel,
web
Langages/logiciels Java, Selenium, ant, HTML, Javascript
Mots clés DevOps, intégration continue, développement, tests,
automatisation, qualité logicielle, web, javascript
Formation recherchée BAC+4 ou 5
Durée du stage 5 mois minimum Durée de l’apprentissage 1 an
minimum
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 14
Titre DevOps : intégration continue, analyse et qualité de
code
Référence IE-19-02
Contexte
Le département informatique du CEA / DAM prend à sa charge certains
développements d’informatique de gestion, et intègre également des
solutions commerciales ou open source, souvent enrichies par des
fonctionnalités développées spécifiquement pour ses besoins
propres. Dans ces deux cas, développements internes et
sous-traités, le CEA / DAM souhaite contrôler de façon très
régulière la qualité du code des applications dont il a la
responsabilité, voire même contribuer à la recette fonctionnelle.
Un environnement technique est déjà existant (gestion de version
notamment). Les autres briques n’existent pas encore.
Objectifs
Prise de connaissance de l’environnement et de la cible Etude et
analyse des différentes solutions possibles pour chaque brique
Prototypage et maquettage éventuel de certaines solutions
(installation, intégration, paramétrage, développements
spécifiques) Intégration des solutions retenues aux autres briques
DevOps de production Rédaction de la documentation technique
Présentation de la solution aux unités informatiques
Domaines de spécialité requis
Langages/logiciels Langages web, langages de programmation (C#,
Java, Python), Sonar, Jenkins, …
Mots clés DevOps, intégration continue, développement,
automatisation, qualité logicielle
Formation recherchée BAC+3, 4 ou 5
Durée du stage 5 mois minimum
Durée de l’apprentissage 1 an minimum
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected]
Pour tout renseignement complémentaire, vous pouvez contacter
Isabelle Visotto au 01.69.26.40.00.
Page 15
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
Titre Développement d’un outil de gestion du parc de postes Windows
DAM
Référence IE-19-03
Contexte
Le laboratoire IS (Ingénierie des Systèmes) est responsable des
services d’infrastructure des différents réseaux centralisés du
CEA/DAM répartis sur cinq centres. Les activités du Laboratoire
Ingénierie des Systèmes portent principalement sur : la conception
et maintien en condition opérationnelle des plates formes
hébergeant les services d’administration, de stockage, de
virtualisation, de sauvegarde, de sécurité et d’exploitation des
réseaux DAM, l’optimisation et l’adaptation de tous ces services
pour l’accueil des plates formes applicatives, la mise en
production auprès de l’infogérant dans le respect des pratiques
ITIL, la résolution des incidents escaladés, le maintien en
sécurité exigée sur les réseaux qu’il maîtrise. Le laboratoire est
garant de la mise en œuvre du niveau de sécurité attendu sur chacun
des réseaux qu’il opère. Il doit répondre de manière récurrente à
des sollicitations concernant la mise en place de nouveaux
mécanismes de sécurité demandées par des entités internes ou
externes.
Objectifs
Dans le cadre du renforcement de la sécurité informatique, le LIS
souhaite automatiser et standardiser son outil de gestion de parc
informatique Microsoft SCCM. Afin d’assurer sa mission
d’harmonisation du poste de travail au standard DAM en Windows 10
pour tous les centres DAM. Les objectifs du stage sont :
l’optimisation du déploiement des postes en Windows 10 avec
l’élaboration de scripts en Powershell. Suivant la durée de la
mission, le stagiaire sera amené à se déplacer sur les centres. Des
connaissances en administration systèmes et en filtrage de réseaux
IP serait un plus.
Domaines de spécialité requis
Langages/logiciels Windows 2016 Server, Microsoft SCCM
Mots clés Informatique, Administration Windows, Sécurité,
SCCM
Formation recherchée Minimum BAC+4/5
Durée du stage 5 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 16
11 LES STAGES EN INFORMATIQUE SCIENTIFIQUE
Titre
Référence IS-19-01
Contexte
Les utilisateurs des centres de calcul du CEA disposent d’un espace
de travail sur un serveur de fichiers de type NAS. Il est utilisé
pour préparer leurs codes de calculs avant de les faire tourner sur
le calculateur. Cet es- pace dispose de plusieurs fonctionnalités
qui permettent notamment de récupérer facilement des fichiers
effacés ou modifiés (snapshot), de fonc- tionner en haute
disponibilité, etc.
Objectifs
Les objectifs du stage sont : évaluer les alternatives Open Source
de la solution propriétaire actuel- lement en place avec les
différentes fonctionnalités proposées, mettre en place une ou des
solutions retenues sur plusieurs configura- tions matérielles pour
en évaluer les performances, réaliser une série de tests proche de
l’usage des équipements en centre de calcul afin d’évaluer la tenue
des différentes solutions, valider le fonctionnement des
différentes fonctionnalités (Haute disponibi- lité, …). Le
stagiaire explorera plus particulièrement le système de fichiers
ZFS qui est utilisé dans plusieurs solutions de NAS.
Domaines de spécia- lité requis Informatique
Langages/logiciels Linux
Formation recher- chée BAC+4/5
Durée du stage 3 à 6 Mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected]
Pour tout renseignement complémentaire, vous pouvez contacter
Isabelle Visotto au 01.69.26.40.00.
Page 17
Titre
Référence IS-19-02
Contexte
Les supercalculateurs du CEA produisent tous les jours de grandes
quanti- tés de données qui sont stockées sur des systèmes de
fichiers distribués. Robinhood[1] (Policy Engine) est un logiciel
open source qui permet de sur- veiller et gérer l’ensemble des
fichiers/dossier/… qui se trouvent sur ces systèmes de fichiers
(Récupérer le nombre de fichiers d’un utilisateur, la taille,
l’espace utilisé par un groupe d’utilisateur, de déplacer des
fichiers selon certaines règles, …). Cet outil dispose actuellement
d’une interface web « sommaire » qui permet de visualiser quelques
éléments principaux. [1]https://github.com/cea-hpc/robinhood
Objectifs
L’interface web de Robinhood se décompose en deux parties : Une API
qui expose les données contenues dans la base de Robinhood Une
interface « End-User » qui permet d’afficher les données exposées
par l’API Le stage consistera à : Développer l’interface pour
ajouter une vision « globale » du système de fichier (Semblable à
de celle de Baobab[1] ou qdirstat[2]), Proposer une extension à
Baobab pour qu’il puisse se connecter à l’API de Robinhood,
Améliorer la fonctionnalité de recherche et visualisation des
fichiers des utilisateurs, Proposer et ajouter d’autres
visualisations pour aider à l’administration, Ajouter une
interface/API pour exporter les données vers des outils tiers. [1]
: https://wiki.gnome.org/Apps/Baobab [2] :
https://github.com/shundhammer/qdirstat
Domaines de spécia- lité requis Programmation PHP, Web, Base de
données, Linux
Langages/logiciels PHP, HTML, Javascript, SQL, Git
Mots clés Web, Visualisation, Stockage
Formation recher- chée BAC+4/5
Durée du stage 3 à 6 Mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected]
Pour tout renseignement complémentaire, vous pouvez contacter
Isabelle Visotto au 01.69.26.40.00.
Page 18
Titre
Conception d'une nouvelle architecture de tests pour le projet
open
source Lustre
Référence IS-19-03
Contexte
Lustre est un système de fichiers distribué, hautement parallèle,
open source, couramment utilisé dans le domaine du HPC. Le CEA
contribue activement au projet. Actuellement, le temps d'exécution
séquentiel de la base de tests du projet avoisine les 21h. Ceci
impacte lourdement le développement de Lustre.
Objectifs
Les objectifs du stage sont : étudier et réaliser une architecture
qui facilitera la création de nouveaux tests et réduira le temps
d'exécution des bases de tests tout en conservant une grande
simplicité d'utilisation. Ce stage n'a pas pour objectif de
réécrire les bases de tests de Lustre. définir un protocole de
migration de l'architecture actuelle vers celle qu'il aura retenue,
évaluer les gains apportés par son architecture via une preuve de
con- cept, présenter son architecture à la communauté Lustre.
Domaines de spécia- lité requis Génie logiciel, tests, Linux,
développement système
Langages/logiciels C, bash, git
Mots clés Programmation distribuée, tests, open source, système de
fichiers
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 19
Titre
logiciel de stockage
Contexte
R&D du laboratoire en matière de stockage massif de données en
environ- nement HPC. Les supercalculateurs du CEA produisent
d'immenses quantités de données (dizaines de pétaoctets par an) à
des débits extrêmes (centaines de gigaoc- tets par seconde). Pour
stocker ces données de manière robuste et perfor- mante, le CEA
développe un logiciel de stockage de données parallèle et
distribué. Ce logiciel doit notamment gérer plusieurs types de
données, avec des be- soins de performance et de fiabilité
différents.
Objectifs
Les objectifs du stage sont : développer un mécanisme de gestion de
classes de services (COS) dans un logiciel de stockage développé
par le CEA, Le choix d'une classe de service permet à un
utilisateur de choisir le type de média sur lequel il souhaite
stocker une donnée, et d'indiquer le niveau et le type de
redondance souhaité (RAID1, Erasure coding…). Définir solution
(définition de l'API, des structures de données...), Réaliser le
développement en langage C et l'intégrer au projet existant.
Domaines de spécia- lité requis Programmation en C, programmation
système, bases de données
Langages/logiciels C, git, systèmes Linux
Mots clés Systèmes distribués, stockage, programmation,
développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected]
Pour tout renseignement complémentaire, vous pouvez contacter
Isabelle Visotto au 01.69.26.40.00.
Page 20
Titre
Référence IS-19-05
Contexte
R&D du laboratoire en matière de stockage massif de données en
environ- nement HPC. Les supercalculateurs du CEA produisent
d'immenses quantités de données (dizaines de pétaoctets) à des
débits extrêmes (centaines de gigaoctets par seconde). Pour stocker
ces données de manière robuste et performante, le CEA développe un
logiciel de stockage de données parallèle et distribué. Ce logiciel
vise notamment à gérer une grande variété de technologies de
stockage, telles que les disques, bandes, SSD, NVMe, NVRAM,
stockage objet...
Objectifs
Les objectifs du stage sont : d'intégrer de nouvelles technologies
de stockage dans un logiciel déve- loppé par le CEA pour préparer
les nouvelles générations de supercalcula- teurs, pour faciliter
cette intégration, développer une couche d'abstraction of- frant
une même interface d'accès quelle que soit la technologie sous-
jacente. Il s'agira par exemple d'intégrer des technologies de
stockage novatrices de disques connectés en réseau (Seagate
Kinetic, appliances OpenIO, …), des logiciels de stockage objet
pour le Cloud (Scality) ou pour le HPC (MERO)...
Domaines de spécia- lité requis Programmation en C, programmation
système
Langages/logiciels C, git, systèmes Linux
Mots clés Stockage objet, programmation, développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 21
Titre
Développement d'une interface S3 pour un logiciel de stockage
objet
distribué
Contexte
R&D du laboratoire en matière de stockage massif de données en
environ- nement HPC. Les supercalculateurs du CEA produisent
d'immenses quantités de données (dizaines de pétaoctets) à des
débits extrêmes (centaines de gigaoctets par seconde). Pour stocker
ces données de manière robuste et performante, le CEA développe un
logiciel de stockage de données parallèle et distribué. S3 est un
protocole initialement développé et utilisé par Amazon Web Ser-
vices. Il est aujourd'hui communément utilisé comme interface
d'accès aux données dans le Cloud Computing.
Objectifs
L'objectif final du stage est de : concevoir un serveur S3 pour un
logiciel de stockage développé par le CEA, dans un premier temps,
d’étudier la sémantique du protocole S3, réaliser un état de l’art
des serveurs S3 disponibles en ‘’open source’’, adapter la solution
retenue à un logiciel de stockage distribué développé au CEA.
Domaines de spécia- lité requis Programmation en C, programmation
système, réseau et sécurité
Langages/logiciels C, git, systèmes Linux
Mots clés Cloud Computing, stockage, programmation,
développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 22
Titre
Référence IS-19-07
Contexte
R&D du laboratoire en matière de stockage massif de données en
environ- nement HPC. Les supercalculateurs du CEA produisent
d'immenses quantités de données (dizaines de pétaoctets) à des
débits extrêmes (centaines de gigaoctets par seconde). Pour stocker
ces données de manière robuste et performante, le CEA développe un
logiciel de stockage de données parallèle et distribué. Ce logiciel
doit pouvoir gérer un grand nombre d'accès concurrents aux données,
ce qui nécessite un mécanisme élaboré de gestion de versions. Ce
mécanisme doit notamment permettre un passage à l'échelle pour les
prochaines générations de super-calculateurs (calculateurs
Exaflopiques).
Objectifs
L'objectif de ce stage est : développer un mécanisme de gestion des
versions de données dans un logiciel de stockage développé par le
CEA, Ce mécanisme devra permettre de gérer des lectures et des
écritures sur de multiples versions des données, tout en offrant
certaines garanties sur la cohérence finale des données. réaliser
une étude de mécanismes existants de versionage de données
(copy-on-write, generation numbers, …), proposer un design de
mécanisme adapté aux besoins du CEA, développer la solution (en
langage C) et l'intégrera au projet existant.
Domaines de spécia- lité requis Programmation en C, programmation
système
Langages/logiciels C, git, systèmes Linux
Mots clés Systèmes distribués, stockage, programmation,
développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 23
Titre
de données
Référence IS-19-08
Contexte
R&D du laboratoire en matière de stockage massif de données en
environ- nement HPC. Les supercalculateurs du CEA produisent
d'immenses quantités de données (dizaines de pétaoctets) à des
débits extrêmes (centaines de gigaoctets par seconde). Pour stocker
ces données de manière robuste et performante, le CEA développe un
logiciel de stockage de données parallèle et distribué. Face à
l'explosion de la quantité de données à stocker, la dé-duplication
peut s'avérer une stratégie efficace pour gagner en capacité mais
également en performance.
Objectifs
Les objectifs du stage sont de : développer un outil permettant de
prédire le taux de dé-duplication d'un très large ensemble de
données pouvant excéder plus de 10 millions de fichiers pour
plusieurs pétaoctets, Cet outil devra être optimisé en temps
d'exécution et en ressources néces- saires. Pour cela, on pourra
s'inspirer d'une part des dernières avancées et algorithmes
statistiques récemment proposés dans ce domaine [1][2] et d'autre
part du parallélisme largement utilisé au sein des environnements
HPCs. tester et valider cet outil sur des jeux de données
représentatifs des centres de calculs du CEA un design de mécanisme
adapté aux besoins du CEA, contribuer au développement de
mécanismes de dé-duplication au sein des logiciels parallèles et
distribués de stockage massif de données déve- loppés au CEA. [1] :
https://www.usenix.org/system/files/conference/fast16/fast16-papers-
harnik.pdf [2] :
http://theory.stanford.edu/~valiant/papers/VV_stoc11.pdf
Domaines de spécia- lité requis programmation, systèmes distribués,
base de données
Langages/logiciels C, C++, python, administration Linux, SQL/NoSQL,
git
Mots clés stockage, big data, dé-duplication, programmation,
développement, statis- tique
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 24
Titre Définition d'un benchmark générique pour la validation
de cluster
Référence IS-19-09
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances
composés de plusieurs milliers de serveurs. Le besoin de puissance
de calcul est croissant et la nécessité de développer, de
paralléliser et d'optimiser les codes de calcul est cruciale. D'un
autre côté, une meilleure compréhension des codes de calcul permet
aussi d'optimiser le cluster afin de fournir le meilleur service
possible aux utilisateurs. La production sur ces clusters est
constituée de plusieurs codes de calcul très différents. Dans le
processus de validation de ces clusters, il faudrait dans l'idéal
passer tous les codes, ce qui en pratique est très difficile à
mettre en place. Le sujet du stage consiste à définir et développer
un ben- chmark générique où il serait possible de le paramétrer
pour qu'il reproduise le comportement d'un code de calcul donné. Ce
benchmark permettrait de choisir un noyau de calcul particulier, un
type de schéma de communication ou bien un schéma de
lecture/écriture de fichiers. Les logiciels libres sont au cœur de
l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et
en développe.
Objectifs
Prendre en main les technologies liées au calcul parallèle (MPI,
OpenMP, entrées/sorties, etc ...), Définir un benchmark générique,
Développer un prototype de ce benchmark, Rédiger une documentation
sur le travail effectué. Prérequis: Langage C, Environnement Linux
Anglais technique et scientifique Compétences appréciées:
Programmation parallèle (MPI) Python http://www-hpc.cea.fr/
https://github.com/cea-hpc/
Domaines de spécia- lité requis
Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux,
Parallélisme, MPI
Formation recher- chée BAC+4/5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse
Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 25
Titre Génération de rapports de profilage pour SELFIE
Référence IS-19-10
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances
composés de plusieurs milliers de serveurs. Le besoin de puissance
de calcul est croissant et la nécessité de développer, de
paralléliser et d'optimiser les codes de calcul est cruciale. D'un
autre côté, une meilleure compréhension des codes de calcul permet
aussi d'optimiser le cluster afin de fournir le meilleur service
possible aux utilisateurs. Le CEA a développé l'outil SELFIE pour
profiler des codes de calcul. Cet outil génère des données et le
CEA souhaiterait les présenter sous forme de rapport. Le CEA a une
préférence pour des rapports sous forme page HTML (avec les
technologies web dynamiques) non connecté car le format est lisible
sur n'importe quel navigateur récent. Le rapport contiendra des
gra- phiques interactifs permettant d'analyser les données. Les
logiciels libres sont au cœur de l'infrastructure qui pilote ces
machines, le CEA/DAM y contribue et en développe.
Objectifs
Les objectifs de ce stage sont :
Prendre en main les données fournies sous forme JSON de SELFIE
Développer un outil pour générer les rapports Rédiger une
documentation sur le travail effectué.
Prérequis: HTML/JavaScript/CSS Anglais technique et scientifique
Compétences appréciées: Framework JavaScript (pour front-end web)
Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/
https://github.com/cea-hpc/selFIe
Domaines de spécia- lité requis Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux,
Parallélisme, MPI
Formation recher- chée BAC+4
Durée du stage 4 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 26
Titre Génération d'un simulateur de communications MPI
Référence IS-19-11
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances
composés de plusieurs milliers de serveurs. Le besoin de puissance
de calcul est croissant et la nécessité de développer, de
paralléliser et d'optimiser les codes de calcul est cruciale. D'un
autre côté, une meilleure compréhension des codes de calcul permet
aussi d'optimiser le cluster afin de fournir le meilleur service
possible aux utilisateurs. Le modèle de programmation MPI (Message
Passing Interface) basé sur des communications inter-processus est
le modèle le plus utilisé pour déve- lopper des codes parallèles.
Les schémas de communications deviennent de plus en plus compliqués
et il y a besoin de mieux comprendre ces com- munications afin de
les optimiser tant côté code que côté gestion du cluster. Le
problème est qu'un code de calcul en production est très complexe à
manipuler lorsqu'on souhaite simplement étudier les communications
MPI. Ce stage consiste à étudier les moyens pour extraire le schéma
de commu- nication d'un code de calcul puis de générer un code qui
va reproduire les communications MPI.
Les logiciels libres sont au cœur de l'infrastructure qui pilote
ces machines, le CEA/DAM y contribue et en développe.
Objectifs
Prendre en main le modèle de programmation MPI. La prise en main
pourra se faire avec un code de calcul parallèle, Prendre en main
un outil de profilage type Score-P et/ou Vampitrace, Développer un
outil qui à partir d'une trace OTF de profilage génère un code qui
reproduit les communications MPI d'un code profilé, Rédiger une
documentation sur le travail effectué. prérequis: Langage C,
Environnement Linux Anglais technique et scientifique Compétences
appréciées: Programmation parallèle (MPI) Python
http://www-hpc.cea.fr/ https://github.com/cea-hpc/
https://tu-dresden.de/zih/forschung/projekte/vampirtrace
http://www.vi-hps.org/projects/score-p/
Domaines de spécia- lité requis
Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux,
Parallélisme, MPI Formation recher- chée BAC+4/5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 27
Titre Etude et amélioration d’outils de configuration de fabrics
InfiniBand
Référence IS-19-12
Contexte
La technologie InfiniBand est utilisée sur les réseaux
d’interconnexion internes aux clusters de calculs du CEA, ainsi que
sur les réseaux de stockage de données des centres de
calculs.
Divers outils de configuration et de monitoring des réseaux
InfiniBand existent, qu’il convient au travers de ce stage de faire
évoluer
Objectifs
Les objectifs du stage sont :
Dans un premier temps, le candidat travaillera sur la configuration
des réseaux InfiniBand, permettant une prise en main du domaine et
des outils existants. L’évolution principale demandée concerne
l’interface utilisateur de l’outil. Aujourd’hui en CLI, nous
souhaitons apporter une GUI Web, simplifiant l’accès et
l’utilisation. Entre autres choses l’interface devra apporter :
Vision synthétique de la configuration déployée (topologie logique)
Configuration des serveurs, groupes, partitions et QoS sur le
réseau Vision physique du réseau InfiniBand avec identification des
différents groupes de ressources.
Une seconde évolution de l’outil consiste en l’automatisation de la
découverte des serveurs virtuels InfiniBand utilisant SRIOV. En
effet, l’usage de la virtualisation est grandissant et il est
primordial de pouvoir apporter les mêmes niveaux de configuration à
une machine physique et virtuelle, avec la même simplicité. Dans un
second temps, le stage s’orientera vers l’analyse du routage
InfiniBand sur les fabrics, et l’intégration de métriques
pertinentes à la fois sur la vision physique du réseau InfiniBand
de la GUI développée, ainsi que dans un système de stockage pour
analyse ultérieure. L’ensemble des éléments nécessaires à la
solution de monitoring retenue devra être packagée de manière à
être intégrable à une distribution linux de type CentOS. Le
candidat devra faire preuve de curiosité intellectuelle et de
rigueur.
Domaines de spécialité requis Informatique (Linux), Réseaux
Langages/logiciels Python, python-rdma, InfiniBand, Opensm
Mots clés Réseau, Infiniband, Informatique, Programmation
Formation recherchée BAC+5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 28
Référence IS-19-13
Contexte
La technologie InfiniBand est utilisée sur les réseaux
d’interconnexion internes aux clusters de calculs du CEA, ainsi que
sur les réseaux de stockage de données des centres de calculs.
Divers outils de configuration et de monitoring des réseaux
InfiniBand existent, qu’il convient au travers de ce stage de faire
évoluer.
Objectifs
Dans un premier temps, le candidat travaillera sur l’étude de la
technologie InfiniBand, permettant une prise en main du domaine,
ainsi que la proposition d’une solution de monitoring basée sur des
outils OpenSource. Cette solution pourrait se baser sur un
prototype existant reposant sur le couple InfluxDB/Grafana, ou
proposer une architecture plus adaptée. Dans un second temps, le
stage s’orientera sur la collecte des compteurs InfiniBand. Le
challenge est complexe et se validera par étape :
Proposer et implémenter des solutions efficaces de collecte pour
les topologies de taille moyenne (jusque 4000 ports InfiniBand)
garantissant une collecte et une synchronisation toutes les
secondes
Autoriser le passage à l’échelle sur des topologies de grande
taille (jusque 20000 ports IB) le plus rapidement possible avec une
tolérance à 10 secondes d’intervalle de collecte
Proposer les opérations mathématiques permettant d’enrichir les
compteurs avant stockage (calcul de congestion, statistiques
d’émission…)
Un troisième volet du stage porte sur la collecte de métriques sur
des équipements Ethernet en prenant en compte les spécificités et
contraintes de sécurité des centres de calcul du CEA. Un accent
particulier sera mis sur la possibilité de migrer des données vers
un système OpenTSDB. L’ensemble des éléments nécessaires à la
solution de monitoring retenue devra être packagée de manière à
être intégrable à une distribution linux de type CentOS. Le
candidat devra faire preuve de curiosité intellectuelle et de
rigueur.
Domaines de spécialité requis Informatique (Linux) et Réseaux
Langages/logiciels Python, pyhton-rdma, Monitoring, Grafana
Mots clés Réseau, Infiniband, Informatique, Programmation
Formation recherchée BAC+5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 29
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
Titre Evaluation du routage sur les réseaux d’interconnexion de
clusters de calcul (HPC)
Référence IS-19-14
Contexte
La toute nouvelle technologie Bull eXascale Interconnect sera
utilisée sur les réseaux d’interconnexion internes aux clusters de
calculs du CEA. Cette technologie innovante permet un routage
différencié par port permettant une meilleure répartition des
communications. Il convient au travers de ce stage de faire évoluer
l’outil d’évaluation du routage afin de mener une comparaison des
performances du routage Infiniband, traditionnellement utilisé sur
les réseaux d’interconnexion de clusters et du routage nouvelle
génération proposé par la technologie BXI.
Objectifs
Les objectifs du stage sont :
Dans un premier temps, le candidat travaillera sur l’étude des
réseaux d’interconnexion de cluster ainsi que sur la technologie
BXI afin de se familiariser avec le domaine. L’essentiel du travail
consistera en la collecte des informations de routage et de
topologie spécifique à la technologie BXI. Le candidat travaillera
sur un simulateur de réseau BXI et devra adapter le code python
existant afin de permettre l’interprétation des informations
collectées par l’outil d’analyse du routage. Le stage se conclura
par l’analyse des résultats produits permettant de valider la
performance du routage sur BXI, en regard des analyses existantes
sur Infiniband. Le candidat devra faire preuve d’autonomie, de
curiosité intellectuelle et de rigueur.
Domaines de spécialité requis Informatique (Linux), Réseaux,
Programmation python
Langages/logiciels Python, python-rdma, InfiniBand, Opensm
Mots clés Réseau, Infiniband, BXI, HPC, Programmation
Formation recherchée BAC+5
Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00. .
Page 30
12 LES STAGES EN SIMULATION NUMERIQUE
Titre Algorithmes de reconstruction d’interface par Machine
Learning et Apprentissage Supervisé
Référence SN-19-01
Contexte
Les approches « Machine Learning » font l’objet d’un engouement
croissant dans de nombreux domaines relevant des Sciences de
l’Ingénieur. Jusqu’alors, peu de publications traitent
d’applications aux méthodes de résolution d’équations aux dérivées
partielles. Lors de ce stage, on évaluera l’apport de telles
approches sur un problème difficile, objet d’une littérature
abondante dans le cadre des méthodes numériques « traditionnelles »
: le problème de reconstruction d’interfaces à partir de fractions
de présence de matériaux sur maillages 2D/3D cartésiens. Il s’agit
d’un problème purement géométrique, souvent coûteux avec les
méthodes traditionnelles et qui se prête à l’utilisation de
frameworks ML (Machine Learning) utilisés en reconnaissance
d’images.
Objectifs
Les méthodes VOF (Volume Of Fluid) constituent une classe
importante de méthodes de résolution des équations de la mécanique
des fluides. Pour des écoulements bi-fluides, les algorithmes LVIRA
et ELVIRA font actuellement référence pour l’étape de
reconstruction d’interface à partir des fractions volumiques de
présence sur les mailles voisines.
1) Ces algorithmes seront utilisés pour constituer des bases
de
configurations sur lesquelles seront lancées les phases
d’apprentissage (solutions exactes pour des interfaces
planes).
2) Les capacités de l’approche ML seront alors évaluées par prises
d’erreurs et comparaisons des coûts selon taille & type de
base.
Dans un second temps, on examinera des cas non lipchitziens et
l’extension à 3 matériaux (points triples, configurations trop
complexes pour un traitement géométrique exhaustif et rigoureux de
type ELVIRA). Références bibliographiques Itay Lieder, Yehezkel
resheff, Tom Hope, Learning TensorFlow A guide to Building Deep
Learning systems, O’Reilly media (2017) Kevin P. Murphy, Machine
Learning: a probabilistic perspective, MIT Press (2012) J. E.
Pilliod and E. G. Puckett, “Second-order accurate volume-of-fluid
algorithms for tracking material interfaces”, J. Comput. Phys.,
Vol. 199, p. 465-502 (2004)
Domaines de spécialité requis
Langages/logiciels Python, TensorFlow + Keras (Google, cours MIT,
Stanford, etc)
Mots clés CNN (Convolutional Neural Network), ML (Machine
Learning), VOF (Volume Of Flui), CFD (Computational Fluid
Dynamics)
Formation recherchée BAC+4/5
Durée du stage 3 à 6 mois Stage pouvant se poursuivre en
thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 31
Référence SN-19-02
Contexte
La description lagrangienne consiste à suivre dans le temps les
particules fluides le long de leurs trajectoires. Elle est souvent
utilisée pour résoudre les équations d'Euler en dynamique
multi-matériaux, car elle permet de préserver exactement les
interfaces des matériaux au niveau discret. Cependant, elle n'est
pas toujours suffisante pour décrire la dynamique des gaz
compressibles. C'est le cas si le rapport entre les forces
d'inertie et visqueuse est localement faible (nombre de Reynolds
petit). Le terme de diffusion moléculaire des équations de
Navier-Stokes n'est alors plus négligeable et doit être pris en
compte. Si le nombre de Reynolds est grand, les modélisations de la
turbulence (Reynolds Averaged Navier- Stokes-RANS ou
Large-Eddy-Simulation-LES) sont généralement basées sur
l'approximation de Boussinesq. Celle-ci consiste à approcher
l'effet de la turbulence non résolue sur l'écoulement moyen par un
opérateur de diffusion, proportionnel au tenseur des
contraintes.
Objectifs
Le stage a pour objectifs de : proposer, analyser numériquement et
tester différentes stratégies de discrétisation de l'opérateur de
diffusion, et son couplage au solveur de Godunov acoustique pour
les équations d'Euler [1,2]. Les stratégies retenues seront testées
en 1D et 2D sur maillages non réguliers dans un code écrit en C++.
Une bonne connaissance du lan- gage est souhaitée.
[1] B. Després et C. Mazeran, Arch. Rat. Mech. Anal., 2005, 178,
pages 327-372. [2] P.-H. Maire, R. Abgrall, J. Breil et J. Ovadia,
Siam J. Sci. Comp., 2007, 29.
Domaines de spé- cialité requis Analyse numérique
Langages/logiciels C/C++
Formation recher- chée BAC+5 (Master/Ingénieur)
Durée du stage 6 mois
Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 32
Titre
Référence SN-19-03
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est
re- connu comme un expert du domaine HPC ayant une implication
forte dans le domaine de la simulation numérique. Cette dernière
consiste à reproduire par le calcul le fonctionnement d’un système
physique, préala- blement décrit par un ensemble de modèles
mathématiques. Certains de ces modèles nécessitent de discrétiser
le domaine d’étude à l’aide d’un maillage hexaédrique 3D. La
génération automatique de tels maillages est un problème difficile
qui suscite de nombreuses recherches. De plus, tout maillage
hexaédrique n’est pas utilisable en simulation numérique, et
différents critères doivent être vérifiés. En particulier, la «
qualité » géométrique des mailles doit être estimée et améliorée si
nécessaire. Dans cette optique, les auteurs de [1] proposent un
algorithme de relaxation qui repose sur la transformation du
problème d’optimisation de la forme géométrique des hexaèdres en un
problème d’optimisation sur les arêtes du maillage. Il reste à
résoudre une succession de problèmes d’optimisation quadratiques et
convexes. L’espace des solutions étant potentiellement vide du fait
de contraintes trop importantes, une heuristique locale est en
outre proposée. [1] M. Livesu, A. Sheffer, N. Vining and M. Tarini.
Practical Hex-Mesh Optimization via Edge-Cone Rectification,
Transactions on Graphics (Pro- ceedings of SIGGRAPH 2015),
2015.
Objectifs
L’objectif du stage proposé est : 1) d’étudier et implanter les
algorithmes proposés dans [1], 2) puis de les étendre à des
maillages mixtes composés à la fois
d’hexaèdres, tétraèdres, prismes à base triangulaire, et pyra-
mides à base quadrangulaire.
L’implantation se fera dans le cadre du projet open-source GMDS,
projet développé et maintenu au CEA/DAM. Les résultats seront
évalués au vu de la qualité des maillages générés à partir de
modèles de pièces méca- niques plus ou moins complexes
Domaines de spé- cialité requis Informatique – Mathématiques
appliquées
Langages/logiciels C/C++
Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected]
Pour tout renseignement complémentaire, vous pouvez contacter
Isabelle Visotto au 01.69.26.40.00.
Page 33
Titre Métriques orientées pour maillages quadrangulaires
surfaciques
Référence SN-19-04
Contexte
Le CEA est un acteur majeur en matière de recherche et d’innovation
avec une implication forte dans le domaine de la simulation
numérique. Le travail de stage s’inscrit justement dans le contexte
de la simulation numérique de phénomènes physiques sur des
architectures modernes de calculateurs, et plus précisément dans la
génération automatique de mail- lages surfaciques quadrangulaires.
L’idée est d’adapter des maillages aux problèmes physiques à
traiter en considérant à la fois les caractéris- tiques
géométriques de la surface à discrétiser (courbures,
discontinuités) et des caractéristiques du problème (couches
limites le long d’une aile d’avion, choc dans un fluide). Dans
notre contexte, ces dernières sont modélisées à l’aide de
métriques. Sur l’exemple ci-dessous le maillage régulier (à gauche)
et adapté à la métrique (au centre) pour obtenir le maillage aligné
sur cette métrique (à droite).
Objectifs
Le cadre proposé est de se baser sur l’extension de techniques
d’adaptation de maillages triangulaires. Celles-ci sont robustes et
permet- tent intrinsèquement de contrôler la densité, l’orientation
et la qualité du maillage. En considérant les travaux récents sur
les champs d’orientations 3D, elles peuvent être complétées d’une
information d’orientation pour générer des maillages
quadrangulaires. Partant des travaux de [1] et [2], l’objectif du
stage sera de : valider une nouvelle procédure d’insertion de
points durant la phase d’adaptation du maillage ainsi qu’une
procédure de création directe de quadrilatères. Ce travail
nécessite de développer des opérateurs topologiques de modi-
fication de maillages et des opérateurs géométriques reposant sur
les notions de métriques et d’orientations pour placer les nouveaux
points du maillage. D’un point de vue mathématique, tous les
développements reposeront sur le socle théorique des espaces
métriques Riemanniens. L’implantation se fera dans le cadre du
projet open-source GMDS, projet C++ développé et maintenu au
CEA/DAM. Les résultats seront évalués sur différents exemples
analytiques et sur des données issues de codes de simulation
numérique. [1] A. Loseille. Metric-orthogonal anisotropic mesh
generation. Procedia Engineering, 82:403–415, 2014. [2] N.
Kowalski, F. Ledoux, and P. Frey. Smoothness driven frame field
generation for hexa- hedral meshing. Computer Aided Design, vol.
72, pages 65-77, 2016.
Domaines de spé- cialité requis Informatique – Mathématiques
appliquées
Langages/logiciels C/C++
Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse
Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 34
Titre Etude et implantation d’algorithmes parallèles de
génération
d’hexaèdres par combinaison de tétraèdres
Référence SN-19-05
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est
re- connu comme un expert du domaine HPC grâce à l’impulsion du «
Pro- gramme Simulation ». La simulation numérique consiste à
reproduire par le calcul le fonctionnement d’un système physique,
préalablement décrit par un ensemble de modèles. Le CEA/DAM
travaille à l’élaboration de méthodes mathématique qui nécessitent
le plus souvent la discrétisation en hexaèdres du domaine d’étude.
De tels maillages sont utilisés par de nombreux organismes de
recherche et industriels pour la résolution de problèmes physiques
(interaction fluide-structure, aérodynamisme). La génération
automatique de maillages 3D purement hexaédriques est un problème
difficile pour lequel aucune solution satisfaisante n’existe
actuellement. De ce fait, depuis quelques années, différentes
solutions [1,2,3] ont été proposées pour générer des maillages à
dominante hexaé- drique, c’est-à-dire composés majoritairement
d’hexaèdres et minoritaire- ment de tétraèdres, prismes à base
triangulaire et de pyramides à base quadrangulaire. [1] S. Meshkat,
D. Talmor, Generating a mixed mesh of hexahedra, pentahedra and
tetrahe- dra from an underlying tetrahedral mesh, International
Journal for Numerical Methods in Engineering, pp. 17-30, 2000. [2]
S. Yamakawa, K. Shimada, Fully-automated hex-dominant mesh
generation with direc- tionality control via packing rectangular
solid cells, International Journal for Numerical Meth- ods in
Engineering, pp. 2089-2129, 2003. [3] D. Sokolov, N. Ray, L.
Untereiner, B. Levy, Hexahedral-dominant meshing, ACM Tran-
sactions on Graphics, pp. 1-23, 2016.
Objectifs
Les algorithmes proposés dans [1,2,3] suivent une approche
indirecte qui consiste à générer un maillage tétraèdrique puis à
combiner des té- traèdres pour créer des hexaèdres. Les
heuristiques employées sont de nature « gloutonne ». Relativement
coûteuse en temps de calcul, elles ne garantissent pas d’obtenir
une solution optimale au problème posé. C’est pourquoi le stage
proposé consistera à :
1. Développer au sein du projet open-source GMDS, une version
concurrente d’au moins un algorithme de recombinaison de té-
traèdres en hexaédres. L’implémentation pourra se faire indiffé-
remment en C++ ou en Rust.
2. A l’aide de méthodes issues de la recherche opérationnelle (pro-
grammation dynamique par exemple), proposer une approche as- surant
l’optimalité de la solution.
Evaluer théoriquement et expérimentalement les solutions
développées aux étapes 1 et 2.
Domaines de spé- cialité requis Informatique
Langages/logiciels C/C++ et/ou Rust Mots clés Maillage, théorie des
graphes, recherche opérationnelle Formation recher- chée
BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse
Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 35
Titre Equilibrage de charge dynamique pour la visualisation
scientifique
Référence SN-19-06
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est
con- sidéré comme étant un expert du Calcul Haute Performance. Ses
équipes développpent des codes de simulation numérique et des
logiciels d’environnement de codes pouvant s’exécuter efficacement
sur des su- percalculateurs. En particulier, les équipes du CEA/DAM
spécialisées en visualisation scientifique sont reconnues pour leur
expertise en visualisa- tion parallèle sur supercalculateur. Pour
cela, elles participent activement au développement de la
bibliothèque open-source VTK, qui fournit un pipeline complet de
visualisation mixant différents types de données et d’algorithmes
(des filtres). Pour répondre aux besoins des codes de simulations,
le CEA/DAM a dé- veloppé depuis quelques années des structures de
données et des filtres VTK dédiés à la manipulation de maillages
AMR [1]. Intuitivement, un maillage AMR est un grille régulière
(I,J,K) où chaque maille de la grille peut elle-même être
subdivisée en une sous-grille et ce de manière récur- sive. Le
stage proposé s’inscrit dans la manipulation parallèle de tels
maillages et plus spécifiquement dans leur partitionnement.
Partitionner un maillage consiste à attribuer chaque maille à
exactement un et un cœur, dans le but d'équilibrer les temps de
calcul sur chaque cœur [2]. [1] Guénolé Harel, Jacques-Bernard
Lekien, Philippe P. Pébaÿ. Two New Contributions to the
Visualization of AMR Grids: I. Interactive Rendering of
Extreme-Scale 2-Dimensional Grids II. Novel Selection Filters in
Arbitrary Dimension. [2] C. Chevalier and F. Pellegrini, PT-SCOTCH:
a tool for efficient parallel graph ordering. Parallel Computing,
34(6-8), pp 318-331, 2008.
Objectifs
L’objectif du stage est de proposer un nouvel algorithme de
partitionne- ment dédié à la visualisation scientifique de
maillages AMR. Le travail consistera à :
1. Effectuer une étude bibliographique des algorithmes de
partition- nement généralistes de graphes et implémenter une
première ap- proche en utilisant les structures AMR de VTK ;
2. Puis, en tirant parti des caractéristiques intrinsèques des
mail- lages AMR, l’approche sera étendue pour gérer des maillages
disposant de mailles fantômes (i.e. des mailles dupliquées sur
plusieurs coeurs).
Selon l’état d’avancement des travaux et le profil du stagiaire, ce
travail pourra être complété par : (1) une extension parallèle de
l’algorithme où l’on s’intéressa au paradigme de programmation
concurrente (multi- threads) ; (2) la modification d’un
partitionnement existant (ou repartition- nement). L’ensemble des
travaux réalisés sera implémenté et évalué expérimenta- lement au
sein de la bibliothèque VTK écrite en C++. L’étudiant aura pour
cela accès à plusieurs supercalculateurs et par la même différents
types d’accélérateurs modernes.
Domaines de spé- cialité requis Informatique
Langages/logiciels C/C++, Python
Mots clés Visualisation scientifique, AMR, Partitionnement, VTK.
Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse
Oui
Pour faire acte de candidature, veuillez transmettre un CV et une
lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous
pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 36
Propositions de stages informatiques 2019 au CEA/DAM Ile de
France
Titre Etude et évaluation de la structure de donnée SVDAG et
ses
variantes pour le RayTracing en visualisation scientifique
Référence SN-19-07
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est
considéré comme étant un expert du Calcul Haute Performance. Dans
ce contexte, les équipes du CEA/DAM spécialisées en visualisation
scientifique sont reconnues pour leur expertise en visualisation
parallèle sur supercalculateur. Elles participent activement au
développement de la bibliothèque open-source VTK, qui fournit un
pipeline complet de visualisation associant différents types de
données et d’algorithmes. Pour répondre aux besoins de codes de
simulation, le CEA/DAM a développé depuis quelques années des
structures de données et des filtres VTK dédiés à la visualisation
et la manipulation de maillages AMR [1]. D’autres structures
hiérarchiques utilisées dans le cadre de l’industrie
cinématographique ou du jeux-vidéo permettent un rendu réaliste de
type ray-tracing en temps réel en faisant appel à la programmation
sur carte graphique (CUDA). Ces structures sont basées sur les
Smart Voxel Octrees (SVO) [2], une représentation d’une scène
voxelisée de type octree optimisée. Des techniques de compressions
offrent par la suite des gains substantiels en tenant compte des
motifs similaires : les Smart Voxel Directed Acyclic Graph (SVDAG)
[2] ou encore les Symmetric SVDAG (SSVDAG) [3]. [1] Guénolé Harel,
Jacques-Bernard Lekien, Philippe P. Pébaÿ. Visualization and
Analysis of Large-Scale, Tree-Based, Adaptative Mesh Refinement
Simulations with Arbitrary Rectilinear Geometry. [2] Viktor Kämpe,
Erik Sintorn et Ulf Assarsson. High Resolution Sparse Voxel DAGs.
[3] Alberto Jaspe Villanueva, Fabio Marton et Enrico Gobbetti.
Symmetry-aware Sparse Voxel DAGs (SSVDAGs) for compression-domain
tracing of high-resolution geometric scenes.
Objectifs
L’objectif du stage est de permettre l’évaluation de ces structures
hiérarchiques pour la visualisation scientifique. En contact avec
les équipes de recherche suédoises à la base du SVDAG, le stagiaire
devra : 1. Tout d’abord, étudier et comprendre la théorie et
l’implémentation des
structures SVO/SVDAG/SSVDAG pour en évaluer les performances de
rendu ray-tracing dans un contexte maitrisé.
2. Un premier convertisseur VTK-AMR vers SVDAG/SSVDAG sera à
implémenter.
3. Le travail se poursuivra par l’application de rendu réaliste de
type lancé de rayons à base de SVDAG sur ces données issues de
VTK-AMR.
Plusieurs développements seront possibles en vue de prendre en
compte la notion de variables ou de compresser encore plus les
informations dans le cadre de rendu de films interactifs. Les
développements effectués seront évalués aussi bien sur GPU que sur
les nombreux accélérateurs et processeurs disponibles au
CEA/DAM.
Domaines de spécialité requis
Mots clés Visualisation scientifique, AMR, multithread, GPU, VTK,
MPI, Anglais. Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en
thèse
Oui
Pour faire acte de candidature, veuill