of 48 /48
Direction des applications militaires Centre DAM Île de France INFORMATIQUE D’ENTREPRISE INFORMATIQUE SCIENTIFIQUE SIMULATION NUMERIQUE SECURITE INFORMATIQUE Date de diffusion : septembre 2018 Commissariat à l’énergie atomique et aux énergies alternatives Centre DAM Île de France - Bruyères-le-Châtel – F- 91297 Arpajon Cedex Tél : (33) – 01 69 26 40 00 Établissement public à caractère industriel et commercial R. C..S. PARIS B 775 685 019 PROPOSITIONS DE STAGES 2019 AU CEA/DAM ÎLE DE FRANCE

PROPOSITIONS DE STAGES -

  • Author
    others

  • View
    1

  • Download
    0

Embed Size (px)

Text of PROPOSITIONS DE STAGES -

PROCCOU.docDi rect ion des appl icat ions mi l i ta i res Centre DAM Î le de France
INFORMATIQUE D’ENTREPRISE INFORMATIQUE SCIENTIFIQUE
SIMULATION NUMERIQUE SECURITE INFORMATIQUE
Date de diffusion : septembre 2018
Commissariat à l’énergie atomique et aux énergies alternatives Centre DAM Île de France - Bruyères-le-Châtel – F- 91297 Arpajon Cedex
Tél : (33) – 01 69 26 40 00 Établissement public à caractère industriel et commercial
R. C..S. PARIS B 775 685 019
PROPOSITIONS DE STAGES 2019
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
TABLE DES MATIERES 1 Les stages proposés en un coup d’oeil ..................................................................... 4
2 Le CEA ...................................................................................................................... 5
3 Le CEA/DAM ............................................................................................................. 6
5 Le CAMPUS TERATEC .......................................................................................... 10
6 Les activités informatiques au CEA/DAM – Ile de France ....................................... 12
7 Sites utiles ............................................................................................................... 12
9 Les thématiques des stages ................................................................................... 13
10 Les stages en informatique d’entreprise ................................................................. 14
11 Les stages en informatique scientifique .................................................................. 17
12 Les stages en simulation numérique ....................................................................... 31
13 Les stages en sécurité informatique ....................................................................... 42
Page 3
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
1 LES STAGES PROPOSES EN UN COUP D’OEIL
Thème Titre Référence Formation Durée (mois)
Info rm
ati que
d'en tre
pris e
DevOps : automatisation des tests sur l’application PLM IE-19-01 Bac + 4/5 5 à 6
DevOps : intégration continue, analyse et qualité de code IE-19-02 Bac + 4/5 5 à 6
Développement d’un outil de gestion du parc de postes Windows DAM IE-19-03 Bac + 4/5 3 à 6Info rm
ati que
d'en tre
pris e
Evaluation de solutions de NAS open source IS-19-01 Bac + 4/5 3 à 6
Interface web de visualisation de filesystem IS-19-02 Bac + 4/5 3 à 6
Conception d'une nouvelle architecture de tests pour le projet open source Lustre IS-19-03 Bac + 4/5 4 à 6
Développement d'une fonctionnalité de classes de service dans un logiciel de stockage
IS-19-04 Bac + 4/5 4 à 6
Bibliothèques d'accès à des nouvelles technologies de stockage IS-19-05 Bac + 4/5 4 à 6
Développement d'une interface S3 pour un logiciel de stockage objet distribué
IS-19-06 Bac + 4/5 4 à 6
Développement d'un mécanisme de versionnage de données IS-19-07 Bac + 4/5 4 à 6
Info rm
ati que
sc ien
tif ique
Prédiction du taux de dé-duplication pour du stockage massif de données IS-19-08 Bac + 4/5 4 à 6
Définition d'un benchmark générique pour la validation de cluster IS-19-09 Bac + 4/5 4 à 6Info rm
ati que
sc ien
tif ique
Génération de rapports de profilage pour SELFIE IS-19-10 Bac + 4/5 4 à 6
Génération d'un simulateur de communications MPI IS-19-11 Bac + 4/5 4 à 6
Etude et amélioration d’outils de configuration de fabrics InfiniBand IS-19-12 Bac + 4/5 4 à 6
Etude et intégration d’une solution de monitoring InfiniBand IS-19-13 Bac + 4/5 4 à 6
Evaluation du routage sur les réseaux d’interconnexion de clusters de calcul (HPC)
IS-19-14 Bac + 4/5 4 à 6
Algorithmes de reconstruction d’interface par Machine Learning et Apprentissage Supervisé
SN-19-01 Bac + 4/5 4 à 6
Opérateur de diffusion vectoriel pour l’hydrodynamique lagrangienne turbulente SN-19-02 Bac + 5 5 à 6
Optimisation géométrique de maillages hexaédriques SN-19-03 Bac + 5 5 à 6
Métriques orientées pour maillages quadrangulaires surfaciques SN-19-04 Bac + 5 5 à 6
Sim ulat
numéri que
Etude et implantation d’algorithmes parallèles de génération d’hexaèdres par combinaison de tétraèdres SN-19-05 Bac + 5 5 à 6
Equilibrage de charge dynamique pour la visualisation scientifique SN-19-06 Bac + 5 5 à 6
Etude et évaluation de la structure de donnée SVDAG et ses variantes pour le RayTracing en visualisation scientifique SN-19-07 Bac + 5 5 à 6
Etude et implémentation d’algorithmes massivement multi-threads et GPU en visualisation scientifique SN-19-08 Bac + 5 5 à 6
Algorithme concurrent d’appariement de sommets dans un graphe SN-19-09 Bac + 5 5 à 6
Simulateur des flux de données des codes de calcul HPC SN-19-10 Bac + 5 5 à 6
Couplage d’un framework de visualisation in-situ avec un code de calcul hydrodynamique HPC
SN-19-11 Bac + 5 5 à 6
Sim ulat
numéri que
R&D autour de la cartographie réseau SI-19-01 Bac + 5 3 à 6
Dé-obscurcissement de JavaScript SI-19-02 Bac + 5 5 à 6
Séc urit
info rm
ati que
Reconnaissance automatique de fonctions par effets de bord SI-19-03 Bac + 4 3
Techniques de fuzzing et d'audit de code appliquées à l'évaluation de la sécurité de systèmes de fichiers réseau
SI-19-04 Bac + 5 5 à 6Séc urit
é
SI-19-05 Bac + 5 5 à 6
Page 4
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
2 LE CEA
Acteur majeur de la recherche, du développement et de l'innovation, le Commissariat à l’énergie atomique et aux énergies alternatives intervient dans quatre domaines :
• la défense et la sécurité,
• les énergies nucléaires et renouvelables,
• la recherche technologique pour l’industrie,
• la recherche fondamentale (sciences de la matière et sciences de la vie).
S’appuyant sur une capacité d’expertise reconnue, le CEA participe à la mise en place de projets de collaboration avec de nombreux partenaires académiques et industriels.
Le CEA est implanté sur 9 centres répartis dans toute la France. Il développe de nombreux partenariats avec les autres organismes de recherche, les collectivités locales et les universités. A ce titre, le CEA est partie prenante des alliances nationales coordonnant la recherche française dans les domaines de l’énergie (ANCRE), des sciences de la vie et de la santé (AVIESAN), des sciences et technologies du numérique (ALLISTENE), des sciences de l’environnement (AlIEnvi) et des sciences humaines et sociales (ATHENA).
Reconnu comme un expert dans ses domaines de compétence, le CEA est pleinement inséré dans l'espace européen de la recherche et exerce une présence croissante au niveau international.
Le CEA compte 16 010 techniciens, ingénieurs, chercheurs et collaborateurs pour un budget de 4,1 milliards d'euros (chiffres publiés fin 2016).
ORGANIGRAMME DU CEA
Page 5
Propositions de stages informatiques 2019 au CEA/DAM Ile de France 3 LE CEA/DAM
Une direction au service de la dissuasion La Direction des applications militaires (DAM) du CEA, a pour mission de concevoir, fabriquer, maintenir en condition opérationnelle, puis démanteler les têtes nucléaires qui équipent les forces nucléaires aéroportée et océanique françaises. La DAM est chargée de la conception et de la réalisation des réacteurs et de cœurs nucléaires équipant les bâtiments de la Marine nationale, sous-marins et porte-avions. Elle apporte son soutien à la Marine nationale pour le suivi en service et le maintien en condition opérationnelle de ces réacteurs. La DAM est également responsable de l'approvisionnement des matières nucléaires stratégiques pour les besoins de la dissuasion. Dans un monde en profonde mutation, la DAM contribue aussi à la sécurité nationale et internationale à travers l’appui technique qu’elle apporte aux autorités, pour les questions de lutte contre la prolifération nucléaire et le terrorisme et de désarmement. Depuis le transfert du centre de Gramat en 2010 de la Direction générale de l’armement au CEA, la DAM apporte son expertise à la Défense dans le domaine de l’armement conventionnel. Une direction ouverte à la recherche Le partage national et international des connaissances (lorsqu’il est possible), la confrontation à l’évaluation scientifique extérieure, l’intégration à des réseaux de compétences constituent des gages de crédibilité scientifique. Les équipes de la DAM réalisent chaque année environ 2000 publications et communications scientifiques. Cette ouverture de la DAM passe également par la mise à la disposition de la communauté des chercheurs de ses moyens expérimentaux et par la contribution de ses équipes à d’autres programmes de recherche. Une direction actrice de la politique industrielle française La DAM partage très largement son activité avec l’industrie française : c’est ainsi que le montant des achats, auprès de celle-ci, représente plus des deux tiers de son budget ; le dernier tiers se répartit entre les salaires des personnels (un cinquième) et les taxes. La politique industrielle de la DAM est originale à plus d’un titre :
• d’abord parce que la DAM conserve la maîtrise d’œuvre d’ensemble de la grande majorité des systèmes dont elle a la responsabilité : elle veille ainsi au juste équilibre entre les grands groupes industriels de la Défense et les PME souvent innovantes, en contractualisant directement avec ces dernières, leur permettant ainsi de recevoir la juste rémunération de leur production ;
• ensuite, parce que la répartition de son budget est sous-tendue par une répartition des travaux : la DAM conduit la recherche dans ses laboratoires grâce à son personnel de haut niveau scientifique et technologique. Une fois la définition d’un produit acquise, la DAM transfère la définition et les procédés vers les industriels qui en réalisent le développement, puis la production.
La DAM a également pour objectif que ses centres participent à la vie économique locale par leur implication dans les pôles de compétitivité. Hors de son propre champ d’utilisation, elle valorise ses recherches par le transfert de technologies vers l’industrie et le dépôt de nombreux brevets.
Page 6
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
Le format La DAM comprend cinq centres aux missions homogènes, dont les activités se répartissent entre la recherche de base, le développement et la fabrication :
• DAM Ile-de-France (DIF), à Bruyères-le-Châtel, où sont menés les travaux de physique des armes, les activités de simulation numérique et de lutte contre la prolifération nucléaire ; DIF est aussi le centre responsable de l’ingénierie à la DAM ; enfin, au centre DIF est rattachée l’INBS-Propulsion Nucléaire du centre CEA/Cadarache, en région Provence Alpes-Côte d’Azur, où sont implantées les installations d'essais à terre et une partie des fabrications de la propulsion nucléaire ;
• Le Cesta, en Aquitaine, consacré à l’architecture des
armes, aux tests de tenue à l’environnement. Il met en œuvre le Laser Mégajoule, équipement majeur de la Simulation ;
• Valduc, en Bourgogne, dédié aux matériaux nucléaires et à
l’installation expérimentale Epure du programme Simulation ;
• Le Ripault, en région Centre, dédié aux matériaux non
nucléaires (explosifs chimiques…) ;
• Gramat, (ex-DGA) en Midi-Pyrénées, qui conduit au profit de la Défense des activités en vulnérabilité des systèmes et efficacité des armements.
Centre DAM Île-de-France
Page 7
Propositions de stages informatiques 2019 au CEA/DAM Ile de France 4 LE CENTRE DAM - ILE DE FRANCE
Le CEA/DAM - Île de France (DIF) est l'une des directions opérationnelles de la DAM.
Le site de la DIF compte environ 2000 salariés CEA et accueille quotidiennement environ 600 salariés d'entreprises extérieures. il est situé à Bruyères-le-Châtel à environ 40 km au sud de Paris, dans l'Essonne.
Les missions de la DIF comprennent :
• la conception et garantie des armes nucléaires, grâce au programme Simulation. L'enjeu consiste à reproduire par le calcul les différentes phases du fonctionnement d'une arme nucléaire et à confronter ces résultats aux mesures des tirs nucléaires passés et aux résultats expérimentaux obtenus sur les installations actuelles (machine radiographique, lasers de puissance, accélérateurs de particules) ;
• la lutte contre la prolifération et le terrorisme, en contribuant notamment au programme de garantie du Traité de Non Prolifération et en assurant l'expertise technique française pour la mise en œuvre du Traité d'Interdiction Complète des Essais Nucléaires (TICE) ;
• l'expertise scientifique et technique, dans le cadre de la construction et du démantèlement d'ouvrages complexes ainsi que pour la surveillance de l'environnement et les sciences de la terre ;
• l'alerte des autorités, mission opérationnelle assurée 24h sur 24, 365 jours par an, en cas d'essai nucléaire, de séisme en France ou à l'étranger, et de tsunami dans la zone Euro-méditerranéenne. La DIF fournit aux autorités les analyses et synthèses techniques associées.
Depuis 2003, le centre DAM-Île-de-France héberge le complexe de calcul scientifique du CEA, qui regroupe l’ensemble des supercalculateurs du CEA, et qui comprend à ce jour :
• le supercalculateur Tera1000-1 pour les besoins du programme Simulation du CEA/DAM, mis en service en 2016, dispose d’une puissance de calcul de 2,5 petaflops, c’est à dire capable d’effectuer 2,5 millions de milliards d’opérations par seconde. Il est complété en 2018 par Tera1000-2, autre composante du projet Tera1000, qui préfigure les architectures et technologies du futur supercalculateur qui sera installé à l’horizon 2020.Sa puissance de calcul est de 12,5 petaflops.
Page 8
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
• Le supercalculateur Cobalt du Centre de Calcul pour la Recherche et la Technologie (CCRT), ouvert à la communauté civile de la recherche et de l’industrie, pour une puissance globale de 1,5 petaflops.
• le supercalculateur IRENE, d’une puissance de 9 petaflops, deuxième élément d’un réseau de supercalculateurs de classe petaflopique destiné aux chercheurs de la communauté scientifique européenne. Ce supercalculateur est hébergé au TGCC (Très Grand Centre de Calcul) et exploité par les équipes du CEA, qui apporte ainsi sa contribution à la participation de la France au projet PRACE (Partnership for Advanced Computing in Europe)
Page 9
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
5 LE CAMPUS TERATEC La plupart des stages proposés se déroulent dans les locaux du campus [email protected]. Les autres se déroulent dans les locaux situés à l’intérieur du site CEA.
Le Campus TERATEC est l’une des deux composantes de la Technopole TERATEC, l’autre composante étant le « Très Grand Centre de Calcul du CEA » (TGCC).
Cette technopole, a été créée à l’initiative du CEA afin de développer et promouvoir la simulation numérique haute performance, à proximité du site du CEA, sur la commune de Bruyères-le-Châtel, dans le département de l’Essonne.
Une cantine « inter-entreprises » est accessible à tous les stagiaires.
L’accès principal à la Technopole TERATEC se fait par une entrée commune au TGCC et au Campus, située au nord-ouest, sur le chemin de la Piquetterie.
Page 10
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
Le CEA a mis en place un réseau spécifique de cars qui dessert Paris et de nombreuses communes de la région parisienne. Par ailleurs, le campus [email protected] est desservi par la ligne de transport en commun 91-04, entre la gare routière d’Evry et la gare autoroutière de Briis-sous-Forges.
Page 11
Propositions de stages informatiques 2019 au CEA/DAM Ile de France 6 LES ACTIVITES INFORMATIQUES AU CEA/DAM – ILE DE FRANCE
Le système d’information (SI) de la DAM est constitué de 4 sous-systèmes : entreprise, technique, industriel et scientifique, concernant respectivement :
• les aspects budget, ressources humaines, logistique, sécurité des personnes et des biens, patrimoine …
• les activités « Programme » de la DAM : bureau d’études, méthodes, calcul, fabrication, qualité des produits fabriqués, gestion des matières …
• les procédés industriels : acquisition mesures, système de supervision, surveillance, commande contrôle, contrôle des utilités, accès, autocom télécom …
• le domaine scientifique associant la simulation avec le calcul haute performance.
Les activités déclinées dans ces systèmes d’information dans lesquelles s’inscrivent les stages proposés, sont les suivantes :
• étude, conception et réalisation du système d’information du CEA/DAM ; • définition, conception, déploiement et exploitation des réseaux et des serveurs ; • étude, conception, développement et maintenance de codes et outils de simulation
numérique et d’environnement logiciel dans le domaine du calcul haute performance ; • étude, conception, développement de systèmes informatiques dans le domaine du calcul
haute performance ; Auxquelles deux activités transverses sont ajoutées :
• expertise et activités opérationnelles dans le domaine de la sécurité informatique ; • animation scientifique dans le domaine du calcul scientifique haute performance.
7 SITES UTILES Pour plus d’informations, vous pouvez consulter les sites suivants : http://www.cea.fr http://www-hpc.cea.fr/ http://www.teratec.eu/ Retrouvez tous les stages proposés par le CEA sur le site : http://www.cea.fr/recrutement
8 COMMENT POSTULER POUR UN STAGE ? Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00. Nous attirons l’attention des candidats sur le fait que les délais d’instruction des dossiers de candidature sont de 2 mois, sauf pour les thématiques « Informatique d’entreprise » et « sécurité informatique » pour lesquels le délai est de 4 mois.
Page 12
9 LES THEMATIQUES DES STAGES
Les stages proposés se déclinent dans les 4 thématiques suivantes : Informatique d’entreprise : serveurs bureautiques et applicatifs, applications de gestion, postes de travail, bases de données, Intranet ; Informatique scientifique, Calcul Haute Performance (HPC) et réseaux : grands calculateurs à vocation scientifique, High Performance Computing, stockage haute performance, logiciels « système », Linux, réseaux d’entreprise, interconnexion des calculateurs ; Simulation numérique : développement de logiciels scientifiques, IHM, visualisation, gestion de données, pré et post-traitement ; Sécurité informatique : développement d’outils logiciels.
Page 13
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
10 LES STAGES EN INFORMATIQUE D’ENTREPRISE
Titre
Référence IE-19-01
Contexte
L’application SEQUOIA a été déployée en 2010 au sein des différents centres de la DAM, et regroupe aujourd’hui plusieurs centaines d’utilisateurs. L’activité couverte par cette application est centrale : il s’agit de gérer le cycle de vie des produits et de garantir leur qualité. Cette application s’appuie sur un outil du marché, complété par des développements spécifiques qui évoluent régulièrement. La complexité de l’application et la richesse des fonctionnalités qu’elle offre, nécessite d’automatiser les tests sur toutes les versions avant leur déploiement. Ce sujet s’inscrit dans la démarche DevOps engagée au sein du service informatique. Le patrimoine de tests automatiques a été initié et doit être enrichi continuellement. Dans ce contexte, l’outil Selenium a été mis en œuvre. D’autres briques logicielles viennent progressivement compléter la solution d’automatisation, et s’interfacer avec le système d’intégration continue. Une interface avec l’outil de gestion de test TestLink a par exemple été mise en place. Compte tenu des enjeux métier auxquels répond ce sujet, des méthodes de travail très rigoureuses ont été mises en place et devront être respectées, rendant ainsi l’environnement de travail très enrichissant.
Objectifs
Les objectifs du stage sont :
Prise de connaissance de l’application et montée en compétence sur son architecture Montée en compétence sur l’outil d’automatisation de test Selenium Développement des tests automatiques Intégration de la solution aux autres briques DevOps
Rédaction de la documentation technique
Domaines de spécialité requis Programmation, génie logiciel, web
Langages/logiciels Java, Selenium, ant, HTML, Javascript
Mots clés DevOps, intégration continue, développement, tests, automatisation, qualité logicielle, web, javascript
Formation recherchée BAC+4 ou 5
Durée du stage 5 mois minimum Durée de l’apprentissage 1 an minimum
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 14
Titre DevOps : intégration continue, analyse et qualité de code
Référence IE-19-02
Contexte
Le département informatique du CEA / DAM prend à sa charge certains développements d’informatique de gestion, et intègre également des solutions commerciales ou open source, souvent enrichies par des fonctionnalités développées spécifiquement pour ses besoins propres. Dans ces deux cas, développements internes et sous-traités, le CEA / DAM souhaite contrôler de façon très régulière la qualité du code des applications dont il a la responsabilité, voire même contribuer à la recette fonctionnelle. Un environnement technique est déjà existant (gestion de version notamment). Les autres briques n’existent pas encore.
Objectifs
Prise de connaissance de l’environnement et de la cible Etude et analyse des différentes solutions possibles pour chaque brique Prototypage et maquettage éventuel de certaines solutions (installation, intégration, paramétrage, développements spécifiques) Intégration des solutions retenues aux autres briques DevOps de production Rédaction de la documentation technique Présentation de la solution aux unités informatiques
Domaines de spécialité requis
Langages/logiciels Langages web, langages de programmation (C#, Java, Python), Sonar, Jenkins, …
Mots clés DevOps, intégration continue, développement, automatisation, qualité logicielle
Formation recherchée BAC+3, 4 ou 5
Durée du stage 5 mois minimum
Durée de l’apprentissage 1 an minimum
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]
Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 15
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
Titre Développement d’un outil de gestion du parc de postes Windows DAM
Référence IE-19-03
Contexte
Le laboratoire IS (Ingénierie des Systèmes) est responsable des services d’infrastructure des différents réseaux centralisés du CEA/DAM répartis sur cinq centres. Les activités du Laboratoire Ingénierie des Systèmes portent principalement sur : la conception et maintien en condition opérationnelle des plates formes hébergeant les services d’administration, de stockage, de virtualisation, de sauvegarde, de sécurité et d’exploitation des réseaux DAM, l’optimisation et l’adaptation de tous ces services pour l’accueil des plates formes applicatives, la mise en production auprès de l’infogérant dans le respect des pratiques ITIL, la résolution des incidents escaladés, le maintien en sécurité exigée sur les réseaux qu’il maîtrise. Le laboratoire est garant de la mise en œuvre du niveau de sécurité attendu sur chacun des réseaux qu’il opère. Il doit répondre de manière récurrente à des sollicitations concernant la mise en place de nouveaux mécanismes de sécurité demandées par des entités internes ou externes.
Objectifs
Dans le cadre du renforcement de la sécurité informatique, le LIS souhaite automatiser et standardiser son outil de gestion de parc informatique Microsoft SCCM. Afin d’assurer sa mission d’harmonisation du poste de travail au standard DAM en Windows 10 pour tous les centres DAM. Les objectifs du stage sont : l’optimisation du déploiement des postes en Windows 10 avec l’élaboration de scripts en Powershell. Suivant la durée de la mission, le stagiaire sera amené à se déplacer sur les centres. Des connaissances en administration systèmes et en filtrage de réseaux IP serait un plus.
Domaines de spécialité requis
Langages/logiciels Windows 2016 Server, Microsoft SCCM
Mots clés Informatique, Administration Windows, Sécurité, SCCM
Formation recherchée Minimum BAC+4/5
Durée du stage 5 mois Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 16
11 LES STAGES EN INFORMATIQUE SCIENTIFIQUE
Titre
Référence IS-19-01
Contexte
Les utilisateurs des centres de calcul du CEA disposent d’un espace de travail sur un serveur de fichiers de type NAS. Il est utilisé pour préparer leurs codes de calculs avant de les faire tourner sur le calculateur. Cet es- pace dispose de plusieurs fonctionnalités qui permettent notamment de récupérer facilement des fichiers effacés ou modifiés (snapshot), de fonc- tionner en haute disponibilité, etc.
Objectifs
Les objectifs du stage sont : évaluer les alternatives Open Source de la solution propriétaire actuel- lement en place avec les différentes fonctionnalités proposées, mettre en place une ou des solutions retenues sur plusieurs configura- tions matérielles pour en évaluer les performances, réaliser une série de tests proche de l’usage des équipements en centre de calcul afin d’évaluer la tenue des différentes solutions, valider le fonctionnement des différentes fonctionnalités (Haute disponibi- lité, …). Le stagiaire explorera plus particulièrement le système de fichiers ZFS qui est utilisé dans plusieurs solutions de NAS.
Domaines de spécia- lité requis Informatique
Langages/logiciels Linux
Formation recher- chée BAC+4/5
Durée du stage 3 à 6 Mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]
Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 17
Titre
Référence IS-19-02
Contexte
Les supercalculateurs du CEA produisent tous les jours de grandes quanti- tés de données qui sont stockées sur des systèmes de fichiers distribués. Robinhood[1] (Policy Engine) est un logiciel open source qui permet de sur- veiller et gérer l’ensemble des fichiers/dossier/… qui se trouvent sur ces systèmes de fichiers (Récupérer le nombre de fichiers d’un utilisateur, la taille, l’espace utilisé par un groupe d’utilisateur, de déplacer des fichiers selon certaines règles, …). Cet outil dispose actuellement d’une interface web « sommaire » qui permet de visualiser quelques éléments principaux. [1]https://github.com/cea-hpc/robinhood
Objectifs
L’interface web de Robinhood se décompose en deux parties : Une API qui expose les données contenues dans la base de Robinhood Une interface « End-User » qui permet d’afficher les données exposées par l’API Le stage consistera à : Développer l’interface pour ajouter une vision « globale » du système de fichier (Semblable à de celle de Baobab[1] ou qdirstat[2]), Proposer une extension à Baobab pour qu’il puisse se connecter à l’API de Robinhood, Améliorer la fonctionnalité de recherche et visualisation des fichiers des utilisateurs, Proposer et ajouter d’autres visualisations pour aider à l’administration, Ajouter une interface/API pour exporter les données vers des outils tiers. [1] : https://wiki.gnome.org/Apps/Baobab [2] : https://github.com/shundhammer/qdirstat
Domaines de spécia- lité requis Programmation PHP, Web, Base de données, Linux
Langages/logiciels PHP, HTML, Javascript, SQL, Git
Mots clés Web, Visualisation, Stockage
Formation recher- chée BAC+4/5
Durée du stage 3 à 6 Mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]
Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 18
Titre
Conception d'une nouvelle architecture de tests pour le projet open
source Lustre
Référence IS-19-03
Contexte
Lustre est un système de fichiers distribué, hautement parallèle, open source, couramment utilisé dans le domaine du HPC. Le CEA contribue activement au projet. Actuellement, le temps d'exécution séquentiel de la base de tests du projet avoisine les 21h. Ceci impacte lourdement le développement de Lustre.
Objectifs
Les objectifs du stage sont : étudier et réaliser une architecture qui facilitera la création de nouveaux tests et réduira le temps d'exécution des bases de tests tout en conservant une grande simplicité d'utilisation. Ce stage n'a pas pour objectif de réécrire les bases de tests de Lustre. définir un protocole de migration de l'architecture actuelle vers celle qu'il aura retenue, évaluer les gains apportés par son architecture via une preuve de con- cept, présenter son architecture à la communauté Lustre.
Domaines de spécia- lité requis Génie logiciel, tests, Linux, développement système
Langages/logiciels C, bash, git
Mots clés Programmation distribuée, tests, open source, système de fichiers
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 19
Titre
logiciel de stockage
Contexte
R&D du laboratoire en matière de stockage massif de données en environ- nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets par an) à des débits extrêmes (centaines de gigaoc- tets par seconde). Pour stocker ces données de manière robuste et perfor- mante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel doit notamment gérer plusieurs types de données, avec des be- soins de performance et de fiabilité différents.
Objectifs
Les objectifs du stage sont : développer un mécanisme de gestion de classes de services (COS) dans un logiciel de stockage développé par le CEA, Le choix d'une classe de service permet à un utilisateur de choisir le type de média sur lequel il souhaite stocker une donnée, et d'indiquer le niveau et le type de redondance souhaité (RAID1, Erasure coding…). Définir solution (définition de l'API, des structures de données...), Réaliser le développement en langage C et l'intégrer au projet existant.
Domaines de spécia- lité requis Programmation en C, programmation système, bases de données
Langages/logiciels C, git, systèmes Linux
Mots clés Systèmes distribués, stockage, programmation, développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]
Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 20
Titre
Référence IS-19-05
Contexte
R&D du laboratoire en matière de stockage massif de données en environ- nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel vise notamment à gérer une grande variété de technologies de stockage, telles que les disques, bandes, SSD, NVMe, NVRAM, stockage objet...
Objectifs
Les objectifs du stage sont : d'intégrer de nouvelles technologies de stockage dans un logiciel déve- loppé par le CEA pour préparer les nouvelles générations de supercalcula- teurs, pour faciliter cette intégration, développer une couche d'abstraction of- frant une même interface d'accès quelle que soit la technologie sous- jacente. Il s'agira par exemple d'intégrer des technologies de stockage novatrices de disques connectés en réseau (Seagate Kinetic, appliances OpenIO, …), des logiciels de stockage objet pour le Cloud (Scality) ou pour le HPC (MERO)...
Domaines de spécia- lité requis Programmation en C, programmation système
Langages/logiciels C, git, systèmes Linux
Mots clés Stockage objet, programmation, développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 21
Titre
Développement d'une interface S3 pour un logiciel de stockage objet
distribué
Contexte
R&D du laboratoire en matière de stockage massif de données en environ- nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. S3 est un protocole initialement développé et utilisé par Amazon Web Ser- vices. Il est aujourd'hui communément utilisé comme interface d'accès aux données dans le Cloud Computing.
Objectifs
L'objectif final du stage est de : concevoir un serveur S3 pour un logiciel de stockage développé par le CEA, dans un premier temps, d’étudier la sémantique du protocole S3, réaliser un état de l’art des serveurs S3 disponibles en ‘’open source’’, adapter la solution retenue à un logiciel de stockage distribué développé au CEA.
Domaines de spécia- lité requis Programmation en C, programmation système, réseau et sécurité
Langages/logiciels C, git, systèmes Linux
Mots clés Cloud Computing, stockage, programmation, développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 22
Titre
Référence IS-19-07
Contexte
R&D du laboratoire en matière de stockage massif de données en environ- nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel doit pouvoir gérer un grand nombre d'accès concurrents aux données, ce qui nécessite un mécanisme élaboré de gestion de versions. Ce mécanisme doit notamment permettre un passage à l'échelle pour les prochaines générations de super-calculateurs (calculateurs Exaflopiques).
Objectifs
L'objectif de ce stage est : développer un mécanisme de gestion des versions de données dans un logiciel de stockage développé par le CEA, Ce mécanisme devra permettre de gérer des lectures et des écritures sur de multiples versions des données, tout en offrant certaines garanties sur la cohérence finale des données. réaliser une étude de mécanismes existants de versionage de données (copy-on-write, generation numbers, …), proposer un design de mécanisme adapté aux besoins du CEA, développer la solution (en langage C) et l'intégrera au projet existant.
Domaines de spécia- lité requis Programmation en C, programmation système
Langages/logiciels C, git, systèmes Linux
Mots clés Systèmes distribués, stockage, programmation, développement
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 23
Titre
de données
Référence IS-19-08
Contexte
R&D du laboratoire en matière de stockage massif de données en environ- nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Face à l'explosion de la quantité de données à stocker, la dé-duplication peut s'avérer une stratégie efficace pour gagner en capacité mais également en performance.
Objectifs
Les objectifs du stage sont de : développer un outil permettant de prédire le taux de dé-duplication d'un très large ensemble de données pouvant excéder plus de 10 millions de fichiers pour plusieurs pétaoctets, Cet outil devra être optimisé en temps d'exécution et en ressources néces- saires. Pour cela, on pourra s'inspirer d'une part des dernières avancées et algorithmes statistiques récemment proposés dans ce domaine [1][2] et d'autre part du parallélisme largement utilisé au sein des environnements HPCs. tester et valider cet outil sur des jeux de données représentatifs des centres de calculs du CEA un design de mécanisme adapté aux besoins du CEA, contribuer au développement de mécanismes de dé-duplication au sein des logiciels parallèles et distribués de stockage massif de données déve- loppés au CEA. [1] : https://www.usenix.org/system/files/conference/fast16/fast16-papers- harnik.pdf [2] : http://theory.stanford.edu/~valiant/papers/VV_stoc11.pdf
Domaines de spécia- lité requis programmation, systèmes distribués, base de données
Langages/logiciels C, C++, python, administration Linux, SQL/NoSQL, git
Mots clés stockage, big data, dé-duplication, programmation, développement, statis- tique
Formation recher- chée BAC+4/5
Durée du stage 4 à 6 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 24
Titre Définition d'un benchmark générique pour la validation
de cluster
Référence IS-19-09
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. La production sur ces clusters est constituée de plusieurs codes de calcul très différents. Dans le processus de validation de ces clusters, il faudrait dans l'idéal passer tous les codes, ce qui en pratique est très difficile à mettre en place. Le sujet du stage consiste à définir et développer un ben- chmark générique où il serait possible de le paramétrer pour qu'il reproduise le comportement d'un code de calcul donné. Ce benchmark permettrait de choisir un noyau de calcul particulier, un type de schéma de communication ou bien un schéma de lecture/écriture de fichiers. Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.
Objectifs
Prendre en main les technologies liées au calcul parallèle (MPI, OpenMP, entrées/sorties, etc ...), Définir un benchmark générique, Développer un prototype de ce benchmark, Rédiger une documentation sur le travail effectué. Prérequis: Langage C, Environnement Linux Anglais technique et scientifique Compétences appréciées: Programmation parallèle (MPI) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/
Domaines de spécia- lité requis
Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI
Formation recher- chée BAC+4/5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 25
Titre Génération de rapports de profilage pour SELFIE
Référence IS-19-10
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. Le CEA a développé l'outil SELFIE pour profiler des codes de calcul. Cet outil génère des données et le CEA souhaiterait les présenter sous forme de rapport. Le CEA a une préférence pour des rapports sous forme page HTML (avec les technologies web dynamiques) non connecté car le format est lisible sur n'importe quel navigateur récent. Le rapport contiendra des gra- phiques interactifs permettant d'analyser les données. Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.
Objectifs
Les objectifs de ce stage sont :
Prendre en main les données fournies sous forme JSON de SELFIE Développer un outil pour générer les rapports Rédiger une documentation sur le travail effectué.
Prérequis: HTML/JavaScript/CSS Anglais technique et scientifique Compétences appréciées: Framework JavaScript (pour front-end web) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/ https://github.com/cea-hpc/selFIe
Domaines de spécia- lité requis Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI
Formation recher- chée BAC+4
Durée du stage 4 mois
Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 26
Titre Génération d'un simulateur de communications MPI
Référence IS-19-11
Contexte
Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. Le modèle de programmation MPI (Message Passing Interface) basé sur des communications inter-processus est le modèle le plus utilisé pour déve- lopper des codes parallèles. Les schémas de communications deviennent de plus en plus compliqués et il y a besoin de mieux comprendre ces com- munications afin de les optimiser tant côté code que côté gestion du cluster. Le problème est qu'un code de calcul en production est très complexe à manipuler lorsqu'on souhaite simplement étudier les communications MPI. Ce stage consiste à étudier les moyens pour extraire le schéma de commu- nication d'un code de calcul puis de générer un code qui va reproduire les communications MPI.
Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.
Objectifs
Prendre en main le modèle de programmation MPI. La prise en main pourra se faire avec un code de calcul parallèle, Prendre en main un outil de profilage type Score-P et/ou Vampitrace, Développer un outil qui à partir d'une trace OTF de profilage génère un code qui reproduit les communications MPI d'un code profilé, Rédiger une documentation sur le travail effectué. prérequis: Langage C, Environnement Linux Anglais technique et scientifique Compétences appréciées: Programmation parallèle (MPI) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/ https://tu-dresden.de/zih/forschung/projekte/vampirtrace http://www.vi-hps.org/projects/score-p/
Domaines de spécia- lité requis
Calcul massivement parallèle
Langages/logiciels C LINUX MPI
Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI Formation recher- chée BAC+4/5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 27
Titre Etude et amélioration d’outils de configuration de fabrics InfiniBand
Référence IS-19-12
Contexte
La technologie InfiniBand est utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA, ainsi que sur les réseaux de stockage de données des centres de calculs.
Divers outils de configuration et de monitoring des réseaux InfiniBand existent, qu’il convient au travers de ce stage de faire évoluer
Objectifs
Les objectifs du stage sont :
Dans un premier temps, le candidat travaillera sur la configuration des réseaux InfiniBand, permettant une prise en main du domaine et des outils existants. L’évolution principale demandée concerne l’interface utilisateur de l’outil. Aujourd’hui en CLI, nous souhaitons apporter une GUI Web, simplifiant l’accès et l’utilisation. Entre autres choses l’interface devra apporter : Vision synthétique de la configuration déployée (topologie logique) Configuration des serveurs, groupes, partitions et QoS sur le réseau Vision physique du réseau InfiniBand avec identification des différents groupes de ressources.
Une seconde évolution de l’outil consiste en l’automatisation de la découverte des serveurs virtuels InfiniBand utilisant SRIOV. En effet, l’usage de la virtualisation est grandissant et il est primordial de pouvoir apporter les mêmes niveaux de configuration à une machine physique et virtuelle, avec la même simplicité. Dans un second temps, le stage s’orientera vers l’analyse du routage InfiniBand sur les fabrics, et l’intégration de métriques pertinentes à la fois sur la vision physique du réseau InfiniBand de la GUI développée, ainsi que dans un système de stockage pour analyse ultérieure. L’ensemble des éléments nécessaires à la solution de monitoring retenue devra être packagée de manière à être intégrable à une distribution linux de type CentOS. Le candidat devra faire preuve de curiosité intellectuelle et de rigueur.
Domaines de spécialité requis Informatique (Linux), Réseaux
Langages/logiciels Python, python-rdma, InfiniBand, Opensm
Mots clés Réseau, Infiniband, Informatique, Programmation
Formation recherchée BAC+5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 28
Référence IS-19-13
Contexte
La technologie InfiniBand est utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA, ainsi que sur les réseaux de stockage de données des centres de calculs. Divers outils de configuration et de monitoring des réseaux InfiniBand existent, qu’il convient au travers de ce stage de faire évoluer.
Objectifs
Dans un premier temps, le candidat travaillera sur l’étude de la technologie InfiniBand, permettant une prise en main du domaine, ainsi que la proposition d’une solution de monitoring basée sur des outils OpenSource. Cette solution pourrait se baser sur un prototype existant reposant sur le couple InfluxDB/Grafana, ou proposer une architecture plus adaptée. Dans un second temps, le stage s’orientera sur la collecte des compteurs InfiniBand. Le challenge est complexe et se validera par étape :
Proposer et implémenter des solutions efficaces de collecte pour les topologies de taille moyenne (jusque 4000 ports InfiniBand) garantissant une collecte et une synchronisation toutes les secondes
Autoriser le passage à l’échelle sur des topologies de grande taille (jusque 20000 ports IB) le plus rapidement possible avec une tolérance à 10 secondes d’intervalle de collecte
Proposer les opérations mathématiques permettant d’enrichir les compteurs avant stockage (calcul de congestion, statistiques d’émission…)
Un troisième volet du stage porte sur la collecte de métriques sur des équipements Ethernet en prenant en compte les spécificités et contraintes de sécurité des centres de calcul du CEA. Un accent particulier sera mis sur la possibilité de migrer des données vers un système OpenTSDB. L’ensemble des éléments nécessaires à la solution de monitoring retenue devra être packagée de manière à être intégrable à une distribution linux de type CentOS. Le candidat devra faire preuve de curiosité intellectuelle et de rigueur.
Domaines de spécialité requis Informatique (Linux) et Réseaux
Langages/logiciels Python, pyhton-rdma, Monitoring, Grafana
Mots clés Réseau, Infiniband, Informatique, Programmation
Formation recherchée BAC+5
Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 29
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
Titre Evaluation du routage sur les réseaux d’interconnexion de clusters de calcul (HPC)
Référence IS-19-14
Contexte
La toute nouvelle technologie Bull eXascale Interconnect sera utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA. Cette technologie innovante permet un routage différencié par port permettant une meilleure répartition des communications. Il convient au travers de ce stage de faire évoluer l’outil d’évaluation du routage afin de mener une comparaison des performances du routage Infiniband, traditionnellement utilisé sur les réseaux d’interconnexion de clusters et du routage nouvelle génération proposé par la technologie BXI.
Objectifs
Les objectifs du stage sont :
Dans un premier temps, le candidat travaillera sur l’étude des réseaux d’interconnexion de cluster ainsi que sur la technologie BXI afin de se familiariser avec le domaine. L’essentiel du travail consistera en la collecte des informations de routage et de topologie spécifique à la technologie BXI. Le candidat travaillera sur un simulateur de réseau BXI et devra adapter le code python existant afin de permettre l’interprétation des informations collectées par l’outil d’analyse du routage. Le stage se conclura par l’analyse des résultats produits permettant de valider la performance du routage sur BXI, en regard des analyses existantes sur Infiniband. Le candidat devra faire preuve d’autonomie, de curiosité intellectuelle et de rigueur.
Domaines de spécialité requis Informatique (Linux), Réseaux, Programmation python
Langages/logiciels Python, python-rdma, InfiniBand, Opensm
Mots clés Réseau, Infiniband, BXI, HPC, Programmation
Formation recherchée BAC+5
Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00. .
Page 30
12 LES STAGES EN SIMULATION NUMERIQUE
Titre Algorithmes de reconstruction d’interface par Machine Learning et Apprentissage Supervisé
Référence SN-19-01
Contexte
Les approches « Machine Learning » font l’objet d’un engouement croissant dans de nombreux domaines relevant des Sciences de l’Ingénieur. Jusqu’alors, peu de publications traitent d’applications aux méthodes de résolution d’équations aux dérivées partielles. Lors de ce stage, on évaluera l’apport de telles approches sur un problème difficile, objet d’une littérature abondante dans le cadre des méthodes numériques « traditionnelles » : le problème de reconstruction d’interfaces à partir de fractions de présence de matériaux sur maillages 2D/3D cartésiens. Il s’agit d’un problème purement géométrique, souvent coûteux avec les méthodes traditionnelles et qui se prête à l’utilisation de frameworks ML (Machine Learning) utilisés en reconnaissance d’images.
Objectifs
Les méthodes VOF (Volume Of Fluid) constituent une classe importante de méthodes de résolution des équations de la mécanique des fluides. Pour des écoulements bi-fluides, les algorithmes LVIRA et ELVIRA font actuellement référence pour l’étape de reconstruction d’interface à partir des fractions volumiques de présence sur les mailles voisines.
1) Ces algorithmes seront utilisés pour constituer des bases de
configurations sur lesquelles seront lancées les phases d’apprentissage (solutions exactes pour des interfaces planes).
2) Les capacités de l’approche ML seront alors évaluées par prises d’erreurs et comparaisons des coûts selon taille & type de base.
Dans un second temps, on examinera des cas non lipchitziens et l’extension à 3 matériaux (points triples, configurations trop complexes pour un traitement géométrique exhaustif et rigoureux de type ELVIRA). Références bibliographiques Itay Lieder, Yehezkel resheff, Tom Hope, Learning TensorFlow A guide to Building Deep Learning systems, O’Reilly media (2017) Kevin P. Murphy, Machine Learning: a probabilistic perspective, MIT Press (2012) J. E. Pilliod and E. G. Puckett, “Second-order accurate volume-of-fluid algorithms for tracking material interfaces”, J. Comput. Phys., Vol. 199, p. 465-502 (2004)
Domaines de spécialité requis
Langages/logiciels Python, TensorFlow + Keras (Google, cours MIT, Stanford, etc)
Mots clés CNN (Convolutional Neural Network), ML (Machine Learning), VOF (Volume Of Flui), CFD (Computational Fluid Dynamics)
Formation recherchée BAC+4/5
Durée du stage 3 à 6 mois Stage pouvant se poursuivre en thèse
Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 31
Référence SN-19-02
Contexte
La description lagrangienne consiste à suivre dans le temps les particules fluides le long de leurs trajectoires. Elle est souvent utilisée pour résoudre les équations d'Euler en dynamique multi-matériaux, car elle permet de préserver exactement les interfaces des matériaux au niveau discret. Cependant, elle n'est pas toujours suffisante pour décrire la dynamique des gaz compressibles. C'est le cas si le rapport entre les forces d'inertie et visqueuse est localement faible (nombre de Reynolds petit). Le terme de diffusion moléculaire des équations de Navier-Stokes n'est alors plus négligeable et doit être pris en compte. Si le nombre de Reynolds est grand, les modélisations de la turbulence (Reynolds Averaged Navier- Stokes-RANS ou Large-Eddy-Simulation-LES) sont généralement basées sur l'approximation de Boussinesq. Celle-ci consiste à approcher l'effet de la turbulence non résolue sur l'écoulement moyen par un opérateur de diffusion, proportionnel au tenseur des contraintes.
Objectifs
Le stage a pour objectifs de : proposer, analyser numériquement et tester différentes stratégies de discrétisation de l'opérateur de diffusion, et son couplage au solveur de Godunov acoustique pour les équations d'Euler [1,2]. Les stratégies retenues seront testées en 1D et 2D sur maillages non réguliers dans un code écrit en C++. Une bonne connaissance du lan- gage est souhaitée.
[1] B. Després et C. Mazeran, Arch. Rat. Mech. Anal., 2005, 178, pages 327-372. [2] P.-H. Maire, R. Abgrall, J. Breil et J. Ovadia, Siam J. Sci. Comp., 2007, 29.
Domaines de spé- cialité requis Analyse numérique
Langages/logiciels C/C++
Formation recher- chée BAC+5 (Master/Ingénieur)
Durée du stage 6 mois
Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 32
Titre
Référence SN-19-03
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est re- connu comme un expert du domaine HPC ayant une implication forte dans le domaine de la simulation numérique. Cette dernière consiste à reproduire par le calcul le fonctionnement d’un système physique, préala- blement décrit par un ensemble de modèles mathématiques. Certains de ces modèles nécessitent de discrétiser le domaine d’étude à l’aide d’un maillage hexaédrique 3D. La génération automatique de tels maillages est un problème difficile qui suscite de nombreuses recherches. De plus, tout maillage hexaédrique n’est pas utilisable en simulation numérique, et différents critères doivent être vérifiés. En particulier, la « qualité » géométrique des mailles doit être estimée et améliorée si nécessaire. Dans cette optique, les auteurs de [1] proposent un algorithme de relaxation qui repose sur la transformation du problème d’optimisation de la forme géométrique des hexaèdres en un problème d’optimisation sur les arêtes du maillage. Il reste à résoudre une succession de problèmes d’optimisation quadratiques et convexes. L’espace des solutions étant potentiellement vide du fait de contraintes trop importantes, une heuristique locale est en outre proposée. [1] M. Livesu, A. Sheffer, N. Vining and M. Tarini. Practical Hex-Mesh Optimization via Edge-Cone Rectification, Transactions on Graphics (Pro- ceedings of SIGGRAPH 2015), 2015.
Objectifs
L’objectif du stage proposé est : 1) d’étudier et implanter les algorithmes proposés dans [1], 2) puis de les étendre à des maillages mixtes composés à la fois
d’hexaèdres, tétraèdres, prismes à base triangulaire, et pyra- mides à base quadrangulaire.
L’implantation se fera dans le cadre du projet open-source GMDS, projet développé et maintenu au CEA/DAM. Les résultats seront évalués au vu de la qualité des maillages générés à partir de modèles de pièces méca- niques plus ou moins complexes
Domaines de spé- cialité requis Informatique – Mathématiques appliquées
Langages/logiciels C/C++
Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Non
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]
Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 33
Titre Métriques orientées pour maillages quadrangulaires surfaciques
Référence SN-19-04
Contexte
Le CEA est un acteur majeur en matière de recherche et d’innovation avec une implication forte dans le domaine de la simulation numérique. Le travail de stage s’inscrit justement dans le contexte de la simulation numérique de phénomènes physiques sur des architectures modernes de calculateurs, et plus précisément dans la génération automatique de mail- lages surfaciques quadrangulaires. L’idée est d’adapter des maillages aux problèmes physiques à traiter en considérant à la fois les caractéris- tiques géométriques de la surface à discrétiser (courbures, discontinuités) et des caractéristiques du problème (couches limites le long d’une aile d’avion, choc dans un fluide). Dans notre contexte, ces dernières sont modélisées à l’aide de métriques. Sur l’exemple ci-dessous le maillage régulier (à gauche) et adapté à la métrique (au centre) pour obtenir le maillage aligné sur cette métrique (à droite).
Objectifs
Le cadre proposé est de se baser sur l’extension de techniques d’adaptation de maillages triangulaires. Celles-ci sont robustes et permet- tent intrinsèquement de contrôler la densité, l’orientation et la qualité du maillage. En considérant les travaux récents sur les champs d’orientations 3D, elles peuvent être complétées d’une information d’orientation pour générer des maillages quadrangulaires. Partant des travaux de [1] et [2], l’objectif du stage sera de : valider une nouvelle procédure d’insertion de points durant la phase d’adaptation du maillage ainsi qu’une procédure de création directe de quadrilatères. Ce travail nécessite de développer des opérateurs topologiques de modi- fication de maillages et des opérateurs géométriques reposant sur les notions de métriques et d’orientations pour placer les nouveaux points du maillage. D’un point de vue mathématique, tous les développements reposeront sur le socle théorique des espaces métriques Riemanniens. L’implantation se fera dans le cadre du projet open-source GMDS, projet C++ développé et maintenu au CEA/DAM. Les résultats seront évalués sur différents exemples analytiques et sur des données issues de codes de simulation numérique. [1] A. Loseille. Metric-orthogonal anisotropic mesh generation. Procedia Engineering, 82:403–415, 2014. [2] N. Kowalski, F. Ledoux, and P. Frey. Smoothness driven frame field generation for hexa- hedral meshing. Computer Aided Design, vol. 72, pages 65-77, 2016.
Domaines de spé- cialité requis Informatique – Mathématiques appliquées
Langages/logiciels C/C++
Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 34
Titre Etude et implantation d’algorithmes parallèles de génération
d’hexaèdres par combinaison de tétraèdres
Référence SN-19-05
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est re- connu comme un expert du domaine HPC grâce à l’impulsion du « Pro- gramme Simulation ». La simulation numérique consiste à reproduire par le calcul le fonctionnement d’un système physique, préalablement décrit par un ensemble de modèles. Le CEA/DAM travaille à l’élaboration de méthodes mathématique qui nécessitent le plus souvent la discrétisation en hexaèdres du domaine d’étude. De tels maillages sont utilisés par de nombreux organismes de recherche et industriels pour la résolution de problèmes physiques (interaction fluide-structure, aérodynamisme). La génération automatique de maillages 3D purement hexaédriques est un problème difficile pour lequel aucune solution satisfaisante n’existe actuellement. De ce fait, depuis quelques années, différentes solutions [1,2,3] ont été proposées pour générer des maillages à dominante hexaé- drique, c’est-à-dire composés majoritairement d’hexaèdres et minoritaire- ment de tétraèdres, prismes à base triangulaire et de pyramides à base quadrangulaire. [1] S. Meshkat, D. Talmor, Generating a mixed mesh of hexahedra, pentahedra and tetrahe- dra from an underlying tetrahedral mesh, International Journal for Numerical Methods in Engineering, pp. 17-30, 2000. [2] S. Yamakawa, K. Shimada, Fully-automated hex-dominant mesh generation with direc- tionality control via packing rectangular solid cells, International Journal for Numerical Meth- ods in Engineering, pp. 2089-2129, 2003. [3] D. Sokolov, N. Ray, L. Untereiner, B. Levy, Hexahedral-dominant meshing, ACM Tran- sactions on Graphics, pp. 1-23, 2016.
Objectifs
Les algorithmes proposés dans [1,2,3] suivent une approche indirecte qui consiste à générer un maillage tétraèdrique puis à combiner des té- traèdres pour créer des hexaèdres. Les heuristiques employées sont de nature « gloutonne ». Relativement coûteuse en temps de calcul, elles ne garantissent pas d’obtenir une solution optimale au problème posé. C’est pourquoi le stage proposé consistera à :
1. Développer au sein du projet open-source GMDS, une version concurrente d’au moins un algorithme de recombinaison de té- traèdres en hexaédres. L’implémentation pourra se faire indiffé- remment en C++ ou en Rust.
2. A l’aide de méthodes issues de la recherche opérationnelle (pro- grammation dynamique par exemple), proposer une approche as- surant l’optimalité de la solution.
Evaluer théoriquement et expérimentalement les solutions développées aux étapes 1 et 2.
Domaines de spé- cialité requis Informatique
Langages/logiciels C/C++ et/ou Rust Mots clés Maillage, théorie des graphes, recherche opérationnelle Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :
[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 35
Titre Equilibrage de charge dynamique pour la visualisation scientifique
Référence SN-19-06
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est con- sidéré comme étant un expert du Calcul Haute Performance. Ses équipes développpent des codes de simulation numérique et des logiciels d’environnement de codes pouvant s’exécuter efficacement sur des su- percalculateurs. En particulier, les équipes du CEA/DAM spécialisées en visualisation scientifique sont reconnues pour leur expertise en visualisa- tion parallèle sur supercalculateur. Pour cela, elles participent activement au développement de la bibliothèque open-source VTK, qui fournit un pipeline complet de visualisation mixant différents types de données et d’algorithmes (des filtres). Pour répondre aux besoins des codes de simulations, le CEA/DAM a dé- veloppé depuis quelques années des structures de données et des filtres VTK dédiés à la manipulation de maillages AMR [1]. Intuitivement, un maillage AMR est un grille régulière (I,J,K) où chaque maille de la grille peut elle-même être subdivisée en une sous-grille et ce de manière récur- sive. Le stage proposé s’inscrit dans la manipulation parallèle de tels maillages et plus spécifiquement dans leur partitionnement. Partitionner un maillage consiste à attribuer chaque maille à exactement un et un cœur, dans le but d'équilibrer les temps de calcul sur chaque cœur [2]. [1] Guénolé Harel, Jacques-Bernard Lekien, Philippe P. Pébaÿ. Two New Contributions to the Visualization of AMR Grids: I. Interactive Rendering of Extreme-Scale 2-Dimensional Grids II. Novel Selection Filters in Arbitrary Dimension. [2] C. Chevalier and F. Pellegrini, PT-SCOTCH: a tool for efficient parallel graph ordering. Parallel Computing, 34(6-8), pp 318-331, 2008.
Objectifs
L’objectif du stage est de proposer un nouvel algorithme de partitionne- ment dédié à la visualisation scientifique de maillages AMR. Le travail consistera à :
1. Effectuer une étude bibliographique des algorithmes de partition- nement généralistes de graphes et implémenter une première ap- proche en utilisant les structures AMR de VTK ;
2. Puis, en tirant parti des caractéristiques intrinsèques des mail- lages AMR, l’approche sera étendue pour gérer des maillages disposant de mailles fantômes (i.e. des mailles dupliquées sur plusieurs coeurs).
Selon l’état d’avancement des travaux et le profil du stagiaire, ce travail pourra être complété par : (1) une extension parallèle de l’algorithme où l’on s’intéressa au paradigme de programmation concurrente (multi- threads) ; (2) la modification d’un partitionnement existant (ou repartition- nement). L’ensemble des travaux réalisés sera implémenté et évalué expérimenta- lement au sein de la bibliothèque VTK écrite en C++. L’étudiant aura pour cela accès à plusieurs supercalculateurs et par la même différents types d’accélérateurs modernes.
Domaines de spé- cialité requis Informatique
Langages/logiciels C/C++, Python
Mots clés Visualisation scientifique, AMR, Partitionnement, VTK. Formation recher- chée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui
Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.
Page 36
Propositions de stages informatiques 2019 au CEA/DAM Ile de France
Titre Etude et évaluation de la structure de donnée SVDAG et ses
variantes pour le RayTracing en visualisation scientifique
Référence SN-19-07
Contexte
Le CEA, acteur majeur en matière de recherche et d’innovation, est considéré comme étant un expert du Calcul Haute Performance. Dans ce contexte, les équipes du CEA/DAM spécialisées en visualisation scientifique sont reconnues pour leur expertise en visualisation parallèle sur supercalculateur. Elles participent activement au développement de la bibliothèque open-source VTK, qui fournit un pipeline complet de visualisation associant différents types de données et d’algorithmes. Pour répondre aux besoins de codes de simulation, le CEA/DAM a développé depuis quelques années des structures de données et des filtres VTK dédiés à la visualisation et la manipulation de maillages AMR [1]. D’autres structures hiérarchiques utilisées dans le cadre de l’industrie cinématographique ou du jeux-vidéo permettent un rendu réaliste de type ray-tracing en temps réel en faisant appel à la programmation sur carte graphique (CUDA). Ces structures sont basées sur les Smart Voxel Octrees (SVO) [2], une représentation d’une scène voxelisée de type octree optimisée. Des techniques de compressions offrent par la suite des gains substantiels en tenant compte des motifs similaires : les Smart Voxel Directed Acyclic Graph (SVDAG) [2] ou encore les Symmetric SVDAG (SSVDAG) [3]. [1] Guénolé Harel, Jacques-Bernard Lekien, Philippe P. Pébaÿ. Visualization and Analysis of Large-Scale, Tree-Based, Adaptative Mesh Refinement Simulations with Arbitrary Rectilinear Geometry. [2] Viktor Kämpe, Erik Sintorn et Ulf Assarsson. High Resolution Sparse Voxel DAGs. [3] Alberto Jaspe Villanueva, Fabio Marton et Enrico Gobbetti. Symmetry-aware Sparse Voxel DAGs (SSVDAGs) for compression-domain tracing of high-resolution geometric scenes.
Objectifs
L’objectif du stage est de permettre l’évaluation de ces structures hiérarchiques pour la visualisation scientifique. En contact avec les équipes de recherche suédoises à la base du SVDAG, le stagiaire devra : 1. Tout d’abord, étudier et comprendre la théorie et l’implémentation des
structures SVO/SVDAG/SSVDAG pour en évaluer les performances de rendu ray-tracing dans un contexte maitrisé.
2. Un premier convertisseur VTK-AMR vers SVDAG/SSVDAG sera à implémenter.
3. Le travail se poursuivra par l’application de rendu réaliste de type lancé de rayons à base de SVDAG sur ces données issues de VTK-AMR.
Plusieurs développements seront possibles en vue de prendre en compte la notion de variables ou de compresser encore plus les informations dans le cadre de rendu de films interactifs. Les développements effectués seront évalués aussi bien sur GPU que sur les nombreux accélérateurs et processeurs disponibles au CEA/DAM.
Domaines de spécialité requis
Mots clés Visualisation scientifique, AMR, multithread, GPU, VTK, MPI, Anglais. Formation recherchée BAC+5
Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse
Oui
Pour faire acte de candidature, veuill